The issues with data
1 2023-01-04T08:45:25+00:00 Jotsna Iyer 4f2bfb514a09301de0e5275ee45bf5db41479839 9 1 plain 2023-01-04T08:45:25+00:00 Jotsna Iyer 4f2bfb514a09301de0e5275ee45bf5db41479839This page is referenced by:
-
1
2023-01-04T08:45:24+00:00
Parlare di IA: Sistemi basati sui dati Parte 1
11
plain
2023-06-05T14:28:17+00:00
Decisioni in classe
Come insegnanti, avete accesso a molti tipi di dati. Dati tangibili, come i registri delle presenze e delle prestazioni, o intangibili, come il linguaggio del corpo degli studenti. Considerate alcune delle decisioni che prendete nella vostra vita professionale: Quali sono i dati che vi aiutano a prendere queste decisioni?
Esistono applicazioni tecnologiche che possono aiutarvi a visualizzare o elaborare i dati. I sistemi di intelligenza artificiale utilizzano i dati per personalizzare l'apprendimento, fare previsioni e prendere decisioni che potrebbero aiutarvi a insegnare e a gestire la classe: avete esigenze a cui la tecnologia può rispondere? Se sì, quali sono i dati che un sistema di questo tipo potrebbe richiedere per svolgere il compito?
I sistemi educativi hanno sempre generato dati: dati personali degli studenti, registri accademici, dati di frequenza e altro ancora. Con la digitalizzazione e le applicazioni AIED, vengono registrati e memorizzati molti più dati: clic del mouse, pagine aperte, timestamp e battute della tastiera.1 Con il pensiero incentrato sui dati che sta diventando la norma nella società, è naturale chiedersi come si possano analizzare tutti questi dati per fare qualcosa di appropriato: Possiamo fornire un feedback più personalizzato al discente? Potremmo progettare strumenti di visualizzazione e notifica migliori per l'insegnante?2
Qualunque sia la tecnologia utilizzata, deve soddisfare un'esigenza reale in classe. Una volta identificata l'esigenza, possiamo esaminare i dati disponibili e chiederci cosa sia rilevante per il risultato desiderato. Si tratta di scoprire i fattori che consentono agli educatori di prendere decisioni complesse. Questi fattori possono essere catturati utilizzando i dati disponibili? I dati e i sistemi basati sui dati sono il modo migliore per affrontare il bisogno? Quali potrebbero essere le conseguenze indesiderate di questo utilizzo dei dati?3
L'apprendimento automatico (Machine Learning - LM) ci permette di rinviare molte di queste domande ai dati stessi.4 Le applicazioni di ML sono addestrate sui dati. Funzionano operando sui dati. Trovano schemi e generalizzazioni e li memorizzano come modelli - dati che possono essere utilizzati per rispondere a domande future.4 Anche le loro decisioni e previsioni, e il modo in cui queste influiscono sull'apprendimento degli studenti, sono tutti dati. Pertanto, sapere come i programmatori, la macchina e l'utente gestiscono i dati è una parte importante della comprensione del funzionamento dell'intelligenza artificiale.I Dati
I dati riguardano generalmente un'entità del mondo reale: una persona, un oggetto o un evento. Ogni entità può essere descritta da una serie di attributi (caratteristiche o variabili).5 Ad esempio, nome, età e classe sono alcuni attributi di uno studente. L'insieme di questi attributi è il dato che abbiamo sullo studente che, pur non essendo in alcun modo vicino all'entità reale, ci dice qualcosa su di lui. I dati raccolti, utilizzati ed elaborati nel sistema educativo, sono chiamati dati educativi.1
Un dataset è un insieme di entità disposte in righe e colonne. Il registro delle presenze di una classe è un dataset. Ogni riga rappresenta il record di uno studente. Le colonne possono essere la presenza o l'assenza durante un particolare giorno o sessione. Ogni colonna è quindi un attributo.
I dati vengono creati scegliendo gli attributi e misurandoli: ogni dato è il risultato di decisioni e scelte umane. La creazione dei dati è quindi un processo soggettivo, parziale e disordinato, soggetto a difficoltà tecniche4,5.Inoltre, ciò che scegliamo di misurare e ciò che non misuriamo può avere una grande influenza sui risultati attesi.
Le tracce dei dati (datatraces) sono registrazioni dell'attività degli studenti, come i clic del mouse, i dati sulle pagine aperte, la tempistica delle interazioni o la pressione dei tasti in un sistema digitale.1 Metadati, cioè dati che descrivono altri dati.5 I dati derivati sono dati calcolati o dedotti da altri dati: I punteggi individuali di ogni studente sono dati. La media della classe è un dato derivato. Spesso i dati derivati sono più utili per ottenere intuizioni utili, trovare modelli e fare previsioni. Le applicazioni di Machine Learning possono creare dati derivati e collegarli con tracce di metadati per creare modelli dettagliati di studenti, che aiutano a personalizzare l'apprendimento.1
Affinché qualsiasi applicazione basata sui dati abbia successo, gli attributi devono essere scelti con cura e misurati correttamente. I modelli scoperti devono essere verificati per vedere se hanno senso nel contesto educativo. Se progettati e mantenuti correttamente, i sistemi basati sui dati possono essere molto preziosi.
Questo capitolo intende introdurre alcune nozioni di base sui dati e sulle tecnologie basate sui dati, ma l'alfabetizzazione ai dati è un'abilità molto importante da possedere e merita una formazione dedicata, un supporto e un aggiornamento continui.1Legislazione da conoscere
Grazie al drastico calo dei costi di archiviazione dei dati, una maggiore quantità di dati e metadati viene salvata e conservata più a lungo.6 Questo può portare a violazioni della privacy e dei diritti. Leggi come il General Data Protection Regulation (GDPR) scoraggiano tali pratiche e offrono ai cittadini dell'UE un maggiore controllo sui loro dati personali. Il regolamento fornisce norme sulla protezione dei dati giuridicamente vincolanti in tutti gli Stati membri dell'UE.
Secondo il GDPR, i dati personali sono tutte le informazioni relative a una persona identificata o identificabile (soggetto dei dati). Le scuole, oltre a collaborare con le aziende che gestiscono i loro dati, conservano enormi quantità di informazioni personali su studenti, genitori, personale, dirigenti e fornitori. In qualità di responsabili del trattamento dei dati, sono tenute a conservare i dati che trattano in modo confidenziale e sicuro e a disporre di procedure per la protezione e l'uso corretto di tutti i dati personali.1
I diritti stabiliti dal GDPR comprendono:- Il Diritto di Accesso, che rende obbligatorio per i cittadini la possibilità di sapere facilmente quali dati vengono raccolti su di loro.
- Il Diritto del cittadino di essere informato sull'utilizzo dei suoi dati
- Il Diritto alla Cancellazione, che consente a un cittadino i cui dati sono stati raccolti da una piattaforma di chiedere che tali dati siano rimossi dal dataset costruito dalla piattaforma (e che può essere venduto a terzi).
- Il Diritto alla Spiegazione: ogni volta che i cittadini hanno bisogno di chiarimenti sui processi decisionali automatizzati che li riguardano, deve essere fornita una spiegazione.
Si può fare riferimento al documento GDPR for dummies per l'analisi effettuata da esperti indipendenti dell'Unione delle Libertà Civili per l'Europa (Civil Liberties Union for Europe - Liberties), che è un organo di controllo che tutela i diritti umani di tutti nell'Unione Europea.
------------------------------------------------------------------------------------------------------
1 Ethical guidelines on the use of artificial intelligence and data in teaching and learning for educators, European Commission, October 2022
2 du Boulay, B., Poulovasillis, A., Holmes, W., Mavrikis, M., Artificial Intelligence And Big Data Technologies To Close The Achievement Gap,in Luckin, R., ed. Enhancing Learning and Teaching with Technology, London: UCL Institute of Education Press, pp. 256–285, 2018
3 Hutchinson, B., Smart, A., Hanna, A., Denton, E., Greer, C., Kjartansson, O., Barnes, P., Mitchell, M., Towards Accountability for Machine Learning Datasets: Practices from Software Engineering and Infrastructure, Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, Association for Computing Machinery, New York, 2021
4 Barocas, S., Hardt, M., Narayanan, A., Fairness and machine learning Limitations and Opportunities, yet to be published
5 Kelleher, J.D, Tierney, B, Data Science, London, 2018
6 Schneier, B., Data and Goliath: The Hidden Battles to Capture Your Data and Control Your World, W. W. Norton & Company, 2015
7 Kant, T., Identity, Advertising, and Algorithmic Targeting: Or How (Not) to Target Your “Ideal User.”, MIT Case Studies in Social and Ethical Responsibilities of Computing, 2021
-
1
2023-01-04T08:45:25+00:00
Aperto o chiuso?
10
Una sezione per il capitolo 8
plain
2023-06-05T06:50:34+00:00
Le risorse educative aperte (Open Educational Resources - OER) e la loro storia
Le risorse educative si riferiscono a qualsiasi materiale, oggi per lo più digitale, che avrà un ruolo nell'istruzione: libri di testo, diapositive, programmi di studio, esami, ecc. Sono aperte quando possono essere condivise liberamente con altri (ma una definizione più precisa verrà data tra poco).
Anche se l'istruzione è stata aperta in molti aspetti in diversi momenti della storia, i termini chiave vanno compresi meglio. Le seguenti definizioni di OER e di licenza aperta sono state riviste in relazione alla Raccomandazione del 25 novembre 2019.1:
1. Le risorse educative aperte (OER) sono materiali per l'apprendimento, l'insegnamento e la ricerca, in qualsiasi formato e supporto, che sono di dominio pubblico o che sono coperti da copyright. Questi materiali sono stati rilasciati con una licenza aperta e consentono l'accesso, il riutilizzo, il reimpiego, l'adattamento e la ridistribuzione a costo zero da parte di altri.
2. Una licenza aperta è una licenza che rispetta i diritti di proprietà intellettuale del titolare del copyright e fornisce permessi che garantiscono al pubblico il diritto di accedere, riutilizzare, riproporre, adattare e ridistribuire i materiali didattici.
Le espressioni open content e OER si riferiscono a qualsiasi opera soggetta a diritto d'autore (tradizionalmente escluso il software, che viene descritto con altre espressioni come open source) che viene concessa in licenza per garantire i seguenti diritti (noti anche come le 5 R)2:
• Conservare (to Retain) - il diritto di realizzare, possedere e controllare copie del contenuto (ad esempio, scaricare, riprodurre, archiviare e gestire).
• Riutilizzare (to Reuse) - il diritto di utilizzare il contenuto in vari modi (ad esempio, in classe, in un gruppo di studio, su un sito web, in un video).
• Revisionare (to Revise) - il diritto di adattare, aggiustare, modificare o alterare il contenuto stesso (ad esempio, tradurre il contenuto in un'altra lingua).
• Remixare (to Remix) - il diritto di combinare il contenuto originale o rivisto con altro materiale per creare qualcosa di nuovo (ad esempio, incorporare il contenuto).
• Ridistribuire (to Redistribute) - il diritto di distribuire ad altri copie del contenuto originale, delle revisioni o della loro combinazione.
Va notato che questi diritti non sono banali: ad esempio, il terzo diritto è essenziale per gli insegnanti: poter prendere il materiale didattico di qualcuno e adattarlo ai propri scopi, alla durata e al livello della propria classe, magari alle specificità geografiche e culturali.Perché l'IA vuole gli open data
D'altra parte, come dimostrato in diverse parti di questo libro e anche dagli investimenti finanziari del settore, l'istruzione può essere vista come un mercato. E poiché l'apprendimento automatico è la forza principale che guida l'Intelligenza Artificiale, è lecito dedurre che, per prosperare, l'Intelligenza Artificiale per l'istruzione avrà bisogno di dati.La differenza tra dati utente e dati di conoscenza
Il tipo di dati di cui l'IA per l'istruzione avrà bisogno è duplice.
Dati sugli utenti. Come imparano? Cosa scatena un buon apprendimento? Cosa permette di imparare meglio? Come disse una volta Daphne Koller: "Trasformiamo la scienza dell'educazione in una scienza dei dati".
Questi dati possono essere prodotti solo dagli utenti stessi. È quindi essenziale che le aziende possiedano le piattaforme con cui gli utenti saranno chiamati a interagire. Questa è stata la chiave del successo di molte aziende di IA e sarà la chiave del successo nel settore dell'istruzione.
Il secondo tipo di dati riguarda la conoscenza. Nel settore dell'istruzione, il materiale didattico rappresenta una grossa fetta di questa conoscenza. Questi dati sono o non sono condivisi: nella maggior parte dei casi i creatori o i raccoglitori di conoscenza possono conoscere poco le licenze e il materiale che hanno prodotto sarà nascosto in archivi universitari, su strani blog o condiviso all'interno di gruppi specifici sui social network. Alcune di queste conoscenze sono ovviamente dietro i paywall e altre si trovano su siti il cui modello di business consiste nell'offrire le conoscenze gratuitamente, ma in un contesto in cui si devono visualizzare annunci pubblicitari e pubblicità indesiderata per ottenere o mantenere l'accesso.I dati degli utenti devono essere protetti
Nel primo caso i dati - i dati degli utenti - devono essere protetti. A maggior ragione se questi dati appartengono ad alunni minorenni. Ciò significa che la scuola o l'insegnante non dovrebbero condividere questi dati con le piattaforme a meno che non siano esplicitamente autorizzati a farlo. Anche quando la piattaforma offre un servizio interessante. Allo stesso modo, non è mai una buona idea registrare i nomi e gli indirizzi dei propri alunni per partecipare a qualche attività. Per maggiori dettagli, consultare il video sui dati e la reidentificazione. Please refer to the video about data and reidentification for details.
The European Union has provided a robust framework to protect its citizens, their privacy, their digital rights. This is called the GDPR. The GDPR protects by giving the citizens rights that have to be granted by the platforms, whether they are for education or not.Knowledge data should be shared
On the other hand, knowledge can be shared. And should be shared. Obviously this is only possible when one has the right to do this, which means understanding how licensing works. Creative commons licenses are usually those that work best for OER.
Once OER are shared, artificial intelligence can be used by many things, such as those present in project X5-GON.
------------------------------------------------------------------------------------------------------
2Wiley, D., & Hilton, J. (2018). Defining OER-enabled pedagogy. International Review of Research in Open and Distance Learning, 19(4). https://doi.org/10.19173/irrodl.v19i4.3601
2The Access Compromise and the 5th R David Wiley, 2014. https://opencontent.org/blog/archives/3221
2UNESCO. (2021a). Open educational resources. https://en.unesco.org/themes/building-knowledge-societies/oer/recommendation
UNESCO. (2019). Recommendation on open educational resources (OER). http://portal.unesco.org/en/ev.php-URL_ID=49556&URL_DO=DO_TOPIC&URL_SECTION=201.html