This site requires Javascript to be turned on. Please enable Javascript and reload the page.

L'intelligenza artificiale per gli insegnanti: Un libro aperto

ML Process

This page is referenced by:

Parlare di IA : Come Youtube ti studia Parte 2
Il processo
In Google, le reti neurali profonde vengono ora utilizzate per l'apprendimento automatico.² In base al modello di video, la rete neurale di Youtube prende i video simili a quelli già visti dall'utente. Poi cerca di prevedere il tempo di visione di ogni nuovo video per un determinato modello di utente e li classifica in base alla previsione. L'idea è quella di mostrare i 10-20 video (a seconda del dispositivo) con la migliore posizione in classifica.

Il processo è simile a quello del Machine Learning model che abbiamo studiato in precedenza. In primo luogo, la macchina prende le caratteristiche dai modelli di utenti e video forniti dal programmatore. Impara dai dati di addestramento quale peso dare a ciascuna caratteristica per prevedere correttamente il tempo di visione. Poi, una volta testata e trovata corretta, può iniziare a prevedere e consigliare.
Training
Durante l'addestramento, il sistema riceve milioni di esempi positivi e negativi. Un esempio positivo si ha quando un utente clicca su un video e lo guarda per un certo tempo. Un esempio negativo è quando l'utente non clicca sul video o non lo guarda a lungo.²

La rete prende in considerazione le caratteristiche dell'utente e le caratteristiche del video discusse nella sezione modelli di Come Youtube vi studia Parte 1. Regola l'importanza data a ciascuna caratteristica di input verificando se ha previsto correttamente il tempo di visione per un determinato video e utente.

Ci sono circa un miliardo di parametri (peso di ogni caratteristica) da apprendere su centinaia di miliardi di esempi.²La rete potrebbe anche imparare a non tenere conto di alcune caratteristiche, attribuendo loro un'importanza pari a zero. Pertanto, l'incorporazione o il modello creato dall'algoritmo può essere molto diverso da quello previsto dagli sviluppatori.
Testing

Una volta addestrata, la rete viene testata su dati già disponibili e regolata. Oltre all'accuratezza della previsione, l'output del sistema deve essere regolato dal programmatore in base a diversi giudizi di valore. Mostrare video troppo simili a quelli già visti non sarà molto coinvolgente. Cosa significa veramente che una raccomandazione è buona? Quanti video simili mostrare e quanta diversità introdurre, sia rispetto agli altri video sia rispetto alla storia dell'utente. Quanti interessi dell'utente coprire? Quali tipi di raccomandazioni portano a una soddisfazione immediata e quali a un utilizzo a lungo termine?^1,3 Sono tutte domande importanti da considerare.

Dopo questo test, si procede alla valutazione in tempo reale delle raccomandazioni. Viene misurato il tempo totale di visione per ogni serie di video predetti.² Se un utente guarda più a lungo l'insieme di video raccomandati, il modello è considerato di maggior successo. Si noti che la semplice osservazione del numero di video cliccati non è un buon metodo di valutazione. Youtube valuta i suoi raccomandatori in base a quanti video raccomandati sono stati guardati per una frazione sostanziale del video, alla durata della sessione, al tempo trascorso fino alla prima visione prolungata e alla frazione di utenti connessi con raccomandazioni.¹
Interfaccia
Infine, il modo in cui le raccomandazioni vengono presentate allo spettatore: quanti video mostrare? Le raccomandazioni migliori devono essere presentate tutte insieme o alcune devono essere conservate per un secondo momento? ³ Come visualizzare le miniature e i titoli dei video? Quali altre informazioni mostrare? Quali impostazioni può controllare l'utente?¹ Le risposte a queste domande determinano il modo in cui Youtube tiene agganciati due miliardi di utenti 24 ore al giorno.
------------------------------------------------------------------------------------------------------
¹Davidson, J., Liebald, B., Liu, J., Nandy, P., Vleet, T., The Youtube Video Recommendation System, Proceedings of the 4th ACM Conference on Recommender Systems, Barcelona, 2010
² Covington, P., Adams, J., Sargin, E., Deep neural networks for Youtube Recommendations, Proceedings of the 10th ACM Conference on Recommender Systems, ACM, New York, 2016
³Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021
4 Spinelli, L., and Crovella, M., How YouTube Leads Privacy-Seeking Users Away from Reliable Information, In Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP '20 Adjunct), Association for Computing Machinery, New York, 244–251, 2020
Parlare di IA : Apprendimento automatico Un algoritmo è una sequenza fissa di istruzioni per svolgere un compito. Il compito è suddiviso in fasi facili e prive di confusione: come una ricetta ben scritta.

I linguaggi di programmazione sono linguaggi che un computer può seguire ed eseguire. Fanno da ponte tra ciò che capiamo e ciò che può fare una macchina - in definitiva, interruttori che si accendono e si spengono. Per un computer immagini, video, istruzioni sono tutti degli 1 (interruttore acceso) e degli 0 (interruttore spento).

Quando viene scritto in un linguaggio di programmazione, un algoritmo diventa un programma. Le applicazioni sono programmi scritti per un utente finale.

I programmi convenzionali ricevono i dati e seguono le istruzioni per fornire un risultato. Molti dei primi programmi di intelligenza artificiale erano convenzionali. Poiché le istruzioni non possono adattarsi ai dati, questi programmi non erano molto bravi in cose come la previsione basata su informazioni incomplete e l'elaborazione del linguaggio naturale (NLP).
Un motore di ricerca è alimentato sia da fonti convenzionali che da algoritmi di apprendimento automatico. A differenza dei programmi convenzionali, gli algoritmi di apprendimento automatico analizzano i dati alla ricerca di modelli e utilizzano questi modelli o regole per prendere decisioni o previsioni future. In altre parole, basandosi sui dati - esempi buoni e cattivi - trovano la loro ricetta.

Questi algoritmi sono adatti a situazioni molto complesse e con dati mancanti. Possono anche monitorare le loro prestazioni e utilizzare questo feedback per migliorare con l'uso.

Questo non è molto diverso dagli esseri umani, in particolare dai bambini, che apprendono abilità al di fuori del sistema educativo convenzionale. I bambini osservano, ripetono, imparano, verificano il loro apprendimento e migliorano. Se necessario, improvvisano.

Ma la somiglianza tra macchine e umani è molto superficiale. L'"apprendimento" dal punto di vista umano è molto diverso e molto più sfumato e complesso dell'"apprendimento" per la macchina.
Un problema di classificazione
Un compito comune che un'applicazione di apprendimento automatico adotta per il suo funzionamento è la classificazione: questa è la foto di un cane o di un gatto? Questo studente è in difficoltà o ha superato l'esame? Esistono due o più gruppi. L'applicazione deve classificare i nuovi dati in uno di questi gruppi.

Prendiamo l'esempio di un mazzo di carte da gioco diviso in due pile - Gruppo A e Gruppo B, secondo un certo schema. Dobbiamo classificare una nuova carta, l'asso di quadri, come appartenente al Gruppo A o al Gruppo B.

Per prima cosa, dobbiamo capire come vengono suddivisi i gruppi: abbiamo bisogno di esempi. Pesciamo quattro carte dal gruppo A e quattro dal gruppo B. Questi 8 casi di esempio formano il nostro insieme di addestramento - dati che ci aiutano a vedere il modello - "allenandoci" a vedere il risultato.

Non appena ci viene mostrata la disposizione a destra, la maggior parte di noi indovina che l'Asso di quadri appartiene al gruppo B. Non abbiamo bisogno di istruzioni, il cervello umano è un prodigio nel trovare schemi. Come farebbe una macchina a farlo?

Gli algoritmi di apprendimento automatico si basano su potenti teorie statistiche. I diversi algoritmi si basano su equazioni matematiche diverse che devono essere scelte con attenzione per adattarsi al compito da svolgere. È compito del programmatore scegliere i dati, analizzare quali caratteristiche dei dati sono rilevanti per il problema specifico e scegliere l'algoritmo di apprendimento automatico corretto.
L'importanza dei dati
L'estrazione della carta qui sopra potrebbe essere andata male in diversi modi. Fare riferimento all'immagine. 1 ha troppe poche carte, non è possibile indovinare. Il 2 ha più carte, ma tutte dello stesso seme: non c'è modo di sapere dove andrebbero i diamanti. Se i gruppi non sono della stessa dimensione, il 3 potrebbe benissimo significare che le carte numero sono nel gruppo A e le carte immagine nel gruppo B.

Di solito i problemi di apprendimento automatico sono più aperti e coinvolgono insiemi di dati molto più grandi di un mazzo di carte. Gli insiemi di addestramento devono essere scelti con l'aiuto dell'analisi statistica, altrimenti gli errori si insinuano. Una buona selezione dei dati è fondamentale per una buona applicazione di ML, più di altri tipi di programmi. L'apprendimento automatico ha bisogno di un gran numero di dati rilevanti. Come minimo assoluto, un modello di apprendimento automatico di base dovrebbe contenere un numero di punti dati dieci volte superiore al numero totale di caratteristiche.1 Detto questo, il ML è anche particolarmente adatto a gestire dati rumorosi, disordinati e contraddittori.

Estrazione delle caratteristiche
Quando sono stati mostrati gli esempi del Gruppo A e del Gruppo B, la prima cosa che avete notato potrebbe essere il colore delle carte. Poi il numero o la lettera e il seme. Per un algoritmo tutte queste caratteristiche devono essere inserite in modo specifico. Non può sapere automaticamente cosa è importante per il problema.

Nel selezionare le caratteristiche di interesse, i programmatori devono porsi molte domande. Quante funzioni sono troppo poche per essere utili? Quante caratteristiche sono troppe? Quali caratteristiche sono rilevanti per il compito? Qual è la relazione tra le caratteristiche scelte - una caratteristica dipende dall'altra? Con le caratteristiche scelte, è possibile che l'output sia accurato?
Il processo
Quando il programmatore crea l'applicazione, prende i dati, ne estrae le caratteristiche, sceglie un algoritmo di apprendimento automatico appropriato (funzione matematica che definisce il processo) e lo addestra utilizzando dati etichettati (nel caso in cui l'output sia noto, come il gruppo A o il gruppo B) in modo che la macchina capisca il modello alla base del problema.

Per una macchina la comprensione assume la forma di un insieme di numeri - i pesi - che essa assegna a ciascuna caratteristica. Con l'assegnazione corretta dei pesi, la macchina può calcolare la probabilità che una nuova tessera appartenga al gruppo A o al gruppo B. In genere, durante la fase di addestramento, il programmatore aiuta la macchina modificando manualmente alcuni valori: questa operazione si chiama ottimizzazione dell'applicazione.

Una volta fatto questo, il programma deve essere testato prima di essere utilizzato. A tale scopo, al programma vengono forniti i dati etichettati che non sono stati utilizzati per l'addestramento. Questi dati sono chiamati dati di prova. A questo punto si valutano le prestazioni della macchina nel predire l'output. Una volta stabilito che le prestazioni sono soddisfacenti, il programma può essere messo in uso: è pronto a prendere nuovi dati e a fare una decisione o una previsione su di essi.

Le prestazioni in tempo reale vengono poi continuamente monitorate e migliorate (i pesi delle caratteristiche vengono aggiustati per ottenere risultati migliori). Spesso, le prestazioni in tempo reale danno risultati diversi rispetto a quando l'algoritmo di apprendimento automatico viene testato con dati già disponibili. Poiché sperimentare con utenti reali è costoso, richiede un elevato sforzo e spesso è rischioso, gli algoritmi vengono sempre testati utilizzando dati storici degli utenti, che potrebbero non essere in grado di valutare l'impatto sul comportamento degli utenti.1 Per questo motivo è importante effettuare una valutazione completa delle applicazioni di apprendimento automatico una volta in uso:

Avete voglia di mettere mano all'apprendimento automatico? Provate questa attività.

------------------------------------------------------------------------------------------------------
¹Theobald, O. Machine Learning For Absolute Beginners: A Plain English Introduction (Second Edition) (Machine Learning From Scratch Book 1) (p. 24). Scatterplot Press. Kindle Edition.
²Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021
Esperienza di Apprendimento Automatico Questa attività è adattata da attività create da Codeweek e concesse con licenza Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) license. È possibile trovare l'elenco originale delle attività nel loro sito web. Anche i due dataset utilizzati : Initial Training Dataset e Test dataset, sono stati creati da loro.

Utilizzeremo Google's Teachable Machine per addestrare una macchina a classificare un'immagine come bicicletta o motocicletta. Ricapitolando, un'applicazione di apprendimento automatico deve essere addestrata e testata prima di poter essere utilizzata. Raccoglieremo e raggrupperemo immagini di esempio delle categorie che la macchina dovrà classificare, addestreremo il modello e verificheremo se classifica correttamente un insieme di immagini di esempio.
Fase 1: Raccogliere e raggruppare immagini esemplificative
1) Scarica le immagini di biciclette da qui
2) Se necessario, estrai il contenuto della cartella zip in una cartella locale del computer. Questo verrà utilizzato come set di addestramento per l'applicazione di apprendimento automatico.
3) Scarica le immagini delle moto da qui
4) Se necessario, estrai il contenuto della cartella zip in una cartella locale del computer. Questo verrà utilizzato anche come set di addestramento per l'applicazione di apprendimento automatico.
5) Scarica tutte le immagini da qui
6) Se necessario, estrai il contenuto della cartella zip in una cartella locale del computer. Questa verrà utilizzata come set di dati di prova.
7) Clicca su Google's Teachable Machine e seleziona Progetto immagine > Modello immagine standard.
8) Sotto la voce Classe 1, fare clic su carica > scegli le immagini dai propri file > apri la cartella delle immagini delle biciclette create durante i passaggi 1 e 2 e importa tutte le immagini memorizzate.
9) Sotto la voce Classe 2, click carica > scegli le immagini dai propri file > apri la cartella delle immagini della moto creata durante i passi 3 e 4 e importa tutte le immagini memorizzate.
Fase 2: addestramento del modello
In Addestramento, fare clic su Addestra il modello. Il modello impara a classificare biciclette e motocicli. Attendere che venga visualizzato il messaggio Modello addestrato.

Si noti che non è necessario selezionare e inserire manualmente le caratteristiche di biciclette e motociclette. L'algoritmo sa come trovare le proprie caratteristiche dalle immagini!
Fase 3: Test del modello
1) In Anteprima, fare clic sulla freccia vicino alla webcam e cambiare l'input in File.
2) Fare clic su Scegli immagini dai file e scegliere un'immagine di prova memorizzata ai punti 5 e 6.
3) Scorrere verso il basso e controllare l'output.
4) È possibile ripetere l'operazione con altre immagini per confrontare le prestazioni.

Se un'immagine viene utilizzata per addestrare un classificatore, la macchina avrà già registrato l'etichetta corrispondente per quella particolare immagine. Mostrando questa immagine alla macchina durante la fase di test, non si potrà misurare la capacità di generalizzazione del modello. Per questo motivo, i dataset di test e di addestramento devono essere diversi l'uno dall'altro.

Nota: è possibile caricare le proprie immagini per l'addestramento e il test. Questa è una buona fonte di immagini gratuite.