L'IA generativa oltre il testo
Come le macchine hanno imparato a creare immagini, audio e video.
Sette capitoli sull'IA generativa oltre il chatbot: come le macchine creano immagini, audio, video e 3D, come i pezzi si assemblano nei modelli multimodali, e i veri rischi dei media sintetici. Ciascuno abbina una spiegazione in linguaggio chiaro ad approfondimenti facoltativi.
Scritto per i curiosi, per chi costruisce e per chiunque lavori con i media generativi. Nessuna matematica pesante richiesta; gli approfondimenti vanno oltre nella ricerca dove è utile.
Capitoli
- Capitolo 01 · 9 min
Oltre la finestra di chat
“Quando sai imparare la forma di una cosa, puoi imparare la forma di qualsiasi cosa: parole, immagini, suoni.”
Leggi → - Capitolo 02 · 12 min
Come funziona la generazione di immagini
“Uno scultore non aggiunge marmo. Parte da un blocco grezzo e toglie tutto ciò che non è la statua.”
Leggi → - Capitolo 03 · 10 min
Controllare le immagini
“Un prompt è gridare un ordine in una stanza rumorosa. Il controllo è mettere il progetto nelle loro mani.”
Leggi → - Capitolo 04 · 10 min
Audio e musica
“Il suono non è altro che una linea che ondeggia nel tempo. Insegna a una macchina le forme delle ondulazioni e potrà tracciarne di nuove.”
Leggi → - Capitolo 05 · 10 min
Video e 3D
“Un flipbook funziona solo se ogni pagina si accorda con la precedente. Quell'accordo è la parte difficile.”
Leggi → - Capitolo 06 · 11 min
Modelli multimodali
“Insegna due lingue nella stessa aula e cominciano a completarsi le frasi a vicenda.”
Leggi → - Capitolo 07 · 11 min
Rischi e realtà
“Quando chiunque può falsificare una fotografia, la domanda smette di essere "è falso?" e diventa "puoi dimostrare che è reale?"”
Leggi →