Apprendre · Cours · Intermédiaire

L'IA générative au-delà du texte

Comment les machines ont appris à créer des images, de l'audio et de la vidéo.

Sept chapitres sur l'IA générative au-delà du chatbot — comment les machines créent des images, de l'audio, de la vidéo et du 3D, comment les pièces s'assemblent dans des modèles multimodaux, et les vrais risques des médias synthétiques. Chacun associe une explication en langage clair à des approfondissements facultatifs.

Écrit pour les curieux, pour les constructeurs et pour quiconque travaille avec des médias génératifs. Pas de mathématiques lourdes requises; les approfondissements vont plus loin dans la recherche là où c'est utile.

Commencer le chapitre 1 →← Tous les cours7 chapitres · 73 min au total

Chapitres

Chapitre 01 · 9 min
Au-delà de la boîte de chat
“Quand on sait apprendre la forme d'une chose, on peut apprendre la forme de n'importe quoi — mots, images, sons.”
Lire →
Chapitre 02 · 12 min
Comment fonctionne la génération d'images
“Un sculpteur n'ajoute pas de marbre. Il part d'un bloc brut et retire tout ce qui n'est pas la statue.”
Lire →
Chapitre 03 · 10 min
Contrôler les images
“Un prompt, c'est crier un ordre dans une salle bruyante. Le contrôle, c'est mettre le plan dans leurs mains.”
Lire →
Chapitre 04 · 10 min
Audio et musique
“Le son n'est qu'une ligne qui ondule dans le temps. Apprendre à une machine les formes des ondulations lui permet d'en tracer de nouvelles.”
Lire →
Chapitre 05 · 10 min
Vidéo et 3D
“Un folioscope ne fonctionne que si chaque page s'accorde avec la précédente. Cet accord est la partie difficile.”
Lire →
Chapitre 06 · 11 min
Modèles multimodaux
“Enseignez deux langues dans la même salle de classe et elles commencent à compléter les phrases l'une de l'autre.”
Lire →
Chapitre 07 · 11 min
Risques et réalité
“Quand n'importe qui peut falsifier une photographie, la question cesse d'être « est-ce faux? » et devient « pouvez-vous prouver que c'est réel? »”
Lire →

Chapitres

Au-delà de la boîte de chat

Comment fonctionne la génération d'images

Contrôler les images

Audio et musique

Vidéo et 3D

Modèles multimodaux

Risques et réalité