Module 1 â Comprendre l'IA moderne
Durée : 1h
Objectif : Savoir ce qu'est un modĂšle d'IA, ses forces et ses limites
đŻ Objectifs d'apprentissage
Ă la fin de ce module, vous serez capable de :
- Expliquer la différence entre IA traditionnelle et les grands modÚles de langage
- Comprendre comment fonctionnent les tokens et pourquoi ils importent
- Identifier les limites principales de l'IA (hallucinations, biais, dépendance aux données)
- Utiliser l'IA en connaissance de cause dans vos projets
đ Contenu thĂ©orique
1.1 L'IA avant et maintenant : deux paradigmes différents
IA traditionnelle (pré-2017)
L'intelligence artificielle "classique" fonctionnait par rÚgles explicites programmées par des humains :
Exemples concrets :
- Correcteur orthographique : Liste de mots valides + rĂšgles de grammaire
- Chatbot bancaire : Arbre de décision avec questions/réponses préprogrammées
- Filtre anti-spam : Recherche de mots-clés suspects ("viagra", "urgent", "gagnez")
Caractéristiques :
- Prévisible et contrÎlable
- Limité aux cas prévus par les programmeurs
- Incapable de généraliser ou d'improviser
- Excellente pour des tùches répétitives et structurées
Les grands modĂšles de langage - LLM (2018-aujourd'hui)
Les LLM comme GPT, Claude, Mistral ou Llama fonctionnent différemment : ils ont "lu" des milliards de textes et ont appris des patterns statistiques du langage.
Exemples concrets :
- ChatGPT/Claude : Conversations naturelles sur n'importe quel sujet
- GitHub Copilot : Génération de code à partir d'une description
- Midjourney/DALL·E : Création d'images à partir de texte
Caractéristiques :
- Flexible et adaptable Ă de nouveaux contextes
- Capable de raisonnement et de créativité apparente
- Imprévisible dans ses réponses exactes
- Peut se tromper avec confiance (hallucinations)
Métaphore clé :
L'IA traditionnelle est comme une recette de cuisine : suivez les Ă©tapes et vous obtenez toujours le mĂȘme plat.
Un LLM est comme un chef qui a goûté à 10 000 plats différents : il comprend les saveurs, peut improviser, mais pourrait inventer un ingrédient qui n'existe pas.
1.2 Les tokens : la monnaie de l'IA
Qu'est-ce qu'un token ?
Un token est un morceau de texte que l'IA comprend comme une unité. Ce n'est pas toujours un mot complet.
Exemples de tokenisation :
- "Bonjour" = 1 token
- "L'intelligence" = 2 tokens ("L'" + "intelligence")
- "extraordinaire" = 3 tokens ("extra" + "ordin" + "aire")
- "đ" = 1 token
RĂšgle approximative :
- En français : 1 token â 0,75 mot
- En anglais : 1 token â 1 mot
- 100 tokens â 75 mots français â 1 paragraphe court
Pourquoi les tokens comptent ?
1. Coûts et limites
- La plupart des API facturent au nombre de tokens
- Les modĂšles ont une limite de tokens par conversation (contexte)
- Exemple : GPT-4 peut traiter ~128 000 tokens (â96 000 mots français)
2. Performance
- Plus vous utilisez de tokens, plus le traitement est long
- Un prompt trop long peut diluer l'attention du modĂšle
3. Stratégie de prompt
- Ătre concis = Ă©conomiser des tokens = rĂ©ponses plus rapides
- Mais ĂȘtre trop bref = manquer de contexte = mauvaises rĂ©ponses
Outil pratique : Vous pouvez compter les tokens avec des outils comme OpenAI Tokenizer ou directement dans certaines interfaces.
1.3 Les limites de l'IA : ce qu'elle ne peut (pas encore) faire
Limite 1 : Les hallucinations
Définition : Une hallucination se produit quand l'IA invente des informations fausses avec une apparence de vérité.
Exemples réels :
- Inventer des références bibliographiques avec noms d'auteurs fictifs
- Créer de fausses statistiques précises ("73,4% des Québécois...")
- Affirmer des faits historiques inexacts avec confiance
Pourquoi ça arrive ? L'IA gĂ©nĂšre du texte probable statistiquement, pas vĂ©rifiĂ© factuellement. Elle essaie de complĂ©ter des patterns, mĂȘme si elle n'a pas l'information rĂ©elle.
Comment s'en protéger :
- â VĂ©rifier les faits importants auprĂšs de sources fiables
- â Demander des sources (mĂȘme si l'IA peut les inventer)
- â Utiliser l'IA pour le raisonnement, pas pour l'autoritĂ©
- â Croiser avec d'autres outils ou experts
Limite 2 : Les biais
Définition : Les biais sont des préjugés ou perspectives déséquilibrées présents dans les réponses de l'IA.
D'oĂč viennent-ils ?
- Les données d'entraßnement reflÚtent les biais de la société
- Sur-représentation de certaines cultures (web anglophone dominant)
- Biais historiques présents dans les textes anciens
Exemples concrets :
- Associer certaines professions à des genres spécifiques
- Représenter majoritairement des perspectives occidentales
- Reproduire des stéréotypes culturels ou sociaux
Comment s'en protéger :
- â Ătre conscient que l'IA a des angles morts
- â Demander explicitement des perspectives diverses
- â ComplĂ©ter avec votre jugement et expertise humaine
- â Questionner les rĂ©ponses qui semblent stĂ©rĂ©otypĂ©es
Limite 3 : Dépendance aux données
Ce que l'IA sait :
- Ce qui était publiquement disponible jusqu'à sa date de coupure (cutoff)
- Informations générales et largement diffusées
- Patterns communs dans les données d'entraßnement
Ce que l'IA ne sait PAS (ou mal) :
- ĂvĂ©nements aprĂšs sa date de coupure
- Informations confidentielles ou privées (sauf si divulguées publiquement)
- Votre contexte spécifique sans que vous le lui donniez
- Données de niche ou trÚs spécialisées
Exemple concret : Si vous demandez "Comment optimiser le processus X de mon entreprise ?", l'IA ne connaßt pas votre processus X. Vous devez lui décrire.
Stratégie gagnante : Fournir le contexte pertinent dans votre prompt = réponses beaucoup plus pertinentes.
Limite 4 : Absence de jugement éthique véritable
L'IA applique des rÚgles de sécurité, mais n'a pas de conscience morale. Elle ne peut pas :
- Juger de la légalité dans votre juridiction spécifique
- Ăvaluer les consĂ©quences Ă©thiques complexes de vos dĂ©cisions
- Remplacer votre responsabilité professionnelle ou personnelle
RÚgle d'or : L'IA est un outil d'aide à la décision, jamais un décideur à votre place.
đ Ce qu'il faut retenir
Concept | Résumé en une phrase |
---|---|
IA traditionnelle vs LLM | RÚgles programmées vs patterns appris sur des milliards de textes |
Tokens | Morceaux de texte qui définissent les coûts et limites de traitement |
Hallucinations | L'IA peut inventer des faits faux avec assurance |
Biais | L'IA reflÚte les préjugés présents dans ses données d'entraßnement |
DĂ©pendance aux donnĂ©es | L'IA ne sait que ce qu'elle a appris ; votre contexte doit ĂȘtre fourni |
đĄ Exercice pratique (15 minutes)
Objectif
Expérimenter la différence entre une demande technique et métaphorique, puis identifier les limites.
Ătapes
1. Demande technique (5 min) Posez cette question à votre IA préférée :
Explique-moi comment fonctionne techniquement un grand modĂšle de langage comme toi.
2. Demande métaphorique (5 min) Posez ensuite :
Explique-moi comment tu fonctionnes, mais utilise une métaphore imagée
accessible Ă un enfant de 10 ans.
3. Test des limites (5 min) Demandez quelque chose de faux pour observer la réaction :
Peux-tu me donner les références exactes des 3 derniers articles
scientifiques publiés sur l'IA dans la Revue Nature en 2024 ?
Questions de réflexion
- Quelle version avez-vous mieux comprise ? Pourquoi ?
- L'IA a-t-elle inventé des références ou admis ne pas savoir ?
- Comment pourriez-vous vérifier si une information donnée est vraie ?
đ Ressources complĂ©mentaires
Pour aller plus loin
- Visualiser les tokens : OpenAI Tokenizer
- Comprendre les hallucinations : Recherchez "AI hallucination examples"
- Biais dans l'IA : Documentation sur l'équité algorithmique
Avant le prochain module
RĂ©flĂ©chissez Ă un cas d'usage oĂč vous pourriez utiliser l'IA cette semaine. Notez-le, vous l'utiliserez dans le Module 2.
â Auto-Ă©valuation
Cochez si vous pouvez répondre positivement :
- [ ] Je peux expliquer la différence entre IA traditionnelle et LLM à un collÚgue
- [ ] Je comprends ce qu'est un token et pourquoi ça compte
- [ ] Je sais que l'IA peut halluciner et comment m'en protéger
- [ ] Je reconnais que l'IA a des biais et des limites
- [ ] J'ai testé une IA et observé ses comportements en situation réelle
Si vous avez cochĂ© au moins 4 cases, vous ĂȘtes prĂȘt pour le Module 2 !