Module 1 – Comprendre l'IA moderne

Durée : 1h
Objectif : Savoir ce qu'est un modèle d'IA, ses forces et ses limites

🎯 Objectifs d'apprentissage

À la fin de ce module, vous serez capable de :

Expliquer la différence entre IA traditionnelle et les grands modèles de langage
Comprendre comment fonctionnent les tokens et pourquoi ils importent
Identifier les limites principales de l'IA (hallucinations, biais, dépendance aux données)
Utiliser l'IA en connaissance de cause dans vos projets

📚 Contenu théorique

1.1 L'IA avant et maintenant : deux paradigmes différents

IA traditionnelle (pré-2017)

L'intelligence artificielle "classique" fonctionnait par règles explicites programmées par des humains :

Exemples concrets :

Correcteur orthographique : Liste de mots valides + règles de grammaire
Chatbot bancaire : Arbre de décision avec questions/réponses préprogrammées
Filtre anti-spam : Recherche de mots-clés suspects ("viagra", "urgent", "gagnez")

Caractéristiques :

Prévisible et contrôlable
Limité aux cas prévus par les programmeurs
Incapable de généraliser ou d'improviser
Excellente pour des tâches répétitives et structurées

Les grands modèles de langage - LLM (2018-aujourd'hui)

Les LLM comme GPT, Claude, Mistral ou Llama fonctionnent différemment : ils ont "lu" des milliards de textes et ont appris des patterns statistiques du langage.

Exemples concrets :

ChatGPT/Claude : Conversations naturelles sur n'importe quel sujet
GitHub Copilot : Génération de code à partir d'une description
Midjourney/DALL·E : Création d'images à partir de texte

Caractéristiques :

Flexible et adaptable à de nouveaux contextes
Capable de raisonnement et de créativité apparente
Imprévisible dans ses réponses exactes
Peut se tromper avec confiance (hallucinations)

Métaphore clé :

L'IA traditionnelle est comme une recette de cuisine : suivez les étapes et vous obtenez toujours le même plat.

Un LLM est comme un chef qui a goûté à 10 000 plats différents : il comprend les saveurs, peut improviser, mais pourrait inventer un ingrédient qui n'existe pas.

1.2 Les tokens : la monnaie de l'IA

Qu'est-ce qu'un token ?

Un token est un morceau de texte que l'IA comprend comme une unité. Ce n'est pas toujours un mot complet.

Exemples de tokenisation :

"Bonjour" = 1 token
"L'intelligence" = 2 tokens ("L'" + "intelligence")
"extraordinaire" = 3 tokens ("extra" + "ordin" + "aire")
"🎉" = 1 token

Règle approximative :

En français : 1 token ≈ 0,75 mot
En anglais : 1 token ≈ 1 mot
100 tokens ≈ 75 mots français ≈ 1 paragraphe court

Pourquoi les tokens comptent ?

1. Coûts et limites

La plupart des API facturent au nombre de tokens
Les modèles ont une limite de tokens par conversation (contexte)
Exemple : GPT-4 peut traiter ~128 000 tokens (≈96 000 mots français)

2. Performance

Plus vous utilisez de tokens, plus le traitement est long
Un prompt trop long peut diluer l'attention du modèle

3. Stratégie de prompt

Être concis = économiser des tokens = réponses plus rapides
Mais être trop bref = manquer de contexte = mauvaises réponses

Outil pratique : Vous pouvez compter les tokens avec des outils comme OpenAI Tokenizer ou directement dans certaines interfaces.

1.3 Les limites de l'IA : ce qu'elle ne peut (pas encore) faire

Limite 1 : Les hallucinations

Définition : Une hallucination se produit quand l'IA invente des informations fausses avec une apparence de vérité.

Exemples réels :

Inventer des références bibliographiques avec noms d'auteurs fictifs
Créer de fausses statistiques précises ("73,4% des Québécois...")
Affirmer des faits historiques inexacts avec confiance

Pourquoi ça arrive ? L'IA génère du texte probable statistiquement, pas vérifié factuellement. Elle essaie de compléter des patterns, même si elle n'a pas l'information réelle.

Comment s'en protéger :

✅ Vérifier les faits importants auprès de sources fiables
✅ Demander des sources (même si l'IA peut les inventer)
✅ Utiliser l'IA pour le raisonnement, pas pour l'autorité
✅ Croiser avec d'autres outils ou experts

Limite 2 : Les biais

Définition : Les biais sont des préjugés ou perspectives déséquilibrées présents dans les réponses de l'IA.

D'où viennent-ils ?

Les données d'entraînement reflètent les biais de la société
Sur-représentation de certaines cultures (web anglophone dominant)
Biais historiques présents dans les textes anciens

Exemples concrets :

Associer certaines professions à des genres spécifiques
Représenter majoritairement des perspectives occidentales
Reproduire des stéréotypes culturels ou sociaux

Comment s'en protéger :

✅ Être conscient que l'IA a des angles morts
✅ Demander explicitement des perspectives diverses
✅ Compléter avec votre jugement et expertise humaine
✅ Questionner les réponses qui semblent stéréotypées

Limite 3 : Dépendance aux données

Ce que l'IA sait :

Ce qui était publiquement disponible jusqu'à sa date de coupure (cutoff)
Informations générales et largement diffusées
Patterns communs dans les données d'entraînement

Ce que l'IA ne sait PAS (ou mal) :

Événements après sa date de coupure
Informations confidentielles ou privées (sauf si divulguées publiquement)
Votre contexte spécifique sans que vous le lui donniez
Données de niche ou très spécialisées

Exemple concret : Si vous demandez "Comment optimiser le processus X de mon entreprise ?", l'IA ne connaît pas votre processus X. Vous devez lui décrire.

Stratégie gagnante : Fournir le contexte pertinent dans votre prompt = réponses beaucoup plus pertinentes.

Limite 4 : Absence de jugement éthique véritable

L'IA applique des règles de sécurité, mais n'a pas de conscience morale. Elle ne peut pas :

Juger de la légalité dans votre juridiction spécifique
Évaluer les conséquences éthiques complexes de vos décisions
Remplacer votre responsabilité professionnelle ou personnelle

Règle d'or : L'IA est un outil d'aide à la décision, jamais un décideur à votre place.

🎓 Ce qu'il faut retenir

Concept	Résumé en une phrase
IA traditionnelle vs LLM	Règles programmées vs patterns appris sur des milliards de textes
Tokens	Morceaux de texte qui définissent les coûts et limites de traitement
Hallucinations	L'IA peut inventer des faits faux avec assurance
Biais	L'IA reflète les préjugés présents dans ses données d'entraînement
Dépendance aux données	L'IA ne sait que ce qu'elle a appris ; votre contexte doit être fourni

💡 Exercice pratique (15 minutes)

Objectif

Expérimenter la différence entre une demande technique et métaphorique, puis identifier les limites.

Étapes

1. Demande technique (5 min) Posez cette question à votre IA préférée :

                Explique-moi comment fonctionne techniquement un grand modèle de langage comme toi.

2. Demande métaphorique (5 min) Posez ensuite :

                Explique-moi comment tu fonctionnes, mais utilise une métaphore imagée 
accessible à un enfant de 10 ans.

3. Test des limites (5 min) Demandez quelque chose de faux pour observer la réaction :

                Peux-tu me donner les références exactes des 3 derniers articles 
scientifiques publiés sur l'IA dans la Revue Nature en 2024 ?

Questions de réflexion

Quelle version avez-vous mieux comprise ? Pourquoi ?
L'IA a-t-elle inventé des références ou admis ne pas savoir ?
Comment pourriez-vous vérifier si une information donnée est vraie ?

📖 Ressources complémentaires

Pour aller plus loin

Visualiser les tokens : OpenAI Tokenizer
Comprendre les hallucinations : Recherchez "AI hallucination examples"
Biais dans l'IA : Documentation sur l'équité algorithmique

Avant le prochain module

Réfléchissez à un cas d'usage où vous pourriez utiliser l'IA cette semaine. Notez-le, vous l'utiliserez dans le Module 2.

✅ Auto-évaluation

Cochez si vous pouvez répondre positivement :

[ ] Je peux expliquer la différence entre IA traditionnelle et LLM à un collègue
[ ] Je comprends ce qu'est un token et pourquoi ça compte
[ ] Je sais que l'IA peut halluciner et comment m'en protéger
[ ] Je reconnais que l'IA a des biais et des limites
[ ] J'ai testé une IA et observé ses comportements en situation réelle

Si vous avez coché au moins 4 cases, vous êtes prêt pour le Module 2 !