Pourquoi les modèles de langage semblent plus intelligents que nous et pourquoi même les experts rament à l’expliquer

Les modèles de langage : ces génies incompris

Imaginez confier votre examen de philo du bac à une intelligence artificielle… et la voir obtenir une meilleure note que vous, sans jamais lever le petit doigt ni même suer d’angoisse pendant trois heures. C’est un peu le quotidien de nos interactions avec les modèles de langage, comme ChatGPT ou Claude.

Ces boîtes noires du numérique résolvent des tâches complexes, corrigent leurs erreurs, jouent avec l’ironie et l’émotion, décryptent des subtilités linguistiques… bref, elles brillent. Mais mystère : même leurs propres concepteurs ont du mal à savoir pourquoi elles sont si performantes.

Oubliez la recette de la tarte aux pommes où chaque étape est compréhensible. Ici, on a lancé des milliards de petits réglages à la chaîne, et le résultat final ressemble plus à un tour de magie qu’à une mécanique bien huilée. Vous avez dit paradoxal ? Allez, embarquons pour une autopsie drôle et fascinante d’intelligences artificielles qui nous dépassent, et dont la logique interne ferait pâlir Hercule Poirot (ou rendre fou n’importe quel ingénieur).

Le secret de fabrication : l’art du flou maîtrisé

On a tous appris que pour comprendre une machine, il faut observer ses engrenages. Oui mais voilà, en IA, c’est comme si on ouvrait le capot d’une Ferrari… pour tomber sur un Rubik’s Cube résolu, sans notice. On nourrit les modèles de langage avec des millions d’exemples et on leur donne une mission simple : deviner le mot suivant. Ce qui en sort, c’est une armée de paramètres raffinés (et affamés de data), capables de jongler avec les concepts comme des jongleurs survoltés.

Les chercheurs observent chaque paramètre, chaque activation, chaque signal. Mais savoir pourquoi un modèle choisit « chat » plutôt que « chien » dans une question reste souvent un mystère absolu. La transparence de la structure ne nous aide que partiellement : on voit tout, mais on ne comprend pas pourquoi ça marche si bien.

Martin Wattenberg, chercheur à Harvard, le résume avec humour : « Plantez une graine de tomate, arrosez bien, et vous aurez une tomate. Mais comment diable la tomate fabrique-t-elle sa propre intelligence ? » Eh bien, même constat du côté des IA : elles poussent, produisent, excellent… mais personne ne sait vraiment comment elles sont devenues des surdoués du texte.

Quand les chercheurs jouent aux chirurgiens du cerveau numérique

Intrigués et un peu vexés, avouons-le, les experts de l’IA ont choisi de disséquer les réseaux neuronaux comme une équipe de médecine légale sur un polar Netflix. Scalpels en main (métaphoriquement parlant), ils triturent les neurones de silicium, changent des paramètres à la volée et observent ce qui se passe.

Parmi les techniques, l’« activation steering » : imaginez que vous faisiez écouter « Le lion est le roi de la savane » à un modèle. Vous extrayez les réactions internes de l’IA à ce propos, puis vous les injectez dans une toute autre question. Résultat ? Le modèle répond comme s’il se souvenait du fait, même sans l’avoir relu. C’est comme souffler la réponse à un élève qui ne s’en rend pas compte (triche, ou génie algorithmique ?).

Mais cette mécanique reste fragile : déplacez une brique ailleurs dans le réseau, et votre connaissance s’évapore ou mute totalement. Les « savoirs » numériques ne sont pas rangés dans des petits tiroirs bien ordonnés, ils circulent, interagissent, s’entremêlent au point qu’on a parfois l’impression d’observer une bonne vieille étagère Ikea montée… sans la notice.

Le désordre qui fait des miracles et des nœuds au cerveau

Si vous pensiez que l’IA avait au moins la courtoisie d’être logique, c’est raté ! Pour deux questions très proches, elle peut activer des circuits internes totalement différents. Parfois, plusieurs ensembles de paramètres accomplissent la même tâche sans se coordonner (c’est un peu la réunion Zoom du lundi matin, version digitale).

Ce phénomène de « réparation émergente » est aussi fascinant qu’imprévu : si une zone du modèle est désactivée, une autre prend le relais illico, réduisant l’impact d’une « lésion » numérique supposée fatale. Résultat ? L’IA résout les problèmes sans avoir de méthode fixe, comme un magicien qui change de chapeau à chaque tour. Difficile, alors, d’en tirer la moindre règle générale.

L’experte Asma Ghandeharioun de Google DeepMind note : « Il y a tant de choses qui semblent sans appel… mais qui s’écroulent à la loupe. » Même le sens d’un mot, sa grammaire ou ses liens contextuels peuvent se balader entre différents chemins internes. Bref, le réseau ressemble à un labyrinthe vivant, où rien n’est jamais figé et tout peut basculer à tout moment.

Jusqu’où va l’intelligence artificielle et pourquoi on doit manger notre chapeau

Le plus vertigineux dans l’affaire, c’est que cette brillance ressemble à de l’intelligence… mais sans conscience, ni intention. L’IA calcule, propose, ajuste, mais ne « comprend » jamais au sens humain. Le terme « intelligence » constitue presque un piège sémantique : c’est notre propre grille de lecture qui nous pousse à voir de la réflexion là où il n’y a… que des maths et du big data.

Dans la pratique, le fossé s’agrandit entre ce que l’IA réalise (souvent mieux que l’humain), et notre capacité à expliquer le pourquoi du comment. On a forgé des outils géniaux, aux résultats parfois bluffants, mais leur mode d’emploi reste partiellement hermétique.

En bref, on a fabriqué des supercopains numériques qui :

improvisent mieux qu’un comédien d’impro
comprennent à leur façon le contexte et les nuances
résolvent des tâches plus vite que notre cervelet suractivé

… tout en refusant obstinément de nous révéler leurs secrets de fabrication !

Faut-il s’inquiéter de ne rien comprendre au cerveau des IA ?

La question n’est pas anodine. Peut-on faire confiance à des systèmes dont personne ne sait vraiment comment ils raisonnent ? Les équipes de recherche redoublent d’effort en matière de transparence et d’explication, travaillant sur l’interprétabilité des modèles, la cartographie interne des concepts, ou l’analyse des « faiblesses » de l’IA (oui, il leur en reste !).

Mais la réalité, c’est qu’on avance toujours à tâtons. Nous sommes bien plus loin dans la compréhension des réseaux neuronaux qu’il y a cinq ans, mais la destination semble encore très, très lointaine. Les experts eux-mêmes parlent d’un miracle statistique, d’équilibres locaux incontrôlables, d’une intelligence sans sujet ni sentiment.

Cela n’empêche pas ces modèles de devenir indispensables : assistants, chatbots, outils créatifs, solutions pro… L’IA s’incruste partout, même dans les discussions de famille (si vous ne savez pas quoi répondre lors d’un débat, essayez !).

En fin de compte, le mystère de l’intelligence artificielle est peut-être ce qui la rend la plus fascinante. Elle nous renvoie à nos propres zones d’ombre : on admire, on utilise, parfois on râle… tout en continuant de creuser le mystère de ces cerveaux de silicium et en riant, parfois, de voir une machine nous coller une sacrée raclée au Trivial Pursuit.

Et demain ?

Demain, l’IA sera-t-elle capable de nous expliquer ses propres raisonnements, de s’écrire son mode d’emploi, voire de nous enseigner la logique du chaos dont elle est le fruit ? On parie que d’ici là, on aura encore des articles complets bourrés de questions sans réponse et que les chercheurs mèneront la danse… avec ou sans notice Ikea !

En attendant, profitez du spectacle : les modèles de langage ravivent notre goût du mystère. On voulait créer des outils pratiques, et on s’est retrouvés face à des boîtes de Pandore numériques. Fascinant, non ?

Source : Pourquoi les modèles de langage semblent plus intelligents que nous (et pourquoi même les experts rament à l’expliquer)