Dragon Hatchling : la nouvelle architecture d’IA imite le cerveau humain pour un saut potentiel en AGI

11

Les chercheurs ont dévoilé « Dragon Hatchling », un nouveau modèle d’intelligence artificielle (IA) conçu pour reproduire les processus d’apprentissage dynamiques du cerveau humain. Cette architecture, développée par la startup d’IA Pathway, pourrait représenter une étape cruciale vers la réalisation de l’intelligence générale artificielle (AGI) – une IA capable de raisonner, d’apprendre et de s’adapter comme les humains.

Les limites de l’IA actuelle

Les grands modèles de langage (LLM) existants, tels que ChatGPT et Google Gemini, s’appuient sur une architecture de transformateur. Bien que puissants, les transformateurs ont une limitation fondamentale : ils n’apprennent pas en permanence. Une fois formés, leurs paramètres restent fixes, nécessitant un recyclage ou un ajustement pour intégrer de nouvelles connaissances. Cela signifie qu’ils ont du mal à généraliser le raisonnement au-delà des schémas qu’ils ont déjà observés, contrairement au cerveau humain, qui s’adapte et renforce constamment les connexions neuronales grâce à l’expérience.

En quoi les nouveau-nés de dragon diffèrent

Dragon Hatchling vise à surmonter cette limitation en ajustant dynamiquement sa structure interne en temps réel au fur et à mesure qu’il traite les informations. Contrairement aux transformateurs, qui traitent les données de manière séquentielle à travers des couches empilées, Dragon Hatchling se comporte davantage comme une toile flexible. De minuscules « particules neuronales » échangent des informations, renforçant ou affaiblissant les connexions pour conserver les connaissances acquises et les appliquer à des situations futures.

Cette adaptation continue imite la façon dont les neurones humains se renforcent ou s’affaiblissent au fil du temps, donnant ainsi au modèle une forme de mémoire à court terme qui influence les nouvelles entrées. Contrairement aux LLM traditionnels, cette mémoire n’est pas stockée dans les données de formation mais émerge de changements architecturaux continus.

Principales fonctionnalités et performances

L’architecture du modèle est conçue pour généraliser le raisonnement au-delà des modèles pré-entraînés, un défi important pour l’IA actuelle. Lors des tests initiaux, Dragon Hatchling a fonctionné de manière similaire à GPT-2 sur les tâches standard de modélisation et de traduction du langage, bien qu’il s’agisse d’un prototype. Cela suggère que l’architecture a le potentiel d’évoluer et de rivaliser avec les LLM établis.

Implications pour l’AGI

La capacité d’apprendre en continu et de s’adapter en temps réel est une étape essentielle vers l’AGI. L’IA actuelle a du mal à gérer la nouveauté et échoue souvent lorsqu’elle est confrontée à des entrées inattendues. L’architecture dynamique de Dragon Hatchling pourrait surmonter cette limitation, permettant à l’IA de raisonner, d’apprendre et de s’adapter comme les humains.

Perspectives d’avenir

Le développement de Dragon Hatchling marque un changement important dans l’architecture de l’IA. Bien qu’il en soit encore à ses débuts, ce modèle démontre le potentiel de l’IA pour aller au-delà de l’apprentissage statique et vers une forme d’intelligence plus dynamique et proche de l’humain. De nouvelles recherches et développements seront essentiels pour libérer pleinement ses capacités et explorer ses implications pour l’avenir de l’IA.

La capacité de créer une IA qui apprend et s’adapte comme le cerveau humain pourrait révolutionner des domaines allant de la découverte scientifique à la résolution de problèmes quotidiens. L’émergence d’architectures comme Dragon Hatchling suggère que le chemin vers l’AGI pourrait être plus proche qu’on ne l’imaginait auparavant.