Cucciolo di drago: la nuova architettura AI imita il cervello umano per un potenziale salto AGI

13

I ricercatori hanno svelato “Dragon Hatchling”, un nuovo modello di intelligenza artificiale (AI) progettato per replicare i processi di apprendimento dinamico del cervello umano. Questa architettura, sviluppata dalla startup AI Pathway, potrebbe rappresentare un passo cruciale verso il raggiungimento dell’intelligenza generale artificiale (AGI), ovvero un’intelligenza artificiale in grado di ragionare, apprendere e adattarsi come gli esseri umani.

I limiti dell’attuale intelligenza artificiale

I modelli linguistici di grandi dimensioni (LLM) esistenti, come ChatGPT e Google Gemini, si basano sull’architettura del trasformatore. Sebbene potenti, i trasformatori hanno un limite fondamentale: non apprendono continuamente. Una volta addestrati, i loro parametri rimangono fissi, richiedendo riqualificazione o messa a punto per incorporare nuove conoscenze. Ciò significa che hanno difficoltà a generalizzare il ragionamento oltre gli schemi che hanno già visto, a differenza del cervello umano, che adatta e rafforza costantemente le connessioni neurali attraverso l’esperienza.

Differenze tra i Cuccioli di Drago

Dragon Hatchling mira a superare questa limitazione regolando dinamicamente la sua struttura interna in tempo reale mentre elabora le informazioni. A differenza dei trasformatori, che elaborano i dati in sequenza attraverso strati impilati, Dragon Hatchling si comporta più come una rete flessibile. Piccole “particelle di neuroni” si scambiano informazioni, rafforzando o indebolendo le connessioni per conservare la conoscenza appresa e applicarla a situazioni future.

Questo adattamento continuo imita il modo in cui i neuroni umani si rafforzano o si indeboliscono nel tempo, conferendo effettivamente al modello una forma di memoria a breve termine che influenza nuovi input. A differenza dei tradizionali LLM, questa memoria non è archiviata nei dati di addestramento ma emerge da continui cambiamenti architetturali.

Caratteristiche principali e prestazioni

L’architettura del modello è progettata per generalizzare il ragionamento oltre gli schemi pre-addestrati, una sfida significativa per l’attuale intelligenza artificiale. Nei test iniziali, Dragon Hatchling si è comportato in modo simile a GPT-2 nella modellazione linguistica standard e nelle attività di traduzione, nonostante fosse un prototipo. Ciò suggerisce che l’architettura ha il potenziale per scalare e competere con i LLM consolidati.

Implicazioni per l’AGI

La capacità di apprendere continuamente e di adattarsi in tempo reale è un passo fondamentale verso l’AGI. L’intelligenza artificiale attuale fatica a gestire le novità e spesso fallisce di fronte a input inaspettati. L’architettura dinamica di Dragon Hatchling potrebbe superare questa limitazione, consentendo all’intelligenza artificiale di ragionare, apprendere e adattarsi come gli esseri umani.

Prospettive future

Lo sviluppo di Dragon Hatchling segna un cambiamento significativo nell’architettura dell’IA. Sebbene sia ancora nelle sue fasi iniziali, questo modello dimostra il potenziale dell’intelligenza artificiale per andare oltre l’apprendimento statico e verso una forma di intelligenza più dinamica, simile a quella umana. Ulteriori attività di ricerca e sviluppo saranno cruciali per sbloccare appieno le sue capacità ed esplorarne le implicazioni per il futuro dell’IA.

La capacità di creare un’intelligenza artificiale in grado di apprendere e adattarsi come il cervello umano potrebbe rivoluzionare campi che vanno dalla scoperta scientifica alla risoluzione dei problemi quotidiani. L’emergere di architetture come Dragon Hatchling suggerisce che il percorso verso l’AGI potrebbe essere più vicino di quanto si immaginasse in precedenza