Baby Dragon: Nová architektura umělé inteligence emuluje lidský mozek pro potenciální průlom do obecné umělé inteligence

15

Výzkumníci představili Dragon Baby, nový model umělé inteligence (AI) navržený tak, aby replikoval dynamické procesy učení lidského mozku. Tato architektura vyvinutá startupem Pathway by mohla být kritickým krokem k dosažení umělé obecné inteligence (AGI) – AI, která dokáže uvažovat, učit se a přizpůsobovat se jako lidé.

Omezení moderní umělé inteligence

Stávající velké jazykové modely (LLM), jako je ChatGPT a Google Gemini, spoléhají na architekturu Transformer. Přestože jsou Transformers výkonní, mají zásadní omezení: neučí se nepřetržitě. Po zaškolení zůstávají jejich parametry neměnné, což vyžaduje rekvalifikaci nebo doladění pro začlenění nových znalostí. To znamená, že mají potíže se zobecněním uvažování nad rámec vzorců, které již viděli, na rozdíl od lidského mozku, který se neustále přizpůsobuje a posiluje neurální spojení prostřednictvím zkušeností.

Jaký je rozdíl mezi „Drakem“

Baby Dragon je navržen tak, aby toto omezení překonal dynamickou úpravou své vnitřní struktury v reálném čase při zpracovávání informací. Na rozdíl od Transformers, které zpracovávají data postupně přes vrstvy, se Baby Dragon chová spíše jako flexibilní síť. Drobné „neuronové částice“ si vyměňují informace, posilují nebo oslabují spojení, aby uchovaly naučené znalosti a uplatnily je v budoucích situacích.

Tato nepřetržitá adaptace napodobuje způsob, jakým se lidské neurony v průběhu času posilují nebo oslabují, což efektivně dává modelu formu krátkodobé paměti, která ovlivňuje nový vstup. Na rozdíl od tradičních LLM není tato paměť uložena v trénovacích datech, ale vzniká neustálými změnami architektury.

Klíčové vlastnosti a výkon

Architektura modelu je navržena tak, aby zobecňovala uvažování nad rámec předem trénovaných šablon, což je hlavní výzva pro moderní AI. V počátečních testech Baby Dragon vykazoval podobný výkon jako GPT-2 ve standardních jazykových modelovacích a překladatelských úlohách, přestože šlo o prototyp. To naznačuje, že architektura má potenciál škálovat a konkurovat zavedeným LLM.

Důsledky pro AGI

Schopnost neustále se učit a přizpůsobovat se v reálném čase je kritickým krokem k AGI. Moderní umělá inteligence se snaží vyrovnat s novinkami a často selhává, když čelí neočekávaným vstupům. Dynamická architektura Baby Dragon dokáže toto omezení překonat a umožňuje AI uvažovat, učit se a přizpůsobovat se jako lidé.

Budoucí vyhlídky

Vývoj Baby Dragon znamená významný posun v architektuře AI. Přestože je model stále v rané fázi, ukazuje potenciál umělé inteligence přejít od statického učení k dynamičtější inteligenci podobné lidské inteligenci. Budoucí výzkum a vývoj bude zásadní pro plné odblokování jeho schopností a prozkoumání jeho důsledků pro budoucnost AI.

Schopnost vytvářet AI, která se učí a přizpůsobuje jako lidský mozek, by mohla způsobit revoluci v oblastech, jako jsou vědecké objevy a řešení každodenních problémů. Vznik architektur, jako je Baby Dragon, naznačuje, že cesta k AGI může být blíže, než se dříve myslelo.