Naukowcy zaprezentowali Dragon Baby, nowy model sztucznej inteligencji (AI), zaprojektowany w celu odtworzenia dynamicznych procesów uczenia się ludzkiego mózgu. Architektura ta, opracowana przez start-up Pathway, może być kluczowym krokiem w kierunku osiągnięcia sztucznej inteligencji ogólnej (AGI), czyli sztucznej inteligencji, która potrafi rozumować, uczyć się i dostosowywać jak ludzie.
Ograniczenia współczesnej sztucznej inteligencji
Istniejące duże modele językowe (LLM), takie jak ChatGPT i Google Gemini, opierają się na architekturze Transformer. Chociaż Transformatory są potężne, mają podstawowe ograniczenie: nie uczą się w sposób ciągły. Po szkoleniu ich parametry pozostają niezmienne i wymagają przekwalifikowania lub dostrojenia w celu uwzględnienia nowej wiedzy. Oznacza to, że mają trudności z uogólnianiem rozumowania wykraczającego poza wzorce, które już widzieli, w przeciwieństwie do ludzkiego mózgu, który stale dostosowuje się i wzmacnia połączenia neuronowe poprzez doświadczenie.
Jaka jest różnica między „Małym Smokiem”
Baby Dragon został zaprojektowany tak, aby przezwyciężyć to ograniczenie poprzez dynamiczne dostosowywanie swojej wewnętrznej struktury w czasie rzeczywistym podczas przetwarzania informacji. W przeciwieństwie do Transformers, które przetwarzają dane sekwencyjnie przez warstwy, Baby Dragon zachowuje się bardziej jak elastyczna sieć. Malutkie „cząsteczki neuronowe” wymieniają informacje, wzmacniając lub osłabiając połączenia, aby przechowywać wyuczoną wiedzę i stosować ją w przyszłych sytuacjach.
Ta ciągła adaptacja naśladuje sposób, w jaki ludzkie neurony wzmacniają się lub słabną w czasie, skutecznie nadając modelowi formę pamięci krótkotrwałej, która wpływa na nowe dane wejściowe. W przeciwieństwie do tradycyjnych LLM, pamięć ta nie jest przechowywana w danych szkoleniowych, ale powstaje w wyniku ciągłych zmian architektonicznych.
Kluczowe funkcje i wydajność
Architektura modelu została zaprojektowana tak, aby uogólniać rozumowanie wykraczające poza wstępnie wytrenowane szablony, co stanowi główne wyzwanie dla współczesnej sztucznej inteligencji. We wstępnych testach Baby Dragon wykazał podobną wydajność do GPT-2 w standardowych zadaniach związanych z modelowaniem języka i tłumaczeniem, mimo że był prototypem. Sugeruje to, że architektura ma potencjał skalowania i konkurowania z uznanymi LLM.
Implikacje dla AGI
Zdolność do ciągłego uczenia się i dostosowywania się w czasie rzeczywistym jest kluczowym krokiem w kierunku AGI. Współczesna sztuczna inteligencja ma trudności z radzeniem sobie z nowościami i często zawodzi w obliczu nieoczekiwanych danych wejściowych. Dynamiczna architektura Baby Dragon może pokonać to ograniczenie, umożliwiając sztucznej inteligencji rozumowanie, uczenie się i dostosowywanie jak ludzie.
Perspektywy na przyszłość
Rozwój Baby Dragon oznacza znaczącą zmianę w architekturze sztucznej inteligencji. Chociaż model jest wciąż na wczesnym etapie, pokazuje on potencjał sztucznej inteligencji w zakresie przejścia od uczenia się statycznego do bardziej dynamicznej inteligencji przypominającej ludzką. Przyszłe badania i rozwój będą miały kluczowe znaczenie dla pełnego odblokowania jego możliwości i zbadania jego konsekwencji dla przyszłości sztucznej inteligencji.
Możliwość stworzenia sztucznej inteligencji, która uczy się i dostosowuje jak ludzki mózg, może zrewolucjonizować takie obszary, jak odkrycia naukowe i rozwiązywanie codziennych problemów. Pojawienie się architektur takich jak Baby Dragon sugeruje, że droga do AGI może być bliższa, niż wcześniej sądzono.




























