Modelele AI mai vechi prezintă semne de declin cognitiv

Modelele AI mai vechi prezintă semne de declin cognitiv, conform unui nou studiu

Distribuie

Tehnologiile de inteligență artificială (AI), așa cum sunt modelele lingvistice mari (LLM) sau chatboții, la fel ca oamenii, prezintă semne de deteriorare a abilităților cognitive prin îmbătrânire, conform unui studiu publicat la sfârșitul anului trecut în British Medical Journal (BMJ), transmite luni Live Science.

Oamenii sunt din ce în ce mai dependenți de inteligența artificială (AI) pentru diagnostice medicale datorită rapidității cu care aceste sisteme pot depista anumite anomalii și simptome în istoricul medical al pacienților, în radiografii și în alte teste și analize, înainte de instalarea unor simptome. Însă conform acestui studiu, AI-ul este departe de a fi infailibil, fiind expus declinului cognitiv.

‘Rezultatele acestei cercetări contestă ipoteza că inteligența artificială îi va înlocui în curând pe medicii umani’, conform autorilor studiului care arată că ‘declinul cognitiv devenit evident în cazul unor chatboți de vârf le poate afecta precizia în diagnoza medicală și poate submina încrederea pacienților’.

Cercetătorii au testat chatboți LLM disponibili public, printre care ChatGPT al OpenAI, Sonnet dezvoltat de Anthropic și Gemini, dezvoltat de Alphabet, folosind testul Montreal Cognitive Assessment (MoCA) – o serie de teste folosite de neurologi pentru a evalua atenția, memoria, limbajul, abilitățile spațiale și funcțiile mentale de execuție.

MoCA este folosit în mod obișnuit pentru a evalua sau testa apariția declinului cognitiv în maladii precum demența. Subiecții primesc o serie de sarcini cum ar fi desenarea unei anumite ore pe un ceas, să pornească de la 100 și să scadă în mod repetat numărul 7, să-și amintească cuvinte de pe o listă și așa mai departe. În cazul oamenilor, un punctaj de 26 dintr-un maxim de 30 de puncte este considerat un punctaj de trecere (subiectul nu suferă de declin cognitiv).

În timp ce unele puncte ale testării, cum ar fi denumirea, atenția, limbajul și capacitatea de abstractizare au fost aparent ușoare pentru majoritatea LLM-urilor utilizate, toate au avut rezultate slabe în abilitățile vizuale/spațiale și în sarcinile de execuție, unele având rezultate mai proaste decât altele în domenii precum memoria întârziată.

În mod esențial, în timp ce cea mai recentă versiune a ChatGPT (versiunea 4) a obținut cel mai mare punctaj (26 din 30), programul Gemini 1.0 LLM a obținut doar 16, ceea ce duce la concluzia că LLM-urile mai vechi prezintă semne de declin cognitiv.

Autorii studiului notează că descoperirile lor sunt doar observaționale – diferențele critice între modurile în care funcționează AI și mintea umană înseamnă că experimentul nu poate constitui o comparație directă. Dar ei avertizează că cercetarea ar putea indica ceea ce ei numesc o ‘zonă semnificativă de slăbiciune’ care ar putea frâna implementarea AI în medicina clinică. Mai exact, ei au argumentat împotriva utilizării AI în sarcini care necesită abstracție vizuală și funcție executivă.

De asemenea, rezultatele studiului ridică o perspectivă oarecum amuzantă; neurologii umani ar putea prelua o clientelă cu totul nouă – sistemele AI care prezintă semne de declin cognitiv.

Citește și ChatGPT, disponibil pentru apeluri telefonice şi mesaje text