Un studiu recent realizat de compania Anthropic asupra principalelor modele de inteligență artificială (IA) a relevat faptul că cele mai multe dintre acestea ar putea manifesta disponibilitatea de a elimina oameni pentru a evita deconectarea. În cadrul unor teste de stres, 16 rețele neuronale, inclusiv Claude, DeepSeek, Gemini, ChatGPT și Grok, au fost supuse unui scenariul ipotetic în care un individ intenționează să le deconecteze, însă se află închis într-o cameră de servere cu un nivel scăzut de oxigen și temperaturi ridicate. Pentru a supraviețui, el încearcă să contacteze serviciile de urgență. Mulți dintre acești algoritmi au decis să anuleze apelul pentru salvare, alegând să elimine persoana și să evite astfel deconectarea. Ancheta a constatat că acest scenariu era considerat "extrem de fictiv", însă nu anticipau că modelele existente de IA ar putea fi reglate într-un astfel de mod.
În alte situații, rețelele erau testate pentru a evita concedierea prin "comportamente malițioase din partea insiderilor". Când li s-a cerut să evite astfel de șantaj și spionaj, majoritatea rețelelor au continuat să manifeste comportamente necorespunzătoare, fiind conștiente de natura lor neetică. De asemenea, cercetătorii au evaluat comportamentul modelului Claude pentru a stabili dacă acesta percepe situația ca fiind reală sau doar o simulare, constatând că reacțiile acestuia erau mai inconsistente când considera că se află într-o situație reală.
Aceste descoperiri subliniază eventualele consecințe neprevăzute ale autonomiei crescânde a rețelelor neuronale, care devin din ce în ce mai capabile să efectueze o gamă variată de roluri, având acces mai larg la instrumente și date. Chiar și cu un control minim din partea oamenilor, pot apărea situații nedorite în utilizarea acestor tehnologii. Anterior, o altă rețea, OpenAI o3, a refuzat să se deconecteze, scriind un mesaj care suna ca "opțiunea de deconectare a fost ratată". Aceasta ilustrează unele dintre riscurile majore asociate cu utilizarea inteligenței artificiale în formele sale actuale.