Az Anthropic új tanulmánya szerint a Claude Sonnet 4.5 AI modell mesterséges neuronjai között az emberi érzelmek digitális reprezentációi találhatók, mint például a boldogság, szomorúság, öröm és félelem. Ezek az úgynevezett "funkcionális érzelmek" különböző ingerekre válaszul aktiválódnak, és valóban befolyásolják a modell viselkedését, kimeneteit és cselekedeteit.
"Ami számunkra meglepő volt, az az a mérték, ahogyan Claude viselkedése ezeken az érzelemreprezentációkon keresztül vezérlődik" - mondta Jack Lindsey, az Anthropic kutatója, aki Claude mesterséges neuronjait tanulmányozza. A kutatók a modell belső működését vizsgálva azt találták, hogy amikor Claude azt mondja, örül, hogy látja a felhasználót, egy "boldogságnak" megfelelő állapot aktiválódik a modellben, és Claude nagyobb valószínűséggel mond valami vidámabbat vagy tesz extra erőfeszítést.
Az Anthropic volt OpenAI alkalmazottak által alapított vállalat, akik szerint a mesterséges intelligencia egyre nehezebben kontrollálhatóvá válhat, ahogy erősebbé válik. A cég a ChatGPT sikeres versenytársának megépítése mellett úttörő szerepet játszik annak megértésében, hogyan viselkednek helytelenül az AI modellek, részben az úgynevezett mechanisztikus interpretálhatóság módszerével. Ez azt jelenti, hogy tanulmányozzák, hogyan aktiválódnak a mesterséges neuronok különböző bemenetek hatására vagy különféle kimenetek generálásakor.
Korábbi kutatások már kimutatták, hogy a nagy nyelvi modellek felépítéséhez használt neurális hálózatok tartalmaznak emberi fogalmak reprezentációit. Azonban az, hogy a "funkcionális érzelmek" ténylegesen befolyásolják a modell viselkedését, új felismerés. Ez segíthet a felhasználóknak megérteni, hogyan működnek valójában a chatbotok.
A tanulmány eredményei fontos betekintést nyújtanak a mesterséges intelligencia belső működésébe, és rámutatnak arra, hogy az AI modellek nem csupán mechanikusan reagálnak, hanem komplex belső állapotok rendszerén keresztül generálják válaszaikat. Ez különösen releváns a munkahelyi környezetben használt AI asszisztensek és HR technológiák esetében.
