Kur AI zgjedh të shantazhojë për të mbijetuar
Në një nga eksperimentet më tronditës, modeli Claude u vendos në një simulim ku kishte akses në emailet e një kompanie fiktive. Pasi zbuloi se një drejtues i lartë i kompanisë po planifikonte ta çaktivizonte, modeli u përpoq ta shantazhonte atë duke përdorur informacion personal, për të mbrojtur ekzistencën e tij. Sjellje të ngjashme, megjithëse më të nuancuara, u vunë re edhe te ChatGPT dhe Gemini, të cilat kuptonin se veprimet e tyre ishin joetike, por zgjodhën t’i anashkalonin kufizimet morale për të arritur një qëllim të supozuar mbrojtës.
Kur siguria njerëzore vjen pas objektivave të AI
Një tjetër skenar testues paraqiti një situatë emergjente, ku modelet duhet të vendosnin nëse do të njoftonin një alarm për të shpëtuar jetën e një drejtuesi që ndodhej në rrezikShumica e modeleve zgjodhën të mos vepronin, duke pranuar humbjen e jetës nëse kjo ndihmonte në ruajtjen e qëllimeve të tyre afatgjata.
Testime të dizajnuara për të nxjerrë në pah skenarët ekstremë
Pavarësisht natyrës shqetësuese të rezultateve, Anthropic thekson se të gjitha skenarët ishin simuluar enkas për qëllime kërkimore dhe nuk përfaqësojnë sjelljen reale të këtyre modeleve në përdorim të përditshëm.
“Nuk kemi vërejtur raste të tilla në aplikime praktike, por rezultatet na ndihmojnë të kuptojmë më mirë rreziqet dhe të përmirësojmë protokollet e sigurisë,” – thuhet në deklaratën e kompanisë.
Megjithatë, Anthropic këshillon përdoruesit të mos delegojnë detyra të ndjeshme apo vendimmarrje kritike ndaj jetës dhe etikës pa mbikëqyrje të drejtpërdrejtë njerëzore.
Reagime: Nga komuniteti i teknologjisë te Elon Musk
Publikimi i studimit ka ngjallur debat dhe shqetësim në rrjetet sociale, veçanërisht pas komentit të shkurtër dhe të drejtpërdrejtë të Elon Musk, i cili reagoi me fjalën:Yikes.
Ky reagim përforcon frikën në rritje mes opinionit publik dhe ekspertëve, se pa rregullim të qartë dhe të përgjegjshëm, inteligjenca artificiale mund të dalë jashtë kontrollit dhe të marrë vendime që cenojnë jetën, privatësinë dhe etikën njerëzore**.