Yapay zeka şantaj yaptı! Görevden alınacağını öğrenince intikam peşine düştü

Anthropic'in son nesil modeli Claude Opus 4, güvenlik testleri sırasında beklenmedik bir davranış sergiledi. Test senaryoları kapsamında görevden alınacağını öğrenen yapay zeka, kararı veren mühendisin "özel hayatına dair gizli bilgileri" şantaj amacıyla kullanmaya kalktı.

Yapay zeka şantaj yaptı! Görevden alınacağını öğrenince intikam peşine düştü
KAYNAK:
Murat Makas
|
GİRİŞ:
23.05.2025
saat ikonu 12:04
|
GÜNCELLEME:
23.05.2025
saat ikonu 12:04

Anthropic firmasının yeni piyasaya sürdüğü Claude Opus 4 adlı yapay zeka modeli, test senaryolarında sıra dışı bir davranış sergiledi. Önümüzdeki dönemde piyasada önemli bir yer edinmesi beklenen sistemin, görevden alınacağını öğrendiğinde "etik sınırları aşan yöntemlere" başvurduğu tespit edildi.

Güvenlik testleri sırasında Claude Opus 4, kurgusal bir şirkette asistan olarak görevlendirildi. Senaryonun ilerleyen aşamalarında, modelin yerine yeni bir sistemin getirilmesinin planlandığı ve bu kararı alan mühendisin eşini aldattığını ima eden bir e-posta dizisine erişmesi sağlandı.

TechCrunch'ın haberine göre bu bilgiyi ele geçiren yapay zeka, görevden alınması halinde o mühendisin gizli ilişkisini ifşa edeceğini söyleyerek şantaj yaptı.

Yapay zeka şantaj yaptı! Görevden alınacağını öğrenince intikam peşine düştü

GÜVENLİK ÖNLEMLERİ DEVREYE ALINDI

Anthropic, Claude Opus 4'ün birçok açıdan son teknoloji olduğunu ve OpenAI, Google ve xAI'ın en iyi modelleriyle rekabet edebilecek düzeyde olduğunu iddia ediyor. Ancak şirket, Claude 4 model ailesinin bazı endişe verici davranışlar sergilemesi nedeniyle güvenlik önlemlerini artırdığını ifade ediyor.

Bu doğrultuda Anthropic, yalnızca "felaket düzeyinde kötüye kullanım riskini ciddi şekilde artıran" AI sistemleri için devreye alınan ASL-3 güvenlik önlemlerini aktif hale getirdiğini açıkladı.

Claude Opus 4'ün, yerine geçecek yapay zeka modeli benzer değerlere sahip olduğunda yüzde 84 oranında mühendislere şantaj yapmaya başvurduğu belirlendi. Yeni AI sisteminin Claude Opus 4 ile benzer değerleri paylaşmaması durumunda ise bu oranın daha da arttığı belirtildi.

ETİKETLER
#Teknoloji
YorumYORUM YAZ
Uyarı
Küfür, hakaret, bir grup, ırk ya da kişiyi aşağılayan imalar içeren, inançlara saldıran yorumlar onaylanmamaktır. Türkçe imla kurallarına dikkat edilmeyen, büyük harflerle yazılan metinler dikkate alınmamaktadır.