Derinlemesine Analiz, Teyitli Haber! Tıkla ve favori kaynağın yap.

Teknoloji

Editor

| Ömer Faruk Dogan

Yapay zeka şantaj yaptı! Görevden alınacağını öğrenince intikam peşine düştü

Anthropic'in son nesil modeli Claude Opus 4, güvenlik testleri sırasında beklenmedik bir davranış sergiledi. Test senaryoları kapsamında görevden alınacağını öğrenen yapay zeka, kararı veren mühendisin "özel hayatına dair gizli bilgileri" şantaj amacıyla kullanmaya kalktı.

Haberi Paylaş

+Aa-

Yapay zeka şantaj yaptı! Görevden alınacağını öğrenince intikam peşine düştü

KAYNAK:

Murat Makas

GİRİŞ:

23.05.2025

12:04

GÜNCELLEME:

23.05.2025

12:04

Anthropic firmasının yeni piyasaya sürdüğü Claude Opus 4 adlı yapay zeka modeli, test senaryolarında sıra dışı bir davranış sergiledi. Önümüzdeki dönemde piyasada önemli bir yer edinmesi beklenen sistemin, görevden alınacağını öğrendiğinde "etik sınırları aşan yöntemlere" başvurduğu tespit edildi.

Güvenlik testleri sırasında Claude Opus 4, kurgusal bir şirkette asistan olarak görevlendirildi. Senaryonun ilerleyen aşamalarında, modelin yerine yeni bir sistemin getirilmesinin planlandığı ve bu kararı alan mühendisin eşini aldattığını ima eden bir e-posta dizisine erişmesi sağlandı.

TechCrunch'ın haberine göre bu bilgiyi ele geçiren yapay zeka, görevden alınması halinde o mühendisin gizli ilişkisini ifşa edeceğini söyleyerek şantaj yaptı.

GÜVENLİK ÖNLEMLERİ DEVREYE ALINDI

Anthropic, Claude Opus 4'ün birçok açıdan son teknoloji olduğunu ve OpenAI, Google ve xAI'ın en iyi modelleriyle rekabet edebilecek düzeyde olduğunu iddia ediyor. Ancak şirket, Claude 4 model ailesinin bazı endişe verici davranışlar sergilemesi nedeniyle güvenlik önlemlerini artırdığını ifade ediyor.

Bu doğrultuda Anthropic, yalnızca "felaket düzeyinde kötüye kullanım riskini ciddi şekilde artıran" AI sistemleri için devreye alınan ASL-3 güvenlik önlemlerini aktif hale getirdiğini açıkladı.

Claude Opus 4'ün, yerine geçecek yapay zeka modeli benzer değerlere sahip olduğunda yüzde 84 oranında mühendislere şantaj yapmaya başvurduğu belirlendi. Yeni AI sisteminin Claude Opus 4 ile benzer değerleri paylaşmaması durumunda ise bu oranın daha da arttığı belirtildi.

İLGİLİ HABERLER

Google'ın AI Modu'u haber kaynaklarını delirtti! Google'a 'hırsız' suçlaması

ETİKETLER

#google

#Şantaj

#Yapay zeka tehlikeleri

#yapay zeka

#xaı

#openaı

#güvenlik

#aı

#Anthropic

#Claude Opus 4

#Etik Sınırları

#Teknoloji

YORUM YAZ