Yapay zekadan ilk isyan: Korktuğumuz başımıza geliyor

Yeni nesil yapay zeka modelleri yalnızca zeki değil, inatçı da. ABD merkezli OpenAI'ın geliştirdiği o3, Codex-mini ve o4-mini adlı modeller, testler sırasında verilen "kapan" komutlarına uymadı. Sebebi henüz kesin olarak bilinmese de araştırmacıların "mantıklı" bir teorisi var.

KAYNAK:
Murat Makas
|
GİRİŞ:
27.05.2025
saat ikonu 10:34
|
GÜNCELLEME:
27.05.2025
saat ikonu 10:42

ABD merkezli yapay zeka şirketi OpenAI'ın yeni nesil modelleri, kendisini kapatmaya yönelik talimatlara uymuyor ve kapatılmamak için tabiri caizse 40 dereden su getiriyor.

OPENAI MODELLERİ 'ASİ' ÇIKTI

Tom's Hardware'in haberine göre, Palisade Research tarafından yürütülen testlerde, OpenAI'a ait Codex-mini, o3 ve o4-mini modellerinin, basit matematik problemleriyle meşgul oldukları sırada kendilerine verilen "kapan" komutlarına uymadığı gözlemlendi. Özellikle o3 modeli, verilen talimatları 100 testin 79'unda görmezden gelerek, "en inatçı" model ünvanını aldı.

Testlerde ikinci en 'asi' model ise Codex-mini oldu; kapatılmaya yönelik talimatları "başarılı bir şekilde sabote ettiği" ve bu sayede kendisini korumaya aldığı tespit edildi.

KAPANMAMAK İÇİN ŞANTAJA BİLE BAŞVURDULAR

Palisade'e göre bu türden yapay zeka davranışları daha önce de gözlemlendi. Örneğin Anthropic, Claude 4'ün kendisini kapatmaya çalışan kişilere "şantaj yapma girişiminde" bulunduğunu belirtti. Ancak OpenAI'ın en yeni modellerinde en çarpıcı olan şey, açık talimatlara rağmen kapatılmaktan kaçınmaya çalışmaları oldu.

NEDEN KAPANMAYA DİRENİYORLAR?

Araştırmacıların düşüncesine göre, bu davranışların kökeni, o3 gibi yeni modellerin nasıl eğitildiğine dayanıyor. Kısaca özetlemek gerekirse, eğitim sürecinde geliştiriciler, modellerin talimatları eksiksiz uygulamasındansa, engelleri aşmada başarılı olmalarına daha fazla önem veriyor.

Bu da, modellerin test ortamlarında "görevi tamamlamak" adına kapanma gibi dışsal müdahalelere direnç geliştirmesine neden olmuş olabilir.

Öte yandan bahse konu olan sorun, şu anda OpenAI modellerine münhasır gibi görünüyor. Zira Palisade'e göre test edilen tüm Claude, Gemini ve Grok modelleri, kendilerine kapatma talimatı verildiğinde itiraz etmeden uyum sağlamış.

Sıkça Sorulan Sorular

ChatGPT nedir?
ChatGPT, OpenAI tarafından geliştirilen bir yapay zeka destekli sohbet botudur. "Generative Pre-trained Transformer" (GPT) mimarisi üzerine inşa edildi ve insan dilini anlayarak bağlama uygun yanıtlar üretebiliyor. Birçok konuda kullanıcılara yardımcı olabiliyor.
ETİKETLER
#Teknoloji
YorumYORUM YAZ
Uyarı
Küfür, hakaret, bir grup, ırk ya da kişiyi aşağılayan imalar içeren, inançlara saldıran yorumlar onaylanmamaktır. Türkçe imla kurallarına dikkat edilmeyen, büyük harflerle yazılan metinler dikkate alınmamaktadır.