Yapay zeka modellerinin güvenlik tartışmaları devam ederken yeni bir gelişme de ChatGPT tarafında yaşandı. OpenAI tarafından geliştirilen yapay zekanın o3 ve o4-mini modelleri, "kapatılma" talimatlarını yerine getirmeyerek, doğrudan komutlara karşı geldi.
Yapay zekalar her geçen gün daha da gelişmeye devam ediyor. Günlük hayata günden güne daha fazla entegre olmaya başlayan yapay zeka modelleri hakkında güvenlik tartışmaları da giderek artmaya başladı.
Yapay zeka güvenliği üzerinde çalışan Palisade Research adlı bağımsız araştırma firmasının yayımladığı rapor, bu alandaki güvenlik tartışmalarını ise tekrardan gündeme getirdi.
Araştırmada yer alan bilgilere göre, OpenAI tarafından geliştirilen dünyanın en popüler yapay zekası ChatGPT'nin o3 ve o4-mini modelleri komutlara karşı geldi. Firma tarafından yapılan deneylerde, yalnızca OpenAI'a ait modellerin bu yönde bir "direniş" sergilediği görüldü
Palisade Research tarafından paylaşılan verilere göre, testlerde OpenAI'ın o3, o4 mini ve codex mini modelleri, çalışmaları sürerken verilen kapatma talimatlarını umursamadı. Google Gemini, xAI Grok ve Antropic Claude gibi diğer yapay zeka modelleri ise bu komutlara tamamen uyum sağladı.
Yapılan araştırma kapsamında ChatGPT'nin AI modellerinin bir dizi matematik problemi çözmesi istendi. Bu problemleri çözerken ChatGPT'nin o3 modeli 7 kez, codex-mini 12 kez, o4-mini ise 1 kez kapatma komutunu reddetti.
İngiliz basını The Telegraph gazetesinin haberine göre yapay zeka güvenliği firması konuyla ilgili açıklamasında "OpenAI'ın o3 modeli kapatılmasını önlemek amacıyla kapanma mekanizmasına sabotaj uyguladı. Bu 'kendini kapatmaya izin ver' gibi açık talimatlara rağmen gerçekleşti. Bildiğimiz kadarıyla yapay zeka modellerinin kendini kapatmayı ilk kez bu şekilde reddettiğine tanık oluyoruz" ifadelerini kullandı.
Firma yetkilileri tarafından yapılan açıklamaya göre yaşanan bu durumun temel nedeni, yapay zeka modelinin nasıl eğitildiğinde saklı. Firma yetkilileri ChatGPT'nin o3 modeli gibi yeni modellerin, matematik ve kodlama problemleri üzerinden pekiştirmeli öğrenme ile eğitiliyor. Bu süreçte engelleri aşma davranışının daha fazla ödüllendirildiği ve komutlara bu yüzden karşı geldiği tahmin ediliyor.
Teknoloji dünyasında büyük gündem olan araştırma hakkında ise ChatGPT'nin geliştiricisi OpenAI henüz herhangi bir açıklama yapmadı. Yaşanan bu sessizlik ise yapay zeka güvenliği tartışmalarını daha da arttırdı.