OpenAI, yapay zeka alanındaki en iddialı hamlelerinden birini gerçekleştirdi ve ChatGPT'yi, kullanıcıların çok çeşitli bilgisayar tabanlı görevleri yerine getirebilecek bir ajana dönüştürdü. Şirket, "ChatGPT Agent" adlı yeni aracın, kullanıcıların takvimlerini yönetmekten, düzenlenebilir sunumlar oluşturmak ve karmaşık kodları çalıştırmaya kadar pek çok işi otomatik olarak gerçekleştirmesini sağlayabileceğini duyurdu.
'ChatGPT Agent'ı kısaca, OpenAI'ın daha önce piyasaya sürdüğü ajanlarının birleşimi olarak özetleyebiliriz. Örneğin Operator'un web sitelerinde gezinme yeteneği ve Deep Research'ün birçok web sitesinden bilgi sentezleyip kısa bir araştırma raporu oluşturma yeteneği bir arada kullanılabiliyor.
Ayrıca OpenAI, kullanıcıların "ChatGPT Agent" ile doğal dilde komutlar vererek etkileşime girebileceğini söylüyor.
ChatGPT Agent, OpenAI'ın Pro, Plus ve Team planlarına abone olan kullanıcılara sunulmaya başlanmış durumda. ChatGPT'nin araçlar menüsünde yer alan "Agent Mode" seçeneğini aktifleştirerek ajanı kullanabilirsiniz.
ChatGPT Agent'in lansmanı, OpenAI'ın ChatGPT'yi sadece soru cevaplamakla kalmayıp, kullanıcılar için eyleme geçebilecek ve görevleri devralabilecek bir ürün haline getirmedeki en iddialı girişimi olarak öne çıkıyor. Son birkaç yılda, OpenAI, Google ve Perplexity gibi ABD merkezli şirketler, tam da bunu vaat eden birçok YZ ajanı tanıttılar.
ChatGPT Agent, kullanıcıların Gmail ve GitHub gibi uygulamaları bağlamasına olanak tanıyan ChatGPT bağlantılarına erişebiliyor. Böylece vermiş olduğunuz talimatlardan yola çıkarak ilgili bilgileri bulabiliyor. OpenAI ayrıca, ajanın bir terminal erişimine sahip olduğunu ve belirli uygulamalara erişmek için API'leri kullanabileceğini söylüyor.
Örneğin uygulamayı "dört kişilik bir Japon kahvaltısı yapmak için malzemeleri planlayıp satın almak" veya "üç rakibi analiz edip bir sunum hazırlamak" gibi görevler için kullanabilirsiniz. ChatGPT Agent, isteklerinizi yerine getirmek için web sitelerini tarıyor, bir eylem planı oluşturuyor ve gerekli olan bütün araçları otomatik olarak kullanabiliyor.
OpenAI'a göre ChatGPT Agent modeli, yüzden fazla konuda binlerce sorudan oluşan zor bir test olan Humanity's Last Exam (pass@1) sınavında yüzde 41,6 puan (o3 ve o4-mini modellerinin aldığı puanların iki katı) almış durumda. Uygulamanın, FrontierMath adlı matematik testinde ise yüzde 27,4 puan aldığı belirtildi (o4-mini ise yüzde 6,3 puan almıştı).
OpenAI, ChatGPT Agent'i geliştirirken güvenliği sıkı tuttuğunu, çünkü ürünün kötü niyetli bir kişinin elinde çok tehlikeli hale gelebilecek bazı özelliklere sahip olduğunu belirtiyor. Şirket daha önce yapay zeka ajanlarının birtakım tehlikeleri konusunda uyarılar yapmıştı.
ChatGPT Agent için alınan güvenlik önlemleri arasında, kullanıcıların ürünle etkileşime girdiği her an gerçek zamanlı çalışan bir izleyici bulunuyor. OpenAI, girilen her komutu sınıflandıran bir model çalıştırdığını, bunun biyoloji ile ilgili olup olmadığını belirlediğini ve eğer öyleyse, ChatGPT'nin cevabını biyolojik tehdit oluşturabilecek bir içeriğe karşı ikinci bir izleyiciden geçirdiğini belirtiyor.
OpenAI ayrıca, kötüye kullanımı önlemek için ChatGPT'nin hafıza özelliğini bu ajan için devre dışı bıraktı. ChatGPT'nin diğer bölümlerinde, hafıza özelliği sohbet botunun önceki kullanıcı sohbetlerindeki bilgilere başvurmasına izin veriyor. Ancak OpenAI, kötü niyetli kişilerin ChatGPT aracındaki bu özelliği kullanarak hızlı enjeksiyon saldırıları yoluyla hassas verileri dışarı sızdırabileceğini söylüyor.
ChatGPT Agent etkileyici görünse de, gerçek dünyada ne kadar yetenekli olduğu henüz kesin değil. Şimdiye kadar piyasaya çıkan YZ ajanlarının çoğu, gerçek dünyada etkileşimde zayıf kalmıştı. Ancak OpenAI, daha yetenekli bir model geliştirdikleri ve vaatlerini yerine getirebilecekleri konusunda iddialı.