OpenAI, yapay zeka alanındaki iddialı adımlarına bir yenisini ekledi: Yeni tanıttığı "o3-pro" modeli, önceki nesil sistemlerden farklı olarak daha gelişmiş akıl yürütme yetenekleri sunarak fizik, matematik ve kodlama gibi karmaşık alanlarda adım adım çözümleme yapabiliyor. Ancak o3-pro'nun büyük bir dezavantajı var.
OpenAI, şimdiye kadarki en yetenekli modeli olduğunu iddia ettiği o3-pro adlı yapay zekasını duyurdu. TechCrunch'ın haberine göre, yeni o3-pro, şirketin bu yılın başlarında tanıttığı akıl yürütme (reasoning) modeli olan o3'ün gelişmiş bir versiyonu olarak karşımıza çıktı.
Geleneksel yapay zeka sistemlerinden farklı olarak akıl yürütme modelleri, problemleri adım adım çözerek fizik, matematik ve kodlama gibi alanlarda daha güvenilir performans sergiliyor. En azından akıl yürütebilen YZ modellerini geliştiren şirketlerin iddiaları bu yönde.
Bir önceki model o1-pro'nun yerini alan o3-pro, ChatGPT Pro (aylık 200 dolar) ve Team kullanıcıları için erişime açıldı. Enterprise ve Edu kullanıcılarına ise bir hafta sonra açılacak olan o3-pro, aynı zamanda OpenAI'ın geliştirici API'sinde de aktif hale getirildi.
API fiyatlandırması, 1 milyon giriş (input) token'ı için 20 dolar, 1 milyon çıkış (output) token'ı için 80 dolar olarak belirlenmiş durumda.
Giriş token'ları modele verilen girdileri, çıkış token'ları ise modelin bu girdilere verdiği yanıtları ifade ediyor. 1 milyon giriş token'ı yaklaşık 750 bin kelimeye denk geliyor ki bu da "Savaş ve Barış" romanından biraz daha uzun.
OpenAI'a göre o3-pro'nun web'de arama yapmasına, dosyaları analiz etmesine, görseller hakkında mantık yürütmesine, Python kullanmasına, hafızadan yararlanarak yanıtlarını kişiselleştirmesine ve daha fazlasına olanak tanıyan araçlara erişimi var.
Ancak modelin bazı dezavantajları da mevcut. Örneğin yanıt süreleri, o1-pro'ya göre genellikle daha uzun. Geçici sohbetler "şimdilik" teknik bir sorun nedeniyle devre dışı. Görsel oluşturamıyor (image generation desteklenmiyor) ve Canvas özelliği kullanılamıyor.
Bununla birlikte o3-pro, OpenAI'ın iç testlerine göre popüler yapay zeka benchmark'larında etkileyici puanlar elde etti. Matematik yeteneklerini ölçen AIME 2024 testinde Google'ın en güçlü modeli olan Gemini 2.5 Pro'dan daha yüksek puan aldı. PhD seviyesindeki bilim bilgilerini test eden GPQA Diamond'da ise, yakın zamanda çıkan Anthropic Claude 4 Opus modelini geride bıraktı.