Kategoriler
UYGULAMALAR
İstanbul
Yapay zekâ tarafında dengeleri değiştiren adımlar atan OpenAI, bu kez görsel üretim tarafında önemli bir güncellemeyle gündemde. Şirket, ChatGPT Images 2.0 modelinin öne çıkan özelliklerini resmi X hesabından paylaştı.
Açıkçası en dikkat çeken yeniliklerden biri, kullanıcıların uzun süredir beklediği esnek en-boy oranları oldu. Artık 3:1 gibi geniş ya da 1:3 gibi dikey formatlarda görseller üretmek mümkün. Bu da işin pratiğini ciddi anlamda değiştiriyor. Web banner’ından sosyal medya postuna kadar her şey tek modelle üretilebiliyor.
Model sadece görsel üretmekle kalmıyor, metin yerleşiminde de daha akıllı davranıyor. İngilizce dışındaki dillerde yazılan ifadeleri görsellere doğru şekilde yerleştirebiliyor. Üstelik sadece çeviri değil, dilin akışını da koruyor.
Yani Türkçe bir afiş hazırlarken yazının garip görünmesi gibi sorunlar büyük ölçüde ortadan kalkıyor. Bu da özellikle içerik üreticileri için ciddi bir avantaj.
Images 2.0’ın belki de en iddialı tarafı, “düşünme yeteneği” olarak tanımlanan yeni sistem. Seçilen modele göre yapay zekâ, gerektiğinde web’de arama yapabiliyor, aynı komuttan birden fazla alternatif üretebiliyor ve kendi çıktısını analiz edip hataları düzeltebiliyor.
Bir bakıma sadece üretmiyor, ürettiğini değerlendiriyor da. Bu da onu klasik görsel modellerden ayıran önemli bir fark.
Modelin görsel kalitesi tarafında da ciddi bir sıçrama var. Fotogerçekçi sahnelerden sinematik karelere, piksel sanattan manga stiline kadar oldukça geniş bir üretim yelpazesi sunuyor.
Işık, doku ve kompozisyon konusunda daha tutarlı sonuçlar verdiği belirtiliyor. Bu durum özellikle oyun geliştirme, storyboard hazırlama ve pazarlama içerikleri üretimi gibi alanlarda öne çıkabilir.
OpenAI’ın açıklamasına göre ChatGPT Images 2.0 modeli şu an tüm ChatGPT ve Codex kullanıcılarının erişimine açılmış durumda. Ancak gelişmiş “düşünme” özellikleri şimdilik Plus, Pro ve Business aboneleriyle sınırlı. Enterprise kullanıcıları için de yakında sunulması planlanıyor.