Google, yapay zeka destekli video üretiminde çığır açacak yeni aracı Veo 3'ü tanıttı. Görüntü kalitesinde önemli bir sıçrama sunan yeni nesil sistem, sadece metinle değil aynı zamanda görsellerle de yönlendirilebiliyor. Ayrıca oluşturulan videolara otomatik ses efektleri, arka plan sesleri ve senkronize diyaloglar da ekleyebiliyor.
Google, yeni metinden video oluşturma yapay zekasını Veo 3 adıyla tanıttı. TechCrunch'ın haberine göre, Veo 2'ye kıyasla görüntü kalitesinde büyük bir gelişme sağladığı belirtilen Veo 3 ile gelen en önemli yenilik; oluşturduğu videolara ses efektleri, arka plan sesleri ve diyaloglar ekleyebilmesi.
Hem metin hem de görselle komut verilebilen Veo 3, salı gününden itibaren Google'ın Gemini sohbet botu uygulamasında, aylık 249,99 dolarlık AI Ultra abonelik planına sahip kullanıcılara açıldı.
Google DeepMind CEO'su Demis Hassabis, düzenlediği basın toplantısında, "İlk kez video üretiminde sessiz çağdan çıkıyoruz. "Veo 3'e karakterleri ve ortamı tanımlayan bir komut verebilir, nasıl ses çıkarmasını istediğinize dair bir açıklama ile diyalog önerebilirsiniz" diyerek durumu açıkladı.
Veo 3 modeli ile üretilen örnek bir video:
https://x.com/demishassabis/status/1924501631972057186
Eğer Google vaatlerini yerine getirebilirse, ses üretimi konusundaki yetenekler Veo 3 için büyük bir ayırt edici özellik olabilir. Yapay zeka destekli ses üretim araçları ve video ses efektleri oluşturabilen modeller yeni değil. Ancak Google'a göre Veo 3, oluşturduğu videolardaki ham pikselleri anlayabiliyor ve ürettiği sesleri otomatik olarak bu kliplerle senkronize edebiliyor.
Veo 3'ün eğitiminde kullanılan içeriklerin nereden temin edildiği belli değil. Ancak YouTube güçlü bir olasılık. Daha önce DeepMind tarafından TechCrunch'a yapılan açıklamada, Google'ın bazı modellerinin YouTube materyalleriyle "eğitilmiş olabileceği" belirtilmişti.
Bu arada deepfake içerik riskini azaltmak için DeepMind, Veo 3'ün oluşturduğu karelere görünmez işaretleyiciler yerleştiren özel filigran teknolojisi SynthID'yi kullanıyor.