OpenAI, metinden video oluşturma programı Sora'yı tanıttıktan sonra yeni bir programı daha duyurdu. Voice Engine, sadece 15 saniyelik bir örnekle insan sesini kopyalayıp istenilen dile çevirebiliyor.
OpenAI, geliştirdiği Voice Engine adlı metinden ses üretme platformunu tanıttı. 15 saniyelik bir sesi temel alarak sentetik bir ses oluşturabiliyor. Yapay zeka tarafından üretilen ses, metin komutlarını konuşmacıyla aynı dilde veya başka dillerde okuyabiliyor.
OpenAI blog yazısında şunları söyledi: "Bu küçük ölçekli dağıtımlar yaklaşımımızı, korumalarımızı ve Voice Engine'nin çeşitli endüstrilerde iyi amaçlar için nasıl kullanılabileceği hakkındaki düşüncelerimizi bilgilendirmeye yardımcı oluyor."
Voice Engine programına erişimi olanlar arasında, eğitim teknolojisi şirketi Age of Learning, görsel hikaye anlatma platformu HeyGen, sağlık yazılımı üreticisi Dimagi, yapay zeka iletişim uygulaması geliştiricisi Livox ve Lifespan yer alıyor.
OpenAI tarafından yayınlanan bu örneklerde, Age of Learning'in önceden senaryolu seslendirme içeriği oluşturmak ve öğrencilere GPT-4 tarafından yazılan "gerçek zamanlı, kişiselleştirilmiş yanıtları" okumak için teknolojiyle neler yaptığını duyabilirsiniz.
OpenAI, 2022'nin sonlarında Voice Engine'yi geliştirmeye başladığını ve teknolojinin halihazırda ChatGPT'nin Yüksek Sesle Okuma özelliği için önceden ayarlanmış sesleri de desteklediğini açıkladı.
Ürün geliştirme ekibinin bir üyesi olan Jeff Harris, TechCrunch ile yaptığı röportajda modelin "lisanslı ve kamuya açık verilerin bir karışımı" üzerinde eğitildiğini söyledi. Modelin yalnızca yaklaşık 10 geliştiricinin kullanımına sunulacağı bilgisi de paylaşıldı.
Öte yandan OpenAI, şubat ayında tanıtıp sınırlı sayıda kullanıma sunduğu metinden video oluşturma programı Sora'yı da bu yıl kullanıma açacak.
OpenAI baş teknoloji sorumlusu Mira Murati, "Bu teknolojiyi insanların düzenleyip oluşturabileceği bir araç olarak nasıl kullanacağımızı araştırıyoruz." dedi ve Sora'yı önümüzdeki birkaç ay içerisinde herkese açacaklarını sözlerine ekledi.