OpenAI'nın YouTube videolarını kullanarak yapay zeka modellerini eğittiği iddiaları, yeni bir rapora göre doğru olabilir.
Yapay zeka arenasinda bir süredir OpenAI ve Google arasinda, Sora'nin YouTube videolari kullanilarak egitildiginin iddia edilmesiyle birlikte ortaya çikan ve YouTube CEO Neal Mohan'in açiklamalariyla kizisan polemik konusuluyor.
Mart ayinda OpenAI Bas Teknoloji Sorumlusu (CTO) Mira Murati, katildigi bir yayinda sirketin metinden video üretme programi Sora'nin egitiminde YouTube'daki içerikleri kullanip kullanmadigi sorusuna cevap vermekten kaçindigi için tartisma konusu olmustu.
Murati Sora'yi halka açik verilerle egittiklerini söylese de YouTube'daki videolardan da faydalanip faydalanmadiklari sorusuna net bir cevap vermemisti. Bunun üzerine YouTube CEO'su Mohan geçtigimiz günlerde bir açiklama yaparak söyle dedi:
"Bir içerik üretici, çalismasini platformumuza yüklediginde belirli beklentileri olur. Bunlardan biri de hizmet sartlarina uyulmasidir. Transkript veya video parçalari gibi seylerin indirilmesine izin vermez. Bunlar platformumuzdaki içerik kurallaridir."
Simdi ise New York Times gazetesi, Google'in pek de hosuna gitmeyecek bir iddiayi haberine tasidi. OpenAI'nin yapay zeka modellerini YouTube videolarindan kopyalanan metinler üzerinde egittini iddia etti.
NYT'nin sirketin uygulamalari hakkinda bilgisi olan kaynaklara dayandirdigi haberine göre OpenAI, bir milyon saatten fazla YouTube videosunu yaziya dökmek için Whisper konusma tanima aracindan faydalandi ve bunlar daha sonra GPT-4'ü egitmek için kullanildi.
The Information daha önce OpenAI'nin iki YZ sistemini egitmek için YouTube videolarini ve podcast'lerini kullandigini bildirmisti. OpenAI baskani Greg Brockman'in bu ekipteki kisiler arasinda oldugu bildirildi.
Google sözcüsü Matt Bryant, NYT'ye yaptigi açiklamada, Google'in kurallari uyarinca "YouTube içeriginin izinsiz olarak indirilmesine" izin verilmedigini ve ayrica sirketin OpenAI tarafindan bu tür bir kullanimdan habersiz oldugunu söyledi.
Rapordaki bir baska iddia, Google'da OpenAI'nin YouTube videolarini kullandigini bilen ancak buna karsi harekete geçmeyen kisilerin oldugunu, çünkü Google'in da kendi YZ modellerini egitmek için ayni yöntemi kullandigini öne sürüyor. Google ise yalnizca kabul eden içerik üreticilerin videolarini kullandigini savunuyor.