Runway, binlerce YouTube videosunu kullandı
Runway, hem görüntü hem de video oluşturma modelleriyle halihazırda piyasada bulunan en gelişmiş yapay zeka araçlarına sahip. Firma geçtiğimiz ay Gen-3 Alpha video oluşturma aracını sergileyerek son derece kaliteli videolar oluşturabileceğini gözler önüne sermişti. Runway, tıpkı diğer yapay zeka şirketleri gibi kendi yapay zeka modelinin de açık veriler üzerinde eğitildiğini söylemiş ve spesifik kaynakları açıklamamıştı.
Ancak şimdi 404 Media tarafından elde edilen belgeye göre bu çekingenliğin sebebi tespit edildi. Elde edilen e-tabloya göre korsan içerik barındıran web sitelerinin yanı sıra Disney, Netflix, Sony ve medya organlarına ait olanlar da dahil olmak üzere büyük YouTube kanallarından alınan popüler içerikler Gen-3 Alpha’nın eğitiminde kullanılmış.
Elbette spesifik olarak hangi videoların eğitimde kullanıldığını tespit etmek şu noktada mümkün değil ancak verilerin bir yerde toplanıp bağlantılarla desteklenmiş olması çoğu içeriğin kullanıldığına işaret ediyor. Bu da yapay zeka şirketlerinin modellerini beslemek için telif haklarını görmezden geldiğinin en net kanıtlarından.
Runway 3’ün eğitim verilerinde olduğu söylenen son derece etkileyici kısa filmler çeken Benjamin Hardman (ve aynı adlı YT kanalı) için bir test de yapıldı. Gen 3 Alpha’nın video ve görüntü üretme bölümüne “Benjamin Hardman” istemi yazıldığında ortaya çıkanlar sanki Hardman’in elinden çıkmış gibi görünüyor.
Elde dilen bilgilere göre Gen-3 Alpha’nın eğitiminde 21.000 adet Washington Post, 10.000 adet New York Times, 27.000 Wall adet Street Journal videosu ve çeşitli kanallardan daha yüzlerce ve binlerce video kullanıldı. Hatta Runway’in YouTube ve Google tarafından engellenmemek için proxy’ler kullanarak tüm videoları indirdiğinin de altı çiziliyor. İlginç bir şekilde Runway, geçtiğimiz yıl Google, Salesforce ve Nvidia gibi şirketlerden toplamda 140 milyon dolar doğrudan fon sağlamıştı.
YouTube CEO’su Neal Mohan, geçtiğimiz aylarda yapay zeka eğitiminde YouTube içeriklerinin kullanılmasının politikalarının açık bir ihlali olduğunu söylemişti. Öte yandan telifli ve izinsiz içerikleri kullanmakla suçlanan tek yapay zeka şirketi Runway değil. Hatırlanacağı üzere OpenAI CTO’su Mira Murati, yakında piyasaya çıkacak Sora video oluşturucusunun eğitim verilerinin YouTube videolarını içerip içermediğinden “emin olmadığını” söylemişti.
Geçtiğimiz haftalarda ise Anthropic, Apple, Nvidia ve Salesforce‘un AI modellerini 170.000’den fazla YouTube videosu üzerinde eğittiği bulunmuştu. Bu firmaların yüz binlerce YouTube video transkriptini kullandığı tespit edilmişti. Bu verileri şirkerler doğrudan indirmese de veriler yine de yapay zeka modellerini eğitmek için kullanıldı ve bu da YouTube’un Hizmet Şartlarını kesinlikle ihlal ediyor.