Yapay zeka dünyasının önde gelen isimlerinden Anthropic, rakibi OpenAI’ın telif haklı veri setlerinin kullanımıyla ilgili iddialarına sert bir yanıt verdi. OpenAI, yazarların açtığı telif hakkı ihlali davalarına karşı kendisini savunurken, Anthropic’in de benzer verileri kullandığını öne sürmüştü. Ancak Anthropic, yaptığı açıklamayla bu iddiaları kesin bir dille yalanlayarak, Books3 adlı tartışmalı veri setini kullanmayı onaylamadığını ve 2020 yılında bu tür verileri eğitim setlerinden çıkarmak için çalıştığını belirtti.
Bu gelişme, yapay zeka modellerinin eğitilmesi için kullanılan büyük veri setlerinin telif hakları ve etik sorunları etrafında dönen tartışmaları yeniden alevlendirdi. Sektörün en büyük oyuncuları arasındaki bu söz düellosu, veri kullanım politikalarının şeffaflığı ve yasal sınırları konusunda önemli soruları gündeme getiriyor.
Kim Ne Söyledi?
OpenAI’ın Savunması
- OpenAI, yapay zeka modelleri ChatGPT ve DALL-E’nin eğitiminde telif haklı materyalleri izinsiz kullandığı gerekçesiyle birçok yazar tarafından dava edildi.
- Şirket, bu davalara yanıt olarak, “internet genelindeki verilerle eğitilen modellerin adil kullanım kapsamına girdiğini” savundu.
- Ayrıca, savunmasında sadece kendilerinin değil, Anthropic, Meta ve Google gibi diğer büyük şirketlerin de benzer telif haklı veri setlerini kullandığını iddia etti. Bu veri setlerinden biri de 170.000 dijitalleştirilmiş kitabı içeren Books3 idi.
Anthropic’in Karşı Hamlesi
- Anthropic, eski OpenAI araştırmacılarının kurduğu bir şirket olarak, rakibinin bu iddialarına resmi bir açıklamayla karşılık verdi.
- Şirket, Books3 veri setini yapay zeka modellerini eğitmek için kullanmayı hiçbir zaman onaylamadığını kesin bir dille ifade etti.
- Daha da önemlisi, 2020 yılında, yani bu veri setinin tartışmalı niteliği daha geniş çapta fark edilmeden önce, Anthropic’in bu tür veri setlerini eğitim materyallerinden kaldırmak için aktif olarak çaba gösterdiği vurgulandı.
- Anthropic, telif hakkı endişeleri taşıyan ve açıkça lisanslanmamış verilerden kaçınma politikası izlediğini belirtti. Şirket, bunun yerine “yüksek kaliteli, lisanslı ve telif hakkı sorunları olmayan verileri” tercih ettiğini açıkladı.
Neden Önemli?
Bu olay, yapay zeka sektörünün karşı karşıya olduğu en büyük etik ve yasal zorluklardan birini gözler önüne seriyor: Büyük dil modellerini besleyen devasa veri setlerinin kaynağı ve telif hakkı durumu. Yaratıcı içerik sahipleri, çalışmalarının rızaları olmadan ve telif ücreti ödenmeden AI modellerini eğitmek için kullanılmasından endişe duyuyor.
Anthropic’in bu konudaki net duruşu, diğer AI şirketlerine de emsal teşkil edebilir. Şirketler, hem yasal riskleri azaltmak hem de etik bir duruş sergilemek adına veri toplama ve kullanma politikalarını daha şeffaf hale getirmek ve telif haklarına saygılı bir yaklaşım benimsemek zorunda kalabilirler. Bu tartışma, yapay zeka teknolojilerinin gelecekteki gelişimini ve yaygınlaşmasını doğrudan etkileyecek kritik bir gündem maddesi olmaya devam edecek.