Akademik makaleler yapay zekâ modellerini eğitmek için kullanılıyor mu?

Akademik makaleler yapay zekâ modellerini eğitmek için kullanılıyor mu?

Akademik yayıncılar, araştırma makalelerine erişim satarak teknoloji firmalarının yapay zekâ (YZ) modellerini eğitmelerine olanak tanıyor. Ancak, bu anlaşmaların yazarların haberi olmadan gerçekleşmesi bazı araştırmacıları endişelendiriyor. Bu durum, yayımlanmış ve bazen telif hakkıyla korunan eserlerin hızla çoğalan yapay zeka sohbet botlarını eğitmek için kullanılmasının yasal ve etik boyutlarını gündeme getiriyor.

Uzmanlar, bir araştırma makalesinin büyük bir dil modelini (LLM) eğitmek için henüz kullanılmamış olsa bile, yakında kullanılabileceğini öne sürüyor. Araştırmacılar, içeriklerinin kullanımını tespit etmek için teknik yollar araştırıyorlar.

Akademik Yayınlara Erişim İçin Büyük Anlaşmalar Yapılıyor

Geçtiğimiz aylarda, Birleşik Krallık’taki akademik yayınevi Taylor & Francis'in, Microsoft'a verilerini AI sistemlerini geliştirmek amacıyla kullanması için 10 milyon dolarlık bir anlaşma yaptığı ortaya çıktı. Haziran ayında ise, Amerikan yayınevi Wiley'nin, içeriğini bir şirketin jeneratif AI modellerini eğitmek için kullanmasına izin vererek 23 milyon dolar kazandığı öğrenildi.

Seattle’daki Washington Üniversitesi’nde AI araştırmacısı Lucy Lu Wang, çevrimiçi olarak erişilebilen her şeyin — ister açık erişim deposunda olsun ister olmasın — büyük olasılıkla bir LLM tarafından eğitilmiş olabileceğini belirtiyor. Wang, "Bir makale bir modelin eğitim verisi olarak kullanıldıysa, model eğitildikten sonra o makaleyi çıkarmanın bir yolu yok" diye ekliyor.

Telif Hakkı Sorunları

LLM’lerin bireysel bir makaleyi kullandığını kanıtlamak zor, diyor Imperial College London'da bilgisayar bilimcisi olan Yves-Alexandre de Montjoye. Bu durum, AI geliştiricilerinin eğitim verilerini gizli tutmasıyla daha da karmaşıklaşıyor. Bazı şirketler eğitim verilerini açık tutarken, birçok jeneratif AI modeli geliştiren firma, bu verileri gizli tutuyor.

Bazı bilim insanları, çalışmalarının LLM'leri eğitmek için kullanılmasından rahatsız olmasa da, diğerleri adil bir süreç arayışında. Telif hakkı ile korunan içeriklerin izinsiz kullanılması hukuki bir konu haline gelebilir. ABD'de devam eden bir dava, bu konuda emsal teşkil edebilir.