- ChatGPT’nin yaratıcısı OpenAI’ya veri hırsızlığı davası açıldı.
- İnternetteki verilerimiz istesek de istemesek de ChatGPT’nin eğitimi için kullanılabilir.
- ChatGPT’nin eğitimi için kullanılmasa bile bu veriler büyük ölçekte çekiliyor.
ChatGPT’nin yaratıcısı OpenAI’ya karşı açılan yeni bir davada, Silikon Vadisi’nde faaliyet gösteren firmanın yapay zekâ eğitim uygulamalarının, internette herhangi bir şey paylaşmış olan herkesin gizliliğini ve telif haklarını ihlal ettiği iddia ediliyor.
OpenAI, güçlü yapay zekâ dil modellerini eğitmek için web’in çeşitli köşelerinden kazınan inanılmaz miktarda veri kullandı. Şirket, sistemlerinin tam olarak ne üzerinde eğitildiğini bilmese de bu veri kümeleri Wikipedia makalelerinden ünlü romanlara, sosyal medya gönderilerinden erotik paylaşımlara kadar her şeyi içeriyor ve OpenAI bunların hiçbiri için izin istemedi.
Kaliforniya’da açılan toplu dava, en başta bu içeriği üretenlerin iznini almak da dahil olmak üzere uygun satın alma kurallarına uymamanın doğrudan veri hırsızlığı anlamına geldiğini iddia ediyor.
Dava dilekçesinde, “Kişisel bilgilerin satın alınması ve kullanılmasına yönelik yerleşik protokollere rağmen, Davalılar farklı bir yaklaşım benimsedi: hırsızlık. İnternetten sistematik olarak 300 milyar kelime, ‘kitaplar, makaleler, web siteleri ve gönderiler ve rıza olmaksızın elde edilen kişisel bilgiler’ dahil topladılar.” yazıldı.
Eğer son birkaç on yıl içinde internete girdiyseniz, dijital çıktılarınız muhtemelen OpenAI’ın veri kümelerine gömülü. Yani OpenAI’yın üretici modellerinin kâr amacıyla ürettiği her şeyde, dijital emeğinizin parçaları gömülü olabilir.
OpenAI’ya dava açan firmanın yönetici ortağı Ryan Clarkson, “Tüm bu bilgiler, büyük bir dil modeli tarafından kullanılması asla amaçlanmadığı halde, büyük ölçekte alınıyor.” dedi.
Bununla birlikte, davanın gerçekten mahkemeye taşınıp taşınmayacağını zaman gösterecek. internetin altyapısı karmaşık ve platformların kendi kullanıcı şartları ve anlaşmaları var. Bu siteleri içerikle doldursak da çoğu durumda hepsi platforma ait olur.
Fikri mülkiyet avukatı Katherine Gardner, “Bir sosyal medya sitesine ya da herhangi bir siteye içerik koyduğunuzda, genellikle siteye içeriğinizi herhangi bir şekilde kullanabilmesi için çok geniş bir lisans vermiş oluyorsunuz. Sıradan bir kullanıcının verilerinin eğitimin bir parçası olarak kullanılması karşılığında herhangi bir ödeme ya da tazminat alma hakkına sahip olduğunu iddia etmesi çok zor olacaktır.” diyor.
Derleyen: Arda Yardımsever