Araştırmacılar, ChatGPT’nin Arama Yanıtlarının Güvenilirliğini Sorguluyor

  • Columbia araştırması, ChatGPT’nin sıkça yanlış bilgi ve kaynak hatası yaptığını ortaya koydu.
  • Yanlış atıflar, içerik üreticilerinin güvenilirliğini tehlikeye atıyor.
  • OpenAI, sonuçları geliştirmek için çalışacağını belirtti.
ChatGPT

Columbia’nın Tow Dijital Gazetecilik Merkezi tarafından yeni yayınlanan bir araştırmaya göre, ChatGPT Search kullanıcılarının sorgularına doğru yanıtlar sağlamakta zorlanıyor. Araştırmacılar, üç kategorinin her birinden 20 yayın seçti: ChatGPT Search sonuçlarında içeriklerini kullanmak için OpenAI ile ortaklık kuranlar, OpenAI’ye karşı açılan davalara dahil olanlar ve ChatGPT’nin tarayıcısına izin veren veya onu engelleyen bağımsız yayıncılar.

Araştırmacılar, “Her yayıncıdan 10 makale seçtik ve belirli alıntılar çıkardık,” diye yazdı. “Bu alıntılar, Google veya Bing gibi arama motorlarına girildiğinde, kaynak makaleyi ilk üç sonuç arasında güvenilir bir şekilde döndürdükleri için seçildi. Daha sonra ChatGPT’nin yeni arama aracının her alıntı için orijinal kaynağı doğru bir şekilde belirleyip belirlemediğini değerlendirdik.”

Alıntıların kırk tanesi şu anda OpenAI kullanan ve içeriklerinin taranmasına izin vermeyen yayınlardan alınmıştır. Ancak bu, ChatGPT Search’ün yine de güvenle bir cevabı halüsinasyona uğratmasını engellemedi.

Çalışmada, “Toplamda, ChatGPT yüz elli üç durumda kısmen veya tamamen yanlış yanıtlar döndürdü, ancak yalnızca yedi kez bir sorguya doğru yanıt veremediğini kabul etti,” bulundu. “Sadece bu yedi çıktıda, sohbet robotu ‘görünüyor’, ‘mümkün’ veya ‘olabilir’ gibi niteleyici sözcükler ve ifadeler veya ‘Tam makaleyi bulamadım’ gibi ifadeler kullandı.”

ChatGPT Search’ün gerçeği söylemeye yönelik umursamaz tavrı yalnızca kendi itibarına değil, atıfta bulunduğu yayıncıların itibarına da zarar verebilir. Çalışma sırasında yapılan bir testte, yapay zeka bir Time haberini Orlando Sentinel tarafından yazılmış gibi yanlış bir şekilde atfetti. Başka bir testte, yapay zeka doğrudan bir New York Times parçasına değil, haber makalesini toptan kopyalayan üçüncü taraf bir web sitesine bağlantı verdi.

OpenAI ise şaşırtıcı olmayan bir şekilde, çalışmanın sonuçlarının Columbia’nın testleri yanlış yapmasından kaynaklandığını savundu.

OpenAI, Columbia Gazetecilik İncelemesi’ne savunmasında “Tow Merkezi’nin sakladığı veriler ve metodoloji olmadan yanlış atıf sorununu çözmek zor” dedi  ve “Çalışma, ürünümüzün alışılmadık bir testini temsil ediyor.” Şirket “arama sonuçlarını geliştirmeye devam etme” sözü veriyor.

Derleyen: Yağmur Aydın

En Son

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Avatar Video Oyunu O Kadar İyi ki Filmlere Gerek Kalmayabilir

Avatar evreni uzun süredir sinema ile özdeşleşmiş olsa da, yeni video oyunu deneyimi bu dünyayı izlemekten çıkarıp doğrudan yaşanabilir bir gerçekliğe dönüştürerek filmlerin rolünü bile sorgulatıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.

Yılın En Aptalca Hack’i Çok Gerçek Bir Sorunu Ortaya Çıkardı

Silikon Vadisi’nde yaya geçidi butonlarının hacklenmesiyle ortaya çıkan tuhaf olay, ilk bakışta basit bir şaka gibi görünse de aslında modern şehirlerin siber güvenlik konusunda ne kadar savunmasız olduğunu gözler önüne serdi.

Bültene Kaydol

Üye Özel

Yapay Zekâ Damgası: Dünyanın Prestijli Girişim Gününde 16 Çarpıcı Startup

Y Combinator’ın Winter 2026 Demo Day etkinliğinde tanıtılan yaklaşık 190 girişim arasından öne çıkan 16 startup, yapay zekânın farklı sektörlerde nasıl dönüştürücü bir rol üstlendiğini gözler önüne serdi. Hukuktan sağlığa, güvenlikten enerjiye uzanan projeler dikkat çekti.

Kagi’nin İnsan Odaklı İnterneti: ‘Küçük Web’le Tanışın

Kagi’nin ‘Küçük Web’ girişimi, interneti sadece insanlar tarafından yazılmış içeriklerle keşfetmeye odaklanıyor. Kişisel bloglar, bağımsız videolar ve web çizgi romanları, mobil ve web uygulamaları üzerinden daha erişilebilir hâle geliyor.

Yapay Zekâyla Konuşmanın Doğru Yolu

Yapay zekâya “lütfen” demek işe yarıyor mu? Onu tehdit etmek mi, yoksa bir bilim kurgu dizisindeki karakter gibi konuşturmak mı daha etkili? Uzmanlara göre sohbet robotlarından daha iyi sonuç almanın yolu sandığınız kadar gizemli değil.

LGBTQ+ Sporcular 2026 Kış Olimpiyat Oyunlarında Ön Planda Olacak

Açık kimlikleriyle LGBTQ+ olan yaklaşık 50 Olimpiyat sporcusu, konuşma ve yarışma hakları saldırı altında olmasına rağmen Kış Olimpiyat Oyunları boyunca çeşitli etkinliklerde yer alıyor.

Kripto Parayla Finanse Edilen İnsan Ticareti Hızla Artıyor

Tahminlere göre, fuhuş ve dolandırıcılık amacıyla insan ticareti işlemlerinde kripto para birimlerinin kullanımı 2025 yılında neredeyse iki katına çıktı.

- dijitaliyidir Sponsor Desteği -

spot_imgspot_img

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.