ChatGPT, 9 Yaşındaki Bir İnsanın Zihninin Önüne Geçti

Stanford Üniversitesi’nde psikolog olan Michal Kosinski, Open AI tarafından geliştirilen ChatGPT AI sohbet robotunu, ünlü Zihin Teorisi Testini geçme yeteneğini ölçmek için test etti. ArXiv’de yayımlanan makalesinde Kosinski, ChatGPT’nin en son sürümünün yapılan testin sonucuna göre ortalama 9 yaşındaki bir çocuğun zihin seviyesini geçtiğini bildirdi.

ChatGPT ve diğer yapay zekâ uygulamaları, lise ve üniversite öğrencileri için eksiksiz makaleler yazmak gibi gelişmiş yeteneklere sahip. Yetenekleri geliştikçe bazıları, bazı yazılım uygulamalarıyla sohbet etmenin bilinmeyen ve görünmeyen bir insanla sohbet etmekten neredeyse ayırt edilemez olduğunu fark etti. Bu tür bulgular, psikoloji alanındaki bazı kişilerin bu uygulamaların hem bireyler hem de toplum üzerindeki etkisini merak etmesine yol açtı. Bu yeni durumda ise Kosinski, bu tür sohbet robotlarının Zihin Kuramı Testini geçmeye yaklaşıp yaklaşmadıklarını merak etti.

Zihin Teorisi Testi, bir kişinin zihinsel durumunu tanımlamaya veya anlamaya çalışır. Ya da başka bir deyişle, insanların mevcut bilgilere dayanarak, ancak sınırlı bir ölçüde, başka bir kişinin zihninde neler olup bittiğini “tahmin etme” yeteneğine sahip olduklarını öne sürer. Mesela bir kişinin sahip olduğu belirli bir yüz ifadesine göre birçok kişi onun kızgın mı yoksa mutlu mu olduğunu anlayabilir, ve böylelikle o kişinin aklından geçenlerin hangi duygu durumuna daha yakın olduğu tahmin edilebilir.

https://youtu.be/6SniaiSbx7o

Önceki araştırmalar, bu tür yeteneklerin çocuklukta ortaya çıkıp çocukluğun devamında ve yetişkinlik boyunca da  geliştiğini öne sürdü. Doğal olarak bu tür teorilerin incelenmesi de onları ölçmek için testlerin geliştirilmesine yol açtı.

Kosinski, ChatGPT’nin 2022’den önce yayımlanan bir sürümünü test etti ve Zihin Teorisi testini geçemediğini gördü. Daha sonra kısa bir süre sonra çıkan yeni bir versiyonunu test ettiğinde ise yapay zekânın teorik testlerin %70’ini çözebildiğini gördü. Bu da kabaca 7 yaşındaki bir çocuğa eşdeğer sayılırdı. Ardından, geçtiğimiz kasım ayında en son sürümü test ettiğinde görevlerin %93’ünü çözebildiğini gördü. Bu durum ise ChatGPT’nin zihinsel seviye olarak 9 yaşındaki bir çocuğun zihinsel yeteneklerini neredeyse geçtiğini gösteriyor.

Bing sohbet robotuna ChatGPT yetenekleri ekleyen Microsoft, görünüşe göre bu testlerin farkına vardı ve zihin teorisiyle ilgili gelen sorulara bir filtre yerleştirdi. ChatGPT, bu tür sorular sorulduğunda artık cevap olarak şöyle diyor: “Üzgünüm ama bu sohbete devam etmemeyi tercih ediyorum. Hâlâ öğreniyorum, bu yüzden anlayışınız ve sabrınız için teşekkür ederim.”

Derleyen: Ceren Korkmaz

En Son

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Avatar Video Oyunu O Kadar İyi ki Filmlere Gerek Kalmayabilir

Avatar evreni uzun süredir sinema ile özdeşleşmiş olsa da, yeni video oyunu deneyimi bu dünyayı izlemekten çıkarıp doğrudan yaşanabilir bir gerçekliğe dönüştürerek filmlerin rolünü bile sorgulatıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.

Yılın En Aptalca Hack’i Çok Gerçek Bir Sorunu Ortaya Çıkardı

Silikon Vadisi’nde yaya geçidi butonlarının hacklenmesiyle ortaya çıkan tuhaf olay, ilk bakışta basit bir şaka gibi görünse de aslında modern şehirlerin siber güvenlik konusunda ne kadar savunmasız olduğunu gözler önüne serdi.

Bültene Kaydol

Üye Özel

Yapay Zekâ Damgası: Dünyanın Prestijli Girişim Gününde 16 Çarpıcı Startup

Y Combinator’ın Winter 2026 Demo Day etkinliğinde tanıtılan yaklaşık 190 girişim arasından öne çıkan 16 startup, yapay zekânın farklı sektörlerde nasıl dönüştürücü bir rol üstlendiğini gözler önüne serdi. Hukuktan sağlığa, güvenlikten enerjiye uzanan projeler dikkat çekti.

Kagi’nin İnsan Odaklı İnterneti: ‘Küçük Web’le Tanışın

Kagi’nin ‘Küçük Web’ girişimi, interneti sadece insanlar tarafından yazılmış içeriklerle keşfetmeye odaklanıyor. Kişisel bloglar, bağımsız videolar ve web çizgi romanları, mobil ve web uygulamaları üzerinden daha erişilebilir hâle geliyor.

Yapay Zekâyla Konuşmanın Doğru Yolu

Yapay zekâya “lütfen” demek işe yarıyor mu? Onu tehdit etmek mi, yoksa bir bilim kurgu dizisindeki karakter gibi konuşturmak mı daha etkili? Uzmanlara göre sohbet robotlarından daha iyi sonuç almanın yolu sandığınız kadar gizemli değil.

LGBTQ+ Sporcular 2026 Kış Olimpiyat Oyunlarında Ön Planda Olacak

Açık kimlikleriyle LGBTQ+ olan yaklaşık 50 Olimpiyat sporcusu, konuşma ve yarışma hakları saldırı altında olmasına rağmen Kış Olimpiyat Oyunları boyunca çeşitli etkinliklerde yer alıyor.

Kripto Parayla Finanse Edilen İnsan Ticareti Hızla Artıyor

Tahminlere göre, fuhuş ve dolandırıcılık amacıyla insan ticareti işlemlerinde kripto para birimlerinin kullanımı 2025 yılında neredeyse iki katına çıktı.
Ceren Korkmaz
Ceren Korkmazhttp://dijitaliyidir.com
Dinamizmini hiçbir zaman kaybetmeyen dünyada bu akışa uyum sağlarken bilgi alışverişinin en önemli şey olduğunu düşünen Ceren’in en büyük tutkuları okumak yazmak ve izlemekken amacı ise bu eylemleri insanlarla paylaşım içindeyken yapmak. Ceren’in dijitaliyidir için sloganı " Dijital, her zaman söyleyecek sözü olanlar için iyidir." oldu.

- dijitaliyidir Sponsor Desteği -

spot_imgspot_img

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.