Stanford Üniversitesi’nde psikolog olan Michal Kosinski, Open AI tarafından geliştirilen ChatGPT AI sohbet robotunu, ünlü Zihin Teorisi Testini geçme yeteneğini ölçmek için test etti. ArXiv’de yayımlanan makalesinde Kosinski, ChatGPT’nin en son sürümünün yapılan testin sonucuna göre ortalama 9 yaşındaki bir çocuğun zihin seviyesini geçtiğini bildirdi.
ChatGPT ve diğer yapay zekâ uygulamaları, lise ve üniversite öğrencileri için eksiksiz makaleler yazmak gibi gelişmiş yeteneklere sahip. Yetenekleri geliştikçe bazıları, bazı yazılım uygulamalarıyla sohbet etmenin bilinmeyen ve görünmeyen bir insanla sohbet etmekten neredeyse ayırt edilemez olduğunu fark etti. Bu tür bulgular, psikoloji alanındaki bazı kişilerin bu uygulamaların hem bireyler hem de toplum üzerindeki etkisini merak etmesine yol açtı. Bu yeni durumda ise Kosinski, bu tür sohbet robotlarının Zihin Kuramı Testini geçmeye yaklaşıp yaklaşmadıklarını merak etti.
Zihin Teorisi Testi, bir kişinin zihinsel durumunu tanımlamaya veya anlamaya çalışır. Ya da başka bir deyişle, insanların mevcut bilgilere dayanarak, ancak sınırlı bir ölçüde, başka bir kişinin zihninde neler olup bittiğini “tahmin etme” yeteneğine sahip olduklarını öne sürer. Mesela bir kişinin sahip olduğu belirli bir yüz ifadesine göre birçok kişi onun kızgın mı yoksa mutlu mu olduğunu anlayabilir, ve böylelikle o kişinin aklından geçenlerin hangi duygu durumuna daha yakın olduğu tahmin edilebilir.
Önceki araştırmalar, bu tür yeteneklerin çocuklukta ortaya çıkıp çocukluğun devamında ve yetişkinlik boyunca da geliştiğini öne sürdü. Doğal olarak bu tür teorilerin incelenmesi de onları ölçmek için testlerin geliştirilmesine yol açtı.
Kosinski, ChatGPT’nin 2022’den önce yayımlanan bir sürümünü test etti ve Zihin Teorisi testini geçemediğini gördü. Daha sonra kısa bir süre sonra çıkan yeni bir versiyonunu test ettiğinde ise yapay zekânın teorik testlerin %70’ini çözebildiğini gördü. Bu da kabaca 7 yaşındaki bir çocuğa eşdeğer sayılırdı. Ardından, geçtiğimiz kasım ayında en son sürümü test ettiğinde görevlerin %93’ünü çözebildiğini gördü. Bu durum ise ChatGPT’nin zihinsel seviye olarak 9 yaşındaki bir çocuğun zihinsel yeteneklerini neredeyse geçtiğini gösteriyor.
Bing sohbet robotuna ChatGPT yetenekleri ekleyen Microsoft, görünüşe göre bu testlerin farkına vardı ve zihin teorisiyle ilgili gelen sorulara bir filtre yerleştirdi. ChatGPT, bu tür sorular sorulduğunda artık cevap olarak şöyle diyor: “Üzgünüm ama bu sohbete devam etmemeyi tercih ediyorum. Hâlâ öğreniyorum, bu yüzden anlayışınız ve sabrınız için teşekkür ederim.”
Derleyen: Ceren Korkmaz


