Gündemden düşmeyen “süper” yapay zekâ ChatGPT hakkında yeni bir araştırma, ChatGPT’nin insan doktorlara kıyasla daha empatik olduğunu ve gerçek dünyadaki sağlık sorularına daha “kaliteli” yanıtlar verdiğini ortaya koydu.
Kendisi de bir yapay zekâ biçimi olan sanal sağlık hizmetleri, COVID-19 salgınının zirvesinde, insanların tecrit veya tecrit altındayken tıp uzmanlarına erişimini sağlamanın bir yolu olarak ortaya çıktı. Ancak pandemi sırasında sanal sağlık hizmetlerinin yükselişi, elektronik hasta mesajlarında 1,6 kat artış gören doktorlar üzerinde ek bir baskı yarattı ve her mesaj hastanın elektronik kaydında iki dakikadan fazla çalışma ve mesai sonrası ek çalışma ekledi. Artan iş yükü, ABD’li doktorların %62’sinin tükenmişlik belirtileri bildirmesine yol açarak rekor kırdı ve hastaların mesajlarının cevapsız kalma olasılığını artırdı.
Bu durum, Kaliforniya Üniversitesi (UC) San Diego’dan araştırmacıları yapay zekânın, özellikle de ChatGPT’nin tıptaki rolünü düşünmeye sevk etti. Araştırmacılar, ChatGPT’nin hastaların doktorlarına gönderdiği soru türlerine doğru yanıt verip veremeyeceğini bilmek istedi.
UC San Diego Tıp Fakültesinde doktor ve profesör olan ortak yazar Dr. Davey Smith, “ChatGPT tıbbi lisans sınavını geçebilir. Ancak hastaların sorularını doğru ve empatik bir şekilde doğrudan yanıtlamak farklı bir iş.” ifadeleriyle ChatGPT ve insan doktorlar arasındaki sınırı çizdi.
Araştırma ekibi, geniş ve çeşitli bir örneklem grubu elde etmek için, lisanslı, doğrulanmış sağlık uzmanlarının yanıtladığı tıbbi soruları gönderen 480.000’den fazla üyesi olan Reddit’in AskDocs alt dizinine (r/AskDocs) yöneldi.
Araştırmacılar r/AskDocs’tan rastgele 195 benzersiz alışverişi örnekledi, orijinal soruyu ChatGPT’ye (sürüm 3.5) aktardı ve bir yanıt oluşturmasını istedi. Üç lisanslı sağlık uzmanı, her bir soruyu ve ilgili yanıtı, bir doktordan mı yoksa ChatGPT’den mi geldiğini bilmeden değerlendirdi.
Değerlendiricilere ilk olarak hangi yanıtın “daha iyi” olduğu soruldu. Ardından, verilen bilginin kalitesini (çok zayıf, zayıf, kabul edilebilir, iyi veya çok iyi) ve sağlanan empatiyi veya hasta başı tavrını (empatik değil, biraz empatik, orta derecede empatik, empatik, çok empatik) derecelendirmeleri istendi. Değerlendiriciler ChatGPT yanıtlarını %79 oranında tercih etti.
Ortak yazar Jessica Kelley, “ChatGPT mesajları, hastanın sorularının genellikle doktor yanıtlarından daha fazla yönünü ele alan incelikli ve doğru bilgilerle yanıtlandı.” dedi.
ChatGPT’nin daha kaliteli yanıtlar verdiği de tespit edildi. “İyi” veya “çok iyi” yanıtlar ChatGPT için doktorlara kıyasla 3,6 kat daha yüksekti (ChatGPT %78,5 – doktorlar %22,1) ve yapay zekâ daha empatikti. “Empatik” veya “çok empatik” yanıtlar ChatGPT için doktorlara kıyasla 9,8 kat daha yüksekti (ChatGPT %45,1 – doktorlar %4,6).
Araştırmacılar, bunun doktorların vazgeçilmez olduğu anlamına gelmediğini, ChatGPT’yi uygulamalarını geliştirmek için bir öğrenme aracı olarak benimsemeleri gerektiğini söylüyor.
Çalışmanın yazarlarından Adam Poliak, “Çalışmamız ChatGPT ile doktorları karşı karşıya getirse de nihai çözüm doktorunuzu tamamen dışarı atmak değildir. Bunun yerine, ChatGPT’yi kullanan bir hekim daha iyi ve empatik bakım için bir çözümdür.” dedi.
Araştırmacılar ChatGPT’ye ve diğer yapay zekâlara yatırım yapmanın hasta sağlığını ve doktor performansını olumlu yönde etkileyeceğini söylüyor.
Araştırmanın yazarlarından Mark Dredze, “Bu teknolojileri doktorları hasta merkezli iletişim konusunda eğitmek, genellikle mesajlaşma yoluyla sağlık hizmeti arayan azınlık nüfusunun maruz kaldığı sağlık eşitsizliklerini ortadan kaldırmak, yeni tıbbi güvenlik sistemleri oluşturmak ve doktorlara daha kaliteli ve daha verimli bakım sunarak yardımcı olmak için kullanabiliriz.” ifadelerini kullanarak insan- yapay zekâ etkileşimi konusunda olumlu bir tablo çizdi.
Çalışmanın bulgularının bir sonucu olarak araştırmacılar, tıpta yapay zekâ kullanımının hem doktorlar hem de hastalar için sonuçları nasıl etkilediğini değerlendirmek için randomize kontrollü denemeler yapmayı düşünüyorlar.
Çalışma, JAMA Internal Medicine dergisinde yayımlandı.
Derleyen: Hatice Bulut