ChatGPT’nin rakiplerinden Claude AI, George Mason Üniversitesinin sınavlarından geçer not aldı. Profesörler, Claude AI’ın hukuk ve ekonomi testindeki soruları birçok insandan daha iyi yanıtladığını söylüyor.
Araştırma firması Anthropic tarafından geliştirilen Claude, profesörlerin sınav kağıtlarını öğrencilerin isimlerini bilmeden puanladıkları hukuk ve ekonomi testlerinden geçer not aldı. Profesörler, yapay zekâ teknolojisinin birçok insan daha iyi notlar aldığını açıkladı. George Mason Üniversitesinden Profesör Alex Tabarrok, Claude yapay zekâsının OpenAI tarafından geliştirilen yapay zekâya göre daha iyi olduğunu ancak yine de en iyi insan öğrencilere kıyasla oldukça kusurlu olduğunu belirtti. Profesör, yapay zekânın fikri mülkiyetle ilgili yasaların nasıl iyileştirilebileceğine ilişkin bir soruya verdiği yanıtı örnek gösterdi. Claude AI, fikri mülkiyet yasalarındaki potansiyel iyileştirmeleri detaylandıran beş ana noktayı içeren 400 kelimelik bir cevap sundu ancak bildirildiğine göre yapay zekânın cevabı net bir gerekçeden yoksundu.
Profesör Tabarrok, “Cevap zayıftı çünkü kanıtlanmamış görüşlere dayanıyordu. Daha iyi bir cevap için görüşünü ekonomik gerekçelere dayandırarak açıklamalıydı. Yine de inandırıcı bir yanıt ve birçok insan yanıtından daha iyi.” dedi. Claude’un bu başarısı ChatGPT’nin duyurulmasıyla yapay zekâ dil modellerine ilişkin oluşan yoğun ilgi sayesinde daha çok dikkat çekti. OpenAI’ın teknolojisi, karmaşık bilimsel kavramları basit terimlerle açıklamaktan yeni iş fikirleri bulmaya kadar birçok çeşitli soruya insan elinden çıkmış gibi verdiği yanıtlar sayesinde manşetlere çıkmıştı. ChatGPT’nin belirgin yetenekleri, bazı okul ve üniversitelerin hile yapılmasını önlemek amacıyla teknolojiyi bilgisayar ve cihazlardan yasaklamasına neden olmuştu. OpenAI CEO’su ve kurucu ortağı Sam Altman, “Teknoloji şu anda inanılmaz derecede sınırlı olsa da bireyleri yanıltacak derecede harika cevaplar verecek kadar iyi. Şu anda önemli bir şey için ona güvenmek hata olacaktır.” dedi.
Anthropic, Google’ın henüz piyasaya sürülmemiş LaMDA ve Sparrow sohbet robotlarını da içeren alandaki bir dizi rakipten yalnızca biri. OpenAI’ın eski çalışanları tarafından kurulan girişim, ChatGPT ve Claude’un farklı alanlarda güçlü yönleri olduğunu belirtti. Araştırmacılar, iki yapay zekâ botuna yakın zamanda yapılan bir test sonucunda, “Genel olarak Claude, birçok alanda ChatGPT’ye ciddi bir rakiptir. Claude’un yazıları daha ayrıntılı ama aynı zamanda daha doğal. Kendisinin sınırlamaları ve hedefleri hakkında tutarlı bir şekilde yazma yeteneği, diğer konulardaki soruları daha doğal bir şekilde yanıtlamasına da izin veriyor gibi görünüyor. Kod oluşturma veya kod hakkında akıl yürütme gibi diğer görevlerde ise Claude daha kötü görünüyor.” dedi.
Derleyen: Deniz Akbulut