OpenAI tarafından geliştirilen yeni bir yapay zeka modeli, genel zekayı ölçmek için tasarlanmış bir testte insan seviyesinde performans gösterdi. “o3” adı verilen bu model, ARC-AGI kıyaslama testinde %85 puan alarak daha önceki yapay zeka modellerinin elde ettiği en yüksek puanı (%55) geride bıraktı ve ortalama insan puanına ulaştı. o3 ayrıca zorlu bir matematik testinde de başarılı sonuçlar elde etti.
Genel Zeka (AGI) Hedefine Doğru Bir Adım
Yapay genel zeka (AGI), insan zekasına benzer şekilde çeşitli görevleri yerine getirebilen ve yeni durumlara uyum sağlayabilen bir yapay zeka türüdür. o3’ün ARC-AGI testindeki başarısı, AGI hedefine doğru atılmış önemli bir adım olarak değerlendiriliyor.
ARC-AGI Testi Nedir?
ARC-AGI, bir yapay zeka sisteminin yeni bir duruma uyum sağlama yeteneğini ölçen bir testtir. Test, yapay zekanın az sayıda örnekten öğrenme ve genelleme yapma kapasitesini değerlendirir.
o3’ün Başarısının Sırrı
o3’ün başarısının ardında yatan faktörler henüz tam olarak bilinmiyor. Ancak, OpenAI’ın açıklamalarına göre, modelin daha fazla “düşünme” süresi ve farklı “düşünce zincirleri” arasında arama yapma yeteneği, bu başarıda etkili olmuş olabilir.
AGI’ye Ne Kadar Yaklaştık?
o3’ün ARC-AGI testindeki başarısı, AGI’ye ne kadar yaklaştığımız konusunda tartışmaları da beraberinde getirdi. Bazı uzmanlar, bu sonucun AGI’ye giden yolda önemli bir kilometre taşı olduğunu düşünürken, bazıları ise o3’ün henüz gerçek anlamda genel zekaya sahip olmadığını savunuyor.
o3’ün Geleceği
o3’ün potansiyelini tam olarak anlamak için daha fazla araştırma ve değerlendirme yapılması gerekiyor. Modelin gerçek dünyadaki uygulamaları ve AGI’ye ulaşma yolunda ne kadar ilerlediğini zaman gösterecek.
Derleyen: Enis Yabar