OpenAI, şirketin “derin öğrenmeyi ölçeklendirme çabasındaki en son kilometre taşı” olarak adlandırdığı güçlü, yeni bir görüntü ve metin anlama AI modeli GPT-4’ü piyasaya sürdü. GPT-4, bugün itibarıyla OpenAI’in viral yapay zekâ destekli sohbet robotu ChatGPT için premium üyelik planı ChatGPT Plus’ta kullanılabilir.
Ayrıca Microsoft bugün, OpenAI ile birlikte geliştirdiği chatbot teknolojisi Bing Chat’in GPT-4 üzerinde çalıştığını doğruladı. Bu teknolojiyi erken benimseyenler arasında web sitelerini taramak ve müşteri destek personeline bir özet sunmak için GPT-4 kullanan Stripe ve GPT-4’ü yeni bir dil öğrenme aboneliğine yerleştiren Duolingo yer alıyor.
OpenAI’e göre GPT-4, resim ve metin girişlerini kabul edip algılayabiliyor- yalnızca metin kabul eden selefi GPT-3.5’e göre bu büyük bir gelişme- ve çeşitli profesyonel ve akademik ölçütlerde “insan düzeyinde” performans gösteriyor. Örneğin GPT-3, simüle edilmiş bir bar sınavını, sınava girenlerin ilk %10’u civarında bir puanla geçebiliyordu.
Şirkete göre OpenAI, ChatGPT’nin yanı sıra bir rakip test programından alınan dersleri kullanarak GPT-4’ü yinelemeli olarak hizalamak için altı ay harcadı ve şirkete göre gerçeklik, yönlendirilebilirlik ve sınırların dışına çıkmayı reddetme konularında “şimdiye kadarki en iyi sonuçları” sağladı.
OpenAI, GPT-4’ü duyuran bir blog yazısında, “Sıradan bir sohbette, GPT-3.5 ve GPT-4 arasındaki fark ince olabilir. Fark, görevin karmaşıklığı yeterli bir eşiğe ulaştığında ortaya çıkıyor. GPT-4 daha güvenilir, yaratıcı ve GPT-3.5’ten çok daha incelikli talimatları işleyebiliyor.” dedi.
Hiç şüphesiz GPT-4’ün daha ilginç yönlerinden biri, metin kadar görüntüleri de anlama yeteneği. GPT-4, nispeten karmaşık görüntülere altyazı ekleyebilir ve hatta yorumlayabilir: Kablo takılı bir iPhone’un resminden bunun bir Lightning Kablosu adaptörü olduğunu tanımlamak gibi.
Derleyen: Tutku Oza Topçu