Google yeni bir yapay zeka modeli üzerinde çalışıyor. Gemini 2.0 Flash Thinking Experimental olarak adlandırılan yeni model, Google’ın AI prototipleme platformu AI Studio’da mevcut. Bir model kartı bu modeli “çok modlu anlama, akıl yürütme ve kodlama için en iyisi” olarak tanımlıyor ve programlama, matematik ve fizik gibi alanlarda “en karmaşık problemler üzerinde akıl yürütme” yeteneğine sahip olduğunu belirtiyor.
Yapay Zeka Stüdyosu’nun ürün yöneticisi Logan Kilpatrick, X’te yayınlanan bir yazısında Gemini 2.0 Flash Thinking Experimental’ı “Google’ın akıl yürütme yolculuğunun ilk adımı” olarak nitelendirdi. Google’ın yapay zeka araştırma bölümü Google DeepMind’ın baş bilim adamı Jeff Dean de kendi paylaşımında Gemini 2.0 Flash Thinking Experimental’ın, muhakemesini güçlendirmek için düşünceleri kullanmak üzere eğitildiğini söyledi.
Dean, bir soruyu değerlendirirken modeli “çalıştırmak” için kullanılan hesaplama miktarına atıfta bulunarak, “Çıkarım süresi hesaplamasını artırdığımızda umut verici sonuçlar görüyoruz.” dedi.
Google’ın kısa süre önce duyurduğu Gemini 2.0 Flash modeli üzerine inşa edilen Gemini 2.0 Flash Thinking Experimental, tasarım olarak OpenAI’nin o1 ve diğer sözde muhakeme modellerine benziyor. Çoğu yapay zekanın aksine, muhakeme modelleri kendilerini etkin bir şekilde kontrol eder. Bu da normalde yapay zeka modellerini tuzağa düşüren bazı tuzaklardan kaçınmalarına yardımcı olur.
Bir dezavantaj olarak, muhakeme modellerinin çözümlere ulaşması genellikle daha uzun sürer.
Bir komut verildiğinde, Gemini 2.0 Flash Thinking Experimental yanıt vermeden önce duraklar, bir dizi ilgili komutu değerlendirir ve yol boyunca muhakemesini “açıklar”. Bir süre sonra, model en doğru cevap olarak gördüğü şeyi özetler.
Olması gereken de bu zaten. Gemini 2.0 Flash Thinking Experimental’a “Strawberry” kelimesinde kaç tane R harfi olduğunu sorduğumda “iki” dedi.
Diğer şirketler de harakete geçti
o1’in piyasaya sürülmesinin ardından sadece Google değil, rakip yapay zeka laboratuvarlarından da akıl yürütme modellerinde bir patlama yaşandı. Kasım ayı başlarında, quant trader’lar tarafından finanse edilen bir yapay zeka araştırma şirketi olan DeepSeek, ilk muhakeme modeli olan DeepSeek-R1’in ön izlemesini başlattı. Aynı ay Alibaba’nın Qwen ekibi, o1’e ilk “açık” rakip olduğunu iddia ettiği modeli tanıttı.
Bloomberg Ekim ayında Google’ın muhakeme modelleri geliştiren birkaç ekibi olduğunu bildirdi. Kasım ayında The Information tarafından yapılan müteakip haber, şirketin bu teknolojiye odaklanan en az 200 araştırmacısı olduğunu ortaya koydu.
Muhakeme modeli kapılarını ne açtı? Öncelikle, üretici yapay zekayı iyileştirmek için yeni yaklaşımlar arayışı. Meslektaşım Max Zeff’in yakın zamanda bildirdiği gibi, modelleri ölçeklendirmek için kullanılan “kaba kuvvet” teknikleri artık eskisi kadar iyileştirme sağlamıyor.
Herkes muhakeme modellerinin ileriye dönük en iyi yol olduğuna ikna olmuş değil. Birincisi, onları çalıştırmak için gereken büyük miktarda bilgi işlem gücü sayesinde pahalı olma eğilimindedirler. Ve şimdiye kadar kıyaslamalarda iyi performans göstermiş olsalar da muhakeme modellerinin bu ilerleme hızını koruyup koruyamayacağı net değil.
Derleyen: Rüya Uzun