Mark Zuckerberg cuma günü yaptığı açıklamada Meta’nın yeni bir büyük dil modelini eğittiğini ve araştırmacılara sunacağını duyurdu. LLaMA, bilim insanlarının ve mühendislerin sorularını yanıtlamada ve belge özetlemede yardımcı olacak.
Meta’nın Temel Yapay Zekâ Araştırma (FAIR) ekibi tarafından geliştirilen yeni modelini piyasaya sürmesi, büyük teknoloji şirketlerinin yapay zekâ tekniklerindeki ilerlemeleri duyurmak ve teknolojiyi ticari ürünlere entegre etmek için yarıştığı bir döneme denk geliyor. Yapay zekâ teknolojisi alanına hâkim olma savaşı geçen yılın sonlarında Microsoft destekli OpenAI’ın ChatGPT’sinin piyasaya sürülmesiyle başladı ve Alphabet Inc’den Çinli Baidu Inc’e kadar teknolojinin ağır toplarını kendi tekliflerini sunmaya teşvik etti.
Büyük dil modelleri, bilgileri özetlemek ve içerik oluşturmak için büyük miktarda metin madenciliği yapıyor. Örneğin sorulara insanlar tarafından yazılmış gibi cümlelerle cevap verebilirler. Meta’nın önceki modellerinden çok daha az bilgi işlem gücü gerektirdiğini söylediği model, Latin ve Kiril alfabesine sahip 20 dil üzerinde eğitildi.
D.A. Davidson’da kıdemli yazılım analisti olan Gil Luria, “Meta’nın bugünkü duyurusu gelecekte ürünlerine uygulayabilmeleri için üretimsel yapay zekâ yeteneklerini test etmek için atılan bir adım gibi görünüyor. Üretimsel yapay zekâ, Meta’nın daha az deneyime sahip olduğu yeni bir yapay zekâ uygulamasıdır ancak işlerinin geleceği için açıkça önemlidir.” dedi.
Yapay zekâ, teknoloji endüstrisindeki yatırımlar için parlak bir nokta olarak ortaya çıkıyor. Meta, LLaMA’nın daha fazla parametreyi veya algoritmanın dikkate aldığı değişkenleri inceleyerek rakiplerinden daha iyi performans gösterebileceğini belirtti. Özellikle, LLaMA’nın 13 milyar parametreli bir versiyonunun, ChatGPT’nin üzerine inşa edildiği modelin yeni bir öncülü olan GPT-3’ten daha iyi performans gösterebileceği vurgulandı. Meta, 65 milyar parametreli LLaMA modelini, Google’ın Bard sohbet destekli aramasını göstermek için kullandığı modelden bile daha büyük olan Google’ın Chinchilla70B ve PaLM-540B modelleriyle rekabet edebilir olarak tanımladı. Meta geçen yıl mayıs ayında, yine araştırmacılara yönelik olan ve sohbet robotu BlenderBot’un yeni bir yinelemesinin temelini oluşturan OPT-175B adlı büyük dil modelini yayımlamıştı. Daha sonra bilimsel makaleler yazabilen ve matematik problemlerini çözebilen Galactica adlı bir modeli tanıtmış ancak yetkili gibi görünen yanlış yanıtlar ürettikten sonra demoyu hızla geri çekmişti.
Derleyen: Deniz Akbulut





