- Llama 3.1, 405 milyar parametresiyle bugüne kadarki en büyük açık kaynak dil modeli olarak öne çıkarken, çoklu görevleri yerine getirebilme ve “araç kullanımı” yetenekleriyle de dikkatleri üzerine çekiyor.
Meta, yapay zeka alanında ses getiren açık kaynak modeli Llama’nın en yeni versiyonu Llama 3.1 ile çığır açmaya devam ediyor. Llama 3.1, 405 milyar parametresiyle bugüne kadarki en büyük açık kaynak dil modeli olarak öne çıkarken, çoklu görevleri yerine getirebilme ve “araç kullanımı” yetenekleriyle de dikkatleri üzerine çekiyor.
Meta’nın uzmanları tarafından yapılan üç önemli tasarım kararı, giderek büyüyen sinir ağlarının mühendisliğinde adeta bir güç gösterisi niteliğinde.
Meta, “Uzman Karışımı” yerine Standart “Decoder-Only” Transformer Modelini Tercih Etti: Google’ın Gemini 1.5 ve Mistral’ın Mixtral modelleri gibi rakiplerin aksine Meta, 2017’de Google tarafından geliştirilen ve günümüzde yaygın olarak kullanılan Transformer modelini tercih etti. Bu sayede modelin eğitim sürecinde daha istikrarlı olması hedeflendi.
Aşamalı Eğitim ve Özel Ölçeklendirme Yasasıyla Performans Artışı: Meta’nın araştırmacıları, modelin tahmin yeteneğini geliştirmek için eğitim verilerini ve hesaplama gücünü aşamalı olarak artırdıkları özel bir yöntem geliştirdi. Bu yöntem, modelin “ölçeklendirme yasalarını” dikkate alarak, her adımda modelin performansını doğru bir şekilde tahmin etmesine olanak tanıyor. Böylece, 405 milyar parametrenin ideal nokta olduğu tespit edildi.
Kapsamlı Eğitim Sonrası Süreçle İstenmeyen Çıktılar Azaltıldı: Llama 3.1, eğitim sonrası insan geri bildirimleriyle ince ayar yapıldı. Bu sayede model, istenmeyen çıktıları belirleme ve “halüsinasyon” adı verilen yanlış bilgi üretme eğilimini azaltma konusunda önemli ölçüde gelişti. Ayrıca, modelin harici araçları kullanabilmesi için özel olarak eğitilmesi, Llama 3.1’in yeteneklerini daha da artırdı.
Llama 3.1’in Avantajları Neler?
Açık Kaynak ve Erişilebilirlik: Llama 3.1, yapay zeka dünyasının demokratikleşmesine katkı sağlayan açık kaynak bir modeldir. Geliştiriciler ve araştırmacılar, modeli kendi projelerinde kullanarak yapay zeka teknolojisinin gelişimine katkıda bulunabilirler.
Yüksek Performans ve Düşük Maliyet: Llama 3.1, kapalı kaynaklı rakiplerine kıyasla yüksek performans gösteriyor. Üstelik bu performansı, daha düşük maliyetle sunması da büyük bir avantaj.
Çoklu Görev Yeteneği: Llama 3.1, metin oluşturma, çeviri, kod yazma gibi birçok farklı görevi başarıyla yerine getirebiliyor.
“Araç Kullanımı” Becerisiyle Kapsamlı Sonuçlar: Llama 3.1, arama motorları gibi harici araçları kullanarak daha kapsamlı ve doğru sonuçlar elde edebiliyor.
Llama 3.1, yapay zeka dünyasında açık kaynaklı modellerin gücünü bir kez daha gözler önüne seriyor. Gelecekte Llama ve benzeri açık kaynak modellerin, yapay zeka alanında daha büyük projelere ve yeniliklere öncülük etmesi bekleniyor.
Derleyen: Enis Yabar