- Meta, OpenAI’ın ChatGPT, Bing Chat ve diğer sohbet robotları gibi uygulamaları yönlendirmek için tasarlanan yeni yapay zekâ modelleri seti Llama 2’yi duyurdu.
- Meta, genel olarak erişilebilir verilerin bir karışımıyla eğitilmiş olan Llama 2’nin performansının, önceki Llama modellerinden önemli ölçüde daha iyi olduğunu iddia ediyor.
- Llama 2, araştırma ve ticari kullanım için ücretsiz olarak kullanılabilecek.
Llama 2, diğer sohbet robotu benzeri sistemlerle karşılaştırılabilir şekilde, komutlara yanıt olarak metin ve kod üretebilen bir modeller koleksiyonu olan Llama’nın devamı olarak tasarlandı. Ancak Meta, kötüye kullanım endişesiyle modellere erişimi kısıtlama kararı alarak Llama’yı yalnızca talep üzerine kullanılabilir hâle getirmişti.
Buna karşılık araştırma ve ticari kullanım için ücretsiz olan Llama 2, AWS, Azure ve Hugging Face’in yapay zekâ modeli barındırma platformunda önceden eğitilmiş biçimde ince ayar için kullanılabilir olacak. Meta, Microsoft ile genişletilmiş ortaklık sayesinde Windows için optimize edilen ve Qualcomm’un Snapdragon yonga üstü sistemini barındıran akıllı telefonlar ve PC’ler için daha kolay çalıştırılabileceğini söylüyor.
Llama 2’nin Llama 2 ve Llama 2-Chat olmak üzere iki çeşidi var; bunlardan ikincisi iki yönlü konuşmalar için ayarlandı. Llama 2 ve Llama 2-Chat, farklı karmaşıklıktaki versiyonlara bölünmüş olarak geliyor: 7 milyar parametre, 13 milyar parametre ve 70 milyar parametre.
Llama 2, iki milyon belirteç üzerinde eğitildi. Bu sayı, ilk sürümün eğitildiği sayının (1,4 trilyon) neredeyse iki katı. Google’ın mevcut amiral gemisi büyük dil modeli (LLM) PaLM 2’nin 3,6 milyon belirteç üzerinde eğitildiği bildiriliyor ve GPT-4’ün de trilyonlarca belirteç üzerinde eğitildiği tahmin ediliyor.
Şirket, whitepaper’daki eğitim verilerinin belirli kaynaklarını açıklamıyor ancak bunların web’den alındığını, çoğunlukla İngilizce olduğunu, şirketin kendi ürün veya hizmetlerinden olmadığını ve “olgusal” nitelikteki metinleri vurguladığını belirtiyor.
Meta bir blog yazısında “Günümüzün büyük dil modellerini açıkça paylaşmanın, yararlı ve daha güvenli üretken yapay zekânın geliştirilmesini de destekleyeceğine inanıyoruz. Dünyanın Llama 2 ile neler inşa ettiğini görmek için sabırsızlanıyoruz.” diyor.
Derleyen: Ayça Ayaz