Foxconn, üretim ve tedarik zinciri yönetimini iyileştirmek için ilk büyük dil modelini (FoxBrain) piyasaya sürdü. Model, Nvidia’nın H100 GPU’ları ile eğitildi.
Detaylar haberimizde…
Tayvan’ın Foxconn şirketi, üretim ve tedarik zinciri yönetimini iyileştirmek amacıyla ilk büyük dil modelini (LLM) piyasaya sürdüğünü duyurdu.
Özetle bu yazıda:

FoxBrain’in Özellikleri:
- Modelin adı “FoxBrain” olarak belirlendi.
- Nvidia’nın 120 adet H100 GPU’su kullanılarak yaklaşık dört haftada eğitildi.
- Apple için iPhone montajı yapan ve Nvidia’nın yapay zeka sunucularını üreten şirket, modelin Meta’nın Llama 3.1 mimarisine dayandığını belirtti.
- Geleneksel Çince ve Tayvan dil stilleri için optimize edilmiş, muhakeme yeteneklerine sahip Tayvan’ın ilk büyük dil modelidir.
- Başlangıçta iç uygulamalar için tasarlanan FoxBrain, veri analizi, karar desteği, belge işbirliği, matematik, muhakeme ve problem çözme ve kod oluşturmayı kapsıyor.
Foxconn’un Hedefleri:
- Foxconn, modelin uygulamalarını genişletmek, açık kaynak bilgilerini paylaşmak ve üretim, tedarik zinciri yönetimi ve akıllı karar vermede yapay zekayı teşvik etmek için teknoloji ortaklarıyla işbirliği yapmayı planlıyor.
- Nvidia, Tayvan merkezli süper bilgisayarı “Taipei-1” aracılığıyla destek sağladı ve modelin eğitimi sırasında teknik danışmanlık sundu.
- Foxconn, Mart ortasında Nvidia’nın GTC geliştirici konferansında model hakkında daha fazla ayrıntı açıklayacak.

Teknolojik Detaylar:
- Tayvan’ın en büyük süper bilgisayarı Taipei-1, adanın güneyindeki Kaohsiung şehrinde Nvidia‘ya ait ve Nvidia tarafından işletiliyor.
- Foxconn, Çin’in DeepSeek’in damıtma modeliyle karşılaştırıldığında küçük bir performans farkı olduğunu, ancak genel performansının dünya standartlarına çok yakın olduğunu belirtti.
Derleyen: Enis Yabar