Çinli teknoloji şirketi Alibaba, Google ve OpenAI’ın en iyi modelleriyle yarışabileceğini ve bazı durumlarda onları geride bırakabileceğini iddia ettiği Qwen3 adlı yeni bir yapay zeka model ailesini tanıttı.
Detaylar haberimizde…
Çinli teknoloji şirketi Alibaba, Pazartesi günü Qwen3 adını verdiği yeni bir yapay zeka model ailesini piyasaya sürdü. Şirket, bu modellerin Google ve OpenAI’ın mevcut en iyi modelleriyle eşleşebileceğini ve bazı durumlarda onları geride bırakabileceğini iddia ediyor.
Modellerin çoğu, yapay zeka geliştirme platformları Hugging Face ve GitHub üzerinden “açık” bir lisans altında indirilebilir durumda veya yakında kullanıma sunulacak. Bu modeller, 0,6 milyar parametreden 235 milyar parametreye kadar değişen boyutlara sahip. (Parametreler kabaca bir modelin problem çözme becerilerine karşılık gelir ve daha fazla parametreye sahip modeller genellikle daha az parametreye sahip olanlardan daha iyi performans gösterir.)
Qwen gibi Çin kaynaklı model serilerinin yükselişi, OpenAI gibi Amerikan laboratuvarları üzerindeki daha yetenekli yapay zeka teknolojileri sunma baskısını artırdı. Ayrıca, politika yapıcıları Çinli yapay zeka şirketlerinin model eğitmek için gerekli çipler elde etme yeteneklerini sınırlamayı amaçlayan kısıtlamalar uygulamaya yöneltti.
Qwen3’ün Temel Özellikleri
Alibaba’ya göre, Qwen3 modelleri “hibrit” modellerdir – karmaşık problemleri “akıl yürütmek” için zaman ayırabilir veya daha basit istekleri hızlı bir şekilde yanıtlayabilirler. Akıl yürütme, modellerin OpenAI’ın o3 gibi modellerine benzer şekilde kendilerini etkili bir şekilde kontrol etmelerini sağlar, ancak bu daha yüksek gecikme pahasına olur.
Qwen ekibi bir blog gönderisinde, “Düşünme ve düşünmeme modlarını sorunsuz bir şekilde entegre ettik ve kullanıcılara düşünme bütçesini kontrol etme esnekliği sunuyoruz,” diye yazdı. “Bu tasarım, kullanıcıların göreve özel bütçeleri daha kolay yapılandırmasına olanak tanıyor.”
Modellerin bazıları, sorguları yanıtlamak için daha hesaplama açısından verimli olabilen uzmanlar karışımı (MoE) mimarisini de benimsiyor. MoE, görevleri alt görevlere ayırır ve bunları daha küçük, özel “uzman” modellere devreder.
Alibaba, Qwen3 modellerinin 119 dili desteklediğini ve yaklaşık 36 trilyon belirteçlik bir veri kümesi üzerinde eğitildiğini belirtti. (Belirteçler, bir modelin işlediği ham veri parçacıklarıdır; 1 milyon belirteç yaklaşık 750.000 kelimeye eşittir.) Şirket, Qwen3’ün ders kitapları, “soru-cevap çiftleri”, kod parçacıkları ve yapay zeka tarafından oluşturulan verilerin bir kombinasyonu üzerinde eğitildiğini söyledi.
Alibaba, bu iyileştirmelerin ve diğerlerinin, Qwen3’ün yeteneklerini öncülü olan Qwen2’ye kıyasla büyük ölçüde artırdığını belirtti. Qwen3 modellerinin hiçbiri, OpenAI’ın o3 ve o4-mini gibi en üst düzeydeki son modellere belirgin bir üstünlük sağlamıyor gibi görünse de, yine de güçlü performans gösteriyorlar.
Benchmark Sonuçları
Programlama yarışmaları için bir platform olan Codeforces’ta, en büyük Qwen3 modeli – Qwen-3-235B-A22B – OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini az farkla geride bıraktı. Qwen-3-235B-A22B ayrıca zorlu bir matematik kıyaslaması olan AIME’nin en son sürümünde ve bir modelin problemleri “akıl yürütme” yeteneğini değerlendiren bir test olan BFCL’de o3-mini’yi geride bıraktı.
Ancak Qwen-3-235B-A22B henüz kamuya açık değil.
En büyük halka açık Qwen3 modeli olan Qwen3-32B, Çinli yapay zeka laboratuvarı DeepSeek’in R1’i de dahil olmak üzere bir dizi tescilli ve açık yapay zeka modeliyle hala rekabetçi durumda. Qwen3-32B, kodlama kıyaslaması LiveCodeBench dahil olmak üzere çeşitli testlerde OpenAI’ın o1 modelini geride bırakıyor.
Alibaba, Qwen3’ün araç çağırma yeteneklerinin yanı sıra talimatları izleme ve belirli veri formatlarını kopyalama konusunda “mükemmel” olduğunu belirtti. İndirilebilir modellerin yanı sıra Qwen3, Fireworks AI ve Hyperbolic dahil olmak üzere bulut sağlayıcılardan da edinilebilir.
Yapay zeka bulut barındırıcısı Baseten’in kurucu ortağı ve CEO’su Tuhin Srivastava, Qwen3’ün açık modellerin OpenAI gibi kapalı kaynaklı sistemlerle aynı hızda ilerlediği trendinde bir başka nokta olduğunu söyledi.
Srivastava TechCrunch’a verdiği demeçte, “ABD, Çin’e çip satışını ve Çin’den yapılan alımları kısıtlamaya yoğunlaşıyor, ancak Qwen 3 gibi son teknoloji ve açık modeller şüphesiz yurt içinde kullanılacak,” dedi. “Bu, işletmelerin hem kendi araçlarını geliştirdiği hem de Anthropic ve OpenAI gibi kapalı model şirketleri aracılığıyla hazır ürünler satın aldığı gerçeğini yansıtıyor.”
Derleyen: Enis Yabar