Alibaba Qwen 3 ile Google ve OpenAI'a Meydan Okuyor

Alibaba Qwen 3 ile Google ve OpenAI'a Meydan Okuyor
Photo by zhang hui / Unsplash

Çinli teknoloji devi Alibaba, yapay zeka dünyasında dengeleri değiştirebilecek yeni bir adım attı. Şirket, Qwen 3 adını verdiği yeni yapay zeka model ailesini duyurdu. Alibaba'nın iddiasına göre bu modeller, bazı alanlarda Google ve OpenAI gibi sektör liderlerinin en iyi modelleriyle eşleşiyor, hatta onları geride bırakıyor.

Qwen 3 Nedir? 'Hibrit' Muhakeme Yeteneği

Alibaba, Qwen 3 modellerini "hibrit" olarak tanımlıyor. Bu, modellerin karmaşık problemler üzerinde daha fazla zaman harcayıp "düşünebilmesi" (muhakeme yapabilmesi) ve daha basit isteklere hızla yanıt verebilmesi anlamına geliyor. Muhakeme yeteneği, modellerin OpenAI'ın bazı modelleri gibi kendi kendini doğrulamasını sağlıyor ancak bu durum yanıt süresini biraz artırabiliyor.

Qwen ekibi, blog yazılarında "Düşünme ve düşünmeme modlarını sorunsuz bir şekilde entegre ederek kullanıcılara düşünme bütçesini kontrol etme esnekliği sunduk," diye belirtiyor.

Geniş Dil Desteği ve Büyük Veri Seti

Qwen 3 modelleri, 119 dili destekliyor ve yaklaşık 36 trilyon token'lık devasa bir veri setiyle eğitildi. (Token, modelin işlediği ham veri parçalarıdır; 1 milyon token yaklaşık 750.000 kelimeye eşdeğerdir). Alibaba, Qwen 3'ün ders kitapları, soru-cevap çiftleri, kod parçacıkları ve daha fazlasının bir kombinasyonuyla eğitildiğini söylüyor.

Performans ve Karşılaştırmalar

Alibaba'ya göre, bu iyileştirmeler Qwen 3'ün performansını bir önceki sürüm olan Qwen 2'ye kıyasla önemli ölçüde artırdı. Örneğin:

  • Programlama yarışmaları platformu Codeforces'ta, en büyük Qwen 3 modeli (Qwen-3-235B-A22B), OpenAI'ın o3-mini modelini geride bırakıyor.
  • Aynı model, zorlu bir matematik ölçütü olan AIME'nin son sürümünde ve modellerin problem çözme yeteneğini değerlendiren BFCL testinde de o3-mini'den daha iyi performans gösteriyor.

Ancak belirtmek gerekir ki, bu en büyük model olan Qwen-3-235B-A22B henüz halka açık değil.

Halka açık en büyük Qwen 3 modeli olan Qwen3-32B ise DeepSeek'in R1'i gibi birçok özel ve açık kaynaklı yapay zeka modeliyle rekabet edebilecek düzeyde. Hatta Qwen3-32B, LiveBench gibi bazı doğruluk testlerinde OpenAI'ın o1 modelini geride bırakıyor.

Açık Kaynak Yaklaşımı ve Sektöre Etkileri

Modellerin çoğu (0.6 milyar ila 235 milyar parametre arasında değişen boyutlarda) Hugging Face ve GitHub gibi platformlardan "açık" bir lisans altında indirilebiliyor veya yakında indirilebilecek. Bu durum, Qwen gibi Çin menşeli model serilerinin yükselişinin, OpenAI gibi Amerikan laboratuvarları üzerindeki daha yetenekli yapay zeka teknolojileri sunma baskısını artırdığını gösteriyor.

Alibaba, Qwen 3'ün araç çağırma yetenekleri, talimatları takip etme ve belirli veri formatlarını kopyalama konularında da başarılı olduğunu belirtiyor. Modeller, Fireworks AI ve Hyperbolic gibi bulut sağlayıcıları aracılığıyla da kullanılabiliyor.

Yapay zeka bulut sunucusu Baseten'in kurucu ortağı ve CEO'su Tuhin Srivastava'ya göre, Qwen 3'ün başarısı, açık kaynak modellerin OpenAI gibi kapalı kaynak sistemlerle başa baş gittiği yönündeki eğilimi destekliyor. Srivastava, "ABD, Çin'e çip satışını ve Çin'den alımları kısıtlamaya devam etse de, Qwen 3 gibi son teknoloji ve açık modeller şüphesiz ülke içinde kullanılacaktır," diyor.

Sonuç

Alibaba'nın Qwen 3 hamlesi, yapay zeka alanındaki rekabetin ne kadar dinamik olduğunu bir kez daha gösteriyor. Açık kaynaklı modellerin yeteneklerinin artması, işletmelerin hem kendi araçlarını geliştirmelerine hem de Anthropic ve OpenAI gibi kapalı model şirketlerinden hazır çözümler satın almalarına olanak tanıyor. Qwen 3'ün özellikle muhakeme yetenekleri ve geniş dil desteği, onu dikkate değer bir oyuncu haline getiriyor.


Referanslar

Read more

Near Space Labs: Stratosferik Görüntüleme İçin 20 Milyon Dolar Yatırım

Near Space Labs: Stratosferik Görüntüleme İçin 20 Milyon Dolar Yatırım

Near Space Labs: Stratosferik Görüntüleme İçin 20 Milyon Dolar Yatırım Dünya'nın yukarıdan görüntülenmesi denince akla genellikle uydular, dronlar ve uçaklar gelir. Ancak Near Space Labs adlı bir girişim, yüksek çözünürlüklü fotoğraflar çekmek için çok farklı bir yöntem kullanıyor: stratosfere yükselen helyum balonları! Stratosferde Gezinen Robotlar: Swift Teknolojisi Near

By Cansın Cengiz
Lex Proxima Studios LTD