LlamaCon: Meta AI Geliştiricilerini Yeniden Kazanabilecek Mi?

LlamaCon: Meta AI Geliştiricilerini Yeniden Kazanabilecek Mi?

Meta'nın LlamaCon Etkinliği: AI Geliştiricilerinin Kalbi Yeniden Kazanılacak Mı?

Meta, Menlo Park'taki genel merkezinde ilk AI geliştirici konferansı olan LlamaCon'a ev sahipliği yapıyor. Şirketin amacı, geliştiricileri açık kaynaklı Llama AI modelleriyle uygulamalar geliştirmeye teşvik etmek. Daha bir yıl önce bu kolay bir satış gibi görünse de, son aylarda Meta, hızla gelişen yapay zeka yarışında hem DeepSeek gibi "açık" AI laboratuvarlarına hem de OpenAI gibi kapalı ticari rakiplere ayak uydurmakta zorlandı. LlamaCon, Meta'nın geniş bir Llama ekosistemi kurma arayışında kritik bir dönemeçte gerçekleşiyor.

Geliştiricileri kazanmak, daha iyi açık modeller sunmak kadar basit olabilir. Ancak bu, kulağa geldiğinden daha zor olabilir.

Umut Veren Başlangıç ve Llama 4'ün Yarattığı Hayal Kırıklığı

Meta'nın bu ayın başlarında Llama 4'ü piyasaya sürmesi, geliştiriciler arasında beklenen etkiyi yaratmadı. Birçok karşılaştırmalı değerlendirme puanı, DeepSeek'in R1 ve V3 gibi modellerinin gerisinde kaldı. Bu durum, bir zamanlar sınırları zorlayan bir model serisi olan Llama'nın geldiği noktadan oldukça farklıydı.

Geçtiğimiz yaz Meta, Llama 3.1 405B modelini piyasaya sürdüğünde, CEO Mark Zuckerberg bunu büyük bir başarı olarak lanse etmişti. Meta, bir blog gönderisinde Llama 3.1 405B'yi "en yetenekli açık kaynaklı temel model" olarak nitelendirmiş ve performansının o dönemdeki en iyi OpenAI modeli olan GPT-4o ile rekabet ettiğini belirtmişti. Llama 3 ailesindeki diğer modeller de oldukça etkileyiciydi ve geliştiriciler arasında Meta'ya büyük bir sempati kazandırmıştı. Hugging Face ürün ve büyüme başkanı Jeff Boudier, Llama 3.3 modelinin Llama 4'ten daha sık indirildiğini belirtti.

Karşılaştırma Ölçütlerindeki Sorunlar ve Eksik Akıl Yürütme Modeli

Llama 4'ün başlangıcı tartışmalı oldu. Meta, Llama 4 modellerinden biri olan Llama 4 Maverick'in bir sürümünü "konuşkanlık" için optimize etti ve bu sayede kitle kaynaklı karşılaştırma ölçütü LM Arena'da üst sıralara yerleşti. Ancak Meta, bu modeli hiçbir zaman genel kullanıma sunmadı ve geniş çapta yayınlanan Maverick sürümü LM Arena'da çok daha düşük performans gösterdi.

LM Arena'nın arkasındaki grup, Meta'nın bu tutarsızlık konusunda "daha net" olması gerektiğini belirtti. LM Arena kurucu ortağı ve UC Berkeley profesörü Ion Stoica, bu olayın geliştirici topluluğunun Meta'ya olan güvenini zedelediğini ifade etti.

Llama 4 ailesindeki dikkat çekici bir eksiklik ise bir AI akıl yürütme (reasoning) modeliydi. Akıl yürütme modelleri, soruları yanıtlamadan önce dikkatlice üzerinde çalışabilir. Geçen yıl yapay zeka endüstrisinin büyük bir kısmı, belirli karşılaştırma ölçütlerinde daha iyi performans gösterme eğiliminde olan akıl yürütme modelleri yayınladı. Meta, bir Llama 4 akıl yürütme modeli üzerinde çalıştıklarını ima etse de, ne zaman yayınlanacağına dair bir bilgi vermedi.

Meta Üzerindeki Baskı Artıyor

Ai2 araştırmacısı Nathan Lambert, Meta'nın Llama 4 ile birlikte bir akıl yürütme modeli yayınlamamasının, şirketin lansmanı aceleye getirmiş olabileceğini düşündürdüğünü belirtiyor. Rakip açık modellerin artık eskisinden çok daha gelişmiş olduğunu ve daha çeşitli biçimlerde geldiğini belirten Lambert, bunun Meta üzerindeki baskıyı artırdığını vurguluyor. Örneğin, Alibaba'nın Pazartesi günü yayınladığı Qwen 3 model koleksiyonunun, bir programlama karşılaştırma ölçütü olan Codeforces'ta OpenAI ve Google'ın en iyi kodlama modellerinden bazılarını geride bıraktığı iddia ediliyor.

NYU Veri Bilimi Merkezi'nden AI araştırmacısı Ravid Shwartz-Ziv'e göre, Meta'nın açık model liderliğini yeniden kazanması için tek yapması gereken üstün modeller sunmak. Bu, yeni teknikler kullanmak gibi daha fazla risk almayı gerektirebilir.

Meta'nın şu anda büyük riskler alabilecek durumda olup olmadığı belirsiz. Eski ve mevcut çalışanlar daha önce Fortune'a Meta'nın AI araştırma laboratuvarının "yavaş bir ölümle öldüğünü" söylemişti. Şirketin AI Araştırma Başkan Yardımcısı Joelle Pineau da bu ay ayrılacağını duyurdu.

LlamaCon, Meta'nın OpenAI, Google, xAI ve diğerleri gibi AI laboratuvarlarından gelecek sürümleri geride bırakmak için neler hazırladığını gösterme şansı. Eğer bunu başaramazsa, şirket ultra rekabetçi alanda daha da geride kalabilir.

Referanslar

Read more

Near Space Labs: Stratosferik Görüntüleme İçin 20 Milyon Dolar Yatırım

Near Space Labs: Stratosferik Görüntüleme İçin 20 Milyon Dolar Yatırım

Near Space Labs: Stratosferik Görüntüleme İçin 20 Milyon Dolar Yatırım Dünya'nın yukarıdan görüntülenmesi denince akla genellikle uydular, dronlar ve uçaklar gelir. Ancak Near Space Labs adlı bir girişim, yüksek çözünürlüklü fotoğraflar çekmek için çok farklı bir yöntem kullanıyor: stratosfere yükselen helyum balonları! Stratosferde Gezinen Robotlar: Swift Teknolojisi Near

By Cansın Cengiz
Lex Proxima Studios LTD