Manus Çin'in İkinci 'DeepSeek Anı' Olmayabilir

Geçen hafta önizleme sürümü yayınlanan "agentic" yapay zeka platformu Manus, bir Taylor Swift konserinden daha fazla heyecan yaratıyor. Hugging Face'in ürün başkanı Manus'u "şimdiye kadar denediğim en etkileyici yapay zeka aracı" olarak nitelendirdi. Yapay zeka politika araştırmacısı Dean Ball, Manus'u "yapay zekayı kullanan en sofistike bilgisayar" olarak tanımladı. Manus'un resmi Discord sunucusu birkaç gün içinde 138.000'den fazla üyeye ulaştı ve Manus davet kodlarının Çinli yeniden satış uygulaması Xianyu'da binlerce dolara satıldığı bildiriliyor.
Ancak bu heyecanın haklı olup olmadığı net değil.
Sıfırdan Geliştirilmedi
Manus tamamen sıfırdan geliştirilmedi. Sosyal medyadaki raporlara göre, platform araştırma raporları hazırlamak ve finansal dosyaları analiz etmek gibi görevleri yerine getirmek için Anthropic'in Claude ve Alibaba'nın Qwen dahil olmak üzere mevcut ve ince ayarlı yapay zeka modellerinin bir kombinasyonunu kullanıyor.
Ancak Manus'un arkasındaki Çinli girişim Monica, web sitesinde platformun gayrimenkul satın almaktan video oyunları programlamaya kadar gerçekleştirebileceği iddia edilen birkaç çarpıcı örnek veriyor.
X'te viral olan bir videoda, Manus için araştırma lideri olan Yichao "Peak" Ji, platformun OpenAI'nin Deep Research ve Operator gibi agentic araçlarından üstün olduğunu ima etti. Ji, Manus'un genel yapay zeka asistanları için popüler bir kıyaslama olan GAIA'da Deep Research'ü geride bıraktığını iddia etti. Bu kıyaslama, bir yapay zekanın web'de gezinme, yazılım kullanma ve daha fazlasını yaparak iş yapma yeteneğini test ediyor.
"[Manus] sadece başka bir sohbet robotu veya iş akışı değil," dedi Ji videoda. "Konsept ile uygulama arasındaki boşluğu dolduran tamamen otonom bir agent [...] Bunu insan-makine işbirliğinin bir sonraki paradigması olarak görüyoruz."
Kullanıcı Deneyimleri Karışık
Ancak bazı erken kullanıcılar Manus'un her derde deva olmadığını söylüyor.
Yapay zeka girişimi Pleias'ın kurucu ortağı Alexander Doria, X'teki bir gönderide Manus'u test ederken hata mesajları ve sonsuz döngülerle karşılaştığını söyledi. Diğer X kullanıcıları, Manus'un gerçek sorularda hatalar yaptığını, çalışmalarını tutarlı bir şekilde alıntılamadığını ve çevrimiçi ortamda kolayca bulunan bilgileri sıklıkla kaçırdığını belirtti.
TechCrunch yazarının Manus ile deneyimi de olumlu değildi. Yazar, platformdan oldukça basit görünen bir isteği yerine getirmesini istedi: teslimat mesafesindeki en iyi derecelendirmeye sahip fast food restoranından kızarmış tavuk sandviç sipariş etmek. Yaklaşık on dakika sonra, Manus çöktü. İkinci denemede, kriterlerini karşılayan bir menü öğesi buldu, ancak Manus sipariş işlemini tamamlayamadı veya bir ödeme bağlantısı bile sağlayamadı.
Manus, yazarın NYC'den Japonya'ya uçuş ayarlamasını istemesinde de başarısız oldu. Çok fazla belirsizlik bırakmadığını düşündüğü talimatlar verilmesine rağmen (örneğin "fiyat ve esnek tarihleri öncelik veren bir business-class uçuşu ara"), Manus'un yapabildiği en iyi şey, çeşitli havayolu web sitelerinde ve Kayak gibi uçak bileti arama motorlarında, bazıları bozuk olan uçuş bağlantılarını sunmaktı.
Sonraki birkaç görevin daha başarılı olacağını umarak, yazar Manus'a yürüme mesafesindeki bir restoranda bir kişilik masa ayırtmasını söyledi. Birkaç dakika sonra başarısız oldu. Ardından platformdan Naruto temalı bir dövüş oyunu oluşturmasını istedi. Yarım saat sonra hata verdi ve bu noktada yazar havlu atmaya karar verdi.
Teknolojik Heyecan mı, Abartı mı?
Peki Manus teknik vaatlerini yerine getiremiyorsa neden bu kadar popüler oldu? Davet kodlarının azlığının yarattığı özel erişim gibi birkaç faktör katkıda bulundu.
Çin medyası Manus'u hızla bir yapay zeka atılımı olarak sundu; QQ News onu "yerli ürünlerin gururu" olarak nitelendirdi. Bu arada, sosyal medyadaki yapay zeka etkileyicileri Manus'un yetenekleri hakkında yanlış bilgiler yaydı. Yaygın olarak paylaşılan bir video, görünüşte Manus olan bir masaüstü programının birden fazla akıllı telefon uygulamasında işlem yaptığını gösteriyordu. Ji, videonun aslında Manus'un bir demosu olmadığını doğruladı.
X'teki diğer etkili yapay zeka hesapları, Manus ile Çinli yapay zeka şirketi DeepSeek arasında karşılaştırmalar yapmaya çalıştı - bu karşılaştırmalar mutlaka gerçeklere dayanmıyordu. Monica, DeepSeek'in aksine dahili modeller geliştirmedi. Ve DeepSeek teknolojilerinin çoğunu açıkça kullanıma sunarken, Monica henüz bunu yapmadı.
Sonuç
Monica'ya hakkını vermek gerekirse, Manus erken erişimde. Şirket, hesaplama kapasitesini ölçeklendirmek ve bildirilen sorunları düzeltmek için çalıştığını iddia ediyor. Ancak platformun mevcut haliyle, Manus teknolojik inovasyonun önünde koşan bir heyecan örneği gibi görünüyor.
Kaynak: TechCrunch