Google Gemini Robotics On-Device: Robotlar İçin Yeni Dönem
Google Gemini Robotics On-Device: Robotlar İçin Yeni Dönem
Google DeepMind, robotlar için çığır açan yeni bir dil modeli olan Gemini Robotics On-Device'ı tanıttı. Bu model, robotların görevleri yerel olarak, yani internet bağlantısı gerektirmeden yerine getirmesini sağlıyor. Bu gelişme, robotik alanında bağımsız ve daha hızlı operasyonların önünü açıyor.
Önceki Modelin Geliştirilmiş Hali
Gemini Robotics On-Device, Google'ın Mart ayında piyasaya sürdüğü önceki Gemini Robotics modelinin üzerine inşa edildi. Yeni model, bir robotun hareketlerini kontrol etme yeteneğine sahip. Geliştiriciler, doğal dil komutlarını kullanarak modeli çeşitli ihtiyaçlara göre kolayca kontrol edebilir ve ince ayar yapabilirler. Bu, robot programlamayı daha erişilebilir hale getiriyor.
Performans ve Uygulamalar
Google, yapılan kıyaslamalarda Gemini Robotics On-Device modelinin bulut tabanlı Gemini Robotics modeline yakın bir performans sergilediğini belirtiyor. Ayrıca, diğer yerel modellerden daha iyi performans gösterdiği iddia ediliyor. Şirket, bu modelin çanta fermuarını açma ve kıyafet katlama gibi günlük görevleri başarıyla gerçekleştirebildiğini gösteren demolar yayınladı.

Görsel Kaynağı: Google
Geniş Kapsamlı Uyumluluk
Başlangıçta ALOHA robotları için eğitilmiş olmasına rağmen, model daha sonra bi-arm Franka FR3 robotu ve Apptronik'in Apollo insansı robotu gibi farklı platformlara da uyarlandı. Özellikle bi-arm Franka FR3'ün, daha önce "görmediği" endüstriyel bir bant üzerindeki montaj gibi senaryoları ve nesneleri başarıyla ele aldığı belirtildi. Bu, modelin genelleme yeteneğinin güçlü bir göstergesi.
Geliştiriciler İçin SDK
Google DeepMind, geliştiricilerin yeni görevler üzerinde robotları eğitmek için kullanabileceği bir Gemini Robotics SDK da yayınlıyor. Bu SDK ile geliştiriciler, MuJoCo fizik simülatörünü kullanarak robotlara 50 ila 100 arasında görev demosu göstererek yeni yetenekler kazandırabilecekler. Bu, robotik alanındaki inovasyonu hızlandıracak önemli bir adım.
Robotik Yapay Zeka Ekosistemi
Robotikte yapay zeka modelleri geliştiren tek şirket Google değil. Nvidia, insansı robotlar için temel modeller oluşturmak üzere bir platform inşa ediyor. Hugging Face ise robotik için açık modeller ve veri kümeleri geliştirmenin yanı sıra kendi robotlarını da üretiyor. Mirae Asset destekli Koreli startup RLWRLD de robotlar için temel modeller oluşturma üzerinde çalışıyor. Bu da robotik yapay zekanın hızla büyüyen ve rekabetçi bir alan olduğunu gösteriyor.
Referanslar
- Google rolls out new Gemini model that can run on robots locally
- Google DeepMind unveils new AI models for controlling robots
- ALOHA robots
- Franka FR3 robot
- Apollo humanoid robot by Apptronik
- NIST - Robotic Grasping and Manipulation for Assembly
- Google DeepMind Gemini Robotics SDK
- Nvidia enlists humanoid robotics' biggest names for new AI platform GR00T
- Hugging Face says its new robotics model is so efficient it can run on a MacBook
- Hugging Face unveils two new humanoid robots
- RLWRLD raises $14.4M to build foundation model for robotics