Google DeepMind'dan Robotları Kontrol Eden Yeni AI Modeli: Gemini Robotics

Google DeepMind, Robotları Fiziksel Dünyaya Taşıyan Gemini Robotics'i Duyurdu
Google'ın yapay zeka araştırma laboratuvarı DeepMind, robotların gerçek dünyada nesnelerle etkileşime girmesini, ortamda gezinmesini ve daha fazlasını sağlayan yeni AI modeli Gemini Robotics'i duyurdu.
Gemini Robotics, robotların daha önce hiç eğitilmediği durumlarda bile çeşitli görevleri yerine getirebilmesini sağlayan görsel-dil-eylem (VLA) modeli olarak tanımlanıyor. Bu model, Gemini 2.0 temel alınarak geliştirilmiş ve fiziksel eylemleri yeni bir modalite olarak ekleyerek yapay zekanın gerçek dünyaya geçişini sağlıyor.

Robotlara Yeni Yetenekler
DeepMind, Gemini Robotics'in robotlara üç temel alanda ilerleme sağladığını belirtiyor:
- Genellik: Robotlar, daha önce eğitilmedikleri senaryolarda bile görevleri anlayıp yerine getirebiliyor
- Etkileşim: İnsanlar ve çevreyle daha etkili iletişim kurabiliyorlar
- El becerisi: Kağıt katlama, şişe kapağı açma gibi hassas işlemleri gerçekleştirebiliyorlar
DeepMind ayrıca "Gemini Robotics-ER" (Embodied Reasoning - Somutlaştırılmış Akıl Yürütme) adlı ikinci bir model de sunuyor. Bu model, robotlara gelişmiş uzamsal anlayış ve çevre değişikliklerine gerçek zamanlı uyum sağlama yeteneği kazandırıyor.
Güvenlik Önlemleri
Google DeepMind, robot güvenliği konusunda katmanlı bir yaklaşım geliştirdiklerini belirtiyor. Gemini Robotics-ER modelleri, potansiyel bir eylemin belirli bir senaryoda güvenli olup olmadığını değerlendirmek üzere eğitilmiş durumda. Şirket ayrıca ASIMOV veri setini kullanarak, robotik eylemlerin gerçek dünya senaryolarındaki güvenlik etkilerini ölçmeyi hedefliyor.
Google, bu teknolojinin geliştirilmesi için Apptronik, Agile Robots, Agility Robotics, Boston Dynamics ve Enchanted Tools gibi şirketlerle işbirliği yapıyor. Gemini Robotics, yapay zekanın fiziksel dünyaya geçişinde önemli bir adım olarak görülüyor.
Kaynak: TechCrunch, The Verge