Google Gemini’nin Pokémon Macerası: Yapay Zeka ve Panik

Google Gemini’nin Pokémon Macerası: Yapay Zeka ve Panik

Google Gemini'nin Pokémon Macerası: Yapay Zeka ve Panik

Yapay zeka şirketleri sektörde liderlik için mücadele ederken, bazen bu mücadelelerini Pokémon arenalarına da taşıyorlar. Google ve Anthropic gibi devler, en son yapay zeka modellerinin eski Pokémon oyunlarında nasıl performans gösterdiğini inceliyor. Bu çalışmalar hem eğlenceli hem de aydınlatıcı sonuçlar ortaya koyuyor.

Google DeepMind tarafından hazırlanan bir rapora göre, Gemini 2.5 Pro modeli Pokémon'ları ölüme yaklaştığında "panik" durumuna geçiyor. Bu durum, yapay zekanın muhakeme yeteneğinde "niteliksel olarak gözlemlenebilir bir bozulmaya" neden olabiliyor. Yapay zeka kıyaslamaları, farklı modellerin performansını karşılaştırmanın tartışmalı bir yolu olsa da, bazı araştırmacılar yapay zeka modellerinin video oyunlarında nasıl davrandığını incelemenin faydalı olabileceğini düşünüyor.

Yapay Zekanın Davranışları ve Öğrenme Süreçleri

Son aylarda, Google ve Anthropic ile bağlantısı olmayan iki geliştirici, "Gemini Plays Pokémon" ve "Claude Plays Pokémon" adında Twitch yayınları başlattı. Bu yayınlarda, yapay zekaların 25 yıldan daha eski bir çocuk video oyununda nasıl yol aldığını gerçek zamanlı olarak izlemek mümkün. Her yayın, yapay zekanın "muhakeme" sürecini, yani bir sorunu nasıl değerlendirdiğini ve bir yanıt bulduğunu doğal bir dille gösteriyor. Bu da bizlere modellerin çalışma şekline dair önemli bilgiler sunuyor.

Google Gemini oynarken

Bu yapay zeka modellerinin ilerlemesi etkileyici olsa da, Pokémon oynamada hala pek başarılı değiller. Bir çocuğun çok daha kısa sürede tamamlayabileceği bir oyunu Gemini'nin çözmesi yüzlerce saat sürüyor. Yapay zekanın bir Pokémon oyununda nasıl ilerlediğini izlemenin ilginç yanı, tamamlama süresi değil, yol boyunca nasıl davrandığıdır.

Raporda belirtildiği üzere, "oyun boyunca Gemini 2.5 Pro, modelin 'panik' simülasyonuna neden olan çeşitli durumlarla karşılaşıyor." Bu "panik" durumu, yapay zekanın performansının kötüleşmesine neden olabiliyor, zira yapay zeka aniden elindeki belirli araçları kullanmayı bırakabiliyor. Yapay zeka düşünmese veya duygu deneyimlemese de, eylemleri bir insanın stres altındayken nasıl aceleci ve kötü kararlar alabileceğini taklit ediyor – bu hem büyüleyici hem de rahatsız edici bir tepki.

Claude modeli de Kanto'daki yolculuklarında bazı ilginç davranışlar sergiledi. Bir örnekte, yapay zeka, tüm Pokémon'ları sağlığını kaybettiğinde oyuncu karakterinin "bayılacağını" ve bir Pokémon Merkezi'ne döneceğini fark etti. Claude, Mt. Moon mağarasında sıkıştığında, tüm Pokémon'larını kasıtlı olarak bayıltırsa, mağaranın diğer tarafındaki Pokémon Merkezi'ne ışınlanacağını yanlış bir şekilde varsaydı. Ancak oyun böyle çalışmıyor; tüm Pokémon'larınız bayıldığında, coğrafi olarak en yakın merkeze değil, en son kullandığınız Pokémon Merkezi'ne geri dönersiniz. İzleyiciler, yapay zekanın oyunda adeta intihar etmeye çalışmasını dehşetle izledi.

Yapay Zekanın Güçlü Yönleri

Eksikliklerine rağmen, yapay zekanın insan oyuncuları geride bırakabildiği birkaç alan da var. Gemini 2.5 Pro'nun piyasaya sürülmesiyle, yapay zeka bulmacaları etkileyici bir doğrulukla çözebiliyor. İnsan yardımıyla, yapay zeka belirli görevlere yönelik olarak tasarlanmış aracı araçlar (Gemini 2.5 Pro'nun yönlendirilmiş örnekleri) oluşturarak oyunun kaya bulmacalarını çözdü ve bir hedefe ulaşmak için verimli rotalar buldu.

Raporda, "Sadece kaya fiziğini açıklayan bir komut ve geçerli bir yolu doğrulama yöntemiyle, Gemini 2.5 Pro, Victory Road'da ilerlemek için gerekli olan bu karmaşık kaya bulmacalarının bazılarını tek seferde çözebiliyor" deniyor. Gemini 2.5 Pro, bu araçların çoğunu kendi başına oluşturduğundan, Google mevcut modelin bu araçları insan müdahalesi olmadan da oluşturabileceğini düşünüyor.

Referanslar

Read more

xAI’ın Hukuk Direktörü Robert Keele Görevinden Ayrıldı: Nedeni ve Yeni Dönem

xAI’ın Hukuk Direktörü Robert Keele Görevinden Ayrıldı: Nedeni ve Yeni Dönem

xAI’ın Hukuk Direktörü Robert Keele, Ailesine Zaman Ayırmak İçin Görevinden Ayrıldı Yapay zeka alanında dikkat çeken girişimlerden xAI’da önemli bir gelişme yaşandı. Şirketin ilk hukuk direktörü Robert Keele, görevine başladıktan yaklaşık bir yıl sonra istifa ettiğini açıkladı. Keele, bu kararı ailesine daha fazla zaman ayırmak için aldığını belirtti.

By Cansın Cengiz
Tesla, Dojo Süper Bilgisayar Projesini Sonlandırdı: Yapay Zeka Stratejisinde Büyük Değişim

Tesla, Dojo Süper Bilgisayar Projesini Sonlandırdı: Yapay Zeka Stratejisinde Büyük Değişim

Tesla, Dojo Süper Bilgisayar Projesine Veda Etti: Nedenleri ve Gelecek Planları Tesla, uzun süredir kendi sürücüsüz araç teknolojisinin temel taşlarından biri olarak gösterdiği Dojo yapay zeka süper bilgisayar projesini sonlandırdı. Bu karar, şirketin otonom sürüş ve yapay zeka stratejisinde önemli bir değişikliğe işaret ediyor. Dojo Projesinin Sonu ve Ekip Dağılımı

By Cansın Cengiz
AI Kodlama Girişimlerinde Yüksek Maliyetler ve Kâr Marjı Krizi

AI Kodlama Girişimlerinde Yüksek Maliyetler ve Kâr Marjı Krizi

AI Kodlama Girişimlerinde Yüksek Maliyetler ve Kâr Marjı Krizi Yapay zeka destekli kodlama asistanları, son dönemin en hızlı büyüyen ve en çok konuşulan girişimlerinin başında geliyor. Ancak bu popülerliğin ardında, ciddi bir finansal sürdürülebilirlik sorunu yatıyor. Hızla değerlenen ve yatırımcı ilgisi gören bazı AI kodlama girişimleri, yüksek işletme maliyetleri ve

By Cansın Cengiz
Lex Proxima Studios LTD