Google Gemini’nin Pokémon Macerası: Yapay Zeka ve Panik
Google Gemini'nin Pokémon Macerası: Yapay Zeka ve Panik
Yapay zeka şirketleri sektörde liderlik için mücadele ederken, bazen bu mücadelelerini Pokémon arenalarına da taşıyorlar. Google ve Anthropic gibi devler, en son yapay zeka modellerinin eski Pokémon oyunlarında nasıl performans gösterdiğini inceliyor. Bu çalışmalar hem eğlenceli hem de aydınlatıcı sonuçlar ortaya koyuyor.
Google DeepMind tarafından hazırlanan bir rapora göre, Gemini 2.5 Pro modeli Pokémon'ları ölüme yaklaştığında "panik" durumuna geçiyor. Bu durum, yapay zekanın muhakeme yeteneğinde "niteliksel olarak gözlemlenebilir bir bozulmaya" neden olabiliyor. Yapay zeka kıyaslamaları, farklı modellerin performansını karşılaştırmanın tartışmalı bir yolu olsa da, bazı araştırmacılar yapay zeka modellerinin video oyunlarında nasıl davrandığını incelemenin faydalı olabileceğini düşünüyor.
Yapay Zekanın Davranışları ve Öğrenme Süreçleri
Son aylarda, Google ve Anthropic ile bağlantısı olmayan iki geliştirici, "Gemini Plays Pokémon" ve "Claude Plays Pokémon" adında Twitch yayınları başlattı. Bu yayınlarda, yapay zekaların 25 yıldan daha eski bir çocuk video oyununda nasıl yol aldığını gerçek zamanlı olarak izlemek mümkün. Her yayın, yapay zekanın "muhakeme" sürecini, yani bir sorunu nasıl değerlendirdiğini ve bir yanıt bulduğunu doğal bir dille gösteriyor. Bu da bizlere modellerin çalışma şekline dair önemli bilgiler sunuyor.

Bu yapay zeka modellerinin ilerlemesi etkileyici olsa da, Pokémon oynamada hala pek başarılı değiller. Bir çocuğun çok daha kısa sürede tamamlayabileceği bir oyunu Gemini'nin çözmesi yüzlerce saat sürüyor. Yapay zekanın bir Pokémon oyununda nasıl ilerlediğini izlemenin ilginç yanı, tamamlama süresi değil, yol boyunca nasıl davrandığıdır.
Raporda belirtildiği üzere, "oyun boyunca Gemini 2.5 Pro, modelin 'panik' simülasyonuna neden olan çeşitli durumlarla karşılaşıyor." Bu "panik" durumu, yapay zekanın performansının kötüleşmesine neden olabiliyor, zira yapay zeka aniden elindeki belirli araçları kullanmayı bırakabiliyor. Yapay zeka düşünmese veya duygu deneyimlemese de, eylemleri bir insanın stres altındayken nasıl aceleci ve kötü kararlar alabileceğini taklit ediyor – bu hem büyüleyici hem de rahatsız edici bir tepki.
Claude modeli de Kanto'daki yolculuklarında bazı ilginç davranışlar sergiledi. Bir örnekte, yapay zeka, tüm Pokémon'ları sağlığını kaybettiğinde oyuncu karakterinin "bayılacağını" ve bir Pokémon Merkezi'ne döneceğini fark etti. Claude, Mt. Moon mağarasında sıkıştığında, tüm Pokémon'larını kasıtlı olarak bayıltırsa, mağaranın diğer tarafındaki Pokémon Merkezi'ne ışınlanacağını yanlış bir şekilde varsaydı. Ancak oyun böyle çalışmıyor; tüm Pokémon'larınız bayıldığında, coğrafi olarak en yakın merkeze değil, en son kullandığınız Pokémon Merkezi'ne geri dönersiniz. İzleyiciler, yapay zekanın oyunda adeta intihar etmeye çalışmasını dehşetle izledi.
Yapay Zekanın Güçlü Yönleri
Eksikliklerine rağmen, yapay zekanın insan oyuncuları geride bırakabildiği birkaç alan da var. Gemini 2.5 Pro'nun piyasaya sürülmesiyle, yapay zeka bulmacaları etkileyici bir doğrulukla çözebiliyor. İnsan yardımıyla, yapay zeka belirli görevlere yönelik olarak tasarlanmış aracı araçlar (Gemini 2.5 Pro'nun yönlendirilmiş örnekleri) oluşturarak oyunun kaya bulmacalarını çözdü ve bir hedefe ulaşmak için verimli rotalar buldu.
Raporda, "Sadece kaya fiziğini açıklayan bir komut ve geçerli bir yolu doğrulama yöntemiyle, Gemini 2.5 Pro, Victory Road'da ilerlemek için gerekli olan bu karmaşık kaya bulmacalarının bazılarını tek seferde çözebiliyor" deniyor. Gemini 2.5 Pro, bu araçların çoğunu kendi başına oluşturduğundan, Google mevcut modelin bu araçları insan müdahalesi olmadan da oluşturabileceğini düşünüyor.