Google'ın Yeni Gemini 2.5 Pro: Cevap Vermeden Önce "Düşünen" AI Modeli

Google, Yapay Zeka Alanında Çıtayı Yükseltiyor: Gemini 2.5 Pro Tanıtıldı
Google, yapay zeka yarışında önemli bir adım atarak yeni nesil "düşünme" yeteneğine sahip AI modelini duyurdu. Salı günü tanıtılan Gemini 2.5, yanıt vermeden önce "düşünmek" için duraksamayı tercih eden yeni bir yapay zeka model ailesi olarak karşımıza çıkıyor.
Bu yeni model ailesinin ilk üyesi olan Gemini 2.5 Pro Experimental, Google'ın şimdiye kadarki en akıllı modeli olma iddiasını taşıyan çok modlu (multimodal) bir yapay zeka. Model, şirketin geliştirici platformu Google AI Studio'da ve aylık 20 dolarlık Gemini Advanced aboneliğine sahip kullanıcıların Gemini uygulamasında kullanıma sunuldu.
Yapay Zekada Akıl Yürütme Dönemi
Google, ilerleyen dönemde piyasaya süreceği tüm yeni yapay zeka modellerinin akıl yürütme (reasoning) yeteneklerine sahip olacağını belirtiyor. Bu gelişme, OpenAI'ın Eylül 2024'te piyasaya sürdüğü ilk akıl yürütme modeli o1'in ardından teknoloji endüstrisindeki rekabeti daha da kızıştırdı. Bugün Anthropic, DeepSeek, Google ve xAI'ın tümü, cevap vermeden önce gerçekleri kontrol etmek ve problemler üzerinde akıl yürütmek için ekstra hesaplama gücü ve zaman kullanan AI akıl yürütme modellerine sahip.
Akıl yürütme teknikleri, yapay zeka modellerinin matematik ve kodlama görevlerinde yeni zirvelere ulaşmasına yardımcı oldu. Teknoloji dünyasında pek çok kişi, akıl yürütme modellerinin, büyük ölçüde insan müdahalesi olmadan görevleri gerçekleştirebilen otonom sistemler olan AI ajanlarının kilit bir bileşeni olacağına inanıyor. Ancak bu modeller aynı zamanda daha maliyetli.

Gemini 2.5 Pro'nun Performansı
Google, Gemini 2.5 Pro'nun önceki sınır yapay zeka modellerini ve bazı rakip önde gelen yapay zeka modellerini çeşitli kıyaslamalarda geride bıraktığını iddia ediyor. Özellikle, Google'ın Gemini 2.5'i görsel açıdan etkileyici web uygulamaları ve ajanlı kodlama uygulamaları oluşturmada mükemmelleştirmek için tasarladığını belirtiyor.
Kod düzenlemeyi ölçen Aider Polyglot değerlendirmesinde, Google, Gemini 2.5 Pro'nun %68,6 puan alarak OpenAI, Anthropic ve DeepSeek'in önde gelen yapay zeka modellerini geride bıraktığını söylüyor.
Ancak, ajanlı kodlama yeteneklerini ölçen SWE-bench verified testinde, Gemini 2.5 Pro %63,8 puan alarak OpenAI'ın o3-mini ve DeepSeek'in R1 modellerini geçerken, %70,3 puan alan Anthropic'in Claude 3.7 Sonnet modelinin gerisinde kalıyor.
Humanity's Last Exam — matematik, beşeri bilimler ve doğa bilimleri alanlarında binlerce kalabalık kaynaklı soru içeren çok modlu bir test — Google, Gemini 2.5 Pro'nun %18,8 puan alarak OpenAI, Anthropic ve DeepSeek'in önde gelen yapay zeka modellerini geride bıraktığını belirtiyor.
Uzun Bağlam Penceresi
Başlangıçta, Google, Gemini 2.5 Pro'nun tek bir istemde yaklaşık 750.000 kelime alabilen 1 milyon token bağlam penceresiyle geldiğini söylüyor. Bu, tüm Yüzüklerin Efendisi kitap serisinden daha uzun. Bununla birlikte, Google yakında 2 milyon token bağlam penceresinin geleceğini belirtiyor.
Google daha önce yapay zeka akıl yürütme modelleriyle deneyler yapmıştı — Aralık ayında Gemini'nin "düşünen" bir versiyonunu piyasaya sürmüştü — ancak Gemini 2.5, şirketin OpenAI o serisi modellere karşı şimdiye kadarki en ciddi rakibi olarak öne çıkıyor.
Google, Gemini 2.5 Pro için API fiyatlandırmasını henüz paylaşmadı.
Yapay Zeka Yarışında Yeni Dönem
Yapay zeka modelleri arasındaki rekabet, "düşünme" yeteneklerinin geliştirilmesiyle yeni bir boyuta taşınıyor. Google'ın Gemini 2.5 ailesi, cevap vermeden önce akıl yürütme ve mantıksal düşünme süreçlerini uygulayarak daha doğru ve güvenilir yanıtlar sunma hedefiyle öne çıkıyor.
Teknoloji devleri arasındaki bu rekabet, yapay zeka modellerinin özellikle matematik, kodlama ve kompleks problem çözme alanlarında daha yetkin hale gelmesini sağlarken, kullanıcıların daha güvenilir yapay zeka araçlarına erişimini de artırıyor.
Kaynak: TechCrunch