OpenAI'dan Yeni Akıl Yürütme Modeli: o3-pro Çıktı
OpenAI'dan Yeni Akıl Yürütme Modeli: o3-pro Çıktı
Yapay zeka dünyasının öncülerinden OpenAI, şimdiye kadarki en yetenekli yapay zeka modeli olduğunu belirttiği o3-pro'yu duyurdu.
o3-pro, OpenAI'ın daha önce piyasaya sürdüğü o3 akıl yürütme modelinin geliştirilmiş bir versiyonudur. Geleneksel yapay zeka modellerinin aksine, akıl yürütme modelleri problemleri adım adım çözerek, fizik, matematik ve kodlama gibi karmaşık alanlarda daha güvenilir performans sergileyebilir.
o3-pro'nun Özellikleri ve Erişilebilirlik
o3-pro, 10 Haziran 2025 tarihinden itibaren ChatGPT Pro ve Ekip kullanıcıları için erişime açıldı ve o1-pro modelinin yerini aldı. Kurumsal (Enterprise) ve Eğitim (Edu) kullanıcıları da kısa süre içinde bu yeni modele erişebilecekler. Ayrıca, o3-pro, OpenAI'ın geliştirici API'si üzerinden de kullanıma sunuldu.
Modelin API fiyatlandırması, milyon giriş token'ı başına 20 dolar ve milyon çıkış token'ı başına 80 dolar olarak belirlendi. Bir milyon giriş token'ı yaklaşık 750.000 kelimeye denk gelmektedir.
Performans ve Yetenekler
OpenAI'ın açıklamalarına göre, o3-pro, uzman değerlendirmelerinde o3 modeline kıyasla her kategoride, özellikle bilim, eğitim, programlama, iş ve yazma yardımı gibi kilit alanlarda tutarlı bir şekilde tercih edildi. Değerlendiriciler, o3-pro'nun açıklık, kapsamlılık, talimatlara uyma ve doğruluk açısından sürekli olarak daha yüksek puanlar aldığını belirtiyor.
o3-pro, web araması yapma, dosyaları analiz etme, görsel girdiler üzerinde akıl yürütme, Python kullanma ve hafızayı kullanarak yanıtları kişiselleştirme gibi araçlara erişim sağlayabiliyor. Bu yetenekler, modelin çok yönlülüğünü artırıyor.
Mevcut Sınırlamalar
Her ne kadar güçlü olsa da, o3-pro'nun bazı sınırlamaları bulunmaktadır. Modelin yanıt süreleri o1-pro'ya göre daha uzun sürebilir. Ayrıca, geçici sohbetler şu an için devre dışı bırakılmış durumda ve o3-pro görsel oluşturma yeteneğine veya OpenAI'ın yapay zeka destekli çalışma alanı özelliği olan Canvas desteğine sahip değil.
Benchmark Sonuçları
OpenAI'ın dahili testlerine göre, o3-pro popüler yapay zeka kıyaslamalarında etkileyici sonuçlar elde etti:
- Matematik becerilerini değerlendiren AIME 2024 testinde Google'ın en iyi performans gösteren yapay zeka modeli Gemini 2.5 Pro'dan daha iyi skor aldı.
- Doktora düzeyinde bilim bilgisini ölçen GPQA Diamond testinde ise Anthropic'in yeni yayınlanan Claude 4 Opus modelini geride bıraktı.