OpenAI Gelişmiş Görüntü Üretme Aracını API ile Sunuyor

OpenAI Gelişmiş Görüntü Üretme Aracını API ile Sunuyor
Yapay zeka alanındaki yenilikleriyle sıkça gündeme gelen OpenAI, Çarşamba günü yaptığı duyuruyla ChatGPT'deki gelişmiş görüntü üretme özelliğinin temelini oluşturan teknolojiyi API aracılığıyla geliştiricilerin kullanımına sundu. Bu adım, geliştiricilerin bu güçlü aracı kendi uygulama ve hizmetlerine entegre etmelerine olanak tanıyor.
Mart ayının sonlarında çoğu ChatGPT kullanıcısı için aktif hale gelen OpenAI'nin yeni görüntü üretme aracı, özellikle gerçekçi Ghibli tarzı fotoğraflar ve "yapay zeka aksiyon figürleri" oluşturma yeteneğiyle viral olmuştu. Bu popülerlik, OpenAI için hem milyonlarca yeni ChatGPT kullanıcısı anlamına gelirken hem de şirketin altyapı kapasitesini zorlayan bir durum yaratmıştı.
gpt-image-1 Modeli ve Yetenekleri
OpenAI API'sinde bu görüntü üretme yeteneği, "gpt-image-1" adlı yapay zeka modeli tarafından destekleniyor. Doğası gereği çok modlu (multimodal) olan gpt-image-1, farklı stillerde görüntüler oluşturabiliyor, özel talimatları takip edebiliyor, dünya bilgisinden yararlanabiliyor ve metinleri görsellere işleyebiliyor.
Geliştiriciler, gpt-image-1 kullanarak aynı anda birden fazla görüntü üretebilir ve üretim kalitesini (dolayısıyla hızı) kontrol edebilirler.
Güvenlik ve Şeffaflık
OpenAI, gpt-image-1 modelinin, ChatGPT'deki görüntü üretimiyle aynı güvenlik önlemlerine sahip olduğunu belirtiyor. Bu önlemler, modelin şirket politikalarına aykırı içerikler üretmesini kısıtlayan mekanizmaları içeriyor. Geliştiriciler, moderasyon hassasiyetini kontrol edebiliyor; standart filtreleme için "otomatik" veya daha az kısıtlayıcı filtreleme için "düşük" seçeneğini ayarlayabiliyorlar. Düşük filtreleme, potansiyel olarak yaşa uygun olmayan daha az kategoriyi sınırlıyor.
Ayrıca, gpt-image-1 ile oluşturulan tüm görüntülerin, desteklenen platformlar ve uygulamalar tarafından yapay zeka tarafından üretildiğinin anlaşılabilmesi için C2PA meta verileriyle filigranlandığı ifade ediliyor.
Fiyatlandırma ve Kullanım Örnekleri
Fiyatlandırma şu şekilde belirlenmiş:
- Metin girdisi için milyon jeton başına 5 dolar
- Görüntü girdisi için milyon jeton başına 10 dolar
- Görüntü çıktısı için milyon jeton başına 40 dolar
OpenAI'ye göre bu, düşük, orta ve yüksek kaliteli kare görüntüler için sırasıyla yaklaşık 2 sent, 7 sent ve 19 sentlik bir maliyete denk geliyor.
Adobe, Airtable, Wix, Instacart, GoDaddy, Canva ve Figma gibi şirketlerin şimdiden gpt-image-1'i kullandığı veya denediği belirtiliyor. Örneğin, Figma'nın Figma Design platformu artık kullanıcıların gpt-image-1 aracılığıyla görüntü oluşturmasına ve düzenlemesine olanak tanırken, Instacart modeli tarifler ve alışveriş listeleri için görseller oluşturmada test ediyor.