ChatGPT'nin Görsel Üretim Özelliği Büyük Bir Güncelleme Aldı

ChatGPT'nin Görsel Üretim Özelliği Büyük Bir Güncelleme Aldı
Photo by Mariia Shalabaieva / Unsplash

OpenAI, ChatGPT'nin Görsel Üretim Yeteneklerini GPT-4o Modeli ile Güçlendirdi

OpenAI CEO'su Sam Altman, Salı günü gerçekleştirdiği canlı yayında, ChatGPT'nin görsel üretim özelliklerinde bir yılı aşkın süredir yapılan ilk büyük güncellemeyi duyurdu. Bu güncelleme ile ChatGPT, şirketin GPT-4o modelini kullanarak doğrudan görsel içerik oluşturma ve düzenleme yeteneğine kavuştu.

GPT-4o modeli uzun süredir ChatGPT'nin alt yapısını oluşturuyordu, ancak şimdiye kadar bu model sadece metin oluşturma ve düzenleme işlemlerini gerçekleştirebiliyordu. Yeni güncelleme ile birlikte, aynı model artık görsel içerik üretiminde de kullanılabilecek.

Kimler Kullanabilecek?

Altman'ın açıklamasına göre, GPT-4o'nun doğal görsel üretim özelliği şu anda ChatGPT ve OpenAI'nin AI video üretim aracı Sora'da, şirketin aylık 200 dolar ücretli Pro abonelik planı kullanıcıları için aktif durumda. OpenAI, bu özelliğin yakında ChatGPT'nin Plus ve ücretsiz kullanıcıları ile şirketin API servisini kullanan geliştiriciler için de kullanıma sunulacağını belirtti.

DALL-E 3'ten Daha İyi Performans

Görsel üretim özelliğinde GPT-4o, yerini aldığı DALL-E 3 modeline göre "düşünmek" için biraz daha fazla zaman harcıyor. Ancak OpenAI, bu sayede daha doğru ve detaylı görseller üretilebildiğini ifade ediyor. GPT-4o ayrıca var olan görselleri düzenleme, içlerinde insan bulunan görselleri dönüştürme ve "inpainting" adı verilen ön plan ve arka plan nesnelerini değiştirme yeteneklerine de sahip.

Eğitim Verileri Hakkında Şeffaflık Eksikliği

OpenAI, bu yeni görsel üretim yeteneklerini sağlamak için hangi görsel verileri kullandığını açıklamadı. Birçok yapay zeka şirketi, eğitim verilerini rekabet avantajı olarak görmekte ve bu bilgileri gizli tutmaktadır. Ayrıca, eğitim verileri ile ilgili detaylar potansiyel telif hakkı davalarına yol açabildiğinden, şirketler bu konuda açıklama yapmaktan kaçınmaktadır.

Bununla birlikte OpenAI, içerik üreticilerinin eserlerinin şirketin eğitim veri setlerinden çıkarılmasını talep edebilecekleri bir çıkış formu sunuyor. Şirket ayrıca, web sitelerinden eğitim verisi (görsel dahil) toplayan web tarama botlarının engellenmesi taleplerini de dikkate aldığını belirtiyor.

Rakiplerin Çalışmaları

ChatGPT'nin güncellenen görsel üretim özelliği, Google'ın Gemini 2.0 Flash modeli için deneysel doğal görsel çıktı özelliğinin ardından geldi. Google'ın bu güçlü özelliği sosyal medyada viral oldu, ancak tam olarak olumlu nedenlerle değil. Gemini 2.0 Flash'ın görsel bileşeninin çok az koruma bariyeri içerdiği ortaya çıktı ve kullanıcılar bu özelliği görsellerdeki filigranları kaldırmak ve telif hakkı korumalı karakterlerin görsellerini oluşturmak için kullanabildi.

ChatGPT'nin yeni görsel üretim özelliği, OpenAI'nin yapay zeka alanındaki liderliğini sürdürme ve kullanıcı deneyimini geliştirme çabalarının bir parçası olarak görülüyor. Bu güncelleme, görsel içerik üretimi konusunda kullanıcılara daha fazla kontrol ve yaratıcılık imkanı sunarak, dijital içerik üretim süreçlerini dönüştürmeye devam edecek gibi görünüyor.

Kaynak: TechCrunch

Read more

Lex Proxima Studios LTD