Google, Gemini ve Veo AI Modellerini Birleştirecek

Google, Gemini ve Veo AI Modellerini Birleştirecek
Photo by Pawel Czerwinski / Unsplash

Google'dan Yapay Zekada Yeni Bir Dönem: Gemini ve Veo Modelleri Birleşiyor

Teknoloji devi Google, yapay zeka alanındaki iddiasını pekiştirecek önemli bir adım atmaya hazırlanıyor. Google DeepMind CEO'su Demis Hassabis, şirketin metin, görsel ve ses üretebilen Gemini AI modelleri ile video oluşturma yeteneğine sahip Veo modellerini gelecekte birleştirmeyi planladığını açıkladı. Bu birleşme, yapay zekanın fiziksel dünyayı daha iyi anlamasını ve daha yetenekli dijital asistanlar oluşturulmasını hedefliyor.

Evrensel Bir Dijital Asistan Hedefi

LinkedIn kurucu ortağı Reid Hoffman'ın sunduğu "Possible" podcast'ine konuk olan Hassabis, bu vizyonu şu sözlerle ifade etti: "Temel modelimiz olan Gemini'ı en başından beri çok modlu (multimodal) olarak geliştirdik. Bunu yapmamızın nedeni, size gerçek dünyada gerçekten yardımcı olan evrensel bir dijital asistan fikrine sahip olmamızdı." Bu birleşme sayesinde Gemini'ın, Veo'nun video anlama yeteneklerinden faydalanarak fiziksel dünya hakkında daha derin bir kavrayışa sahip olması bekleniyor.

Yapay Zekada "Omni" Model Yükselişi

Google'ın bu adımı, yapay zeka endüstrisindeki daha geniş bir eğilimi yansıtıyor: Farklı medya türlerini (metin, görsel, ses, video) anlayabilen ve sentezleyebilen "omni" modellerin geliştirilmesi. Google'ın en yeni Gemini modelleri zaten metin ve görsellerin yanı sıra ses de üretebiliyor. Benzer şekilde OpenAI'ın ChatGPT'si görseller oluştururken, Amazon da bu yıl içinde "herhangi bir girdiden herhangi bir çıktıya" (any-to-any) bir model sunmayı planlıyor.

Eğitim Verisi Kaynağı: YouTube

Bu gelişmiş modellerin eğitimi, büyük miktarda ve çeşitlilikte veri gerektiriyor. Hassabis, Veo'nun video verilerinin büyük ölçüde Google'ın sahibi olduğu YouTube platformundan geldiğini ima etti. Hassabis, "Temel olarak, çok sayıda YouTube videosu izleyerek [Veo], dünyanın fiziğini çözebiliyor," dedi. Google daha önce TechCrunch'a yaptığı açıklamada, modellerinin YouTube içerik oluşturucularıyla yapılan anlaşmalar çerçevesinde "bazı" YouTube içerikleri üzerinde eğitilmiş "olabileceğini" belirtmişti. Şirketin, yapay zeka modellerini eğitmek için daha fazla veriye erişmek amacıyla geçen yıl hizmet şartlarını genişlettiği de bildiriliyor.

Sonuç

Gemini ve Veo'nun birleştirilmesi, Google'ın yapay zeka yeteneklerini önemli ölçüde artırma potansiyeli taşıyor. Bu gelişme, daha akıllı, bağlama duyarlı ve gerçek dünyayla etkileşim kurabilen AI agent'lar ve dijital asistanlar vizyonuna doğru atılmış büyük bir adım olarak değerlendiriliyor. Bu birleşmenin teknoloji dünyası ve son kullanıcılar için ne gibi yenilikler getireceğini hep birlikte göreceğiz.

Referanslar

Read more

Lex Proxima Studios LTD