Sesame, Maya Sanal Asistanının Temel Yapay Zeka Modelini Açık Kaynak Olarak Yayınladı

Sesame, Maya Sanal Asistanının Temel Yapay Zeka Modelini Açık Kaynak Olarak Yayınladı
Photo by julien Tromeur / Unsplash

Sesame, Viral Olan Maya Sanal Asistanının Arkasındaki Temel Yapay Zeka Modelini Paylaştı

Yapay zeka şirketi Sesame, son derece gerçekçi ses asistanı Maya'nın arkasındaki temel modeli açık kaynak olarak yayınladı. CSM-1B adı verilen bu model, 1 milyar parametre büyüklüğünde olup ("parametre", modelin bireysel bileşenlerine atıfta bulunuyor) ve Apache 2.0 lisansı altında sunuluyor. Bu lisans, modelin ticari olarak çok az kısıtlama ile kullanılabilmesine olanak tanıyor.

Sesame'nin AI geliştirme platformu Hugging Face'teki açıklamasına göre, CSM-1B modeli metin ve ses girdilerinden "RVQ ses kodları" oluşturuyor. RVQ (residual vector quantization), sesi ayrık belirteçler olarak kodlayan bir tekniği ifade ediyor. Bu teknik, Google'ın SoundStream ve Meta'nın Encodec dahil olmak üzere son dönemdeki birçok yapay zeka ses teknolojisinde kullanılıyor.

CSM-1B, omurga olarak Meta'nın Llama ailesinden bir model ile bir ses "kod çözücü" bileşenini birleştiriyor. Sesame, Maya'nın CSM modelinin ince ayarlı bir varyantı tarafından desteklendiğini belirtiyor.

Modelin Özellikleri ve Kısıtlamaları

Sesame, CSM-1B'nin Hugging Face ve GitHub depolarında şu açıklamayı yapıyor: "Burada açık kaynak olarak sunulan model, temel bir üretim modelidir. Çeşitli sesleri üretme yeteneğine sahiptir, ancak herhangi bir belirli ses için ince ayar yapılmamıştır [...] Model, eğitim verilerindeki veri kontaminasyonu nedeniyle İngilizce olmayan diller için bir miktar kapasiteye sahiptir, ancak muhtemelen iyi performans göstermeyecektir."

Sesame'nin CSM-1B'yi eğitmek için hangi verileri kullandığı belirsiz. Şirket bu konuda açıklama yapmadı.

Dikkat çekici bir nokta, modelin gerçek koruma önlemlerinin bulunmaması. Sesame, geliştiricilere ve kullanıcılara modeli bir kişinin sesini onayı olmadan taklit etmek, sahte haberler gibi yanıltıcı içerikler oluşturmak veya "zararlı" ya da "kötü niyetli" faaliyetlerde bulunmak için kullanmamalarını tavsiye ediyor. Ancak bu tamamen bir "onur sistemi" durumu olarak görünüyor.

Sesame ve Maya Hakkında

Oculus'un ortak yaratıcısı Brendan Iribe tarafından kurulan Sesame, Şubat ayı sonunda asistan teknolojisiyle viral oldu. Maya ve Sesame'nin diğer asistanı Miles, nefes alıyor, akıcı olmayan konuşma yapıyor ve konuşurken kesilebiliyor - tıpkı OpenAI'ın Voice Mode'u gibi.

Sesame, Andreessen Horowitz, Spark Capital ve Matrix Partners'tan açıklanmamış miktarda sermaye topladı. Şirket, ses asistanı teknolojisi geliştirmenin yanı sıra, "tüm gün giyilmek üzere tasarlanmış" ve özel modelleriyle donatılmış yapay zeka gözlükleri prototipleri üzerinde çalıştığını belirtiyor.

AI Alanında Açık Kaynak Modellerin Önemi

CSM-1B'nin açık kaynak olarak yayınlanması, yapay zeka alanında giderek yaygınlaşan bir eğilimi yansıtıyor. Açık kaynak modeller, daha geniş bir geliştirici topluluğunun bu teknolojilere erişmesine ve üzerine inşa etmesine olanak tanıyor. Ancak bu tür modellerin potansiyel kötüye kullanımı konusundaki endişeler de artıyor.

Sesame'nin bu hamlesi, ses sentezi ve sanal asistanlar alanında geliştiricilere yeni kapılar açarken, aynı zamanda bu teknolojilerin sorumlu kullanımına ilişkin tartışmaları da yeniden gündeme getiriyor.

Yapay zeka ve ses asistanı teknolojilerinin hızla geliştiği bu dönemde, CSM-1B gibi modellerin açık kaynak olarak sunulması, inovasyonu hızlandırabilir ancak etik çerçevelerin ve düzenlemelerin de bu gelişmelere ayak uydurması gerektiğini gösteriyor.

Read more

OpenAI'nin Matematik Başarısı Tartışma Yarattı: Gerçekten Çığır Açıcı mı?

OpenAI'nin Matematik Başarısı Tartışma Yarattı: Gerçekten Çığır Açıcı mı?

OpenAI'nin GPT-5 Matematik Başarısı: Gerçekten Çığır Açıcı mı? Son günlerde OpenAI'nin GPT-5 modeliyle ilgili matematikteki "devrim" iddiaları teknoloji dünyasında büyük yankı uyandırdı. Ancak bu iddiaların arkasındaki gerçek, sosyal medyada ve akademik çevrelerde tartışmalara yol açtı. Olay Nasıl Başladı? OpenAI Başkan Yardımcısı Kevin Weil, kısa

By Cansın Cengiz
Wikipedia Trafiğinde Düşüş: Yapay Zeka ve Sosyal Video Etkisi

Wikipedia Trafiğinde Düşüş: Yapay Zeka ve Sosyal Video Etkisi

Wikipedia'da Trafik Neden Düşüyor? İnternetin en güvenilir bilgi kaynaklarından biri olarak gösterilen Wikipedia, son dönemde ziyaretçi sayısında önemli bir düşüş yaşıyor. Wikimedia Foundation tarafından yapılan açıklamaya göre, insan kaynaklı sayfa görüntülemeleri yıldan yıla %8 oranında azaldı. Bu durumun arkasında ise dijital ekosistemdeki iki büyük trend öne çıkıyor: Yapay

By Cansın Cengiz
Yapay Zeka ile Tatil Fotoğrafları: Endless Summer Uygulamasıyla Kendi Dijital Kaçamağınızı Yaratın

Yapay Zeka ile Tatil Fotoğrafları: Endless Summer Uygulamasıyla Kendi Dijital Kaçamağınızı Yaratın

Yapay Zeka ile Dijital Tatil: Endless Summer Uygulaması Yoğun iş temposu ve tükenmişlik hissiyle gerçek bir tatile vakit bulamıyor musunuz? Yeni bir iPhone uygulaması olan Endless Summer, bu sorunu ilginç bir şekilde çözüyor: AI destekli sahte tatil fotoğraflarıyla! Endless Summer Nedir? Meta'nın Superintelligence Lab ekibine yeni katılan ürün

By Cansın Cengiz
Lex Proxima Studios LTD