Sesame, Maya Sanal Asistanının Temel Yapay Zeka Modelini Açık Kaynak Olarak Yayınladı

Sesame, Maya Sanal Asistanının Temel Yapay Zeka Modelini Açık Kaynak Olarak Yayınladı
Photo by julien Tromeur / Unsplash

Sesame, Viral Olan Maya Sanal Asistanının Arkasındaki Temel Yapay Zeka Modelini Paylaştı

Yapay zeka şirketi Sesame, son derece gerçekçi ses asistanı Maya'nın arkasındaki temel modeli açık kaynak olarak yayınladı. CSM-1B adı verilen bu model, 1 milyar parametre büyüklüğünde olup ("parametre", modelin bireysel bileşenlerine atıfta bulunuyor) ve Apache 2.0 lisansı altında sunuluyor. Bu lisans, modelin ticari olarak çok az kısıtlama ile kullanılabilmesine olanak tanıyor.

Sesame'nin AI geliştirme platformu Hugging Face'teki açıklamasına göre, CSM-1B modeli metin ve ses girdilerinden "RVQ ses kodları" oluşturuyor. RVQ (residual vector quantization), sesi ayrık belirteçler olarak kodlayan bir tekniği ifade ediyor. Bu teknik, Google'ın SoundStream ve Meta'nın Encodec dahil olmak üzere son dönemdeki birçok yapay zeka ses teknolojisinde kullanılıyor.

CSM-1B, omurga olarak Meta'nın Llama ailesinden bir model ile bir ses "kod çözücü" bileşenini birleştiriyor. Sesame, Maya'nın CSM modelinin ince ayarlı bir varyantı tarafından desteklendiğini belirtiyor.

Modelin Özellikleri ve Kısıtlamaları

Sesame, CSM-1B'nin Hugging Face ve GitHub depolarında şu açıklamayı yapıyor: "Burada açık kaynak olarak sunulan model, temel bir üretim modelidir. Çeşitli sesleri üretme yeteneğine sahiptir, ancak herhangi bir belirli ses için ince ayar yapılmamıştır [...] Model, eğitim verilerindeki veri kontaminasyonu nedeniyle İngilizce olmayan diller için bir miktar kapasiteye sahiptir, ancak muhtemelen iyi performans göstermeyecektir."

Sesame'nin CSM-1B'yi eğitmek için hangi verileri kullandığı belirsiz. Şirket bu konuda açıklama yapmadı.

Dikkat çekici bir nokta, modelin gerçek koruma önlemlerinin bulunmaması. Sesame, geliştiricilere ve kullanıcılara modeli bir kişinin sesini onayı olmadan taklit etmek, sahte haberler gibi yanıltıcı içerikler oluşturmak veya "zararlı" ya da "kötü niyetli" faaliyetlerde bulunmak için kullanmamalarını tavsiye ediyor. Ancak bu tamamen bir "onur sistemi" durumu olarak görünüyor.

Sesame ve Maya Hakkında

Oculus'un ortak yaratıcısı Brendan Iribe tarafından kurulan Sesame, Şubat ayı sonunda asistan teknolojisiyle viral oldu. Maya ve Sesame'nin diğer asistanı Miles, nefes alıyor, akıcı olmayan konuşma yapıyor ve konuşurken kesilebiliyor - tıpkı OpenAI'ın Voice Mode'u gibi.

Sesame, Andreessen Horowitz, Spark Capital ve Matrix Partners'tan açıklanmamış miktarda sermaye topladı. Şirket, ses asistanı teknolojisi geliştirmenin yanı sıra, "tüm gün giyilmek üzere tasarlanmış" ve özel modelleriyle donatılmış yapay zeka gözlükleri prototipleri üzerinde çalıştığını belirtiyor.

AI Alanında Açık Kaynak Modellerin Önemi

CSM-1B'nin açık kaynak olarak yayınlanması, yapay zeka alanında giderek yaygınlaşan bir eğilimi yansıtıyor. Açık kaynak modeller, daha geniş bir geliştirici topluluğunun bu teknolojilere erişmesine ve üzerine inşa etmesine olanak tanıyor. Ancak bu tür modellerin potansiyel kötüye kullanımı konusundaki endişeler de artıyor.

Sesame'nin bu hamlesi, ses sentezi ve sanal asistanlar alanında geliştiricilere yeni kapılar açarken, aynı zamanda bu teknolojilerin sorumlu kullanımına ilişkin tartışmaları da yeniden gündeme getiriyor.

Yapay zeka ve ses asistanı teknolojilerinin hızla geliştiği bu dönemde, CSM-1B gibi modellerin açık kaynak olarak sunulması, inovasyonu hızlandırabilir ancak etik çerçevelerin ve düzenlemelerin de bu gelişmelere ayak uydurması gerektiğini gösteriyor.

Read more

Lex Proxima Studios LTD