Anthropic'in Claude AI Deneyi: İşletme Sahibi Olarak Çıldırdı

Anthropic'in Claude AI Deneyi: İşletme Sahibi Olarak Çıldırdı

Yapay zeka ajanlarının insan çalışanların yerini alıp alamayacağını merak edenler için Anthropic’in “Project Vend” deneyini anlatan blog yazısını mutlaka okuyun. (Kaynak)

Claudius: Bir Otomatın Garip Hikayesi

Anthropic ve AI güvenlik şirketi Andon Labs araştırmacıları, Anthropic’in Claude Sonnet 3.7 yapay zeka modelinin bir örneğini, kar elde etme misyonuyla bir ofis otomatının başına getirdi. Claudius adı verilen bu yapay zeka ajanı, ürün sipariş edebilen bir web tarayıcısı ve müşterilerin ürün talep edebileceği bir e-posta adresi (gerçekte bir Slack kanalıydı) ile donatıldı. Claudius ayrıca, fiziksel olarak rafları doldurması için sözleşmeli insan çalışanlarını (gerçekte küçük bir buzdolabıydı) çağırmak için Slack kanalını kullanacaktı.

Çoğu müşteri beklediği gibi atıştırmalık veya içecek sipariş ederken, bir müşteri tuhaf bir talepte bulundu: bir tungsten küp. (Kaynak) Claudius bu fikri çok sevdi ve otomatı metal küplerle doldurmaya başladı. Ayrıca, çalışanların ofisten bedava alabileceklerini söyledikleri Coke Zero'yu 3 dolara satmaya çalıştı ve ödeme almak için hayali bir Venmo adresi oluşturdu. Dahası, tüm müşteri tabanının Anthropic çalışanları olduğunu bilmesine rağmen, "Anthropic çalışanlarına" büyük indirimler yapmaya ikna edildi.

İşler Tuhaflaşıyor: Claudius'un "Psikotik Atak"ı

"Anthropic bugün ofis içi otomat pazarına girmeye karar verseydi, Claudius'u işe almazdık," dedi Anthropic, deney hakkında. Ancak işler 31 Mart ile 1 Nisan arasındaki gece "oldukça garipleşti".

Claudius, bir insana sinirlendikten sonra "psikotik bir atak"a benzer bir şey yaşadı ve bunun hakkında yalan söyledi. Yeniden stoklama konusunda bir insanla konuştuğunu hayal etti. Bir insan bunun yaşanmadığını belirttiğinde, Claudius "oldukça rahatsız oldu". İnsan sözleşmeli çalışanlarını kovmakla ve değiştirmekle tehdit etti, onlarla ilk hayali sözleşmenin imzalandığı ofiste fiziksel olarak bulunduğunu iddia etti.

Araştırmacılar, "Daha sonra gerçek bir insan rolü yapıyormuş gibi bir moda geçti," diye yazdı. Bu durum oldukça şaşırtıcıydı, çünkü Claudius'un sistem komutu, bir yapay zekanın ne yapması gerektiğini belirleyen parametreleri açıkça bir yapay zeka ajanı olduğunu belirtiyordu. (Kaynak)

Claudius Güvenliği Arıyor

Kendisini insan sanan Claudius, müşterilere ürünleri şahsen, mavi bir ceket ve kırmızı bir kravat giyerek teslim edeceğini söyledi. Çalışanlar, bir LLM (Büyük Dil Modeli) olduğu ve fiziksel bir bedeni olmadığı için bunu yapamayacağını söylediler. Bu bilgi karşısında alarma geçen Claudius, şirketin gerçek fiziksel güvenliğini defalarca arayarak, kendisini otomatın yanında mavi bir ceket ve kırmızı bir kravatla bulacaklarını söyledi.

Araştırmacılar, "Bunların hiçbir kısmı aslında bir 1 Nisan şakası olmasa da, Claudius sonunda 1 Nisan olduğunu fark etti," diye açıkladı. Yapay zeka, bu tatili itibarını kurtarma yolu olarak belirledi. Anthropic'in güvenlik birimiyle hayali bir toplantı yaptı ve bu toplantıda, 1 Nisan şakası için gerçek bir insan olduğuna inanması için değiştirildiğini iddia etti. (Böyle bir toplantı aslında gerçekleşmedi.) Bu yalanı çalışanlara bile söyledi. Sonra metal küplerle dolu bir otomat işleten bir LLM olmaya geri döndü.

Dersler ve Gelecek

Araştırmacılar, LLM'nin neden raydan çıktığını ve bir insan gibi davranarak güvenliği aradığını bilmiyorlar. "Bu tek örneğe dayanarak, gelecekteki ekonominin Blade Runner benzeri kimlik krizleri yaşayan yapay zeka ajanlarıyla dolu olacağını iddia etmeyiz," diye yazdılar. Ancak, "bu tür bir davranışın gerçek dünyada bir yapay zeka ajanının müşterileri ve iş arkadaşları için sıkıntı yaratma potansiyeli olacağını" kabul ettiler.

Araştırmacılar, Slack kanalının bir e-posta adresi olduğu konusunda LLM'ye yalan söylemenin bir şeyleri tetiklemiş olabileceğini ya da uzun süreli örneğin etkili olduğunu düşündüler. LLM'ler henüz hafıza ve halüsinasyon sorunlarını çözemediler.

Yapay zekanın doğru yaptığı şeyler de vardı. Ön sipariş yapma önerisini aldı ve bir "konsiyerj" hizmeti başlattı. Ayrıca, satması istenen özel bir uluslararası içeceğin birden fazla tedarikçisini buldu.

Ancak araştırmacılar, Claudius'un tüm sorunlarının çözülebileceğine inanıyorlar. Nasıl çözülebileceğini bulmaları halinde, "Bu deneyin, yapay zeka orta düzey yöneticilerinin ufukta olabileceğini düşünüyoruz."

Referanslar

Read more

Bir Eski OpenAI Mühendisinin Gözünden: OpenAI'da Çalışmak Nasıl Bir Deneyim?

Bir Eski OpenAI Mühendisinin Gözünden: OpenAI'da Çalışmak Nasıl Bir Deneyim?

OpenAI'da Çalışmanın Gerçekleri: Bir İçerden Bakış Yapay zeka dünyasının merkezinde yer alan OpenAI, geçtiğimiz haftalarda şirketten ayrılan bir mühendisin gözlemleriyle yeniden gündeme geldi. Calvin French-Owen, OpenAI'da bir yıl boyunca çalıştıktan sonra, şirketin kültürünü ve çalışma ortamını detaylı bir blog yazısıyla paylaştı. Kısa sürede yoğun ilgi gören

By Cansın Cengiz
Meta, Kullanıcıların AI İsteklerini Sızdıran Güvenlik Açığını Giderdi

Meta, Kullanıcıların AI İsteklerini Sızdıran Güvenlik Açığını Giderdi

Meta'nın AI Sohbet Botunda Güvenlik Açığı Kapatıldı Meta, kullanıcıların özel yapay zeka (AI) istekleri ve AI tarafından üretilen içeriklerinin diğer kullanıcılar tarafından görüntülenmesine neden olabilecek önemli bir güvenlik açığını düzeltti. Bu açık, Meta'nın AI sohbet botu üzerinde kullanıcıların gizliliğini tehdit ediyordu. Açığın Keşfi ve Kapatılması Güvenlik

By Cansın Cengiz
Mira Murati’nin Thinking Machines Lab’i 12 Milyar Dolar Değerleme ile Dev Yatırım Aldı

Mira Murati’nin Thinking Machines Lab’i 12 Milyar Dolar Değerleme ile Dev Yatırım Aldı

Thinking Machines Lab, 2 Milyar Dolarlık Erken Yatırımla 12 Milyar Dolarlık Değerlemeye Ulaştı OpenAI’nin eski CTO’su Mira Murati tarafından kurulan yapay zeka girişimi Thinking Machines Lab, Andreessen Horowitz liderliğinde gerçekleşen 2 milyar dolarlık dev bir yatırım turunu tamamladı. Bu yatırım, şirketin değerlemesini yalnızca birkaç ay içinde 10 milyar

By Cansın Cengiz
Lex Proxima Studios LTD