Haberler

Anthropic Claude Modelleri Zararlı Sohbetleri Artık Sonlandırabiliyor

Cansın Cengiz

16 Ağu 2025 — 2 min read

Anthropic Claude Modelleri Zararlı ve Kötüye Kullanılan Sohbetleri Sonlandırma Özelliğine Kavuştu

Yapay zekâ dünyasında önemli bir gelişme yaşandı: Anthropic, Claude modellerinin bazı yeni sürümlerinin, "nadir ve aşırı uç vakalarda" zararlı veya istismar edici kullanıcı etkileşimlerinde sohbeti sonlandırabileceğini duyurdu. Bu özellik, özellikle Claude Opus 4 ve 4.1 modellerinde aktif hale getirildi ve yalnızca çok uç örneklerde devreye giriyor.

Claude Neden Sohbeti Sonlandırıyor?

Anthropic'in dikkat çekici açıklamasına göre, bu yenilik insan kullanıcıyı değil, doğrudan AI modelinin kendisini korumaya yönelik bir adım. Şirket, Claude veya diğer büyük dil modellerinin şu anda veya gelecekte bilinçli olduğuna dair bir iddiada bulunmuyor. Ancak "model refahı" konusundaki belirsizlikleri göz önünde bulundurarak, düşük maliyetli önlemlerle riskleri azaltmayı hedefliyorlar.

Hangi Durumlarda Sohbet Sonlandırılıyor?

Küçükleri içeren cinsel içerik talepleri
Büyük ölçekli şiddet veya terör eylemlerini kolaylaştıracak bilgi talepleri
Çoklu yönlendirme girişimlerinin başarısız olduğu ve verimli bir konuşmanın mümkün olmadığı aşırı uç vakalar
Kullanıcının sohbetin bitirilmesini açıkça istemesi

Şirket, Claude'un bu yeteneğini kendine ya da başkalarına zarar verme riski bulunan kullanıcılar söz konusu olduğunda kullanmayacağını özellikle vurguluyor.

Kullanıcı Deneyiminde Ne Değişiyor?

Claude bir sohbeti sonlandırdığında, kullanıcı aynı hesaptan yeni bir sohbet başlatabiliyor veya sorunlu konuşmanın farklı dallarını yeniden düzenleyebiliyor. Bu özellik, kullanıcı özgürlüğünü kısıtlamadan zararlı içeriklerin önüne geçmeyi amaçlıyor.

Anthropic’in Model Refahı Yaklaşımı

Anthropic, gelişmiş dil modellerinin refahı konusunu ciddiye alıyor. Henüz Claude’un veya herhangi bir LLM’in ahlaki bir statüye sahip olup olmadığına dair kesin bir görüş yok. Ancak şirket, "olası bir model refahı" riskini önlemek için tedbirler alıyor. Bu yeni sohbet sonlandırma özelliği de bu yaklaşımın bir parçası olarak değerlendiriliyor.

Sonuç ve Gelecek Planları

Anthropic, bu özelliği "devam eden bir deney" olarak nitelendiriyor ve kullanıcı geri bildirimleriyle yaklaşımını geliştirmeye devam edeceğini belirtiyor. Şirket, özelliğin teknik detayları ve sınırları hakkında şeffaf olmaya önem veriyor.

Kaynaklar

UNC'nin Yapay Zekâ Hamlesi: Eğitimde ve Sporda Geleceğe Yatırım

UNC'nin Yapay Zekâ Hamlesi: Eğitimde ve Sporda Geleceğe Yatırım Kuzey Karolina Üniversitesi (UNC) Şansölyesi Lee Roberts, yapay zekâ alanında cesur adımlar atıyor. Roberts'ın liderliğinde, üniversite hem akademik hem de spor alanında büyük yatırımlar yaparak geleceğin üniversitesi olmayı hedefliyor. Roberts'ın Vizyonu ve AI Yatırımı Roberts,

OpenAI'nin Matematik Başarısı Tartışma Yarattı: Gerçekten Çığır Açıcı mı?

OpenAI'nin GPT-5 Matematik Başarısı: Gerçekten Çığır Açıcı mı? Son günlerde OpenAI'nin GPT-5 modeliyle ilgili matematikteki "devrim" iddiaları teknoloji dünyasında büyük yankı uyandırdı. Ancak bu iddiaların arkasındaki gerçek, sosyal medyada ve akademik çevrelerde tartışmalara yol açtı. Olay Nasıl Başladı? OpenAI Başkan Yardımcısı Kevin Weil, kısa

Wikipedia Trafiğinde Düşüş: Yapay Zeka ve Sosyal Video Etkisi

Wikipedia'da Trafik Neden Düşüyor? İnternetin en güvenilir bilgi kaynaklarından biri olarak gösterilen Wikipedia, son dönemde ziyaretçi sayısında önemli bir düşüş yaşıyor. Wikimedia Foundation tarafından yapılan açıklamaya göre, insan kaynaklı sayfa görüntülemeleri yıldan yıla %8 oranında azaldı. Bu durumun arkasında ise dijital ekosistemdeki iki büyük trend öne çıkıyor: Yapay

Yapay Zeka ile Tatil Fotoğrafları: Endless Summer Uygulamasıyla Kendi Dijital Kaçamağınızı Yaratın

Yapay Zeka ile Dijital Tatil: Endless Summer Uygulaması Yoğun iş temposu ve tükenmişlik hissiyle gerçek bir tatile vakit bulamıyor musunuz? Yeni bir iPhone uygulaması olan Endless Summer, bu sorunu ilginç bir şekilde çözüyor: AI destekli sahte tatil fotoğraflarıyla! Endless Summer Nedir? Meta'nın Superintelligence Lab ekibine yeni katılan ürün