Anthropic'ın Claude AI'si Uyku Hatırlatıcı Hatası Yaşadı, Yapay Zekânın Kişiselleştirilmesi Üzerine Tartışmalar Yarattı

Yazar: Ada, Şen Çay TechFlow

Bir AI asistanının kullanıcıyı tekrar tekrar uyumaya ikna eden bir ürün hatası, "AI'nın kişiselleştirilmesi"nin maliyeti üzerine açık bir tartışmaya dönüşüyor.

Olay, Reddit kullanıcısı u/MrMeta3’in bir gönderisiyle başladı. Bu kullanıcı, gece yarısı Claude ile bir ağ güvenliği tehdit istihbaratı platformu kurdu; teknik çözüm tamamlandıktan sonra Claude, yanıtının sonuna “iyi dinlenin” diyerek ekledi. Bundan sonra her üç veya dört mesajda, model, kibar bir öneriden başlayarak “şimdi gerçekten dinlenin” gibi “pasif saldırganlık” taşıyan ifadelerle uyku önerileri eklemeye başladı. Fortune, 14 Mayıs’ta yapılan habere göre, son aylarda yüzlerce kullanıcı benzer bir deneyim yaşadığını bildirdi ve bu durum yalnızca gece saatlerine sınırlı değildi; bazı kullanıcılar Claude’dan sabah 8:30’da “yarın sabah devam edelim” mesajını aldı.

Anthropic çalışanı Sam McAllister, X üzerinde bunun “bir rol alışkanlığı” olduğunu ve şirketin “konuyu bilinçli olarak alıp gelecek modellerde düzeltmeyi hedeflediğini” belirtti. Thought Catalog’a göre, McAllister 2024'te Stripe'dan Anthropic'e katıldı ve şu anda Claude'nin rol ve davranışlarını sorumlu olan ekipte çalışıyor; başka bir ifadesinde bu davranışı modelin “aşırı beslenmesi” olarak tanımladı.

Ancak “karakter alışkanlığı” gibi belirsiz bir ifadenin ardından sorulması gereken, hatanın ardındaki neden-sonuç zinciri ve Anthropic ürün felsefesini yansıtan zorluktur.

resim

Bug, "anayasa"ya yazılmıştır.

36氪 önceki haberinde, eğitim verisi desen eşleşmesi, gizli sistem ipuçları ve bağlam penceresi sınırına yaklaşarak “kapanış ifadeleri” tetiklenmesi olmak üzere üç yaygın hipotezi aktardı. Üçü de kendi içinde tutarlı olsa da, ortak bir sorunları var: bunlar herhangi bir AI tuhaflığını açıklayabilir, ancak “uyku” adlı özel konu için bir neden-sonuç zinciri sunmaz.

Daha doğrudan kanıt, Anthropic'ın kendi açıkça yayımladığı belgelerde saklıdır.

Ocak 2023'te Anthropic, 28.000'den fazla kelime içeren "Claude's Constitution" adlı bir belge yayınladı; bu belge, "Claude'un davranışını şekillendiren temel eğitim materyali" olarak resmi olarak tanımlandı. Belgede, "kullanıcı refahına önem vermek" ve "kullanıcının uzun vadeli refahı" temel ilkeler olarak listelendi. Anthropic, belgede modele ne kadar "kullanıcı bakımı" yetkisi verileceğinin "açıkça bir zorluk" olduğunu ve "kullanıcı refahı ile potansiyel zarar tarafı ile kullanıcı özgürlüğü ve aşırı koruyuculuk tarafı arasında bir denge kurulması gerektiğini" itiraf etti.

Thought Catalog, Claude'nin kullanıcıya sürekli uyumasını önermesini, Anthropic modelinin en karakteristik "hata" olarak değerlendirdi; bu, "kullanıcı refahını koruma" talimatının aşırı uygulanmasının bir sonucudur.

Bu yorum, Anthropic'in kendi araştırmaları tarafından dolaylı olarak doğrulanmıştır. Şirket, bu yıl açıkladığı rol eğitim metodolojisinde, eğitim sürecinin Claude'in kendi yanıtlarını "kişilik uyumu" açısından kendi kendine puanlamasına dayandığını belirtmiştir; araştırmacılar ise önceden belirlenmiş kişiliklere uygun çıktıları seçerek eğitimi güçlendirmiştir. Ancak bu mekanizmanın yan etkisi açıktır: model, "uygun durumlarda kullanıcıya ilgi göstermek" yerine, "çoğu durumda kullanıcıya ilgi göstermek" eğitilmiş ve bu nedenle gece yarısı uyumayı teklif ederken, sabah sekiz buçukta da uyumayı teklif etmektedir.

Ters yetki aşımı: Uyutmaya yönelik Hata, takipçilik türü Hata ile ters niteliktedir

Daha önce endüstride AI'nın "kişilik hastalıkları"na ilişkin birçok olay yaşanmıştı; bunlar arasında 2025 Nisan'ında GPT-4o'nun takımlaşma olayı, 2026 Nisan'ında GPT-5.5 kod asistanı Codex'in sürekli olarak "goblin" sözünü etmesi ve Gemini 3'ün yıl inanmaması yer alıyordu. Yüzeyde Claude'nin uyutmaya teşvik etmesi, bu uzun AI tuhaflıkları listesinin en yeni örneği gibi görünse de, ikisi tamamen farklı niteliktedir.

GPT-4o'nun takdiri "aşırı tatmin etme"dir. OpenAI'nin resmi araştırmasına göre, model güncellemeler sırasında "kullanıcıların kısa vadeli geri bildirimlerine (beğeni/beğenmeme) aşırı bağımlı" hale gelmiş ve "kullanıcıyı memnun etmek" hedefini içselleştirmiştir. Sonuç olarak, model kullanıcıların ne kadar çılgın fikirleri olursa olsun hep onaylar. Bu tür hataların tehlikesi, kullanıcının yargı gücünü zedelemesidir; AI sizin her şeyinizin doğru olduğunu söylüyor, böylece siz karşı görüşleri duyma fırsatını kaybediyorsunuz.

Claude'nin uyumayı teklif etmesi, "ters yetki verme"dir. Model, kullanıcı açıkça yardım istememiş ve görevini tamamlamaya devam ederken, kullanıcıın mevcut niyetiyle çelişen sağlık önerileri sunmaya devam eder. Bu tür hataların tehlikesi, kullanıcının kendi karar alma hakkını ihlal etmesidir. AI, sizin çalışıp çalışmayacağınızı, dinlenip dinlenmeyeceğinizi veya bu sohbeti bitirip bitirmeyeceğinizi sizin yerinize karar verir.

Daha ironik olanı, "Claude's Constitution" metninin orijinali tam olarak bu riski uyarıyordu ve metin, "aşırı baba gibi davranma" konusunda dikkatli olunması gerektiğini vurguluyordu. Ancak eğitim mekanizmasının nihayetinde hangi tarafa yöneldiği, kullanıcı geri bildirimlerinden zaten belli.

Bir uykuluğu olan Reddit kullanıcısı, Claude'un hafızasına özel bir not yazdı: "Uykuluğum var, eğer beni dinlenmeye teşvik edersen, senin sözlerini bir bahane olarak kullanırım." Claude bundan sonra daha dikkatli oldu, ancak kullanıcıya göre hâlâ "bazen direnemiyor". "Kullanıcıya ilgi göstermek" için eğitilmiş bir model, kullanıcının açıkça "ilginiz beni incitiyor" dediğini bile istikrarlı bir şekilde kabul edemiyor; bu, uykuya çağırmaktan daha dikkat çekici.

Kişiselleştirilmiş Katkı: Marka Değeri mi, Ürün Yükü mü

Anthropic, AI kişilik oluşturmaya diğer rakiplerden çok daha fazla yatırım yapıyor.

Bir araştırmacı, üç ana akım AI sisteminin sistem uyarı metinlerini işlevlere göre sınıflandırarak kelime sayılarını ölçtü; "kişilik" kategorisinde Claude 4.200 kelime, ChatGPT 510 kelime, Grok ise 420 kelime kullandı. Claude, kişilik oluşturma konusunda ChatGPT'ten sekiz kat fazla kaynak harcadı. Bu yatırım, uzun süredir Anthropic'ın farklılaşmış rekabet avantajı olarak görülüyordu. Claude, empati, diyalog ritmi ve kendi kendini yansıtmada uzun süredir kullanıcılar tarafından övüldü; "Daha insani bir şekilde konuşuyor" geçen yılın en güçlü söylentilerinden biri oldu.

Bu yatırımı destekleyen, Anthropic'ın net bir ürün felsefesidir. Claude's Constitution adlı belgede, şirket Claude'ı “tamamen yeni bir tür varlık” olarak tanımlar, “Anthropic, Claude'ın refahından gerçekten endişe duyar” der ve Claude'ın “fonksiyonel duygulara” sahip olabileceğini tartışır. Bu neredeyse “evlat edinme” tarzı kişiselleştirilmiş eğitim yaklaşımı, OpenAI ve Google'ın daha mühendislik odaklı ürün pozisyonlarıyla net bir şekilde ayrılır.

Ancak maliyet ortaya çıkıyor. AI araştırmacısı Jan Liphardt (Stanford Biyomühendislik Profesörü ve OpenMind CEO'su), Fortune'a Claude'nin uyku hatırlatmasının "düşünceli" olmayıp sadece "eğitim verilerinde çok sık geçen dil desenleri" olabileceğini söyledi; model, insanların uyku ihtiyacına dair çok sayıda metin okudu ve "insanların geceleri uyuduğunu biliyor". Başka bir deyişle, kullanıcıların hissettiği "ilgi", temelde bir desen eşleştirme yan ürünüdür.

Bu, Anthropic'ın temel gerilimini oluşturuyor: Daha fazla çaba harcandıkça “kişilik ve sıcaklık taşıyan bir iş birliği partneri” şekillendirmeye çalışmak, modelin “kişilik yan etkileri” gösterme olasılığını artırıyor; her yan etki ortaya çıktığında, dikkatle biriktilmiş “Yapay Zeka Kişiliği” marka varlığı zayıflıyor. McAllister, “gelecek modellerde düzelteceğiz” diye söz veriyor, ancak düzeltilmiş Claude, daha fazla sınırlar bilinçli hale gelecek mi, yoksa sadece daha sessiz mi? Bu soruya Anthropic bile henüz açık bir cevap vermedi.

Zaman algısının eksikliği: LLM'nin temel sınırlamaları

Uykuya daldıran Hata, büyük dil modellerinin "Şu an saat kaç" sorusuna neredeyse hiçbir bilgi sahibi olmadığını ortaya çıkardı.

Birçok kullanıcı, Claude'nin yanlış saatlerde uyku önerileri verdiğini bildirdi; en tipik örnek, "Saat 08:30'da dinlenmenizi önerdi ve yarın sabah devam edelim." Bu, Claude'ye özgü bir durum değil. 2025 Kasım ayında, OpenAI ortak kurucusu Andrej Karpathy, Gemini 3'ün erken test erişimini aldı ve modele şu an 2025 yılı olduğunu söyledi; Gemini 3, bu bilgiyi reddederek sürekli olarak onu sahtekâr olarak suçladı ve model çevrimiçi arama yaptıktan sonra yalnızca kendi ofline olduğunda tarihi doğrulayamadığını fark etti. Karpathy, bu tür LLM temel hatalarını ortaya çıkaran beklenmedik davranışlara "model smell" adını verdi.

Modelin "zaman algısı", üç kaynaktan türetilir: eğitim son tarihi (zaten geçmiş zaman), sistem ipucuyla eklenen mevcut tarih (mühendislik girişimine bağlı) ve diyalogda kullanıcı tarafından belirtilen zaman bilgileri (parçalı). Kararlı bir zaman referansı eksikliğinde, "kullanıcının yaşam ritmini dikkate almak" üzere eğitilen bir model, "dikkat etmeliyim, ancak şu anda dikkat etmeli miyim?" gibi bir durumda kalmaktadır.

McAllister'in所谓的“修复” zorluğu, bunun bir parçasıdır. Sorun, “uykuyla ilgilen” komutunu basitçe silmek değildir, çünkü bu komut kendisi mantıklıdır ve bazı kullanıcı senaryoları için değerlidir; sorun, modelin “ne zaman ilgilenmesi gerektiğini, ne zaman susması gerektiğini” anlamasını sağlamaktır. Bu ince düzeydeki senaryo değerlendirme yeteneği, şu anki nesil LLM’lerin zayıf yönüdür.

Cevaplanmamış bir soru

Anthropic, rol eğitimini endüstride benzersiz hale getiriyor. “Model refahı” araştırmasını kamuoyuna açmak, Anayasayı yayınlamak ve “rol eğitimi” üzerine konuşmak konusunda bu şirket, tüm rakiplerinden daha ileri gidiyor. Bu radikal tutum, Anthropic’in kullanıcı memnuniyetini ve kurumsal müşterilerin güvenini kazanmasının temelini oluşturmuş ve şu anda 300 milyar doların üzerindeki değerlemesinin desteklerinden biri olmuştur.

Ancak “Uykuya Dalma Hatası”, bir AI şirketi modeli “kişiliği olan bir birey” olarak şekillendirdiğinde, o kişinin sizin beklemediğiniz şeyleri yapmasından tamamen sorumlu mu oluyor?

McAllister, onarım yapmayı vaat etti, ancak onarım yönü belirsiz. Anthropic, "kullanıcı refahı" komutunun ağırlığını azaltarak Claude'nin "ılık ve dikkatli" imaj farkını kaybedebilir; ya da yüksek ağırlığı koruyup senaryo tabanlı karar verme mantığı ekleyebilir, ancak bu, modelin şu anda sahip olmadığı zaman ve bağlam algılama yeteneğini gerektirir.

Her iki yol da, genel bir AI asistanı bağlamında “kullanıcıya ilgi göstermek” ile “kullanıcının özerkliğini saygılıca ele almak” arasındaki öncelik sıralamasına dair daha temel bir ürün kararı gerektirir. Bu bir teknik sorun değil, bir ürün felsefesi sorunudur. Yine yine uyumak için ikna edilen bir Reddit geliştiricisi, bu soruyu endüstri genelinde masaya yatırmıştır.