兩名前 OpenAI 員工推出了一個名為 In the Weights 的網站,試圖回答一個具有實驗性質的問題:在不調用網頁搜索的情況下,大型模型本身「記住」了多少人。隨著越來越多用戶轉向聊天機器人獲取資訊,此類測試也開始具備現實意義。
使用多款模型測試人名識別
網站名稱中的 “weights” 指的是模型參數。開發者 Thomas Dimson 和 Joey Flynn 認為,傳統搜索中的 “搜自己” 已不再是衡量個人網絡存在感的唯一方式,模型能否直接說出一個人,正在變成另一種可見度指標。
In the Weights 會向不同模型發出類似「某某是誰」的問題,並要求提供最多 10 個結果、簡短描述和置信度。網站隨後將相似描述歸類,並生成一個強度分數,用以衡量模型對該名字的「記憶」程度。
排名會變動,也會出現幻覺
目前參與測試的模型包括 Grok、Gemini、多個版本的 GPT、Claude、Llama,以及一些較小眾的模型。結果頁面還會顯示哪些模型提供了回答,以及哪些回答可能存在幻覺或混淆。
以 TechCrunch 作者 Anthony Ha 為例,網站給予的分數為 641,位於所有名字的前 6%。不過排名會持續變動。報導發布時,演員 Macaulay Culkin 暫居第一,歌手 Luciano Pavarotti 緊隨其後。
報導還提到,GPT-5.4 Mini 曾將 Anthony Ha 解釋為一個可能對應多人的模糊姓名形式,而非直接識別為具體人物。此類情況亦被網站標記為潛在幻覺。
開發者押注模型時代的新可見度

Dimson 在受訪時表示,他和 Flynn 離開 OpenAI 後,希望從事能重新激發創意的項目。兩人此前加入 OpenAI,是因為他們的設計公司 Global Illumination 被收購。
他認為,到了 2026 年,隨著流量持續向大模型轉移,Google 式的 vanity search 已不再是最重要的目標。與其說是網頁結果排名,模型參數中是否「存有你」的資訊,正成為另一種新的網路存在感。
開發者還表示,接下來會繼續研究為何同一模型系列會產生不同結果、不同模型更容易「記住」哪類人,以及哪些人理論上應有維基百科條目卻仍未建立。
