Those who take context budget seriously will have a better AI-assisted experience than those who mindlessly stack Skill.

文章作者、來源：0x9999in1，ME News

簡而言之

當前主流AI程式設計助手的技能/外掛生態，正經歷「野蠻生長後的消化不良」——重複、冗餘、僵尸技能堆積，嚴重侵蝕寶貴的上下文視窗資源。
Lobster Dad 開源了一個專為 Skill 設計的元技能（Meta-Skill），涵蓋五大核心功能：預算審計、重複檢測、閒置篩查、根目錄審計、描述精簡。
上下文窗口是AI大模型最稀缺的資源之一，每一個冗餘Skill的存在，都在用無意義的token搶佔你真正需要的推理空間。
這個工具的核心價值不是「又多了一個 Skill」，而是用一個 Skill 去治理所有 Skill——它是基礎設施級別的。
Skill 生態的混亂不是個別現象，而是結構性問題。沒有審計機制的插件系統，終將走向熵增。
開源意味著社區可以在此基礎上進行迭代，這可能是 Skill 治理標準化的起點。

先說現狀：你的 Skill 倉庫，可能已經是個垃圾場

這話難聽。但你打開自己的AI助手配置，數一數裝了多少Skill，再想想上一次用到的是哪幾個。

答案大概率讓人沉默。

從2025年下半年開始，Cursor、Windsurf、Codex、Claude Code 等 AI 編程工具集體進入 "Skill 軍備競賽"。社區貢獻者瘋狂輸出，官方內置庫不斷膨脹，個人配置層層疊加。

結果呢？

一個典型的重度用戶，Skill 數量輕鬆突破 50 個。其中能被日常觸發的，可能不到 10 個。剩下的 40 個，安靜地躺在那裡，每次對話啟動時被加載進上下文，默默吃掉 token 預算，然後——什麼都不做。

這不是浪費。這是犯罪。

為什麼這麼說？因為上下文窗口並非無限。即便到了2026年，主流模型的有效上下文長度在128K到200K token之間，聽起來很多對不對？但你算算：系統提示詞、對話歷史、代碼片段、文件內容、工具定義、Skill描述……真正留給「思考」的空間，遠沒有你想象的寬裕。

每多一個無用 Skill 的描述文本佔據 200 個 token，50 個就是 10000 token。一萬個 token，夠模型多讀 400 行代碼了。

這不是理論推演。這是每天都在發生的事。

為什麼沒人管？因為「加」比「減」容易一萬倍

人類有一個根深蒂固的心理偏誤：添加偏好（Addition Bias）。

面對問題，我們本能地想「加點什麼」來解決，而不是「減掉什麼」。2021 年發表在《Nature》上的研究明確指出，人類在改進事物時系統性地忽略「減法方案」，即便減法更有效。

Skill 生態完美複現了這個偏差。

社區貢獻者撰寫了新的 Skill 並發布。用戶覺得「说不定有用」，安裝。官方認為「功能覆蓋面廣」，內置。

誰來刪除？誰來審計？誰來說「這個 Skill 跟那個重複了，幹掉一個」？

沒有人。

因為刪除沒有激勵。寫一個新 Skill，能獲得 star、能被社區認可、能寫進簡歷。清理一個舊 Skill？什麼都得不到。

這就是結構性困境。不是技術問題，是激勵機制問題。

直到有人決定：我不管激勵，這事我來幹。

龍蝦之父出手：用一個 Skill，治理所有 Skill

誰是龍蝦之父？如果你混跡於 AI 編程工具社區，這個 ID 你不會陌生。長期活躍於 Codex 和 Claude 生態的深度玩家，以系統性思考和工程化潔癖著稱。「龍蝦之父」這個稱呼本身就帶有社區的認可——能被冠以「之父」，說明在某個垂直領域，他就是那個繞不過去的人。

這次他開源的東西，本質上是一個元技能（Meta-Skill）。

什麼是元技能？就是「管理技能的技能」。它不會幫你寫代碼，不會幫你調用 API，也不會幫你生成文檔。它只做一件事：為你現有的所有 Skill 進行一次徹底的、量化的、可執行的體檢。

五大功能，逐個拆解。

功能一：技能提示詞預算審計

這是最硬核的一個。

它所做的事很直接：計算每個 Skill 占用的上下文 token 空間，算出各自佔總預算的百分比，然後給出優化建議。

為什麼這很重要？因為絕大多數用戶對「Skill 到底吃了多少資源」這件事，完全沒有感知。

你以為安裝了一個 Skill 只是多了一個功能。實際上，每個 Skill 的描述文字、參數定義、範例代碼、觸發規則，全部都要寫進系統提示詞。模型每次推理，都要先「讀」一遍這些內容，才能決定是否調用。

這就像你背著一個登山包，裡面裝了 50 件工具。你以為「帶著不虧」，但每多一公斤，你的體能消耗就多一分。等你真正需要衝刺的時候，你已經沒力氣了。

預算審計所做的，就是打開你的背包，告訴你：「這把瑞士軍刀重3公斤，但你從未使用過，扔掉吧。」

功能二：重複技能檢測

這個功能解決的問題，可能比你想像的嚴重。

它的掃描範圍覆蓋四個等級：

Codex 內置庫
插件緩存
代碼庫
個人技能根目錄

Scan across tiers for skills with the same name, similar descriptions, or overlapping functions, and flag redundant items.

為什麼會有重複？原因很多。

官方內置了一個「代碼格式化」Skill，你不知道，又從社區安裝了一個功能幾乎一樣的。兩個 Skill，做同一件事，佔兩份預算。

或者更隱蔽的是：你半年前寫了一個自定義 Skill 處理 JSON 解析，後來官方更新，在內置庫中新增了更好的版本。你的舊版本仍在，卻沒有人告訴你該刪除它。

重複檢測不只看名字。名字不同但描述高度相似的，一樣會被標出來。這才是真正有技術含量的部分——它要做語義層面的相似度比對，不是簡單的字串匹配。

功能三：未使用技能篩查

Based on historical logs, identify long-inactive "zombie skills".

這個邏輯很清晰：如果一個 Skill 在過去 30 天、60 天、90 天裡從未被觸發過，大概率說明兩種情況——要麼你的工作流不需要它，要麼它的觸發條件設計有問題，導致模型從不選擇它。

無論哪種情況，結論都一樣：它在白白消耗預算。

此功能輸出的是一份「清理候選清單」。請注意，這是「候選」，而非直接刪除。最終決策權在用戶手中。此設計非常克制且聰明——它清楚自己的界限所在。

有些技能確實是低頻但關鍵的。例如 "資料庫遷移輔助"，你可能三個月才用一次，但用的時候救命。所以篩查結果是參考，不是判決。

功能四：技能根目錄審計

這個功能偏「運維」屬性，但極其實用。

它會統計所有 Skill 的來源目錄，標註啟用／禁用狀態，並梳理載入鏈路。

為什麼需要這個？因為 Skill 的來源是多元的。有的來自全局配置，有的來自項目級配置，有的來自插件自動注入，有的來自用戶手動創建。

當 Skill 數量少的時候，你心裡有數。當數量膨脹到幾十個，你已經搞不清「這個 Skill 是從哪來的」「我能不能安全地刪掉它」「刪了會不會影響其他東西」。

根目錄審計就是給你畫一張地圖，告訴你每個 Skill 住在哪裡、誰加載了它、它現在是活的還是死的。

With this map, you can perform the surgery safely.

功能五：描述簡化優化

最後一個功能，看起來最「小」，實際上槓桿極大。

它會找出描述過於冗長的 Skill，並推薦簡化方案。

為何描述長度如此重要？回到前面所說：Skill 的描述需要寫入系統提示詞中。每個字都是 token。如果一個 Skill 的描述能從 200 token 壓縮到 80 token，節省的空間乘以 Skill 數量，總量非常可觀。

許多社區貢獻的 Skill，描述寫得像論文摘要——背景、動機、適用場景、注意事項、示例輸入輸出，洋洋灑灑。寫的人用心良苦，但從工程角度看，這是過度設計。

模型所需的描述需精準、唯一、可區分。用最少的詞讓模型明白「這個 Skill 做什麼、何時調用它」即可。多餘的每一個字，都是對上下文預算的浪費。

簡化此功能，本質上是進行「提示詞工程的逆向優化」—— 不是撰寫更佳的提示詞，而是將現有提示詞壓縮得更短，同時不損失資訊量。

價值在哪？不是功能，是思維方式

五個功能已拆解完畢。單看每一個，似乎都算不上「驚天動地」。但當它們結合在一起時，代表的是一種思維範式的轉變：

從「創造更多 Skill」到「治理現有 Skill」。

這件事的價值，不在程式碼量，不在演算法複雜度，而在——終於有人把這個問題當成「一等公民」來對待了。

過去兩年，AI 工具生態的注意力全在「做加法」。更多模型、更多功能、更多插件、更多 Skill。跑得快，跑得猛，沒人回頭看。

但任何有工程經驗的人都知道：系統的複雜度增長到一定程度，如果沒有對應的治理機制，它會坍塌。

不是可能。是一定。

在軟體工程中，有一個概念稱為「技術債」。每一個臨時方案、每一次「先這樣吧」、每一個未清理的冗餘，都是在借債。借得越多，利息越高，直到某一天你發現所有精力都在還債，沒有餘力做新事情。

Skill 生態的技術債，已經到了必須正視的時刻。

龍蝦之父這個工具，本質上是一個債務審計器。它不幫你還債，但它告訴你：你欠了多少、欠在哪裡、哪些該優先還。

這比「又寫了一個好用的 Skill」有價值得多。

開源的意義：從個人工具到社區標準

龍蝦之父選擇開源，這個決策本身值得說道。

他完全可以將這個工具做成付費插件。市場需求明確，痛點真實存在，付費用戶不會少。但他選擇了開源。

為什麼？

我猜有兩層考量。

第一層：這個工具要真正發揮價值，需要社區共建。不同AI平台的Skill加載機制不同、日誌格式不同、目錄結構不同。一個人適配不過來，但一百個貢獻者可以。

第二層：他可能想推動的不只是一個工具，而是一個標準。Skill 治理應該怎麼做？審計的維度有哪些？預算分配的最佳實踐是什麼？這些問題，需要社區共識才能形成答案。

開源是達成共識的最佳方式。

回顧軟體工程歷史，ESLint 之於 JavaScript 代碼規範、Black 之於 Python 格式化、Prettier 之於前端代碼風格——這些工具之所以成為事實標準，都是因為開源讓社區參與了規則的制定。

龍蝦之父的這個 Meta-Skill，有沒有可能成為 Skill 治理的 ESLint？

現在判斷太早。但方向是對的。

一個更深的問題：Skill 系統本身該不該重新設計？

審計工具解決的是「存量問題」。但如果我們把視角拉高一層，會發現一個更根本的問題：

為什麼 Skill 會失控？

答案是：當前的 Skill 系統缺乏生命週期管理。

一個 Skill 被創建之後，它就永遠存在了。沒有過期機制、沒有版本淘汰、沒有活躍度衰減。它像一個永遠不會死的進程，佔著資源，直到有人手動 kill 它。

對比操作系統的進程管理：有創建、有調度、有休眠、有終止。生命週期完整閉環。

再對比一下包管理器的依賴管理：npm audit檢查安全漏洞、npm outdated檢查過期依賴、npm prune清理無用包。治理工具是生態的一部分。

Skill 系統呢？建立→使用→……就沒了。中間缺失了大量環節。

龍蝦之父的工具，本質上是用外部工具彌補系統設計的缺失。它很有用，但它也暴露了一個事實：AI 工具平台在 Skill 治理方面的基礎設施，還處於原始階段。

這不是批評。這是發展階段的必然。2024到2025年，平台方的首要目標是「讓生態跑起來」，治理可以後面再說。但到了2026年中，生態已經跑起來了。是時候補課了。

最後一提

回到最初的問題：你的 AI 助手中，有多少 Skill 是活的？

如果你答不上來，說明你需要做一次體檢。

龍蝦之父提供了工具。免費的。開源的。五個維度，全面覆蓋。

用不用，是你的事。

但我非常確定：那些認真對待上下文預算的人，會比那些無腦堆疊 Skill 的人，獲得更好的 AI 輔助體驗。

因為 AI 不是萬能的。它的注意力有限、它的記憶有限、它的推理資源有限。你給它的資訊越精準、越乾淨，它回饋你的輸出就越好。

這不是玄學。這是資訊理論。

Shannon早在1948年就告訴我們：信道容量有限，噪聲越多，有效資訊傳輸率越低。

你 Skill 列表裡那些殭屍技能，就是噪聲。

Eliminate them.

參考引用

Adams, G. S., Converse, B. A., Hales, A. H., & Klotz, L. E. (2021). People systematically overlook subtractive changes. Nature, 592(7853), 258–261.
Shannon, C. E. (1948). A Mathematical Theory of Communication. Bell System Technical Journal, 27(3), 379–423.
OpenAI. (2024). GPT-4 Turbo 上下文視窗與標記限制文件。 https://platform.openai.com/docs/models
Anthropic. (2025). Claude 模型卡：上下文視窗利用率與系統提示開銷。 https://docs.anthropic.com/en/docs/about-claude/models
Cursor Team。 (2025)。規則與技能：自定義指令如何載入至上下文。Cursor 文件。
npm 文件說明。 (2025)。 npm-audit、npm-prune：管理套件生命週期。 https://docs.npmjs.com/cli
龍蝦之父。 (2026)。Skill Health Check Meta-Skill [開源項目]。GitHub Repository。
Sculley, D., 等人 (2015). Hidden Technical Debt in Machine Learning Systems. Advances in Neural Information Processing Systems (NeurIPS), 28.