GitHub 停機由 AI 驅動的流量激增和配置錯誤引起

icon MarsBit
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
2026 年 2 月 9 日,GitHub 遭遇重大停機,由配置錯誤引發的快取重寫風暴所致。此事件暴露了平台在年度代碼提交量飆升 14 倍(主要來自 AI 代理)下的基礎設施弱點。首席技術官承認平台未能達成 99.9% 的正常運行時間,並宣布將進行 30 倍規模的重新設計。隨著恐懼與貪婪指數顯示波幅加劇,關注的山寨幣可能對更廣泛的科技不穩定作出反應。

今年 2 月 9 日,北京時間深夜,全球數以千萬計的開發者打開 GitHub,看到了同一個頁面。

不是 404,比 404 更讓人焦慮——是那個讓所有工程師後背發涼的黃色警告條,加上狀態頁上一排排從綠色變成紅色的指示燈。

github.com 崩潰了。

API 已斷線。

GitHub Actions 崩潰了。

Git 操作掛了——就連 Copilot 也沒能倖免。

那一晚,有人的 CI/CD 流水線在最關鍵的節點停擺,有人的自動化部署卡在了半空中,還有人在等待一個遲遲無法合併的 PR——背後是一個等待上線的功能,等待的是真實用戶。

事後 GitHub 發布了事故報告。根本原因,用技術語言說,是「一個負責認證和用戶管理的核心資料庫叢集過載」。但這幾個字背後藏著一條觸目驚心的觸發鏈——

兩天前,工程團隊為了盡快向用戶推送一個新模型,將「用戶設置緩存」的刷新時間從 12 小時改為 2 小時。就是這個配置數字的更改。

結果,原本分散在 12 小時內完成的快取重寫,被壓縮至 2 小時內,形成了一次密集的「快取重寫風暴」,非同步任務佇列瞬間被擊潰,共享基礎設施組件崩潰,連鎖反應蔓延至負責代理 HTTPS Git 操作的服務,最終導致整個平台的連接耗盡。

一個數字,從 12 改到 2。

GitHub 被自己修改的一個配置擊穿了。

但如果你只看到這一個配置更改,那你大概錯過了這個故事最重要的部分。

01 不是一次意外,是十次意外

2 月 9 日的事故,不是一個孤立事件。

事實上,2026 年的前三個月,GitHub 經歷了至少 8 次重大事故。2 月份單月就有 37 次大大小小的故障記錄。GitHub 的 CTO Vlad Fedorov 後來在部落格中承認,這兩個月 GitHub 沒能維持它向企業客戶承諾的「三個九」——99.9% 可用性。

翻開這兩個月的故障檔案,你會發現一個奇特的規律:每一次事故,看起來都是不同的原因。

2 月 2 日:Azure 計算提供商出現問題,GitHub Actions 停擺近 4 小時,Copilot 編碼代理、CodeQL、Dependabot 全部受牽連。

2 月 9 日:快取重寫風暴,認證資料庫過載。

3 月 5 日:Redis 集群故障,GitHub Actions 95% 的工作流程在 5 分鐘內無法啟動,平均延遲 30 分鐘。

3 月 18 日:Webhook 延遲飆升至正常水平的 32 倍。

每一次看起來都像是「意外」,每一次的直接原因都不盡相同。但 Fedorov 的解釋將它們串聯成同一個故事。他說,這些事故背後有三個共同的結構性原因:「負載快速增長、服務之間的緊密耦合導致局部故障擴散,以及系統缺乏對異常客戶端流量的保護能力。」

用工程師的話說,GitHub 的地基已經開始在新負載的重壓下出現裂縫。

而這個「新負載」,有一個具體的名字。

02 每週 2.75 億次提交

關鍵數據

2025 年全年 commit 總量:約 10 億次

2026 年單週 commit 量:2.75 億次

按此速度,2026 年全年預計:140 億次(同比增長 14 倍)

GitHub Actions 計算量:2023 年每週 5 億分鐘 → 2025 年 10 億 → 2026 年初某週 21 億分鐘

如果你是 GitHub 的基礎設施工程師,2025 年和 2026 年的監控儀表板對比,大概會讓你目瞪口呆。

在 2025 年全年,GitHub 處理了大約 10 億次代碼提交。這個數字本身已經非常龐大,是 GitHub 平台多年累積的成果。但到了 2026 年,單週的提交量已達到 2.75 億次。換算一下——如果以這個速度持續一整年,2026 年的總提交量將接近 140 億次,是 2025 年全年的整整 14 倍。

這不是一條平滑增長的曲線,而是一道陡坡。GitHub 的 Actions 計算量變化更能說明問題:2023 年每周消耗 5 億分鐘,2025 年翻倍到 10 億,然後在 2026 年初的某一周,直接飆到了 21 億分鐘。

是什麼在瘋狂提交代碼?

不是人類開發者。

GitHub 的數據顯示,AI Agent 正成為該平台上最活躍的「用戶」。僅 Claude Code 這一個工具,目前就貢獻了 GitHub 所有公開倉庫提交量的 4.5%。每周達 260 萬次提交,而在 2025 年 9 月底,這一數字僅為 10 萬——三個月內增長了 25 倍。

AI Agent 開啟的 PR 數量同樣在爆炸。2025 年 9 月,AI 生成的 PR 大約是每月 400 萬個,到 2026 年 3 月,這個數字跳到了 1700 萬——四倍多,半年內。

有一個畫面可以幫助你理解這意味著什麼。

過去,GitHub 的「用戶」主要是人類程式設計師。他們白天工作,晚上睡覺,週末休息,每次提交都會思考、猶豫,手速有上限。系統的負載跟著人類的作息走,有峰谷,可以預測。

現在,越來越多的「用戶」是 AI Agent。它們不睡覺,不休息,不猶豫,一個任務可以同時啟動多個並行的 Agent,每個 Agent 每小時的提交量,輕鬆超過一個真實工程師一週的工作量。更重要的是,它們不只是在提交程式碼,還在不斷建立新倉庫——把倉庫當成工作流的「輸出產物」,而不是人類的「工作空間」。

GitHub 的基礎設施工程師們,面對的已經不是一個流量更大的同類問題,而是一個性質完全不同的問題。

03 Copilot 的資金不夠燒了

故障頻發只是問題的一面,GitHub 還有另一個更讓人頭疼的麻煩——算賬的時候發現虧了。

Copilot 最初的定價邏輯基於一個合理的假設:用戶主要以「輔助補全」的方式使用,每次互動時間短暫,計算量可預測。個人版每月 10 美元,商業版每月 19 美元,按座位收費,這個模式在過去幾年運作良好。

然後,Agentic AI 來了。

Agentic 工作流與傳統補全屬於兩種不同的物種。標準的程式碼補全,請求是線性且可預測的,計算週期短暫;而一個 Agentic 編碼會話,可能運行數小時,同時啟動多個平行線程,進行多步推理、自我糾錯、跨倉庫重構——一個會話消耗的 token 數量,輕鬆超過一般用戶一整月的訂閱費用。

GitHub 面對的局面是,少數重度 Agentic 用戶,正在用幾美元的月費消耗相當於幾百美元的計算資源。

面對這個局面,GitHub 的反應很直接——先控流,再改價。

自今年年初起,GitHub 為 Copilot 啟動了兩套並行的限流機制:會話時長上限和每週使用量上限,兩個維度均按 token 消耗量乘以模型計算權重來計算。同時,部分個人 Copilot 套餐已暫停新用戶註冊。

On June 1, GitHub completed a more fundamental pricing reform: Copilot fully switched to usage-based billing, replacing the original subscription fees with "AI Credits," where 1 AI Credit equals US$0.01, and usage is calculated in real time based on token consumption.

在 Agentic AI 面前,按座位收費的時代走到了終點。

這個轉變不只是 GitHub 的煩惱。這是整個 AI 工具行業在 2026 年正在經歷的一次集體定價危機——當 AI 開始替代人類執行完整的工作流程,而不只是「輔助」人類工作時,所有基於「每人每月」的訂閱邏輯都會失效。

04 30 倍,不是 10 倍

回到基礎設施問題。GitHub 到底準備怎麼應對這個「14 倍增長」?

這裡有一個細節,能說明問題的嚴重程度:

2025 年 12 月下旬,Agentic 工作流突然開始加速。GitHub 的工程師們意識到,10 倍不夠。到 2026 年 2 月,也就是那次嚴重停機之後,GitHub 宣布需要按照今天規模的 30 倍重新設計架構。

不是擴容,是重新設計。

這兩個詞的區別很大。擴容是增加現有機器數量、為現有資料庫增加記憶體——方向不變,只是規模變大。重新設計則意味著,現有架構的假設在 30 倍規模下會系統性失效,必須從底層重新思考服務拆分、資料流和故障隔離的方式。

GitHub 披露的具體方向包括:解耦關鍵服務以防止級聯失敗、引入背壓機制和流量降級能力、為熱點服務部署獨立主機、消除單點故障,以及更完善的變更管理——避免「將快取 TTL 從 12 小時改到 2 小時」這種操作在沒有充分壓測的情況下直接上線。

值得注意的是,GitHub 並不孤單。

Stripe 已經遇到 AI Agent 批量建立帳戶的問題,AWS 正在構建專為 Agent 設計的身份系統、日誌系統和生產控制機制。這些舉措並非未雨綢繆,而是因為監控儀表板上已出現它們不得不解決的訊號。

GitHub 只是第一個被攻破的——因為它位於 AI 工具鏈的最核心。

05 開源碼倉庫,正逐漸變成 AI 的排氣管

停下來想一想這整件事的性質。

GitHub 是什麼?最直觀的回答是,它是程式員存放程式碼的地方。但更深一層,它是人類軟體協作的基礎設施——提交記錄是協作的軌跡,PR 是討論的容器,Issues 是意圖的留存,Action 是執行的管道。整套系統,是為人類的工作節奏、思維方式和協作模式設計的。

AI Agent changed all of this.

當一個 AI Agent 一天可以提交數百次代碼,每一次「提交」背後都沒有人類的思考與權衡,僅僅是任務迴圈的進度步驟——代碼倉庫還是「協作的容器」嗎?

當 AI 工具自動生成倉庫、自動開 PR、自動運行 CI、自動合併——開發者仍是這個流程的主體,還是已退化為「審核者」甚至「旁觀者」?

GitHub 的首席技術官在描述這次危機時,使用了「負載快速增長」這個詞。但這個詞很可能低估了問題的本質——這不只是數量的增長,更是使用方式的質變。在舊模型中,GitHub 是「開發者的工具」;在新模型中,GitHub 正在變成「AI 的排氣管」,一個自動化工作流的輸出管道。

這對 GitHub 意味著什麼,其實還沒有答案。30 倍擴容能解決流量問題,但解決不了商業模式的再定義,也解決不了「誰是我的真正用戶」這個身份問題。

最近出現了一個頗具深意的現象:GitHub 在停機後發布了大量工程博客,詳細描述了每次事故的根本原因,透明度幾乎達到令人驚訝的程度。有人認為這是 GitHub 主動建立信任,也有人認為這是用透明度換取開發者社區的耐心——因為接下來的重構期,還會有更多不穩定。

一個平台,在被自己的成功擊穿之後,需要將自己拆解並重建——而這個過程本身,也是一次能否撐住的考驗。

那晚 2 月 9 日,那位等待 PR 合併的工程師,大概最終還是等來了綠燈。但他可能沒有意識到,讓他等待的那次當機,不是 GitHub 的一次意外,而是整個軟體開發行業進入新時代的一聲響動。

本文來自微信公眾號 “極客公園”(ID:geekpark),作者:宇航猿

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露