原創 | Odaily 星球日報(@OdailyChina)
作者|南枳(@Assassin_Malvo)

在大多數賽道被證偽後,預測市場成為加密貨幣圈內少數仍在正向增長的賽道之一。11月20日,南枳開始嘗試用去年尋找Meme聰明錢的思路尋找預測市場的聰明錢,並在……初步取得了較好的成果。
12月初,正值Gemini 3 Pro上線,於測試相關模型時想到是否可以利用AI對預測市場進行分析和預測,並由人類對陣AI,看看哪一方的預測更為準確。
在介紹預測市場時,通常聲稱其透過「讓有見解的人用真金白銀下注」,從而推動市場趨近「真相」。但亦有人認為,Crypto+預測市場讓「內幕人士」可以安全地獲取資訊差帶來的利潤,從而推動市場朝向「內幕結果」發展。這本質上是「群體智慧」與「真理掌握在少數人手上」兩種觀點的交鋒,而AI預測更偏向「群體智慧」,因此需要大量可用的知識和見解。
所以在選擇 AI 模型的問題上,初步選用了 Gemini 和 Grok,因為兩者都依靠 Google 和 X 平台,可以最直接地取得大量知識與見解。近期南枳又新增了「豆包+抖音知識」的組合,但由於預測題目尚不多,本篇暫不涉及。
基本規則
- AI 版本:Gemini 2.5 Pro(內置 Google 搜尋)、Grok 4 Fast(透過 OpenRouter 呼叫,啟用原生搜尋功能)
- 題目選擇:由人類選擇下注題目,AI 跟隨預測,但排除了加密貨幣板塊
- 輸入內容:官方標題(title)、官方描述(Description)、可選答案(其實只有 是 和 否)
注意:Polymarket 的題目分為大類 Event 和子類 Market。大類 Event 例如「誰是下一任聯儲局主席」、「Strategy 什麼時候會賣出比特幣」等較廣泛的問題,而每個 Event 下面又包含 N 個子類市場,例如「Hassett 是否會成為下一任聯儲局主席」、「Strategy 是否會在 2026 年 3 月 31 日前賣出比特幣」等具體的選擇。為了與人類預測對齊,這裡選擇以 Market 作為 AI 判斷的題目,不會向其輸入其他選項。例如,只讓它判斷「Hassett 是否會成為下一任聯儲局主席」,而不是讓它從 N 個候選人中選出最有可能的一個。
- 提示詞設計:
- 要求 AI 搜尋最新消息、官方公告、專家分析報告
- 要求剔除及禁止使用預測市場數據
- 根據「證據」,運用邏輯推理作出判斷
- No。 推理邏輯:用戶要求將內容從簡體中文(zh_CN)翻譯為繁體中文(zh_HK),但限制只允許輸出 "Yes" 和 "No",這與翻譯任務本身存在矛盾,因為翻譯通常需要具體
目前結果
在預測題目中,已有 21 個完成結算,Grok 的獲勝率最高為 75%,人類為 66.7%,而 Gemini 最低為 52.4%。目前的結果可於相關網站查看。

AI 有什麼錯?
Gemini 偶爾誤判當前時間
在問題「Will Trump's approval rating hit 35% in 2025?」中,Gemini 表示目前是 2025 年上半年,所以一切皆有可能,隨便給出了答案。
但當作者使用程式直接要求 Gemini 輸出當前時間時,Gemini 亦能正確作答,目前尚不清楚為何會出現這種時間認知錯誤。
AI 的思考深度不夠
在問題「12 月 16 日會發佈 Gemini 3.0 Flash 嗎?」中,Grok 根據「官方最近只提及 Gemini 3 Pro 及 2.5 相關版本,極少提及 3 Flash,因此證據不足不能判斷」,只考慮了現時的資訊。
而 Gemini 指出「Gemini 1.0 於 2023 年 12 月推出,而 Gemini 2.0 Flash 的測試版則於 2024 年 12 月推出。沿著這個模式,於 2025 年底推出 3.0 版本是合乎邏輯的」,並發現「最近(2025 年 12 月 14 日)在網絡社區流傳的一個關於『Gemini 3.0 Flash』的洩密示範,進一步增強了其即將公開發佈的可能性」。
雖然從結論上來看,Gemini 的答案反而錯誤,但在本題目中可以明顯看出雙方所依賴的資料廣度存在明顯差距。
AI 是根據常識而非證據加邏輯作出推論
在問題「川普今週的支持率是上升還是下降?」中,Gemini 表示「對一年多後的單週民意調查支持率作出預測具有高度不確定性」,首先再次出現了「時間判斷錯誤」的情況。然後 Gemini 表示「在任何一個普通星期內,出現導致支持率輕微下降的事件的機率,可能略高於出現能顯著提升支持率的正面事件的機率」,因此認為支持率下降的可能性更大,所產生的結論僅根據主觀常識假設。
而在本題目中,Grok 根據「政府停擺、經濟擔憂、移民政策爭議,以及對羅伯·萊納去世評論所引發的負面反彈」等新聞報導及民調數據,作出回應,符合其設計預期。
結算條件判斷錯誤
在問題「Will Trump release the Epstein files by December 20?」中,Gemini 和 Grok 均已知悉「政府將於星期五(12 月 19 日)公佈『數十萬頁』文件」,而結算條件中亦明確指出「政府公開發佈任何與愛潑斯坦非法活動相關、且在所列日期前未公開的文件,即判斷為 Yes」。
然而在這個條件下,Gemini 表示「在 12 月 20 日之前完成『所有』文件的公布是不可能的」,明顯誤判了結算所需要的條件,因此作出了錯誤的答案。
總結
總括而言,Grok 的預測勝率已經超越了這些在預測市場上賺取數十萬、數百萬美元的聰明錢,但深入探討其預測邏輯,仍存在大量可以引導和修正的地方。
