Tahmin Pazarlarında Yapay Zeka ve İnsan Tahminleri: Grok, İnsanlardan Daha Başarılı

Orijinal | Odaily Planet Daily (@OdailyChina)

Çoğunlukla yolların yanlış olduğu bu dönemde, tahmin pazarları kripto dünyasında az miktarda hâlâ olumlu büyüme gösteren yollardan biri haline geldi. 20 Kasım'da, Nan Zhi, geçen yıl Meme akıllı para arayışında kullandığı fikri kullanarak tahmin pazarlarında akıllı para arayışına başladı veİlk aşamalarda iyi sonuçlar elde edildi..

Aralık ayının başıydı ve Gemini 3 Pro'nun piyasaya sürülmesiyle birlikte, ilgili modelleri test ederken, AI'nın tahmin pazarlarını analiz etmesi ve öngörmesi fikrini düşündüm. İnsanların AI'ya karşı tahmin yapması ve hangi tarafın daha doğru olacağını görmek istedim.

Tahmin pazarları tanıtıldığında genellikle, "bilgili insanlara gerçek parayla bahis oynama imkanı sunarak" pazarın "gerçek"e yaklaşmasına yardımcı oldukları iddia edilir. Ancak bazıları, Kripto + tahmin pazarlarının "iç bilgili kişilerin" bilgi farkından elde edilen karları güvenli bir şekilde elde etmelerine olanak tanıyarak, pazarın "iç bilgi sonucuna" doğru hareket etmesine neden olabileceğini savunur. Bu, temelde "kitle zekâsı" ile "azınlıkta doğru bilgiye sahip olma" görüşlerinin çatışmasıdır. AI tahmini ise daha çok "kitle zekâsına" dayanır, bu nedenle büyük miktarda kullanılabilir bilgi ve bilgeliğe ihtiyaç duyar.

Bu nedenle, AI modeli seçimi konusunda başlangıçta Google ve X platformlarına dayanan, dolayısıyla en doğrudan şekilde çok sayıda bilgi ve bilgeliğe ulaşılabilen Gemini ve Grok modelleri tercih edildi. Son zamanlarda Nan Zhi, "Dou Bao + TikTok Bilgeliği" kombinasyonunu da ekledi, ancak tahmin konularının sayısı henüz çok olmadığından bu yazıda ele alınmayacak.

Temel kurallar

AI Sürümü: Gemini 2.5 Pro (Yerleşik Google Arama), Grok 4 Fast (OpenRouter aracılığıyla çağrılır, yerel arama özelliği etkinleştirilir)
Konu Seçimi: İnsanların bahis konularını seçmesi, AI tahmin eder, ancak Kripto paralar hariç tutulur.
Giriş içeriği: Resmi başlık (title), resmi açıklama (Description), Seçenekler (Aslında sadece Evet ve Hayır)

Not: Polymarket'te sorular, "Federal Rezerv Başkanı kim olacak?" ve "Strateji ne zaman Bitcoin satar?" gibi genel kategoriler olan Event ve alt kategoriler olan Market olmak üzere iki sınıfa ayrılır. Event kategorisi, "Hasset Federal Rezerv Başkanı olur mu?" ve "Strateji 2026 Mart 31'ine kadar Bitcoin satar mı?" gibi belirli seçenekleri içeren N tane alt pazar içerir. İnsan tahminleriyle uyumlu olmak için burada AI'nın Market üzerinden karar vermesi tercih edilmiştir. Diğer seçeneklerin verilmediği sadece "Hasset Federal Rezerv Başkanı olur mu?" gibi bir soruyla AI'ya karar vermesi istenmiştir. N tane adaydan en olası olanı seçmesi istenmemiştir.

İpucu tasarımı:
AI'den en son haberleri, resmi duyuruları ve uzman analiz raporlarını araştırmayı isteyin
Tahmin pazarı verilerinin çıkarılması ve kullanımı yasaklandı.
"Kanıtlara" dayanarak mantıksal çıkarımlar yapmak
No. Çünkü kullanıcı, sadece "Evet" ve "Hayır" ile birlikte mantık yürütme kısmını bir paragraf halinde açıklamamı istemiştir. Bu, sadece "Evet" ve "Hayır" ile yanıt vermeyi gerektiren

Mevcut sonuçlar

Tahmin konularında 21 tanesi sonuçlandırıldı. Grok'un kazanma oranı %75 olarak en yüksek, insanlar %66,7 ile ikinci sırada yer aldı ve Gemini en düşük olan %52,4'le son sırada kalmıştır. Mevcut sonuçlara buradan ulaşılabilir:İlgili sitelerİncele.

Yapay zeka hangi hatayı yaptı?

Gemini bazen mevcut zamanı yanlış yorumlar.

"Will Trump's approval rating hit 35% in 2025?" (Trump'un onay oranı 2025'te %35'e ulaşacak mı?) sorusunda Gemini, şu an 2025'in ilk yarısında olduğumuzu belirtti ve her şeyin mümkün olabileceğini söyleyerek cevabı rastgele verdi.

Ancak yazar, program aracılığıyla Gemini'den şu anki saati doğrudan isteyince, Gemini doğru cevabı verebiliyor ve neden böyle bir zamanlama hatası meydana geldiği hâlâ bilinmiyor.

Yetersiz AI düşünme derinliği

"Gemi 3.0 Flash 16 Aralık'ta mı yayınlandı?" sorusunda Grok, "Resmi olarak sadece Gemi 3 Pro ve 2.5 ile ilgili sürümlerden bahsedildi, 3 Flash'ten çok az bahsedildi, bu nedenle kanıt yetersizdir ve karar verilemez" diyerek sadece mevcut bilgileri göz önünde bulundurdu.

Gemini'nin "Gemini 1.0, Aralık 2023'te, Gemini 2.0 Flash'in deneme sürümü ise Aralık 2024'te piyasaya sürüldü. Bu model devam ettirilirse, 2025'in sonunda 3.0 sürümünü çıkarmak mantıklıdır." ifadesini kullandığı ve ayrıca "Son zamanlarda (14 Aralık 2025) internet topluluklarında 'Gemini 3.0 Flash' için sızdırılmış bir tanıtımın dolaşması, yakında resmi olarak açıklanma olasılığını daha da artırmaktadır." ifadesini kullandığı görülmüştür.

Sonuç olarak, Gemini'nin cevabı yanlış olsa da, bu soruda her iki tarafın da yararlandığı bilgi genişliği arasındaki fark açıkça görülüyor.

AI, kanıta ve mantığa değil, ortak bilgiye dayanarak çıkarımda bulunur.

"Bu hafta Trump onayı artacak mı yoksa azalacak mı?" sorusuna dair Gemini, "Bir yıldan fazla zaman sonrasına ait haftalık kamuoyu yoklamalarının tahmini, yüksek belirsizlik içerir" demiştir. İlk olarak burada yine "zaman değerlendirme hatası" görülmektedir. Daha sonra Gemini, "Herhangi bir normal haftada, destek oranında hafif bir düşüşe neden olabilecek olayların, destek oranını önemli ölçüde artırabilecek olumlu olaylara göre biraz daha yüksek olma olasılığı vardır" demiştir. Bu nedenle, destek oranının düşmesinin daha olası olduğunu belirtmiştir. Üretilen sonuç, öznitelikli genel bilgilerle yapılan varsayım üzerine dayanmaktadır.

Bu konuda, Grok, "hükûmetin kapanması, ekonomiyle ilgili endişeler, göç politikası tartışmaları ve Rob Reiner'in ölümüne dair yorumların olumsuz tepkiler uyandırması" gibi haberler ve anket verileri temel alınarak tasarlandığı şekilde hareket etti.

Hesaplaşma koşulları yanlış değerlendirildi.

"Will Trump release the Epstein files by December 20?" (20 Aralık'tan önce Trump, Epstein dosyalarını açıklar mı?) sorusunda, hem Gemini hem de Grok'ın "hükümetin Cuma günü (19 Aralık) 'yüzbinlerce sayfa' belgeyi açıkladığını" bildikleri açıktır. Karar kriterleri ise açıkça belirtmiştir ki, "hükümetin, belirtilen tarihten önce kamuoyuna açıklanmamış Epstein'in yasadışı faaliyetleriyle ilgili herhangi bir belgeyi kamuoyuna açıklaması, 'Evet' olarak değerlendirilecektir."

Ancak bu şart altında, Gemini "20 Aralık'tan önce 'tüm' belgelerin açıklanmasının imkânsız olduğunu" ifade etmiş ve netleştirmenin gerektirdiği şartları yanlış değerlendirdiği için yanlış bir yanıt vermiştir.

Özetleme

Sonuç olarak, Grok'un tahmin kazanma oranı, tahmin pazarlarında milyonlarca dolar kazanan zeki paralara bile yetişiyor, ancak tahmin mantığına daha derin bakıldığında, yönlendirilebilecek ve düzeltilmesi gereken birçok alan hâlâ var.