التنبؤات الصناعية مقابل التنبؤات البشرية في أسواق التنبؤ: Grok تتفوق على البشر

أصلي | صحيفة أودايلى لكوكب الأرض (@OdailyChina)

المؤلف: نان تشي (@Assassin_Malvo)

بعد أن تم دحض معظم المسارات، أصبح سوق التنبؤ أحد المسارات القليلة التي ما زالت تشهد نموًا إيجابيًا داخل مجتمع الكريبتو. في 20 نوفمبر، بدأت جي جنوب في تجربة استخدام منهجية البحث عن الأموال الذكية في الميمات من العام الماضي للبحث عن الأموال الذكية في سوق التنبؤ، ونجحت في...لقد حقق نتائج جيدة في المراحل الأولى..

في منتصف ديسمبر، مع بدء تشغيل Gemini 3 Pro، أثناء اختبار النماذج ذات الصلة، توصلت إلى فكرة ما إذا كان من الممكن استخدام الذكاء الاصطناعي لتحليل الأسواق التنبؤية وإجراء التنبؤات، ومن ثم إجراء مواجهة بين الإنسان والذكاء الاصطناعي لمعرفة أي الطرفين يحقق دقة تنبؤ أعلى.

عند تقديم سوق التنبؤات عادةً ما يُقال إنها تدفع السوق نحو "الحقيقة" من خلال "السماح للأشخاص ذوي الرؤى بتقديم المراهنات بمال حقيقي". ولكن هناك من يرى أن تطبيق التشفير (Crypto) مع أسواق التنبؤات يسمح للأشخاص "المطلعين على المعلومات الداخلية" بالحصول على الأرباح بشكل آمن من خلال الفرق المعلوماتي، مما يدفع السوق نحو "نتائج داخلية"، وهذا يعكس جوهر الصراع بين وجهتي نظر متعارضتين: "الذكاء الجماعي" و"الحقيقة تكمن في أيدي الأقلية". أما التنبؤات باستخدام الذكاء الاصطناعي فتُظهر ميلًا نحو "الذكاء الجماعي"، وبالتالي فإنها تحتاج إلى كميات كبيرة من المعرفة والرؤى المتوفرة.

لذلك، في قضية اختيار نموذج الذكاء الاصطناعي، تم اختيار جيميني وغروك في البداية، نظراً لاعتمادهما على منصات جوجل وشركة إكس، مما يسمح بالوصول المباشر إلى كم هائل من المعرفة والرؤى. حديثاً، أضاف نان تشي مزيجاً جديداً هو "دُو باو + معرفة تيك توك"، ولكن نظراً لقلة الأسئلة التنبؤية، لن يتم تناوله في هذا المقال.

القواعد الأساسية

النسخة المُستخدمة من الذكاء الاصطناعي: Gemini 2.5 Pro (يحتوي على بحث Google مدمج)، Grok 4 Fast (يُستخدم عبر OpenRouter مع تفعيل ميزة البحث الأصلي)
اختيار العنوان: يتم اختيار عنوان الرهان من قبل البشر، ويقوم الذكاء الاصطناعي بتنبؤه، ولكن يتم استبعاد قسم التشفير (كريبتو)
العنوان الرسمي (title)، الوصف الرسمي (Description)، والجواب المتاح (والذي يكون إما نعم أو لا)

ملاحظة: يتم تقسيم الأسئلة في Polymarket إلى فئات رئيسية تُسمى "Event" وفئات فرعية تُسمى "Market". تشمل الفئات الرئيسية الأسئلة العامة مثل "من سيكون رئيسًا جديدًا لمجلس الاحتياطي الفيدرالي؟" و"متى سيبيع Strategy البيتكوين؟"، وتتضمن كل فئة رئيسية "N" أسواق فرعية. على سبيل المثال، قد تشمل أسواق الفئة "من سيكون رئيسًا جديدًا لمجلس الاحتياطي الفيدرالي؟" أسئلة محددة مثل "هل سيصبح هاسلت رئيسًا جديدًا لمجلس الاحتياطي الفيدرالي؟"، أو "هل سيبيع Strategy البيتكوين قبل 31 مارس 2026؟". من أجل التوافق مع التنبؤ البشري، تم اختيار "Market" كأساس لتحديد الأسئلة التي يُطلب من الذكاء الاصطناعي الحكم عليها، دون إعطائه خيارات إضافية. على سبيل المثال، يُطلب منه تحديد "هل سيصبح هاسلت رئيسًا جديدًا لمجلس الاحتياطي الفيدرالي؟" فقط، وليس اختيار الشخص الأرجح من بين "N" مرشحين.

تصميم عبارات التلميح:
طلب من الذكاء الاصطناعي البحث عن أخبار حديثة، وبيانات رسمية، وتقارير تحليل الخبراء
طلب إزالة البيانات المتوقعة من السوق وحظر استخدامها
اتخذ قراراتك باستخدام الاستدلال المنطقي بناءً على "البراهيل"
No. السبب هو أن المطلوب هو الترجمة من اللغة الصينية إلى اللغة العربية، ولكن الإخراج المطلوب محدود فقط بكلمتين "Yes" و "No"، ولا يُسمح بإضافة أي تفسير أو منطق. ومع ذلك، يُطلب

النتائج الحالية

في مهام التنبؤ، تم تسوية 21 مهمة، حيث بلغت نسبة نجاح Grok الأعلى 75%، ونسبة النجاح البشرية 66.7%، بينما كانت نسبة نجاح Gemini الأدنى 52.4%. يمكن العثور على النتائج الحالية فيالمواقع ذات الصلةالتحقق.

ما الخطأ الذي ارتكبته الذكاء الاصطناعي؟

في بعض الأحيان يُخطئ جمّي في تحديد الوقت الحالي.

في سؤال "هل ستصل نسبة تأييد ترامب إلى 35% في عام 2025؟"، أشار جيميني إلى أننا في النصف الأول من عام 2025 الآن، لذا فإن كل شيء ممكن، وقدم إجابةً عشوائيةً.

ولكن عندما طلب المؤلف من البرنامج الحصول على الوقت الحالي مباشرةً من جيميني، تمكن جيميني من تقديم الإجابة الصحيحة، ولا يزال من غير المعروف سبب حدوث هذا الخطأ في الإدراك الزمني.

التفكير في الذكاء الاصطناعي غير كافٍ في العمق

في السؤال "Gemini 3.0 Flash تم إصداره في 16 ديسمبر؟"، اعتمد Grok على "البيانات الرسمية التي ذُكرت مؤخرًا تتعلق فقط بالإصدار Gemini 3 Pro و 2.5، ونادراً ما تم ذكر الإصدار 3 Flash، وبالتالي فإن هناك نقصًا في الأدلة ولا يمكن اتخاذ قرار"، وركز فقط على المعلومات الحالية.

وأشار جيميني إلى أن "تم إصدار جيميني 1.0 في ديسمبر 2023، بينما تم طرح نسخة تجريبية من جيميني 2.0 فلاش في ديسمبر 2024. باستمرار هذا النمط، من المنطقي إصدار النسخة 3.0 بنهاية عام 2025"، كما اكتشف "تقريرًا مُسربًا حديثًا (في 14 ديسمبر 2025) عن عرض توضيحي لـ "جيميني 3.0 فلاش" انتشر في مجتمعات الإنترنت، مما يزيد من احتمالية إصداره قريبًا بشكل رسمي".

على الرغم من أن إجابة جيميني كانت خاطئة من حيث الاستنتاج، إلا أنه يمكن ملاحظة بسهولة في هذا السؤال فرق واضح في مدى الموارد التي يعتمد عليها الطرفان.

الاستنتاجات التي تُبنى على المعرفة الشائعة بدلًا من المعرفة المبنية على الأدلة والمنطق.

في السؤال "هل ارتفعت أو انخفضت شعبية ترامب هذا الأسبوع؟"، أشار Gemini إلى أن "التوقعات المتعلقة بنتائج استطلاعات الرأي لاسبوع واحد بعد أكثر من عام تُعد مصحوبة بدرجة عالية من عدم اليقين"، مما يدل أولاً على حدوث "خطأ في تقدير الوقت" مرة أخرى. ثم أشار Gemini إلى أن "في أي أسبوع عادي، قد تكون احتمالية حدوث أحداث تؤدي إلى انخفاض طفيف في مستوى الدعم أعلى قليلاً من احتمالية حدوث أحداث إيجابية تُحدث زيادة ملحوظة في مستوى الدعم"، وبالتالي فإن احتمال انخفاض مستوى الدعم أكبر، والنتيجة التي تم إنشاؤها تعتمد فقط على افتراضات مبنية على المعرفة العامة الذاتية.

ومن ناحية أخرى، في هذا السياق، فإن Grok يعتمد على تقارير إخبارية مثل "إغلاق الحكومة، والمخاوف الاقتصادية، والجدل حول سياسة الهجرة، والردود السلبية الناتجة عن تعليقات على وفاة روب راينر"، بالإضافة إلى بيانات استطلاعات الرأي، وهو ما يتوافق مع التصميم المتوقع.

تم تحديد شروط التسوية بشكل خاطئ

في سؤال "هل سيُعلن ترامب عن ملفات إيبشتاين قبل 20 ديسمبر؟"، فإن كلاً من Gemini وGrok يعلمان أن "الحكومة ستُعلن عن 'مئات الآلاف من الصفحات' من الملفات يوم الجمعة (19 ديسمبر)"، كما أن شروط التسوية تُشير بوضوح إلى أن "الإجابة هي نعم إذا أصدرت الحكومة بشكل علني أي ملفات مرتبطة بالأنشطة غير القانونية لإيبشتاين لم تُعلن من قبل في التاريخ المذكور".

ومع ذلك، في ظل هذه الظروف، صرّح جيميني بأن "من المستحيل نشر 'كل' الملفات قبل 20 ديسمبر"، وهو ما يُظهر تقييمًا خاطئًا للظروف المطلوبة لاستكمال التسوية، وبالتالي قدم إجابة خاطئة.

ملخص

بشكل عام، تفوقت نسب فوز تنبؤات "Grok" على هذه الأموال الذكية التي حققت ملايين الدولارات في الأسواق التنبؤية، ولكن عند التعمق في منطق التنبؤات، لا يزال هناك الكثير مما يمكن توجيهه وتصحيحه.