پیش گوئی مارکیٹس میں AI اور انسانی پیش گوئیاں: گروک انسانوں کی نسبت بہتر کارکردگی دکھاتا ہے

iconOdaily
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
ایک ہوشر با آزمائش جس میں جیمنی اور گروک کے ای آئی ماڈلز کو براہ راست انسانی شرکاء کے ساتھ قیمت کی پیش گوئی مارکیٹوں میں موازنہ کیا گیا۔ پولی مارکیٹ کے غیر کریپٹو سوالات کا استعمال کرتے ہوئے، گروک نے 75 فیصد درستی کا اسکور حاصل کیا، جو انسانوں کے 66.7 فیصد کی کارکردگی کو پیچھے چھوڑ دیا۔ جیمنی 52.4 فیصد کے ساتھ پیچھے رہا، جو وقت کی آگہی اور استدلال کی گہرائی کے مسائل کو ظاہر کرتا ہے۔ گروک کی کارکردگی واقعی دنیا کے ڈیٹا اور خبروں کے ساتھ بہتر مطابقت رکھتی ہے۔ نتائج ای آئی کے بڑھتے ہوئے کردار کو ظاہر کرتے ہیں، خصوصاً بٹ کوائن کی قیمت کی پیش گوئی اور مارکیٹ تجزیہ میں۔

اصلی | اُڈیلی اخبار (Odaily Planet) (@OdailyChina)

لکھاری ۔۔۔ نان جی@Assassin_Malvo)

اکثر میدانوں کی تصدیق کے بعد، پیش گوئی بازار کرپٹو میں ایک خاص حصہ بن گیا۔ 20 نومبر کو، جنوبی جی نے گزشتہ سال میم میں اچھی رقم تلاش کرنے کے اصول کو استعمال کرتے ہوئے پیش گوئی بازار میں اچھی رقم تلاش کرنے کی کوشش شروع کی، اورابتداء میں بہتر نتائج حاصل ہوئ۔

جنوری کے 12 ویں تاریخ کو جب جیمینی 3 پرو متعارف کرایا گیا تھا تو میں نے سوچا کہ کیا ہم ای آئی کا استعمال کر کے پیش گوئی مارکیٹ کا تجزیہ اور پیش گوئی کر سکتے ہیں اور انسانوں کو ای آئی کے خلاف مقابلہ کروائے کہ دونوں میں سے کون سا زیادہ تیزی سے پیش گوئی کر سکتا ہے۔

پیش گوئی مارکیٹ کی متعارف کرائی گئی ہے کہ یہ "واقعیت" کی طرف لے کر جاتی ہے کیونکہ اس میں "اہم علم رکھنے والے افراد" حقیقی رقم کے ساتھ سٹے کر رہے ہوتے ہیں۔ لیکن کچھ لوگوں کا خیال ہے کہ کرپٹو کرنسی + پیش گوئی مارکیٹ کے مطابق "اندر کے لوگ" معلوماتی فرق کے فوائد کو محفوظ طریقے سے حاصل کر سکتے ہیں، جو کہ "اندر کے نتائج" کی طرف مارکیٹ کو لے جاتا ہے۔ یہ بنیادی طور پر "جمعیت کی حکمت" اور "چند لوگوں کے پاس سچائی ہے" دونوں دیدگاہوں کے درمیان تصادم ہے۔ ای آئی پیش گوئی "جمعیت کی حکمت" کی طرف زیادہ مائل ہے، اس لیے اس کی بڑی مقدار میں دستیاب علم اور دیکھنے کی ضرورت ہوتی ہے۔

لہٰوں اس بات کے بارے میں کہ اے آئی ماڈل کیسے منتخب کیا جائے، Gemini اور Grok کا ابتدائی طور پر انتخاب کیا گیا کیونکہ دونوں گوگل اور ایکس پلیٹ فارم پر منحصر ہیں، جو سب سے زیادہ سے علم اور دیکھنے کو حاصل کرنے کی اجازت دیتے ہیں۔ اس کے علاوہ اخیر وقت میں نان چی نے "Dou+ Douyin علم" کا ترکیبی انتخاب بھی شامل کر لیا ہے، لیکن چونکہ پیش گوئی کے سوالات ابھی تک کافی نہیں ہیں، اس لیے اس مضمون میں اس کا ذکر نہیں کیا گیا ہے۔

بنیادی قواعد

  • AI کی ورژن: Gemini 2.5 pro ( گوگل سرچ کے ساتھ)، Grok 4 Fast (OpenRouter کے ذریعے کال کیا گیا، اصلی سرچ کی خصوصیات کو ایکٹیو کیا گیا)
  • موضوعات کا انتخاب: انسانی انتخاب کردہ سٹیک موضوعات، AI پیش گوئی کرتا ہے لیکن کرپٹو کے شعبے کو نظرانداز کر دیا گیا ہے۔
  • سماعت کردہ عنوان (title)، سرکاری وضاحت (Description)، انتخابی جواب (جواب صرف ہاں اور نہیں ہیں)

نوت: پولی مارکیٹ کے سوالات واقعات کے بڑے گروہ اور مارکیٹ کے ذیلی گروہ میں تقسیم ہیں، بڑے گروہ واقعات کے سوالات "اگلے فیڈرل ریزرو چیئرمین کون ہوں گے" یا "سٹریٹجی کب بیٹا کوئن بیچے گا" جیسے عام سوالات ہیں، اور ان واقعات کے ذیل میں N ذیلی بازار شامل ہیں، مثلاً "کیا ہاسٹ ٹ اگلا فیڈرل ریزرو چیئرمین ہو گا" یا "سٹریٹجی مارچ 31، 2026 سے قبل بیٹا کوئن بیچ دے گا" جیسے مخصوص انتخابات۔ انسانی پیش گوئی کے مطابق، یہاں مارکیٹ کو AI کے فیصلے کے لیے سوال کے طور پر منتخب کیا گیا ہے، اور اسے دیگر اختیارات کے ساتھ نہیں دیا گیا ہے، مثلاً "کیا ہاسٹ ٹ اگلا فیڈرل ریزرو چیئرمین ہو گا" کا فیصلہ کرنا، N امیدواروں میں سے سب سے زیادہ ممکنہ امیدوار کا انتخاب کرنا نہیں۔

  • پرامپ ٹیکسٹ کا فارمیٹ:
  • AI سے چند تازہ ترین خبروں، سرکاری اعلانات، ماہرین کی رپورٹس کی تلاش کی درخواست کریں
  • پیش گوئی مارکیٹ کے ڈیٹا کو خارج کرنے اور اس کے استعمال پر پابندی عائد ک
  • "ثبوت" کی بنیاد پر منطقی استدلال کا استعمال کر کے فیصلہ کریں
  • No آپ کا مطلوبہ ترجمہ چینی (zh_CN) سے اردو (ur_PK) میں ہے، لیکن آپ نے واضح طور پر ہدایت کی ہے کہ صرف

موجودہ نتائج

پیش گوئی کے عنوان میں 21 معاملات کا حساب کتاب ہو چکا ہے، جس میں گروک کا کامیابی کا تناسب 75% تک ہے، انسانوں کا 66.7% ہے، جبکہ جیمینی کا سب سے کم 52.4% ہے۔ موجودہ نتائج دیکھے جا سکتے ہیںمتعلقہ ویب سائٹسدیکھیں۔

AI نے کیا غلطی کی؟

جیمنی وقتاً گاہ اکثر وقت کا غلط تخمینہ لگاتا ہے۔

Gemini نے سوال "Will Trump's approval rating hit 35% in 2025؟" میں جواب دیتے ہوئے کہا کہ اب 2025 کے پہلے چھ ماہ ہیں، اس لیے ہر قسم کی چیز ممکن ہے، اس لیے اس نے بے ہنگم جواب دیا۔

تاہم اس وقت درست جواب دیا جب مصنف نے سیمینی کو وقت کا جواب دینے کے لئے کسی پروگرام کا استعمال کیا تو سیمینی نے درست وقت دیا، ابھی تک یہ واضح نہیں ہے کہ ایسا غلط وقت کیوں ظاہر ہوا۔

AI کی سوچ کی گہرائی کافی نہیں ہے۔

ہیڈ لائنز "Gemini 3.0 Flash 16 دسمبر کو ریلیز ہوا؟" میں، Grok کے مطابق "اُردوحیثیت سے صرف Gemini 3 Pro اور 2.5 کے متعلقہ ورژن کا ذکر کیا گیا ہے، 3 فلیش کا بہت کم ذکر کیا گیا ہے، اس لیے سبکدوشی کے لیے شواہد کافی نہیں ہیں"، اس نے صرف موجودہ معلومات کو دیکھا۔

جیمز نے نوٹ کیا کہ "جیمس 1.0 کو دسمبر 2023 میں جاری کیا گیا تھا، جبکہ جیمس 2.0 فلیش کا تجرباتی ورژن دسمبر 2024 میں متعارف کرایا گیا۔ اسی طرح 2025 کے آخر میں 3.0 ورژن کا ایک منطقی امکان ہے"۔ اور اس نے مزید دریافت کیا کہ "تازہ ترین (14 دسمبر 2025) ایک "جیمس 3.0 فلیش" کا لوکل ڈیمو آن لائن کمیونٹیز میں گردش کر رہا ہے، جو اس کے قریبی رسمی اعلان کی ممکنہ اطلاعات کو مزید تقویت دیتا ہے۔"

اگرچہ نتیجہ میں جیمنی کا جواب غلط ہے لیکن اس مسئلہ میں دونوں کے درمیان استعمال ہونے والی معلومات کی گہرائی میں واضح فرق دیکھا جا سکتا ہے۔

AI استدلال عامیانہ استدلال کی بجائے شہادت + منطق کی بنیاد پر استدلال کر رہا ہے

Gemini نے سوال "ٹرمپ کی منظوری کی سطح یہ ہفتہ کم یا زیادہ ہو گی؟" کے حوالے سے کہا کہ "ایک سال سے زیادہ بعد کے ایک عام ہفتے کے دوران رائے عامہ کی منظوری کی سطح کے بارے میں پیش گوئی کرنا بہت زیادہ غیر یقینی ہے"۔ اس سے پہلے "وقت کی غلطی" کی صورت پھر سے سامنے آئی۔ Gemini نے کہا کہ "ہر عام ہفتے میں، منظوری کی سطح میں کمی کا سبب بننے والے واقعات کی احتمال، منظوری کی سطح کو بہتر بنانے والے مثبت واقعات کی احتمال سے کچھ زیادہ ہو سکتی ہے"۔ اس لیے منظوری کی سطح میں کمی کا امکان زیادہ ہے۔ اس نتیجے کو تخلیق کیا گیا ہے، جو صرف ذہنی تجربے کی بنیاد پر ہے۔

اس سوال کے تناظر میں، گروک کی جانب سے "حکومتی بندش، معیشت کے متعلق تشویش، تارکین وطن کی پالیسی کے متنازعہ اور راب رینر کے انتقال کے بعد اظہار خیال کے نتیجے میں منفی رد عمل" کی خبروں اور رائے عامہ کے اعداد و شمار کی بنیاد پر، یہ ڈیزائن کے مطابق توقعات کے مطابق ہے۔

غلط سیٹلمنٹ کی حیثیت کا تعین کیا گی

Gemini اور Grok دونوں کو معلوم ہے کہ "حکومت جمعرات (19 دسمبر) کو 'لاکھوں صفحات' کے دستاویزات کا اعلان کرے گی"۔ جبکہ سوال "کیا ٹرمپ 20 دسمبر تک ایپ斯坦 کے فائلز جاری کرے گا؟" میں معاوضہ کی شرائط میں واضح طور پر کہا گیا ہے کہ "اگر حکومت نے ایپ斯坦 کی غیر قانونی سرگرمیوں سے متعلق کوئی بھی دستاویزات کھل کر جاری کی ہوں جو مقررہ تاریخ سے قبل ظاہر نہ ہوئی ہوں تو اسے ہاں کہا جائے گا۔"

تاہم اس حکم کے تحت، جیمنی نے کہا کہ "12 دسمبر کے قبل تمام دستاویزات کو جاری کرنا ممکن نہیں ہے"، جو واضح طور پر سیٹلمنٹ کی ضرورت کے حالات کا غلط تخمینہ لگانے کی وجہ سے غلط جواب دیا۔

چھوٹا سا خلاص

اکس کرکے، گرو کی پیش گوئی کا کامیابی کا تناسب اس سے بھی آگے ہے جو پیش گوئی مارکیٹ میں لاکھوں یا کروڑوں ڈالر کما رہا ہے، لیکن اس کی پیش گوئی کے منطق کو گہرائی سے دیکھنے کے بعد، اب بھی کافی کچھ ہدایت کرنے یا اس کی اصلاح کرنے کی ضرورت ہے۔

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔