اندرو کارپاتی نے پیشگوئی کی ہے کہ AI انٹرایکشن "انٹرایکٹو نیورل ویڈیو" میں ترقی کرے گا

icon MarsBit
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
اوپن اے آئی کے ملکہ، اینڈری کارپاتھی نے اے آئی اور انسانی تعامل کے مستقبل کا خواب دیکھا ہے، جس میں وہ یہ پیش گوئی کرتے ہیں کہ "انٹرایکٹو نیورل ویڈیو" مرکزی آؤٹ پٹ فارمیٹ بن جائے گا۔ وہ کہتے ہیں کہ ویژوئل میڈیا متن کے مقابلے میں انسانی دماغ کے معالجہ کے ساتھ بہتر ہے۔ ان کے تبصرے، جو اے آئی + کرپٹو خبروں میں شامل ہیں، مارک ڈاؤن سے ایچ ٹی ایم ایل اور اس سے آگے کی طرف منتقلی کو ظاہر کرتے ہیں۔ کرپٹو خبروں کے ذرائع اے آئی اور بلاک چین کے مسلسل تقاطع کے ساتھ ان کے تصورات پر نظر رکھ رہے ہیں۔

动察 Beating کی نگرانی کے مطابق، "vibe coding" کے تصور کے موجد اور OpenAI کے بنیادی رکن اینڈریج کارپاتھی نے آج ایک مضمون میں Claude Code ٹیم کے "HTML کو Markdown کی جگہ استعمال کرنا" کے تجویز کو سختی سے سپورٹ کیا۔ وہ صرف اس تبدیلی کی تائید نہیں کرتے، بلکہ AI انٹرفیس کے ترقیاتی نقشہ بھی بناتے ہیں اور پیش گوئی کرتے ہیں کہ بڑے ماڈلز متعدد شکلوں کی ترقی کے بعد، آخری شکل "انٹرایکٹو نیورل ویڈیو" ہوگی۔ کارپاتھی کا خیال ہے کہ AI آؤٹ پٹ کی شکل نے سب سے پہلے پڑھنے میں بہت مشکل سادہ متن سے شروع کرکے، اب کے Markdown تک، اور اب ہر طرح کے ڈیزائن فلیکسیبِلٹی کے ساتھ نئے معیار بن رہے HTML تک ترقی کی ہے۔ مستقبل میں یہ ترقی متعدد درمیانی مراحل (4، 5، 6 وغیرہ) سے گزرتے ہوئے آخری مرحلہ (n) تک پہنچے گا: جہاں ڈفرجن ماڈلز براہ راست انٹرایکٹو نیورل ویڈیو جنریٹ کریں گے۔ اس شکل کا مخصوص جائزہ، وہ خود سابق OpenAI ریسرچر کے حال ہی میں جاری کردہ کوڈ فری پکسل لیول رینڈرنگ پروٹو ٹائپ Flipbook کا ذکر کرتے ہیں۔ اس ترقیاتی رجحان کا بنیادی منطق انسانی دماغ کے فزکل بینڈ وِدتھ پر مبنی ہے۔ کارپاتھی نے واضح کیا کہ انسانی دماغ کا تقریباً ایک تہائی حصہ وژول سگنلز کو معالجہ کرنے کے لئے مخصوص پیرلل پروسسرز پر مشتمل ہے، جو انسانی دماغ میں معلومات داخل کرنے کا "دس لینوں والی ہائے وَے" ہے۔ اس سے یہ نتیجہ نکلتا ہے کہ انسان اور AI کے درمیان مربوط انٹرایکشن کا بہترین حل ہے: انسان AI کو حکم دینے (Input) کا بہترین طریقہ انتہائی مؤثر آواز ہے، جبکہ AI انسان کو جواب دینے (Output) کا بہترین طریقہ بلند بینڈ وِدتھ والی وژول تصاویر (تصاویر، اینمیشن یا ویڈیو) ہے۔ اس علاوہ، وہ بتاتے ہیں کہ موجودہ ان پٹ انجن میں اب بھی واضح خامیاں موجود ہیں، جس میں صرف آواز یا متن استعمال کرنا اب بھي ناکافی ہے، اور اس طرح کا فضائی اشارہ دینے کا قابلِ استعمال نظام ضرورت ہے جس میں دو افراد اکٹھے کمپيوٹر دेख رہے ہوں اور اسکرین پر خاص علاقے کو اشارہ کرتے ہوئے بتائیں۔ موجودہ تجربات میں بہتر بنانے کا راستہ، وہ صارفین کو تجویز کرتے ہیں کہ وہ اپنے پرومپٹس کے آخر میں "جواب HTML میں سٹرکچرڈ بنائیں" شامل کر دें۔

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔