وفقًا لمراقبة Beating، نشر أندريه كارباتي، المؤسس المؤسس لشركة OpenAI وصاحب مفهوم "vibe coding"، منشورًا اليوم يدعم فريق Claude Code في تبنيهم فكرة "استبدال Markdown بـ HTML". فهو لا يوافق بشدة على هذا التغيير فحسب، بل يرسم خريطة طريق لتطور واجهات التفاعل مع الذكاء الاصطناعي، متوقعًا أن الشكل النهائي الذي ستصل إليه النماذج الكبيرة بعد عدة دورات من التطور سيكون "الفيديو العصبي التفاعلي". يرى كارباتي أن تطور تنسيقات مخرجات الذكاء الاصطناعي بدأ من النصوص الصرفة الصعبة القراءة، ثم تطور إلى Markdown الحالي، ثم إلى HTML الذي يتحول تدريجيًا إلى المعيار الجديد بقدرته العالية على تخطيط المحتوى. وسيمر بمرحلتين وسيطيتين إضافيتين (4 و5 و6 وما إلى ذلك) قبل الوصول إلى المرحلة النهائية (n): الفيديو العصبي التفاعلي المُنشأ مباشرةً بواسطة نماذج الانتشار. بالنسبة لمظهر هذه المرحلة، أشار مباشرةً إلى النموذج الأولي لـ Flipbook الذي أصدره مؤخرًا باحث سابق في OpenAI، والذي يُظهر عرضًا بدون كود على مستوى البكسل. يكمن المنطق الأساسي وراء هذا الاتجاه في عرض الدماغ البشري الفيزيائي. يشير كارباتي إلى أن ثلث الدماغ البشري تقريبًا مخصص لمعالجة الإشارات البصرية كمعالج متوازٍ، وهو ما يمثل "طريقًا سريعًا بعشرة ممرات" لإدخال المعلومات إلى الدماغ. وهذا يحدد الحل الأمثل للتفاعل المدمج بين الإنسان والآلة: أفضل طريقة لإرسال الأوامر من الإنسان إلى الذكاء الاصطناعي (Input) هي الصوت عالي الكفاءة في التواصل، وأفضل طريقة لاستقبال المخرجات من الذكاء الاصطناعي إلى الإنسان (Output) هي الصور البصرية ذات العرض العالي (الصور أو الرسوم المتحركة أو الفيديوهات). بالإضافة إلى ذلك، يشير إلى أن جانب الإدخال لا يزال يعاني من نقاط ضعف واضحة، فاستخدام الصوت أو النص وحدهما لا يزال غير كافٍ، ويجب إضافة قدرة الإشارة المكانية، مثل الإشارة إلى منطقة محددة على الشاشة أثناء جلوس شخصين بجانب بعضهما البعض أمام جهاز كمبيوتر. كحل سريع لتحسين التجربة في هذه المرحلة، يوصي بشدة المستخدمين بإضافة "قم بتنظيم الرد على شكل HTML" في نهاية تعليماتك.
أندريه كارباتي يتوقع أن تتطور تفاعلات الذكاء الاصطناعي إلى "فيديو عصبي تفاعلي"
MarsBitمشاركة






شارك أندريه كارباتي، المؤسس المشارك لشركة OpenAI، رؤيته لمستقبل التفاعل بين الإنسان والذكاء الاصطناعي، متوقعًا أن يصبح "الفيديو العصبي التفاعلي" هو التنسيق السائد للإخراج. وهو يجادل بأن الوسائط البصرية تتماشى بشكل أفضل مع معالجة الدماغ البشري مقارنة بالنص. وقد غطت أخبار الذكاء الاصطناعي والعملات المشفرة تعليقاته، التي تُبرز تحولًا من Markdown إلى HTML وما بعده. وتتابع وسائل إعلام العملات المشفرة عن كثب رؤاه مع استمرار تقاطع الذكاء الاصطناعي وسلسلة الكتل.
المصدر:عرض النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات.
يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.