Andrej Karpathy Meramalkan Interaksi AI Akan Berkembang Menjadi 'Video Neural Interaktif'

Berdasarkan pemantauan Beating, Andrej Karpathy, ahli pendiri OpenAI dan pencetus konsep "vibe coding", telah memposting hari ini untuk mendukung pendekatan tim Claude Code yang mencadangkan "menggantikan Markdown dengan HTML". Dia tidak hanya sangat menyetujui perubahan ini, tetapi juga menggambarkan peta jalan evolusi antarmuka interaksi AI, memprediksi bahawa bentuk akhir output model besar setelah beberapa iterasi bentuk akan menjadi "video neural interaktif". Karpathy berpendapat bahawa evolusi format output AI bermula daripada teks mentah yang sangat sukar dibaca, berkembang kepada Markdown sekarang, dan kini bergerak menuju HTML sebagai standard baru dengan fleksibiliti penataan yang sangat tinggi. Di masa depan, ia akan melalui beberapa generasi bentuk perantara (4, 5, 6, dsb.) sebelum mencapai akhir (n): video neural interaktif yang dihasilkan secara langsung oleh model penyebaran. Untuk bentuk spesifiknya, dia secara langsung menyebut prototip Flipbook tanpa kod yang baru dilancarkan oleh mantan penyelidik OpenAI. Logik mendasari tren evolusi ini ialah lebar pita fizikal otak manusia. Karpathy menunjukkan bahawa sekitar sepertiga otak manusia adalah pemproses selari yang khusus untuk memproses isyarat visual—ini adalah "jalan raya sepuluh lajur" untuk memasukkan maklumat ke otak manusia. Ini menentukan solusi optimal untuk interaksi manusia-AI: cara terbaik bagi manusia untuk menghantar arahan (Input) kepada AI ialah suara yang sangat efisien dalam komunikasi, manakala cara terbaik bagi AI untuk memberikan respons (Output) kepada manusia ialah gambar visual berlebar pita tinggi (gambar, animasi, atau video). Selain itu, dia menunjukkan bahawa sisi input masih menghadapi masalah jelas—hanya bergantung pada suara atau teks masih tidak mencukupi, dan sangat diperlukan kemampuan petunjuk ruang seperti "menunjuk ke kawasan tertentu di skrin" semasa dua orang duduk bersebelahan melihat komputer. Sebagai jalan pintas untuk meningkatkan pengalaman pada peringkat ini, dia sangat mencadangkan pengguna untuk secara langsung menambahkan "strukturkan jawapan sebagai HTML" di akhir prompt.