Andrej Karpathy Meramalkan Interaksi AI Akan Berkembang Menjadi 'Video Neural Interaktif'

icon MarsBit
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Andrej Karpathy, salah seorang penubuh OpenAI, telah berkongsi visinya mengenai masa depan interaksi AI-manusia, meramalkan bahawa "video neural interaktif" akan menjadi format output utama. Beliau berhujah bahawa media visual selari lebih baik dengan pemprosesan otak manusia berbanding teks. Komen beliau, yang dilaporkan dalam berita AI + kripto, menandakan peralihan daripada Markdown ke HTML dan seterusnya. Media berita kripto memantau dengan rapat wawasan beliau kerana AI dan blok rantai terus bersilang.

Berdasarkan pemantauan Beating, Andrej Karpathy, ahli pendiri OpenAI dan pencetus konsep "vibe coding", telah memposting hari ini untuk mendukung pendekatan tim Claude Code yang mencadangkan "menggantikan Markdown dengan HTML". Dia tidak hanya sangat menyetujui perubahan ini, tetapi juga menggambarkan peta jalan evolusi antarmuka interaksi AI, memprediksi bahawa bentuk akhir output model besar setelah beberapa iterasi bentuk akan menjadi "video neural interaktif". Karpathy berpendapat bahawa evolusi format output AI bermula daripada teks mentah yang sangat sukar dibaca, berkembang kepada Markdown sekarang, dan kini bergerak menuju HTML sebagai standard baru dengan fleksibiliti penataan yang sangat tinggi. Di masa depan, ia akan melalui beberapa generasi bentuk perantara (4, 5, 6, dsb.) sebelum mencapai akhir (n): video neural interaktif yang dihasilkan secara langsung oleh model penyebaran. Untuk bentuk spesifiknya, dia secara langsung menyebut prototip Flipbook tanpa kod yang baru dilancarkan oleh mantan penyelidik OpenAI. Logik mendasari tren evolusi ini ialah lebar pita fizikal otak manusia. Karpathy menunjukkan bahawa sekitar sepertiga otak manusia adalah pemproses selari yang khusus untuk memproses isyarat visual—ini adalah "jalan raya sepuluh lajur" untuk memasukkan maklumat ke otak manusia. Ini menentukan solusi optimal untuk interaksi manusia-AI: cara terbaik bagi manusia untuk menghantar arahan (Input) kepada AI ialah suara yang sangat efisien dalam komunikasi, manakala cara terbaik bagi AI untuk memberikan respons (Output) kepada manusia ialah gambar visual berlebar pita tinggi (gambar, animasi, atau video). Selain itu, dia menunjukkan bahawa sisi input masih menghadapi masalah jelas—hanya bergantung pada suara atau teks masih tidak mencukupi, dan sangat diperlukan kemampuan petunjuk ruang seperti "menunjuk ke kawasan tertentu di skrin" semasa dua orang duduk bersebelahan melihat komputer. Sebagai jalan pintas untuk meningkatkan pengalaman pada peringkat ini, dia sangat mencadangkan pengguna untuk secara langsung menambahkan "strukturkan jawapan sebagai HTML" di akhir prompt.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.