アンドレジ・カルパティは、AIとのインタラクションが「インタラクティブなニューラルビデオ」に進化すると予測する

icon MarsBit
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
OpenAIの共同設立者であるアンドレジ・カルパティは、AIと人間の相互作用の未来についてのビジョンを共有し、「インタラクティブなニューラル動画」が主要な出力フォーマットになると予測した。彼は、視覚メディアがテキストよりも人間の脳の処理に適していると主張している。彼の発言はAIと暗号通貨のニュースで取り上げられ、MarkdownからHTML、さらにその先への移行を示している。AIとブロックチェーンが交差し続ける中、暗号通貨ニュースメディアは彼の洞察を注目している。

動察 Beating の監視によると、「vibe coding」の概念を提唱し、OpenAIの創設メンバーであるAndrej Karpathyが、今日「HTMLでMarkdownを置き換える」というClaude Codeチームの提唱を強く支持する投稿をした。彼はこの変更を強く賛成するとともに、AIインタラクティブインターフェースの進化ロードマップを描き、大規模モデルが複数の形態の反復を経た後、最終的な出力形態は「インタラクティブなニューラルビデオ」になると予測した。Karpathyは、AI出力形式の進化が、最初は読みづらい純テキストから、現在のMarkdownへ、そして今や新たな標準となりつつあり、非常に高いレイアウト柔軟性を持つHTMLへと進化してきたと指摘した。今後、さらに複数世代の中間形態(4、5、6など)を経て、最終段階(n)に到達するとされる——それは拡散モデルによって直接生成されるインタラクティブなニューラルビデオである。この形態の具体的な姿については、彼は直ちに、以前のOpenAI研究者が最近公開したノーコードピクセルレベルレンダリングプロトタイプ「Flipbook」を挙げた。 この進化トレンドの根底にある論理は、人間の脳の物理的帯域幅である。Karpathyは、人間の脳の約3分の1が並列処理用の視覚信号処理に特化していると指摘し、これは人間の脳に情報を入力するための「10車線の高速道路」であると述べた。これは、人機融合型インタラクションの最適解を決定づける:人間がAIに指令を伝える(Input)最良の方法は効率的な音声であり、AIが人間に結果をフィードバックする(Output)最良の方法は高帯域の視覚的画像(画像、アニメーションまたはビデオ)である。 さらに彼は、現在の入力端に依然として明確な課題が存在すると指摘し、音声またはテキストだけでは不十分であり、「二人でパソコンを並べて座り、画面の特定の領域を指差して示す」ような空間的指示能力を補完することが急務であると述べた。現段階で体験を向上させるための近道として、彼はユーザーにプロンプトの末尾に「返信をHTML形式で構造化してください」と追加することを強く推奨した。

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。