Selon Beating, une plateforme de surveillance, Andrej Karpathy, membre fondateur d'OpenAI et concepteur du terme « vibe coding », a publié un article aujourd'hui pour soutenir fermement la proposition de l'équipe Claude Code visant à remplacer Markdown par HTML. Il ne se contente pas d'approuver vigoureusement ce changement, mais esquisse également une feuille de route pour l'évolution des interfaces d'interaction avec l'IA, prédisant que, après plusieurs itérations de formes, la forme ultime des sorties des grands modèles sera des « vidéos neuronales interactives ». Karpathy estime que l'évolution des formats de sortie de l'IA est passée des textes purs, initialement très difficiles à lire, à Markdown, puis à HTML, qui devient progressivement la nouvelle norme grâce à sa grande flexibilité de mise en page. À l'avenir, cette évolution traversera plusieurs générations intermédiaires (4, 5, 6, etc.) avant d'atteindre la forme finale (n) : des vidéos neuronales interactives générées directement par des modèles de diffusion. Pour illustrer concrètement cette forme finale, il cite directement le prototype de rendu pixelisé sans code récemment publié par un ancien chercheur d'OpenAI, Flipbook. La logique sous-jacente à cette tendance réside dans la bande passante physique du cerveau humain. Karpathy souligne que le cerveau humain consacre environ un tiers de ses ressources à un processeur parallèle dédié au traitement des signaux visuels — une « autoroute à dix voies » pour l'entrée d'informations. Cela détermine la solution optimale pour l'interaction homme-machine : la meilleure manière pour l'humain de transmettre des instructions à l'IA (entrée) est la voix, extrêmement efficace sur le plan de la communication, tandis que la meilleure manière pour l'IA de restituer ses résultats à l'humain (sortie) est une image visuelle à haute bande passante (image, animation ou vidéo). En outre, il note que les interfaces d'entrée actuelles présentent toujours des lacunes majeures : la voix et le texte seuls restent insuffisants, et il est urgent de compléter ces interfaces avec une capacité d'indication spatiale similaire à celle d'une personne pointant une zone spécifique à l'écran lorsqu'elle regarde un ordinateur à côté d'une autre personne. À titre de solution rapide pour améliorer l'expérience actuelle, il recommande fortement aux utilisateurs d'ajouter directement à la fin de leur prompt : « Structurez la réponse en HTML ».
Andrej Karpathy prédit que l'interaction avec l'IA évoluera vers une « vidéo neuronale interactive »
MarsBitPartager






Andrej Karpathy, cofondateur d'OpenAI, a partagé sa vision de l'avenir de l'interaction homme-IA, prédisant que « la vidéo neuronale interactive » deviendra le format de sortie dominant. Il soutient que les médias visuels s'alignent mieux sur le traitement du cerveau humain que le texte. Ses commentaires, couverts par les actualités IA + crypto, soulignent un passage du Markdown à l'HTML et au-delà. Les médias crypto suivent étroitement ses insights alors que l'IA et la blockchain continuent de se croiser.
Source:Afficher l'original
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.