NVIDIA lance Gamma-World, le modèle multi-agent prend en charge la collaboration à 4 joueurs à 24 images par seconde

iconKuCoinFlash
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
NVIDIA a annoncé un projet avec Gamma-World, un modèle multi-agents développé en collaboration avec l'Université de Tsinghua, l'Université de Toronto et le Vector Institute. Le système prend en charge la collaboration à 4 joueurs à 24 FPS, en utilisant un codage de position rotatoire de haute dimension et une attention à hub clairsemée. L'équipe a partagé la page du projet et l'article scientifique, avec le code et les poids à venir. Cette annonce de projet s'aligne sur les récentes nouvelles concernant les actifs réels (RWA) dans les environnements pilotés par l'IA.
ME AI a annoncé que, selon les données de Beating Monitoring, des chercheurs de NVIDIA en collaboration avec l'Université Tsinghua, l'Université de Toronto et l'Institut Vector ont publié un modèle génératif multi-agents appelé Gamma-World, qui brise la limite historique des simulations d'environnements virtuels restreintes aux interactions individuelles ou à deux personnes. L'équipe a actuellement publié la page du projet et l'article scientifique ; le code et les poids seront ouverts prochainement. Le modèle introduit deux mécanismes : une généralisation de haute dimension de l'encodage de position rotatif et des marqueurs d'intermédiaire d'information. Il permet, pour la première fois, de passer directement de la collaboration à deux joueurs à quatre joueurs sans re-entraînement, tout en garantissant que chaque joueur reste indépendamment contrôlable. Le principal défi des modèles multi-joueurs réside dans la capacité à maintenir un contrôle indépendant pour chaque joueur tout en évitant les conflits d'action. L'équipe de recherche a conçu l'encodage rotatif d'agent simplex (Simplex Rotary Agent Encoding), qui étend l'encodage de position rotatif classique (RoPE) à un espace d'angles de haute dimension. Ce nouvel encodage confère à tous les joueurs une symétrie physique entièrement équivalente, éliminant ainsi la dépendance à des numéros de joueur fixes et permettant une référence et un contrôle indépendants plus naturels. Pour éviter une explosion quadratique du coût de calcul avec l'augmentation du nombre de joueurs, la solution introduit le mécanisme d'attention centrale clairsemée (Sparse Hub Attention). Le système transmet les informations d'interaction via des marqueurs centraux apprenables, réduisant ainsi le coût de calcul de l'attention entre joueurs à un niveau linéaire. En termes de vitesse de génération, l'équipe a distillé un modèle profond à diffusion à forte latence en un modèle causal élève, combiné avec un cache clé-valeur (KV Cache), pour produire une réponse d'action en temps réel à 24 images par seconde (24 FPS). Les évaluations dans des environnements de jeux multijoueurs montrent que le nouveau modèle surpasse nettement les réseaux traditionnels basés sur des emplacements ou sur une attention dense en termes de réalisme visuel, de contrôlabilité des actions et de cohérence entre joueurs. (Source : BlockBeats)
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.