OpenRouter lance l'API Fusion pour offrir une IA de niveau Fable à moitié prix

Titre : La nouvelle fonction « Fusion » d’OpenRouter combine des modèles abordables pour imiter Claude Fable 5 — juste au moment où Fable devient inaccessible pour de nombreux utilisateurs OpenRouter a dévoilé cette semaine Fusion, une API qui mise sur la possibilité de rivaliser avec un modèle de haut niveau en combinant plusieurs modèles moins coûteux et en fusionnant leurs sorties — à une fraction du coût. Le lancement est intervenu à un moment étrangement parfait : Fable 5 et Mythos 5 d’Anthropic ont été suspendus pour les ressortissants étrangers suite à une directive américaine de contrôle des exportations, créant un vide sur le marché que OpenRouter a rapidement ciblé en affirmant proposer « une intelligence au niveau de Fable, à moitié prix ». Comment fonctionne Fusion : - Une seule invite est diffusée en parallèle à un panel de modèles. Chaque modèle peut utiliser la recherche web et des outils bash. - Un modèle juge analyse les réponses du panel pour extraire les points de consensus, les contradictions et les lacunes. - Un synthétiseur (par défaut Claude Opus 4.8) rédige ensuite la réponse finale, fondée sur l’analyse du juge. - Tout cela s’exécute côté serveur via OpenRouter. Les utilisateurs peuvent appeler le panel par défaut en définissant leur chaîne de modèle sur openrouter/fusion, ajouter un outil fusion pour permettre à leur propre modèle d’appeler Fusion sélectivement, ou créer des panels personnalisés dans une salle de chat Fusion sans code. Benchmarks et compromis prix/performance : OpenRouter a testé Fusion sur DRACO, le benchmark de Perplexity basé sur des tâches de recherche approfondie réelles. Points forts : - Un panel composé de Fable 5 + OpenAI GPT-5.5, synthétisé par Opus, a obtenu 69 %. - Fable seul a obtenu 65,3 % (sept tâches étaient bloquées par les filtres de Fable). - Le panel « abordable » mis en avant par OpenRouter — Google Gemini 3 Flash plus les modèles chinois à poids ouvert Kimi K2.6 et DeepSeek V4 Pro, fusionnés et synthétisés par Opus — a atteint 64,7 %. Cela dépasse GPT-5.5 seul (60 %) et Opus 4.8 seul (58,8 %), et se situe à un point de pourcentage près de Fable, à environ la moitié du coût. - Associer Opus 4.8 à une instance distincte d’Opus a obtenu 65,5 %, soit une amélioration de 6,7 points par rapport à Opus seul. OpenRouter attribue environ 75 % de cette amélioration à l’étape de synthèse elle-même et le reste à la diversité des modèles. Contrôle qualité et limites : - Un problème identifié : lorsque les modèles avaient un accès web en direct, ils pouvaient faire apparaître le barème d’évaluation de DRACO dans les résultats de recherche, contaminant ainsi le benchmark. OpenRouter a corrigé cela avec une configuration d’une seule ligne pour exclure les domaines hébergeant le benchmark ; les résultats publiés reflètent les exécutions nettoyées. - OpenRouter reconnaît honnêtement que Fusion n’est pas un remplacement direct de Fable. DRACO ne mesure pas les tâches à long terme où Fable conserve selon toute apparence un avantage. Pour la programmation, Fusion est positionnée comme un outil qu’un agent de codage appelle sélectivement, et non comme un remplacement total d’un modèle de codage — une limite également observée par d’autres testant des backends compatibles Claude moins coûteux (ex. : DeepClaude). - Fusion s’exécute entièrement sur des modèles routés via l’infrastructure d’OpenRouter, donc il ne contourne pas le problème des contrôles d’exportation à sa source. Réaction de la communauté et implications pour les développeurs crypto : Les réactions au lancement ont été globalement positives (environ 2:1 selon le suivi d’OpenRouter). Le chercheur en IA Andrew Trask a qualifié Fusion de « bien plus important qu’il n’y paraît », affirmant que les laboratoires de pointe ne posséderont plus automatiquement la pointe. Les sceptiques ont souligné des résultats inférieurs en programmation ou en appel d’outils dans certains cas et ont averti que la suspension de Fable 5 rend plus difficile les comparaisons publiques équitables. Pour les projets crypto et les équipes de développement mondiales, Fusion présente un intérêt pour plusieurs raisons : - Coût : si vous avez besoin d’un raisonnement proche du niveau supérieur tout en souhaitant réduire vos dépenses, la composition de modèles peut vous rapprocher du résultat à un coût nettement inférieur. - Disponibilité : les équipes exclues de Fable 5 disposent désormais de plusieurs solutions de secours — panels Fusion, changements de backend comme DeepClaude ou modèles à poids ouvert (GLM-5.2 et autres). - Risque de centralisation : Fusion repose toujours sur le routage et l’infrastructure d’OpenRouter, donc ce n’est pas une réponse complète à la décentralisation face aux contrôles d’exportation ou aux monopoles de modèles. Conclusion : Fusion est une démonstration opportune du fait que « plusieurs modèles moyens mais abordables + un bon juge + un bon synthétiseur » peuvent approcher les performances d’un modèle unique coûteux — et à un prix inférieur. Elle ne remplacera pas instantanément Fable pour toutes les tâches exigeantes, mais pour les équipes qui privilégient aujourd’hui le coût et la résilience au raisonnement absolu de pointe, Fusion constitue une nouvelle option convaincante.