Selon les nouvelles de ME News, le 22 avril (UTC+8), selon le suivi de Beating, Claude Developer Console a lancé un tableau de bord de mise en cache de invites, accessible à l'adresse platform.claude.com/usage/cache. Le tableau de bord permet de filtrer par espace de travail, modèle et période, et présente principalement trois indicateurs : le taux de lecture du cache (cache read ratio), soit la proportion des requêtes qui atteignent un cache existant ; la répartition de l'utilisation du cache, qui décompose les jetons d'entrée en quatre catégories — non mis en cache, écriture dans le cache de 5 minutes, écriture dans le cache d'une heure et lecture du cache — présentées sous forme de diagrammes à barres empilées ; et le multiplicateur d'amortissement d'écriture (write amortization), qui mesure combien de fois une écriture de cache est réutilisée par des lectures ultérieures. Dans l'exemple de capture d'écran, Claude Opus 4.6 a traité 27,4 milliards de jetons d'entrée sur 7 jours, avec un taux de lecture de 85,4 % et un multiplicateur d'amortissement de 8,65. En bas, un graphique temporel du taux de lecture du cache est disponible avec une granularité allant d'une heure à 24 heures. Le mécanisme de mise en cache des invites d'Anthropic permet aux utilisateurs de l'API de marquer comme mis en cache des contenus fixes tels que les invites système et les contextes longs ; une frais supplémentaire est facturé lors de la première écriture, tandis que les lectures ultérieures sont facturées à environ un dixième du tarif standard d'entrée. Le cache est conservé par défaut pendant 5 minutes, mais peut être prolongé jusqu'à une heure moyennant un paiement. Auparavant, les utilisateurs ne pouvaient évaluer l'efficacité du cache que de manière indirecte via les champs de comptage de jetons renvoyés par l'API, sans outil visuel. (Source : BlockBeats)
Anthropic lance un tableau de bord de mise en cache des invites avec des métriques visuelles
KuCoinFlashPartager






Anthropic a annoncé un tableau de bord de mise en cache des invites pour la console développeur Claude, offrant un suivi visuel des taux de réussite de la mise en cache et de l'efficacité coûts. L'outil, disponible à platform.claude.com/usage/cache, permet aux développeurs de filtrer les données par espace de travail, modèle et période temporelle. Par exemple, Claude Opus 4.6 a affiché un taux de lecture de mise en cache de 85,4 % sur sept jours. Les métriques incluent le ratio de lecture de la mise en cache, la composition de l'utilisation et l'amortissement des écritures. Le tableau de bord affiche également les tendances des taux de lecture, de l'heure à la journée. La mise en cache des invites permet aux développeurs d'enregistrer du contenu fixe, avec des coûts initiaux d'écriture et des frais de lecture réduits de 10 %. La durée de la mise en cache peut être prolongée jusqu'à une heure moyennant un frais. Cette mise à jour fournit des informations plus claires sur les actualités en chaîne pour les développeurs. Les nouvelles concernant les taux d'intérêt restent un facteur clé pour les entreprises de cryptomonnaies gérant les coûts d'API.
Source:Afficher l'original
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.