Ayon sa pagmamasid sa Beating, ang team ng Alibaba Qwen ay nag-anunsyo na ang kanilang pangunahing modelo, ang Qwen3.7-Max, ay may nakapag-aktibo nang awtomatikong implicit caching sa Alibaba Cloud BaiLian platform. Walang kailangang baguhin ang code o magdagdag ng mga parameter—ang mga developer ay maaaring agad mag-enjoy ng pagbaba ng gastos sa caching. Sa bagong sistema ng pagbabayad, awtomatikong kilalanin at i-ekstrak ng sistema ang mga paulit-ulit na prefix ng konteksto sa bawat request. Kapag nagkakaroon ng cache hit, ang bayad para sa mga input token na nasakop ng cache ay tatawagin lamang sa 20% ng orihinal na presyo, na direktang nagtatanggal ng 80% ng gastos sa input. Ang implicit caching ay direktang tumutugon sa malaking gastos sa mga sitwasyon na may mahabang teksto at Agent AI. Ang Qwen3.7-Max na may 1 milyong token na context window ay kailangang madalas at paulit-ulit na basahin ang malalaking codebase o dokumento sa kaalaman habang nagpapatakbo ng mga mataas na gawain tulad ng autonomous coding. Isang developer ay nag-feedback na sa loob ng higit sa isang oras lamang, nakabuo siya ng isang demo ng web na Tank Battle na nag消耗 ng halos 1 milyong tokens. Kung pahihintulutan ang agent na magpatakbo nang awtomatiko sa background para sa code review at iterative loops, maaaring umabot sa milyon-milyon na tokens sa isang araw. Ang pagkakaroon ng kompetisyon sa presyo ng caching ay isa pang direkta at pangunahing dahilan kung bakit tinurunko ni Alibaba ang presyo. Bago, ang DeepSeek V4-Pro ay nakakuha ng malaking bilang ng mga developer dahil sa napakababang presyo nito para sa cache hits. Pagkatapos ipahayag ang permanenteng pagbaba ng presyo noong huling bahagi ng Mayo, ang bayad para sa cache hit ng DeepSeek V4-Pro ay bawasan hanggang $0.003625 bawat milyong tokens (halos PHP 0.025), na katumbas ng pagbawas ng 99.17% sa orihinal na presyo ng input. Maraming developer, kasama ang mga espesyalisadong tool tulad ng Reasonix, ay nakapagpataas ng rate ng cache hit hanggang sa 99%—ang pinakamataas na posibilidad—na nagresulta sa halos sero ang bill para sa mga mahabang session na agent. Sa harap ng presyur mula sa kompetisyon, hindi lamang ipinakilala ng Qwen3.7-Max ang implicit caching na walang kailangang konfigurasyon, kundi nanatili rin ito sa explicit caching mode na nangangailangan ng manual pagtukoy sa cache_control flag. Kumpara sa automatic caching, mas mataas ang tiyak na rate ng cache hit sa explicit caching, at ang bayad para dito ay maaabot lamang sa 10% (isang porsyento) ng orihinal na presyo ng input. Gayunpaman, kung ikukwenta mo ang unang paglikha ng cache, kailangan mong magbayad ng 125% premium, at mayroon lamang itong 5-minutong lifespan (muling i-reset ang timer bawat cache hit).
Ipinakilala ni Aliyun ang Implicit Caching para sa Qwen3.7-Max, binabawasan ang mga gastos sa input hanggang 80%
MarsBitI-share






Ipinakilala ng Aliyun ang implicit caching para sa Qwen3.7-Max, na nagpapababa ng mga gastos sa input hanggang 80%. Nasa live na ang update sa BaiLian, walang kailangang pagbabago sa code. Ang cache hits ay nagkakahalaga ng 20% ng input tokens, perpektong solusyon para sa mga long-text at agent workflows. Maaaring makatanggap ng pagtaas sa efficiency ang mga bago pang listing ng token. Sumusuporta rin ang model sa explicit caching sa 10%, ngunit kailangan ng manual na pag-setup. Madalas na binibigyang-diin ng balita tungkol sa presyo ng crypto ang mga inobasyon na nakatuon sa pagbabawas ng gastos.
Source:Ipakita ang original
Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito.
Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.