Ang ByteDance, Alibaba, at Tencent ay lalong papaunlad ang model aggregation sa cloud services

Kasalukuyang ipinakilala ng ByteDance Volcano Engine Ark Coding Plan ang GLM-5.1, na sinasabing "naka-align sa orihinal na buong kakayahan, walang limitasyon sa pagbili." Bago ang pag-update, ang Coding Plan ng Volcano ay may matagal nang mga lumang model tulad ng GLM-4.7 lamang. Ang pag-update na ito ay hindi lamang nagdadala ng GLM-5.1 kundi nagtatampok din ng iba pang pinakabagong lokal na malalaking model tulad ng Minimax M2.7, Kimi k2.6, at DeepSeek-V3.2.

Kimi

Ibig sabihin nito, kailangan lang ng mga developer ng iisang subscription fee upang mag-call ng maraming pangunahing model. Ayon sa mga reaksyon ng merkado, napakalaking pagbaba sa gastos sa pagsubok ng ganitong “packaged model.” Kasalukuyan, ang presyo ng Lite plan ay ₱40 bawat buwan, habang ang Pro plan ay ₱200 bawat buwan, na nagpapahintulot sa maraming developer na “bumili muna para magkaroon ng puwang.”

Ang GLM-5.1 ng Zhipu ay nagpakita na ng nakakaimpresong teknikal na kakayahan sa isang update noong unang bahagi ng Abril 2026. Sa dalawang opisyal na video na inilabas ng Zhipu, ang “8 oras mula sa zero upang buuin ang Linux desktop” at “655 iterations, pinataas ang query throughput ng vector database sa 6.9 beses ang orihinal na bersyon,” ay muli nang nagbago ng pang-unawa ng publiko tungkol sa “8 oras na epektibong pagpapatupad” ng malalaking modelo.

Isinagawa ng reporter ang pagpupunta sa komunidad ng developer, kung saan ang karamihan sa mga user ay nagpahayag na “hindi matibay”

Nakapasok ang isang reporter sa isang grupo ng pagkakasama ng mga developer ng Ark Coding at natuklasan na maliban sa mga post na nagbabahagi ng mga karanasan, maraming gumagamit ang nagbabalita ng pagkakaiba sa kanilang tunay na karanasan. Pagkatapos mag-scan ng ilang pahina ng komunidad, makikita mo na maraming mga post na naglalayong maghingi ng refund at mag-complain; maraming netizens ang direktang sinasabing “nagmaliw ako.”

Kimi

Mayroong dalawang pangunahing kontrobersya:

Isang isyu tungkol sa mabilis na paggamit ng limitasyon. Isang user na si “Hakimi” ay nag-post na “Isang task, ilang round ng pag-uusap, at malapit nang mawala ang 5-oras na limitasyon,” habang isang iba pang netizen ay nag-post ng dahilan kung bakit nabawasan ang kanyang 5-oras na limitasyon—dahil sa patuloy na pag-scroll ng window sa loob ng 5 oras, ang aktwal na bilang ng mga hiling ay lumampas na sa 6,004, na lumampas sa limitasyon ng sistema.

Kimi

Ikalawa ay pagbaba ng karanasan dahil sa presyur sa pag-schedule ng hashing power. Maraming gumagamit ang nagsalaysay ng pagkakaroon ng error 429 (masyadong maraming hiling), at ang “unang pagkakatigil ng higit sa isang minuto” ay karaniwan sa oras ng punc. Sabi ng isang gumagamit: “Masyadong madalas ang pag-trigger ng 5-hour limit, kaya hindi ito maaaring gamitin para sa seryosong pag-unlad.”

Samantala, sa likod ng mababang presyo ng ₱40 kada buwan ng Coding Plan, mayroong mga lihim na detalye tungkol sa “isang paghingi ng pagtawag” na may iba’t ibang koepisyenteng pagbawas. Halimbawa, isang user ay nag-post ng larawan sa isang grupo ng mga developer na nagpapakita ng “iba’t ibang koepisyenteng pagbawas para sa iba’t ibang modelo.” Halimbawa, ang lahat ng mga modelo ng DouBao at Qwen ay may koepisyenteng 1, ang DeepSeek series ay may koepisyenteng 2, habang ang MiniMax-M2.7, Kimi-K2.6, at GLM-5.1 series ay may koepisyenteng 5.

Kimi

Ito ay nagpapakita na ang pagbuo ng “model supermarket” ay hindi ganoon kalaki ang kahihinatnan—nagmumula ang mga developer dahil sa kanilang pagkakataon sa halaga, ngunit ang mga kakulangan sa unang yugto, tulad ng pagpaplano ng computing power, ay nagdulot ng pagdududa sa maraming developer pagkatapos subukan. Ito ay nagpapakita rin ng mga hamon sa unang yugto ng “packaging model.” Kasabay ng pagdami ng mga user, kinakaharap ng mga platform ng computing power ang mga hamon sa kanilang kakayahan. Ang paghahanap ng mapanatiling balanse sa pagitan ng pagkakataon sa mababang presyo at kalidad ng serbisyo ay magiging pangmatagalang hamon para sa Volcano Engine at mga susunod na kalahok.

Ang mga cloud provider ay naglalakbay nang magkakasama patungo sa “model supermarket,” at unang nagkakaroon ng pagkakabawas sa paghahati-hati

Ang pag-update na “integrated” na ito ng Volcano Engine Coding Plan ay hindi isang hiwalay na pangyayari.

Mula noong unang bahagi ng 2026, ang mga pangunahing cloud provider tulad ng Alibaba Cloud, Baidu Intelligent Cloud, at Tencent Cloud ay nagpapatuloy sa pagpapalawak ng kanilang pagkakaisa ng maraming modelo. Halimbawa, bilang unang naglalayon sa industriya, ang Alibaba Cloud ay naglunsad ng maagang multi-model subscription plan na tinatawag na “Bailian Coding Plan.” Kasalukuyang suportado ang series ng Qwen at ang mga modelo tulad ng kimi-k2.5, glm-5, at MiniMax-M2.5. Ang presyo ng Pro ay ₱200 bawat buwan, habang ang Lite plan ay hindi na available para sa bagong pagbili mula noong Marso 20, at hindi na suportado ang pagpapalawak o pag-upgrade mula noong Abril 13.

Kimi

Ang Tencent Cloud na pag-subscribe sa malaking modelo para sa Coding Plan ay buong pagsisimula noong Marso 2026, na sumusuporta sa maraming pinakabagong modelo tulad ng Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, at MiniMax-M2.5. Ang Baidu Qianfan ay opisyal na ipinakilala ang AI Coding Subscription Service na Coding Plan noong Pebrero 2026, isa sa mga unang cloud provider sa bansa na naglalabas ng ganitong uri ng serbisyo.

Ang modelo ng “Model Supermarket” ay hindi lamang isang pagpipilian ng isang kumpanya, kundi patuloy na naging isang larangan kung saan nagkakaroon ng kompetisyon ang mga cloud provider. Ngunit kapag tinanggal ang panlabas na estratehiya ng pagpupulong ng mga cloud provider, sino ang makakapagbigay ng mas matatag na serbisyo, mas transparenteng patakaran sa quota, at mas flexible na disaster recovery mechanism? Sino ang makakapagpalawig ng mas maraming enterprise-grade capability sa labas ng pag-program? Kaya ang rate ng pagpapatuloy ay naging bagong sentro ng kompetisyon.

Sa internasyonal, ang mga model aggregation service platform tulad ng Amazon Bedrock at Microsoft Azure ay iba sa mga skena ng subscription model sa lokal, ngunit pareho ay bahagi ng trend ng integrasyon.

Kimi

Sa kabuuan, ang kompetisyon sa industriya ay naglipat mula sa “paghahambing ng kakayahan ng iisang modelo” patungo sa “paghahambing ng kakayahan sa integrasyon ng platform at serbisyo sa ekosistema,” at mabilis na tataas ang antas ng konsentrasyon sa industriya.

Ipinakilala ni Wang Kai, pangunahing analista sa pag-aayos ng ari-arian ng Guoxin Securities, na habang lumalalim ang pagkakahati-hati sa industriya, ang pagtataya na nasa panahon na ng pagkakaisa ay maaaring masyadong maaga. “Mas tumpak na sabihin, ito ay pagpapalalim at pagpapabago ng paghahati-hati sa supply chain. Ang mga modelong vendor ay nakatuon sa algorithm, habang ang mga cloud vendor ay nakatuon sa pagpapadala ng engineering, at nagpapakita ng kanilang pangunahing kahusayan.” Naniniwala siya na anuman ang gawin ng iba pang cloud vendors, ang kompetisyon ay magiging mula sa pag-iisa patungo sa pagkakahati-hati sa ecological niche.

Lalong lumalala ba ang presyur sa “pipeline” ng mga kumpanya ng malalaking modelo?

Ang pagiging "pipelined" ay hindi nangangahulugan na nawawala ang mga kumpanya ng model, kundi ang pagkawala ng premium sa produkto, karapatan sa koneksyon sa user, at pagkakaroon ng boses, kung saan ang kita ay umuusbong patungo sa mga platform ng computing power, nagiging isang "pinagmamalaki" na papel.

Sa ilalim ng pagkakaisa ng mga cloud provider, ang “piping” ay nagsisilbing Sword of Damocles sa itaas ng mga independiyenteng kompanya ng malalaking modelo. Sa tahimik na labanan na ito, ang SenseTime AI, Moonshot AI (Kimi), MiniMax at iba pang mga lider ay hindi pumili ng pasibong pagtanggap, kundi mula sa kanilang sariling ugat, nagbuo ng iba’t ibang paraan para makalabas.

Sa pampublikong talakayan noong Abril 8, ipinahiwatig ni Zhang Peng, CEO ng Zhipu AI, na ang panghuling layunin ng Zhipu ay hindi lamang maging isang “mga tool na maaaring palitan nang libre,” kundi ang pagbuo ng mga autonomous agent. Ang pagkakakilanlang ito ay naglalayong i-upgrade ang Zhipu mula sa “tagapagbigay ng modelo” bilang “tagapagpapatupad ng gawain,” upang maiwasan ang mababang presyo ng mga API pipeline.

Ang Moonshot (Kimi) ay gumagamit ng estratehiyang “mga distributed deployment + pagpapalalim sa mahabang teksto.” Sinasama nito ang mga pangunahing cloud platform tulad ng Volcano Engine at Alibaba Cloud upang matiyak ang maraming pinagkukunan ng computing power, hindi nakabatay sa iisang channel, at mapanatili ang katatagan at kontroladong gastos ng serbisyo. Ang Kimi K2.6, na ipinakilala noong Abril 2026, ay gumagamit ng hybrid experts (MoE) na arkitektura, na may standard na context window na 256K tokens.

Ang MiniMax ay naglalagay ng mga pangunahing yaman sa paggawa ng nilalaman, intelligent customer service, edukasyon, enterprise services, at entertainment at social media, lalo na sa mga aplikasyon tulad ng game AI, digital humans, at multimodal interaction, upang lumikha ng "kustomisadong kakayahan na hindi makakalitong maihahambing sa cloud platform."

Kimi

Magdudulot ba ng pagpapabilis sa pagiging “pipelined” ng mga kompanya ng model ng platform integration ng malalaking kumpanya? Sa pananaw ni Wang Kai, pangunahing analista sa asset allocation ng Guoxin Securities, kailangang ibahin ang pananaw sa maikling at mahabang panahon.

“Sa maikling panahon, ang mga channel ng distribution ay kontrolado ng platform, at ang pagtukoy ng presyo ay bahagyang ipinapasa; ang kita ng mga modelong nagpapatakbo ay umuusbong patungo sa mga entry point—ito ay isang batas ng negosyo. Ngunit sa matagalang panahon, ang mga pangkalahatang modelo ay madaling magiging magkakatulad; ang mga malalim na pag-aaral na modelo para sa mga espesipikong sektor tulad ng finansyal, pangkalusugan, at batas, ay may mga propesyonal na hadlang na hindi maaaring malutas sa pamamagitan ng pagpupulong lamang,” ayon sa kaniya.

Sa pagharap sa panganib ng platformisasyon, maaaring basahin ang mga estratehiya ng OpenAI at Anthropic: isa, pagsusulong ng direkta na channel sa end-user, tulad ng independiyenteng operasyon ng ChatGPT at Claude na nagtatayo ng koneksyon sa user na naglalaktaw sa platform; at dalawa, ang bilis ng teknolohikal na pag-unlad at ang pagkilala sa brand ng user ay dalawang epektibong parapet, kaya kailangan ng mga kumpanya ng modelong magbigay-pansin sa pagpapalago ng R&D at pagpaplano ng produkto.

Ang huling kahihinatnan ng labanan na “paggawa ng pipeline at platform” ay hindi kung sino ang mang-aabot sa kausap, kundi ang mas malinaw na paghahati ng mga tungkulin. Ang mga cloud provider ay gagawa ng pipeline, habang ang mga kompanya ng model ay magpapatakbo ng teknolohiya, at ang parehong panig ay unti-unting makikita ang kanilang sariling hangganan sa paglalaban.

Tungkol sa sino ang kakahin ng sino, sa kasalukuyang yugto, malayo pa sa katapusan ng kuwento.

Nakamula sa WeChat public account na "科创板日报", may-akda: Wang Nai