Kumpleto ng xAI ni Musk ang pagsasanay sa Grok V9-Medium, nakatuon sa komplikadong programming

icon MarsBit
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Natapos na ng xAI ni Elon Musk ang pagtatrain sa Grok V9-Medium na may 1.5T parameter, na inaasahang ilalabas sa publiko sa loob ng 2 hanggang 3 linggo. Kasalukuyang nasa supervised fine-tuning ang modelo, kasunod ng reinforcement learning. Idinagdag ng koponan ang Cursor code data sa panahon ng pagtatrain at plano nilang palawakin ang dataset. Kumpara sa v8-small na modelo na nag-aalok ng lahat ng traffic ng Grok, mas nagpapabuti ang bagong bersyon sa paggawa ng kumplikadong programming. Tinitiyak ni Musk ang mga kakulangan sa training data ng v8-small. Triple ang bilang ng parameter sa Grok V9-Medium at ito ay dinisenyo para sa Blackwell GPUs. Ipakikita ng on-chain na balita ang pagtaas ng interes sa mga tool na dinudulot ng AI, habang nananatiling pangunahing makroekonomikong salik para sa mga crypto market ang data tungkol sa inflation.

Ayon sa pagmamasid ng Beating, inanunsyo ni Musk na natapos na ang pagtatrain ng base model na Grok V9-Medium na may 1.5T na parameter, at inaasahang ipapalabas sa publiko sa loob ng 2 hanggang 3 linggo. Kasalukuyang nasa fase ng supervised fine-tuning ang model, at magsisimula ang reinforcement learning training sa loob ng ilang araw. Ang team ng pagpapalawig ay nagdagdag ng malaking halaga ng code data mula sa Cursor, at magpapatuloy pa sa pagpapalawig ng mas maraming sample. Kumpara sa kasalukuyang v8-small na model na nagpapagana sa lahat ng production traffic ng Grok, ang Grok V9-Medium na may 1.5T na parameter ay magkakaroon ng malaking pagpapabuti sa pagtratrabaho ng mga kumplikadong programming task. Noon, tinanggap ni Musk na ang v8-small na may 0.5T na parameter (na kilala bilang public test version na Grok 4.2) ay may malubhang kakulangan sa kalidad, kahalagahan, at proporsyon ng training data. Ang natapos na Grok V9-Medium ay hindi lamang napalawak ang laki ng parameter hanggang tatlong beses ang dating, kundi ito ay espesyal na dinisenyo para sa optimisasyon sa Blackwell architecture GPU.

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.