Inilabas ng DeepSeek ang Bagong Modelo 'MODEL1' Isang Taon Matapos Ipaunlad ang DeepSeek-R1

iconKuCoinFlash
I-share
AI summary iconSummary

Ayon sa BlockBeats, noong ika-21 ng Enero, ayon sa Quantum Bit, noong ika-1 taon ng paglulunsad ng DeepSeek-R1, inilabas nila ang bagong modelo na "MODEL1". Ang DeepSeek ay in-update ang FlashMLA code sa GitHub, may 28 na pagkakataon na nabanggit ang MODEL1 sa 114 na mga file, at lumitaw ito bilang isang modelo na naiiba sa V32. Kilala na ang V32 bilang DeepSeek-V3.2, at ang MODEL1 ay maaaring isang bagong arkitektura. Ang mga konkreto pang pagkakaiba sa code ay nasa KV cache layout, pagtrato sa kahalimbawa at FP8 decoding, at mayroong maraming pagkakaiba sa memory optimization.

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.