Odaily Planet Daily: Недавно команда проекту AI-платформи для навчання у Сінчженьському коледжі Хэцюань у співпраці з Харбінським технологічним університетом (Сінчжень), Шенчженьським інститутом великих даних та командою Huawei, у співпраці з AI-платформою обчислювальних потужностей Shenzhen Smart City, провела спільну роботу над навчанням великих моделей на вітчизняних обчислювальних потужностях. За допомогою вітчизняного AI-кластера Ascend 910C було завершено пост-навчання великої моделі з 1,6 трильйона параметрів DeepSeek-V4-Pro.
Цей експеримент накопичив важливий досвід для глобальних третіх сторін щодо навчання моделей цього рівня на вітчизняних платформах обчислювальних потужностей, а також підтвердив, що вітчизняні AI-чіпи можуть підтримувати навчання світових моделей з надзвичайно великою кількістю параметрів. З точки зору технічного застосування, використання вже існуючих моделей для висновків у бізнес-процесах та повне навчання всіх параметрів моделі з нуля — це різні технічні етапи, які суттєво відрізняються за складністю та вимогами до апаратного забезпечення. Результати цього експерименту показують, що вітчизняні AI-обчислювальні потужності здатні виконувати завдання навчання топових великих моделей, і відповідні технічні шляхи є реалізованими. (Shenzhen Release)
