source avatarDavid Arnal

مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy

أحد أكثر تقارير تدريب نماذج LLM المتقدمة تفصيلاً في السنوات الأخيرة. نشرت مايكروسوفت للتو تحليلًا تقنيًا عميقًا لنموذج MAI-Thinking-1، الذي يركز على الاستدلال: • 35B معلمة نشطة / 1T معلمة إجمالية من نوع MoE • نافذة سياق 256k (~600 صفحة مستند) • تم التدريب على مجموعة من 8,000 وحدة GB200 GPU الجزء المثير للاهتمام: كان التركيز أقل على البنية الجديدة وأكثر على جودة البيانات ووصفة التدريب. هناك حيث قد ينتقل الكثير من ميزة النماذج المتقدمة. لن يتم فتح مصادره، لكن مايكروسوفت تخطط لتقديم التخصيص الدقيق عبر واجهة برمجة التطبيقات. إذا بدأت مختبرات التكنولوجيا الكبرى الأخرى في مشاركة هذا المستوى من التفاصيل مرة أخرى، فسيحصل الباحثون والمطورون على رؤية أوضح بكثير لما يهم حقًا. هل تعتقد أن المكاسب الكبيرة القادمة ستأتي من بنى أفضل—أم من بيانات وعمليات تدريب أفضل؟

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.