أصدرت OpenAI معيار تقييم جديد يُسمى LifeSciBench، مصممًا لقياس قدرة أنظمة الذكاء الاصطناعي في سيناريوهات بحثية حقيقية. ويعتمد LifeSciBench على 750 مهمة مُعدّة من قبل خبراء، وتغطي 7 سير عمل بحثية و7 مجالات بيولوجية، مستوحاة من 173 باحثًا يحملون شهادة دكتوراه ولديهم خبرة في مجالات التكنولوجيا الحيوية أو الصناعة الدوائية. ويُركّز هذا المعيار على تقييم القدرات البحثية المعقدة، مثل دمج الأدلة، وتصميم التجارب، وتحليل البيانات، والاستدلال العلمي، والتواصل البحثي، بدلاً من الأسئلة الواقعية الفردية. ويحتوي أكثر من 79% من المهام على استدلال متعدد الخطوات، بمتوسط 4 خطوات استدلالية لكل سؤال، ويضم 1,062 مرفقًا بيانات حقيقيًا مرتبطًا بالبحث (مثل الأوراق البحثية، والرسوم البيانية، وبيانات التسلسل، وملفات الهيكل، إلخ).
تطلق OpenAI LifeSciBench لتقييم أنظمة الذكاء الاصطناعي في الأبحاث العلمية الحقيقية
TechFlowمشاركة
أطلقت OpenAI LifeSciBench، وهو معيار جديد لتقييم أنظمة الذكاء الاصطناعي في الأبحاث العلمية الحقيقية. يشمل الأداة 750 مهمة مصممة من قبل خبراء عبر سبعة مجالات بيولوجية، مع مساهمات من 173 باحثًا حاصلًا على درجة الدكتوراه. وتركز على المهارات المعقدة مثل تصميم التجارب وتحليل البيانات، حيث تتطلب 79% من المهام تفكيرًا متعدد الخطوات. تبرز أخبار الأصول الواقعية (RWA) تضمين 1,062 ملفًا للبيانات العلمية. وقد يلاحظ مراقبو أخبار الذكاء الاصطناعي + التشفير التزايد المتزايد في تقاطع الذكاء الاصطناعي وأدوات البحث المتخصصة.
المصدر:عرض النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات.
يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.