تطلق OpenAI LifeSciBench لتقييم أنظمة الذكاء الاصطناعي في الأبحاث العلمية الحقيقية

iconTechFlow
مشاركة
AI summary iconملخص

أصدرت OpenAI معيار تقييم جديد يُسمى LifeSciBench، مصممًا لقياس قدرة أنظمة الذكاء الاصطناعي في سيناريوهات بحثية حقيقية. ويعتمد LifeSciBench على 750 مهمة مُعدّة من قبل خبراء، وتغطي 7 سير عمل بحثية و7 مجالات بيولوجية، مستوحاة من 173 باحثًا يحملون شهادة دكتوراه ولديهم خبرة في مجالات التكنولوجيا الحيوية أو الصناعة الدوائية. ويُركّز هذا المعيار على تقييم القدرات البحثية المعقدة، مثل دمج الأدلة، وتصميم التجارب، وتحليل البيانات، والاستدلال العلمي، والتواصل البحثي، بدلاً من الأسئلة الواقعية الفردية. ويحتوي أكثر من 79% من المهام على استدلال متعدد الخطوات، بمتوسط 4 خطوات استدلالية لكل سؤال، ويضم 1,062 مرفقًا بيانات حقيقيًا مرتبطًا بالبحث (مثل الأوراق البحثية، والرسوم البيانية، وبيانات التسلسل، وملفات الهيكل، إلخ).

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.