您当前的位置是:  首页 > 技术 > 白皮书 >
 首页 > 技术 > 白皮书 > 中国移动研究院发布通用大模型评测体系白皮书 为大模型的评测实践和产业应用提供指导

中国移动研究院发布通用大模型评测体系白皮书 为大模型的评测实践和产业应用提供指导

2023-07-20 14:23:21   作者:   来源:C114通信网   评论:0  点击:2201


  7月17日,由中国移动研究院、中国移动技术能力评测中心主办了“2023年大模型评测及应用研讨会”,会议旨在共同探讨大模型评测体系、应用实践、产业标准及合作生态等议题,推动大模型技术的广泛应用和发展。中国中文信息学会副理事长马少平、中国移动研究院副院长段晓东出席会议并致辞。

  会上,中国移动研究院联合北京邮电大学、中国科学院计算技术研究所、北京市科学技术研究院、科大讯飞、百度、武汉大学和重庆理工大学等知名高校、科研机构和头部企业联合发布了《“弈衡”通用大模型评测体系白皮书》。该白皮书是行业中首个大模型评测领域白皮书,基于客观全面、公平公正和用户视角的三大原则,创新性地提出了“2-4-6”的“弈衡”通用大模型评测体系。该体系将评估场景划分为基础任务和应用任务,明确四项主要评测要素,并制定涵盖六大维度的50余个评测指标。“弈衡”评测体系可对国内外大模型开展有效评测分析,充分揭示大模型在应用中的固有问题,客观反映各模型在准确性、可靠性以及安全性等方面的差异,为大模型的评测实践和产业应用提供指导。

  

闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁惧墽鎳撻—鍐偓锝庝簼閹癸綁鏌i鐐搭棞闁靛棙甯掗~婵嬫晲閸涱剙顥氬┑掳鍊楁慨鐑藉磻濞戔懞鍥偨缁嬪灝鐎俊銈忕到閸燁偆绮诲☉妯忓綊鏁愰崨顔跨缂備礁顑勯懗鍓佹閹捐纾兼慨姗嗗厴閸嬫捇鎮滈懞銉モ偓鍧楁煥閺囨氨鍔嶉柟鍐茬焸濮婄粯鎷呴崨濠傛殘闂佽崵鍠嗛崕鎶藉箲閵忕媭娼ㄩ柍褜鍓欓锝嗙節濮橆厼浜滅紒鐐妞存悂寮查鍕拺闁圭ǹ娴风粻鎾寸箾鐠囇呭埌閺佸牊淇婇妶鍛櫤闁稿鍓濈换婵囩節閸屾稑娅e銈忕到閵堟悂骞冩禒瀣垫晬婵炴垶蓱鐠囩偤姊虹拠鈥虫灍闁荤噦濡囬幑銏犫攽鐎n亞鍊為梺闈浤涢崘銊ヮ洭濠电姷鏁告慨鐑藉极閹间礁纾规い鏍仜閻掑灚銇勯幒鎴濐仼缁炬儳顭烽弻鐔煎礈瑜忕敮娑㈡煟閹惧娲撮柟顔筋殜閺佹劖鎯旈垾鑼晼濠电姭鎷冮崘顏冪驳闂侀€涚┒閸斿秶鎹㈠┑瀣窛妞ゆ洖鎳嶉崫妤呮⒒娴e憡璐¢柟铏尵閳ь剚姘ㄦ晶妤佺┍婵犲洤绠瑰ù锝堝€介妸鈺傜叆闁哄啠鍋撻柛搴$-缁辩偤骞掑Δ浣叉嫽闂佺ǹ鏈悷銊╁礂瀹€鍕厵闁惧浚鍋呭畷宀€鈧娲滈弫璇差嚕娴犲鏁囬柣鎰問閸炵敻姊绘担鑺ョ《闁革綇绠撻獮蹇涙晸閿燂拷...

 

  来自中国移动、北京邮电大学、中国科学院计算技术研究所、信通院、科大讯飞、百度等多家单位的领导和专家,围绕运营商大模型发展思路、CV大模型前沿技术、国内优秀大模型发展状况、大模型基础设施和生态、行业评测标准等主题,在会上发表了精彩演讲,为推动大模型技术发展奉献了一场知识盛宴,引起了线上线下与会观众的热烈反响。

  此外,会上正式成立CCIR大模型评测工作组,并发布“2023 CCIR全国信息检索挑战杯”中国移动赛道赛题。

【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

相关阅读:

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

专题

CTI论坛会员企业