智源钻研院宣告推出“天秤”大模子评测系统,涵盖600余评估维度

  发布时间:2024-11-09 03:23:24   作者:玩站小弟   我要评论
  新浪科技讯 6月9日上午新闻,2023北京智源大会上,智源钻研院院长黄铁军宣告推出FlagEval 天秤)狂语言模子评测系统,力争从“能耐、使命、目的”三维评测角度,600多个维度对于大模子妨碍周 。

  新浪科技讯 6月9日上午新闻,天秤2023北京智源大会上 ,智源钻研智源钻研院院长黄铁军宣告推出FlagEval (天秤)狂语言模子评测系统,院宣力争从“能耐、告推盖余使命  、出大测系目的模评”三维评测角度 ,600多个维度对于大模子妨碍周全测评 ,统涵建树迷信、评估公平、维度周全的天秤大模子技术评估系统。

  据介绍 ,智源钻研天秤大模子的院宣使命维度之后搜罗22个主不雅、主不雅评测数据集,告推盖余评测问题多达84433道。出大测系当初正在探究运用家养智能技术妨碍迷信评测 ,模评力争削减更多的主不雅评测 。同时也正在探究经由大模子评估,辅助大模子预磨炼 。(文猛)

海量资讯、精准解读 ,尽在新浪财经APP

责任编纂 :韦子蓉

  • Tag:

相关文章

最新评论