霸榜C-Eval和CMMLU两大权威评测夸克大模型应用实力初现

2023-11-16 20:58 来源：证券日报网

本报记者袁传玺

11月16日，根据最新成绩，千亿级参数的夸克大模型登顶C-Eval和CMMLU两大权威评测榜单。

作为国内最权威的两个大语言模型测试榜单，C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集，覆盖52个学科，是目前权威的中文AI大模型评测榜单之一。CMMLU是由MBZUAI、上海交通大学、微软亚洲研究院共同推出，包含67个主题，专门用于评估语言模型在中文语境下的知识和推理能力。

评测过程中，夸克大模型经过了上万道专业考题的检验，覆盖几十个学科和不同学段。无论是常识问题还是社会科学知识，夸克大模型都展现出了处理复杂、多层次问题的能力。基于精调后的训练数据，夸克大模型能够更好地理解问题的上下文、逻辑结构和语义关系，从而更全面、深入地分析和解决问题。

在CMMLU榜单评测中，夸克大模型以平均77.08分的成绩位列总成绩第一，并占据社会科学和其他两个类目的首位。在C-Eval榜单中，夸克大模型平均分达到89分，稳居行业第一，同时在社会科学、人文科学和其他三个类目中位列榜首。

据介绍，凭借数据、行业、知识正确性、平台等四大优势，夸克大模型应用会优先落地在通识问答、专业搜索等信息服务领域，满足年轻人学习知识和提升自我的需求。夸克将借助自研大模型全面升级，为年轻人工作、学习、生活提供更全面的服务。

（编辑张钰鹏）

-证券日报网

热点新闻

24小时排行一周排行

深度策划

新一轮以旧换新落地激发消费新动能

首先，一些地方在出台与消费品以旧换新相关的……[详情]

市场快讯

23:50	AI助力产业发展迈向生态协同企业...
23:50	从技术概念到价值引擎 AI重塑企业...
23:50	达力普董事会主席孟凡勇：在行业周...
23:50	云知声创始人、CEO黄伟：在AI 2.0...
23:49	行业共话AI时代“快与慢” 数字安...
23:49	图灵智能研究院院长、北京智源人工...
23:49	中国信息通信研究院总工程师何宝宏...
23:49	第十四届全国政协委员、经济日报社...
23:49	AI技术跨越式突破持续赋能千行百...
23:49	中关村泛联院首席科学家刘光毅：以...
23:49	工行北京分行科技金融中心负责人：...
23:49	城市更新“钱”从何处来？

霸榜C-Eval和CMMLU两大权威评测 夸克大模型应用实力初现

霸榜C-Eval和CMMLU两大权威评测夸克大模型应用实力初现