MedBench最新榜单出炉！深兰科技医疗大模型综合测评第一

2025-05-28 21:44 来源：证券日报网

本报讯（记者矫月）5月27日，国内权威医疗大模型评测平台MedBench发布最新评测榜单。深兰科技DeepBlue-MR-v1医疗大模型不仅以复杂医学推理评测第一的成绩持续霸榜，而且在多个综合评测中以94.2的高分荣膺桂冠。

榜单显示，参与本次评测的大模型有腾讯优图天衍医学大模型、基于华为盘古大模型研发的润医医疗大模型、云知声UniGPT-Med-U1大模型等。

MedBench是中文医疗大模型第一权威评测平台，由上海人工智能实验室与上海市数字医学创新中心联合国内多家医疗机构和科研单位‌‌设立，该平台汇聚了顶级医疗机构的专家经验和知识储备，已为全球超过387个模型提供评测。

深兰科技DeepBlue-MR-v1医学推理大模型是由深兰科技自主研发的医学推理大模型，擅长临床医学问诊、辅助医学诊断和制定诊疗方案等任务，通过对医学教科书、诊疗指南、专家论文、病案病历、医学推理、医学术语以及心理咨询等海量数据的清洗、构建和医学专家团队标注，运用自研训练体系，实现了人类医学推理能力对齐的基于Transformer架构的稠密大语言模型。DeepBlue-MR-v1医学推理大模型在海量高质量的医学数据上进行预训练，构建医学推理语义空间，通过训练监督微调、医学推理指令增强和多阶段自适应强化学习算法实现医学推理能力迭代提高。

医学推理能力是AI医疗皇冠上的明珠。深兰科技DeepBlue-MR-v1医疗大模型，自登顶MedBench复杂医学推理能力榜首至今，持续霸榜并扩大领先优势。在保持复杂医学推理能力的绝对领先优势的同时，还在医学语言理解、医学语言生成、医学知识问答、复杂医学推理、医疗安全和伦理共五个维度的综合得分也荣登MedBench榜首，该成绩充分彰显了公司行业领先的技术实力。

目前，基于DeepBlue-MR-v1医疗大模型，深兰科技所开发的AI医疗产品，已形成涵盖“AI问诊助手”“远程视频问诊”“辅助诊断系统”及“医学专家知识库”等在内的智能体产品矩阵。与武汉市中心医院、武汉协和医院、武汉市血液中心、武汉市精卫中心、武汉市武东医院等多家医疗机构达成合作，将联手推动AI技术在问诊、诊断、专科服务等场景的深度应用。

（编辑张昕）

相关资讯

京东健康旗下“京医千询”医疗大模型迎2.0重磅升级2025-05-22 15:42

-证券日报网

热点新闻

春节黄金市场面面观：有人排队采购有人卖出离场

过新年换新钱银行从“保供应”到“精准服务”

一栋办公楼的“第二次生长”——北京“商改保”样本调研

全球汽车巨头Stellantis“栽跟头”带来哪些警示

24小时排行一周排行

深度策划

新一轮以旧换新落地激发消费新动能

首先，一些地方在出台与消费品以旧换新相关的……[详情]

市场快讯

23:29	A股公司积极参设产业并购基金
23:29	商业航天领域投融资活跃星际荣耀...
23:29	多家锂电企业锚定市场需求优化产能...
23:29	潍柴点亮“电动力”
23:29	乳山：小牡蛎撬动大经济
23:29	看京沈两地券商将金融服务融入民生...
23:29	新能源汽车迎春运“大考”：力保充...
23:22	银行保险机构权益投资信心指数显著...
23:22	券商交易结算系统压力测试“再升级...
23:22	商业银行2025年累计实现净利润2.4...
23:22	车贷“长跑”开启汽车金融驶入共...
23:21	地方密集布局人工智能产业千行百...