本报讯 (记者李冰)2月5日,围绕“信贷多模态AI如何定标准”,奇富科技举办了一场聚焦产业与学术前沿的直播讨论。直播中,奇富科技联合复旦大学、华南理工大学研究人员近期发布的首个面向信贷场景的多模态评测基准FCMBench-V1.0成为核心议题。
在这场对话中,来自产业一线与学术前沿的三位嘉宾,从不同视角指向了同一个问题:如果没有统一标准,金融AI很难真正落地。
作为奇富科技多模态负责人,杨叶辉首先从产业实践谈起。他用“锄头与土地”做比喻,形象阐释了AI与应用场景之间的关系:AI是工具,而金融、医疗这样的高门槛行业则是足够“肥沃”的土地。
“评测先行,本质上是在做一把尺子。”杨叶辉表示,当前金融机构在选择模型和方案时,常常陷入“不同模型分别声称得到了95分和98分,到底哪个好?”的困惑。没有统一、公平、公开的评测体系,决策就容易失焦。FCMBench的价值,正在于把模型拉到同一条起跑线上,让能力在真实业务条件下接受检验。
为此,FCMBench在设计上强调“实战性”。从合规前提下重构数据体系,到任务层面对真实业务流程的映射,再到对光线、角度、反光等十余种真实干扰场景的模拟,评测直指金融风控中最具挑战性的推理问题。杨叶辉坦言,做评测基准并非短期收益项目,但从长期看,行业共识和开源力量的形成终将反哺业务本身。
华南理工大学许言午教授则从跨行业经验出发,为金融AI的发展提供了另一种参照。他表示,很多人直觉上觉得AI在金融领域“存在感不强”,其实并不准确。AI早已深度参与保险定价、资产评估和量化交易,只是这些价值并不直接呈现在ToC产品中,因此“看不见”。
复旦大学陈涛教授认为,好的数据集本身就是对“好问题”的定义。重要的是,金融AI不能停留在通用模型的预训练与微调阶段,而应构建内生的金融思维链,让模型天然理解利率、规则与风险,实现安全可信的推理能力。这也是学界与产业必须协同解决的问题。
(编辑 何帆)