蚂蚁王晓航:大模型落地金融产业是复杂的系统工程
蚂蚁集团副总裁、蚂蚁金融大模型负责人王晓航
11月11日,2023金融街论坛年会“金融科技创新与合规安全”平行论坛在北京举办,蚂蚁集团副总裁、蚂蚁金融大模型负责人王晓航在发表 “跨越大模型金融产业落地鸿沟” 主旨演讲时表示,大模型对金融产业的价值显著,但通用大模型无法开箱即用,需要弥补许多不足之处,并在可靠性方面进行全周期加固。
1 大模型价值日渐凸显,将重塑金融产业全链条
王晓航表示,规模化的产业技术变革和价值兑现不会一蹴而就,必然经历阶梯式的迭代向上过程。蚂蚁作为普惠金融的践行者,一直走在人工智能和金融结合的最前沿。
早在2013年,蚂蚁推出了余额宝和小微金融等国民产品,为金融AI打开了巨大的价值空间。蚂蚁首创的小微金融310模式,成功解决了小微长尾用户的风险识别问题,展现了金融AI的普惠价值。
随着AI技术逐渐深入各类金融场景,金融科技在2017年开始出现平台模式。以“蚂蚁财富”、“蚂蚁保”和“网商银行”为代表的数字金融平台以开放姿态连接机构,通过科技赋能实现更丰富的金融供给和更深入的产业链。在这一阶段,AI场景全面爆发,成为营销、服务、投研、风管和资管各领域降本增效的关键手段。
到了2023年,大模型在金融产业的落地过程中展现出巨大的潜在价值,并具备以下三个重要特征:(1)能力深度,大模型凭借出色的语言和认知能力,在各种金融场景任务中不断刷新前沿技术水平,并在许多高阶任务中达到甚至超过人类专家水平;(2)迭代速度,大模型统一的算法架构降低了AI应用的复杂性,大幅加快了迭代速度;(3)创新宽度,大模型的专业知识生产和推理能力远远越出了上一代深度学习AI的擅长领域,推动了各类应用创新蓬勃出现,显著提升用户体验和生产效率。
综上所述,大模型已经展现出明确的产业价值:“金融服务链条上的每一个环节,都值得用大模型重做一次”。
2 不存在开箱即用,大模型落地金融产业是复杂系统工程
2.1 大模型落地金融产业挑战
金融领域具有高度专业性、复杂的决策和极致的合规和可靠性要求。尽管大模型在能力方面取得了显著进步,但在金融行业中无法直接应用,仍需克服领域知识、复杂决策和可靠性等三个方面的挑战。
(1)首先,领域知识的短板。
通用大模型虽然能够有效压缩数万亿的世界知识,具备较强的通识能力,但金融通识相对薄弱,对金融原理的理解不够深入,缺乏企业私域知识,并且无法实时更新和把握市场动态。例如,当用户询问“请推荐一只既能保本又能高收益的理财产品”时,大模型往往无法理解金融资产的“流动性、收益和风险”之间的不可能三角关系,也难以正确引导用户。
(2)其次,复杂决策短板
通用大模型是个优秀的文科生,理解、沟通、推理能力强大,但是在复杂的专业问题上差强人意,无法胜任量化分析、资源运筹优化、精细化匹配这几类问题。
(3)第三,可靠性不足
通用大模型除了众所周知大模型幻觉与金融严谨性的冲突,也亟须有效识别金融业务常见的合规性陷阱,比如 用户询问“我怎么买这款信托产品”的背后,蕴藏了一个合格投资者判别问题。此外,大模型亦需要遵循金融企业的价值主张,如价值投资、风险平衡、科学配置等。
2.2 认知边界,跨越边界
在当前可得技术约束中,为了金融场景落地大模型顺利补齐上述短板,除了对通用大模型注入金融通识和私域知识,还需要以系统工程解决方案,通过有效的技术组合,跨越鸿沟。
(1)“大模型+小模型”协作
大模型在感知、认知和交互领域具有显著优势。而各专业小模型专注于特定问题或任务,在特定领域(运筹、量化、图算法)表现更为专精。在实际应用中,我们可以将大模型作为认知和交互的核心,而小模型则负责专业判断和决策。通过大模型向小模型的任务分发,共同完成复杂的推理和决策工作。
(2)“大模型隐性知识+图谱显性知识”互补
大模型通识覆盖广,但不够严谨可靠,容易出现幻觉和答非所问现象。相比之下,图谱显性知识专业性和可靠性强,但生产维护成本较高。鉴于金融领域的头部问题是收敛的,应用中可用图谱覆盖严谨性和价值双高场景(比如主流保险产品的条款,核保核赔知识),大模型覆盖低频和长尾场景,以实现服务质量与服务成本的平衡。
(3)“Open QA+Closed QA”结合
需要严谨答案的很多问题,可以转化为“检索增强”问题:系统接到用户问题,检索返回专业内容,大模型基于检索结果生成问题答案(Closed QA)。这就像让大模型从专业书籍寻找答案,适用于财经问答、客服和投教问答等场景。而基于大规模的参数知识进行问答,能够回答开放性问题(Open QA),适用于需要理解和推理的复杂问题。
2.2满足可靠性,还需要全周期强化
大模型落地金融产业的主要挑战是可靠性,涉及内容安全性、金融合规、科技伦理和金融价值观等领域。虽然上述技术组合可以有效弥补大模型的不足,但在消费级金融应用方面仍有待提高。蚂蚁在为数千万消费者提供服务的过程中,积累了丰富的安全和合规技术,并基于此构建了一套全生命周期的可靠性加固技术,以确保大模型的训练和推理过程的可靠性。
(1)离线训练阶段
数据治理是关键,需要“高大正”( 高质量、大规模、价值观正确)的数据。蚂蚁通过模型和人工结合方式,从近2千亿token中筛选出171亿token优质金融语料,在源头上保障大模型的学习质量和价值取向。
价值对齐亦至为关键,蚂蚁建立了多达60万以上的合规和价值对齐指令集,并配备了300多人的安全运营和标注团队参与对齐工作。
(2)线上推理阶段
蚂蚁为金融大模型设立了专用安全围栏:在请求和生成两端都进行严密的风险判别和拦截,这个系统称为蚁鉴,由数百个识别模型和数十万判别规则组成。
检索增强、图谱增强:涉及到合规性、专业性要求高的内容,蚂蚁金融大模型会优先Closed-QA,从可靠内容检索寻找答案。
(3)持续攻防演练
蚂蚁通过模型和人工结合方式,建立了数百万负向样本,在模型上线前后,持续自动化攻击金融大模型可能的可靠性薄弱点,检测安全能力。
经过上述加固,蚂蚁金融大模型在可靠性各维度达到99%及以上的可靠性,媲美人工专家,具备了对消费者开放的可靠性要求。
3 蚂蚁金融大模型实践
王晓航在演讲中强调人工智能是蚂蚁金融科技的核心,并介绍了蚂蚁金融大模型的实践。
3.1蚂蚁1+2技术布局
蚂蚁自主开发了全栈技术体系,用于训练金融大模型,并成功打造了代表性的AI原生应用 —— “支小宝”智能顾问(2C)和“支小助”智能业务助手(2B)。
金融大模型:拥有千亿量级的金融通识知识、60万+金融专属指令集和320+金融专业工具;基于万卡规模的异构算力,在金融“认知、生成、知识、决策、安全”维度优势明显。
支小宝:基于金融大模型,已经服务了超过4000万用户。它在金融领域能够提供个性化的理财和保险服务,用户意图识别准确率达到95%。支小宝关联着千万级别的金融知识图谱,具备媲美专家的市场研判和热点解读的能力。
支小助:作为金融服务链条上的智能业务助手,支小助显著提高了金融顾问、投研、理赔、营销和风控等专家的专业水平和服务效率。其中,“支小助顾问版”已经帮助理财顾问和保险代理人扩大了70%的服务半径;“支小助投研版”助力金融分析师每天能够提取超过100+篇研报的信息,将市场事件解读的效率从每周10篇提升到每日超过400篇;“支小助理赔版”实现了医疗险理赔的全流程自动化,并创造了便捷的“秒赔”理赔体验。
3.2 开源金融Agent框架
为了更好地服务行业生态,助推行业智能化升级,蚂蚁将开源金融大模型应用开发框架—— 金融大模型智能体(Agent)框架。该框架的核心优势在于充分利用蚂蚁金融大模型卓越的语言、金融认知和推理能力,提供了丰富的金融知识和专业工具,及知识增强和工具增强套件。并融入蚂蚁对金融大模型落地实践的经验,通过金融大模型智能体框架,金融企业能够更高效构建金融智能服务系统,提升用户提升和生产效率。
猜你喜欢
蚂蚁数科SOFAStack发布大模型服务平台,助力技术通用走向行业可用
蚂蚁数科旗下多云PaaS平台SOFAStack正式发布大模型服务平台AI Max。国家金融与发展实验室副主任曾刚:AI的发展会去除“知识中介”,金融业需要借助大模型改善传统发展模式
AI的发展会去除“知识中介”,金融业需要借助大模型改善传统发展模式。