金融大模型标准-有效评估金融大模型的能力，促进金融行业智能化转型

来源：中国信息通信研究院编辑：管理员时间：2023/9/16

金融大模型标准可有效评估金融大模型的能力，促进金融行业智能化转型。金融大模型在银行、证券、保险等金融细分领域具有重要应用前景，在智能投研、智能投顾、智能风控、智能营销、智能客服等众多场景中提供助力，促进金融机构数智化水平提升。然而，金融大模型在应用过程中仍面临着诸多挑战。在数据安全方面，由于金融行业对身份信息、金融资产、交易记录、信用历史等数据流动的合规要求较高，导致金融大模型在数据安全和隐私保护方面将面临更高的要求。在时效性方面，由于金融风险的效用具有期限，导致金融大模型对实时数据获取和处理能力提出了更高要求。为了更好推动金融大模型高质量发展，有必要探索金融大模型标准和评测指标的构建。金融大模型标准可用于指导第三方测评机构对金融大模型能力的评估、验收等工作。

金融大模型能力评估标准可以围绕应用场景、能力指标、应用成熟三个部分开展。其中，应用场景可重点考察营销、风控、投研、投顾、文档处理、知识管理、客服等通用场景的覆盖情况，以及银行、保险、证券、基金、资管等专用业务场景的覆盖情况，具体能力项可可分为客户满意度、客户信用评估准确率、风险预警准确率、表单识别准确率、证件识别准确率等。能力指标可以重点考察不同模态数据的覆盖情况，以及任务具体指标、业务整体效果等方面的效果优越性，具体能力项可分为实体识别、关系抽取、事件抽取、情感分析、文本生成、语音合成、语音识别、图片分类、图像真实性鉴定等。应用成熟可重点考察数据合规、模型可控、服务可靠等方面，具体能力项可分为数据加密性、模型的攻击防范性及输出准确性、服务的可扩展性、可维护性、兼容性等。

信息推荐

» Meta Llama2有望成大模型领域“安卓”，推动应用爆发

免费开源的Llama2降低了开发者门槛,成为大模型领域的安卓系统,推动应用的爆发;有利于移动端AI应用的普及,兼顾隐私与智能助理

» 首批国产大模型获批面向用户开放，含商汤,百度,智谱AI

商量SenseChat拥有1230亿参数;智谱AI已具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话等能力;文心一言让用户体验生成式AI的四大核心能力

» 通义大模型-开源社区：魔搭

魔搭”社区首批上架超 300 个模型，其中中文模型超过 100 个，覆盖了视觉、语音、自然语言处理、多模态等 AI 主要领域

» Alicemind语言大模型表现优异

的阿里通义-AliceMind大模型在4项任务中的表现超过人类水平，同时实现了总榜平均分的首次超越，意味着AI模型的中文语言理解水平达到了新的高度

» 通义-Alicemind语言大模型体系

覆盖全面：覆盖多语言、多模态、结构化等多个预训练语言模型;将围绕 Pre-training+Finetuning（“预训练 + 精调”）语言模型持续进行生态性的技术开源

» 阿里通义大模型主要包括M6/AliceMind/视觉