阿里通义大模型：既通用多种任务，又容易落地应用

来源：中信建投编辑：管理员时间：2023/8/28

多年来，阿里巴巴达摩院一直深耕多模态预训练，并率先探索通用统一大模型。自2021年起，阿里达摩院先后发布多个版本的多模态及语言大模型，在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破，引领了中文大模型的发展。2022年9月2日，阿里发布 “通义” 大模型系列，核心模型通过“魔搭”社区向全球开发者开源开放。面对大模型通用性与易用性仍欠缺的难题，通义打造了业界首个AI统一底座，并构建了大小模型协同的层次化人工智能体系，将为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。

• 在技术层面，通义大模型不仅在NLP等单模态场景实现SOTA，在部分多模态任务场景也实现了引领与突破，例如VQA challenge的准确率首超人类表现；在落地层面，通义大模型的资源消耗相对较低，运行速度也进一步加快，以M6大模型为例，相同参数规模下训练能耗仅是GPT-3的 1%；在应用层面，目前“通义”大模型已经深入到电商、设计、医疗、法律、金融等行业，服务超过200个场景。

信息推荐

» AI基础设施商业模式：硬件销售、技术授权与合作、一体化解决方案

AI硬件销售模式涉及从产品研发,生产,市场推广到销售,交付和售后服务的完整过程约占20%;解决方案提供商以平台产品或软硬件服务融合应用场景约占35%

» 医疗大模型：良医小慧，灵医大模型

百度正式宣布面向大健康上下游产业开放灵医大模型测评, 试用,推动医疗行业的数字化和智能化进程;良医小慧能解释超过 4500 个检验项目和 2800 种疾病

» 中国AI技术变革—AI基础设施制约关键点

芯片量产是AI基础设施发展前提, 推动AI应用的普及和商业化落地;芯片实现商业化需构建软件生态;实现价值传递必须将软件生态与具体垂直行业产品化结合

» 中国AI技术变革—AI基础设施行业市场规模

2022年中国由AI基础设施带动的人工智能市场规模达到1,117.8亿元，随着AI基础设施逐渐落地各类应用场景,CAGR将达到39.98%

» 模型智能的“涌现”是生成式 AI 浪潮的充要条件

当模型规模达到某个阈值时,模型对某些复杂问题的处理性能突然呈现快速增长,思维链提示可以显著提升大语言模型的性能

» 预训练语言模型成为NLP主流,用一个高维向量来表示一个token的全部特征