来源:中信建投 编辑:管理员 时间:2023/8/28 |
多年来,阿里巴巴达摩院一直深耕多模态预训练,并率先探索通用统一 大模型。自2021年起,阿里达摩院先后发布多个版本的多模态及语言大 模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现 突破,引领了中文大模型的发展。2022年9月2日,阿里发布 “通义” 大模型系列,核心模型通过“魔搭”社区向全球开发者开源开放。面对 大模型通用性与易用性仍欠缺的难题,通义打造了业界首个AI统一底座, 并构建了大小模型协同的层次化人工智能体系,将为AI从感知智能迈向 知识驱动的认知智能提供先进基础设施。 • 在技术层面,通义大模型不仅在NLP等单模态场景实现SOTA,在部分多 模态任务场景也实现了引领与突破,例如VQA challenge的准确率首超 人类表现;在落地层面,通义大模型的资源消耗相对较低,运行速度也 进一步加快,以M6大模型为例,相同参数规模下训练能耗仅是GPT-3的 1%;在应用层面,目前“通义”大模型已经深入到电商、设计、医疗、 法律、金融等行业,服务超过200个场景。
|
信息推荐 |
» AI基础设施商业模式:硬件销售、技术授权与合作、一体化解决方案 |
AI硬件销售模式涉及从产品研发,生产,市场推广到销售,交付和售后服务的完整过程约占20%;解决方案提供商以平台产品或软硬件服务融合应用场景约占35% |
» 医疗大模型:良医小慧,灵医大模型 |
百度正式宣布面向大健康上下游产业开放灵医大模型测评, 试用,推动医疗行业的数字化和智能化进程;良医小慧能解释超过 4500 个检验项目和 2800 种疾病 |
» 中国AI技术变革—AI基础设施制约关键点 |
芯片量产是AI基础设施发展前提, 推动AI应用的普及和商业化落地;芯片实现商业化需构建软件生态;实现价值传递必须将软件生态与具体垂直行业产品化结合 |
» 中国AI技术变革—AI基础设施行业市场规模 |
2022年中国由AI基础设施带动的人工智能市场规模达到1,117.8亿元, 随着AI基础设施逐渐落地各类应用场景,CAGR将达到39.98% |
» 模型智能的“涌现”是生成式 AI 浪潮的充要条件 |
当模型规模达到某个阈值时,模型对某些复杂问题的处理性能突然呈现快速增长,思维链提示可以显著提升大语言模型的性能 |
» 预训练语言模型成为NLP主流,用一个高维向量来表示一个token的全部特征 |
运用大语言模型做“预训练+提示”的范式,逐步取代了 BERT 时代“预训 练+下游任务改造”的范式,成为了 NLP 业内新的主流 |
» 传媒大模型标准-有效评估传媒大模型的能力,促进传媒行业智能化转型 |
传媒大模型目前生成的内容存在不确定性;其次,传媒大模型的生产作品 能涉及侵犯他人的著作权或其他相关权益的风险;探索传媒大模型标准和评测指标的构建 |
» 政务大模型标准-有效评估政务大模型的能力,促进智慧政务发展,提升政府服务能力 |
政务大模型仍存在多方面的挑战: 一是需要确保模型输出合法合规合理;二是政务大模型应用应避免偏见与不公;有必要探索政务大模型标准和评测指标的构建 |
» 文旅大模型标准-有效评估文旅大模型的能力,助力文旅行业发展,提升游客体验 |
在景区导游应用中,可利用文旅大模型对景区的历史、人文进行全方位的介绍;在文化推广应用中,通过对各类文化元素的分析解读;进一步提升游客体验 |
» 金融大模型标准-有效评估金融大模型的能力,促进金融行业智能化转型 |
金融大模型能力评估标准可以围绕应用场景、能力指标、应用成熟三个部分开展;具体能力项可分为数据加密性、模型的攻击防范性及输出准确性、服务的可扩展性 |
» Meta Llama2有望成大模型领域“安卓”,推动应用爆发 |
免费开源的Llama2降低了开发者门槛,成为大模型领域的安卓系统,推动应用的爆发;有利于移动端AI应用的普及,兼顾隐私与智能助理 |
» 首批国产大模型获批面向用户开放,含商汤,百度,智谱AI |
商量SenseChat拥有1230亿参数;智谱AI已具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话等能力;文心一言让用户体验生成式AI的四大核心能力 |