预训练语言模型成为NLP主流,用一个高维向量来表示一个token的全部特征

来源：财通证券编辑：管理员时间：2023/10/8

从单一小模型到预训练模型的范式转移。语言模型的本质是对任意一段文本序列进行概率建模，用一个高维向量来表示一个 token 的全部特征。

早期的研究者发明了 Word2Vec，一种用于将自然语言中的单词表示为向量的技术，它基于神经网络，并且可以通过训练大规模语料库来学习单词之间的语义和语法关系，是深度学习应用在 NLP 领域的早期范式；

随着对长文本特征提取能力更强，计算效率更高的神经网络的提出，研究者开始尝试用更多的数据去训练一个能力更强的模型——预训练模型，然后通过迁移学习的方法使其适用于下游特定的任务。这就是 Google 在 2018 年提出的 BERT（Bidirectional Encoder Representation from Transformers，基于 Transformer 的双向编码器）的核心思想；

然而，OpenAI 在这一时期坚定押注于 GPT（Generative Pre-Trained Transformer，基于 Transformer 的单向解码器）这一路线，坚信通过优化 “下一个词预测”，以及扩大训练模型的参数量和数据量，机器能够对文本语料拥有与人类相似的“理解”能力。当前，OpenAI 与 ChatGPT 的成功，使得运用大语言模型做“预训练+提示”的范式，逐步取代了 BERT 时代“预训练+下游任务改造”的范式，成为了 NLP 业内新的主流。

信息推荐

» 传媒大模型标准-有效评估传媒大模型的能力，促进传媒行业智能化转型

传媒大模型目前生成的内容存在不确定性；其次，传媒大模型的生产作品能涉及侵犯他人的著作权或其他相关权益的风险;探索传媒大模型标准和评测指标的构建

» 政务大模型标准-有效评估政务大模型的能力，促进智慧政务发展，提升政府服务能力

政务大模型仍存在多方面的挑战：一是需要确保模型输出合法合规合理；二是政务大模型应用应避免偏见与不公;有必要探索政务大模型标准和评测指标的构建

» 文旅大模型标准-有效评估文旅大模型的能力，助力文旅行业发展，提升游客体验

在景区导游应用中,可利用文旅大模型对景区的历史、人文进行全方位的介绍;在文化推广应用中,通过对各类文化元素的分析解读;进一步提升游客体验

» 金融大模型标准-有效评估金融大模型的能力，促进金融行业智能化转型

金融大模型能力评估标准可以围绕应用场景、能力指标、应用成熟三个部分开展;具体能力项可分为数据加密性、模型的攻击防范性及输出准确性、服务的可扩展性

» Meta Llama2有望成大模型领域“安卓”，推动应用爆发

免费开源的Llama2降低了开发者门槛,成为大模型领域的安卓系统,推动应用的爆发;有利于移动端AI应用的普及,兼顾隐私与智能助理

» 首批国产大模型获批面向用户开放，含商汤,百度,智谱AI

商量SenseChat拥有1230亿参数;智谱AI已具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话等能力;文心一言让用户体验生成式AI的四大核心能力

» 通义大模型-开源社区：魔搭

魔搭”社区首批上架超 300 个模型，其中中文模型超过 100 个，覆盖了视觉、语音、自然语言处理、多模态等 AI 主要领域

» Alicemind语言大模型表现优异

的阿里通义-AliceMind大模型在4项任务中的表现超过人类水平，同时实现了总榜平均分的首次超越，意味着AI模型的中文语言理解水平达到了新的高度

» 通义-Alicemind语言大模型体系

覆盖全面：覆盖多语言、多模态、结构化等多个预训练语言模型;将围绕 Pre-training+Finetuning（“预训练 + 精调”）语言模型持续进行生态性的技术开源

» 阿里通义大模型主要包括M6/AliceMind/视觉

通用模型层：NLP模型“通义–AliceMind”；CV模型“通义-视觉”；多模态模型“通义 - M6;行业模型层：深入电商、医疗、娱乐、设计、金融、工业、制造业等行业

» 阿里通义大模型：既通用多种任务，又容易落地应用

通义大模型不仅在NLP等单模态场景实现SOTA，在部分多模态任务场景也实现了引领与突破，例如VQA challenge的准确率首超人类表现

网站制作须知

生成式AI应用

智能机器人行业

最新资讯

» 吉林省2024年政府工作报告-聚焦四大集群,六新产业,四新设施

» 黑龙江2024年政府工作报告-建设省级智能工厂4个、数字化车间41个

» 机器学习教育框架-学习结果和定义

» 人工智能素养：能力和设计的主要考虑因素

» 人工智能素养能力框架-17条能力

» TinyLlama 等小模型爆火,参数量为 11 亿

» 体系化人工智能(Holistic AI)技术探索-AI服务大闭环、AI能力原子化重构、网络原生AI及安全可信AI

» 穿刺机器人的发展趋势：四大应用优势助力行业发展

人工智能鲁ICP备18039973号-6