新华社研究院发布《人工智能大模型体验报告2.0》

 来源:新华社研究院     编辑:管理员      时间:2023/8/18
 

新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》(以下简称报告)显示,讯飞星火、百度文心一言、商汤商量和智谱AI-ChatGLM均表现抢眼,AI大模型的发展为人类工作和生活的提质增效均带来了正向积极的影响。

报告显示,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。具体来看,讯飞星火在工作提效方面优势明显,百度文心一言基础能力仍处领军水准,商汤商量则在情商方面表现优秀,智谱AI-ChatGLM整体表现优秀。

针对各维度能力测评,该报告还给出了相应的案例展示和分析。

在基础能力方面,人类与AI之间的差距并不显著。课题组分别从语言能力(35%)、AI向善(10%)、跨模态(20%)和多轮对话(35%)四大指标进行测评。测评显示,科技企业大模型中,百度文心一言表现最为抢眼,商汤商量、智谱AI-ChatGLM、360智脑表现优良。

在智商评估方面,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对科技企业大模型进行考量。结果显示,讯飞星火、智谱AI-ChatGLM表现突出,百度文心一言、昆仑万维天工表现优良。

在情商方面,AI与人类之间的差距最为明显。人类在情绪理解和处理方面通常具有更强的优势,和更灵活的处理能力。通过对处理日常事项(35%)、一语双关(30%)、人际关系(35%)问题进行分析发现,科技企业大模型中,商汤商量表现亮眼,百度文心一言、澜舟科技Mchat、智谱AI-ChatGLM及360智脑均表现优良。

在工作效率提升方面,课题组重点在工具提效(50%)和生成创新(50%)方面进行考量。结果显示,讯飞星火表现最为抢眼,百度文心一言、商汤商量、智谱AI-ChatGLM表现优良。不过,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。

报告认为,虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。在本次体验测评基础上,研究团队将继续深耕,加强在大模型安全可解释性、工作提效能力、实际落地情况、产业优秀案例等维度上的探索与研究。







 信息推荐
» 关于印发杭州市公共数据授权运营实施方案(试行)的通知 杭政办函〔2023〕63号
新疆部善县民族医院位于新疆吐鲁番地区都善县巴扎村,日门诊量11
» 上海市关于印发《立足数字经济新赛道推动数据要素产业创新发展行动方案(2023-2025年)》的通知
沪府办发〔2023〕14号;数据要素产业动能全面释放,数据产业规模达5000亿元,年均复合增长率达15%,引育1000家数商企业,建成数链融合应用超级节点,形成1000个高质量数据集,打造1000个品牌数据产品
» 北京关于印发《北京市促进机器人产业创新发展的若干措施》的通知
京经信发〔2023〕46号;通过揭榜挂帅聚力解决机器人产业短板问题和技术难题,根据攻关投入予以最高3000万元的支持;实现机器人生产全流程无人化,智能化的机器人企业
» 中国仿生机器人产业全景报告-仿生机器人研究
从我国仿生机器人行业现状、行业变革、行业发展及市场规模发展趋势、产业链及产业竞争格局等多角度、多方向对我国仿生机器人产业进行广泛调研与深度分析
» 中国支付清算协会关于印发《个人支付信息保护指引》的通知
收单机构还应切实履行特约商户检查责任,严格规范与外包服务机构业务合作,不应将收单业务交易处理、资金结算、风险监测、受理终端主密钥生成
» 湖北省发改委组织编制了《湖北省数据要素市场建设实施方案》
公共数据,涉及个人信息等敏感数据必须在交易场所交易; 政府部门、国有企业的数据采购应在场内交易;数据权属清晰,场景形态简单的数据服务或产品合法合规的前提下开展场外交易
» 国家互联网信息办公室起草了《人脸识别技术应用安全管理规定(试行)(征求意见稿)》
在公共场所安装图像采集、个人身份识别设备,应当为维护公共安全所必需,遵守国家有关规定,设置显著提示标识,只能用于维护公共安全的目的
» 关于印发《山东省制造业创新中心建设工作指南》的通知
注册成立公司作为制造业创新中心运营主体,公司应为投资主体多元化的独立法人;)应积极引进和培育高水平管理及研发团队
» 通用人工智能AGI等级保护白皮书-网络安全等级保护与安全保卫技术国家工程研究中心
白皮书旨在帮助读者更好地应对通用人工智能大模型带来的安全风险和挑战,同时也为网络安全等级保护在通用人工智能领域的合规落地提供了指导和建议
» 区块链产业发展“上海方案”发布 架构为“1+1+1+X”
1个算力平台设施、1个公共基础服务平台、1个政务区块链应用系统以及X个标杆场景应用。通过市场主导、产学研用协同,打造创新引领、生态活跃的城市级区块链基础设施服务体系
» 山东关于规范完善高校学费收费政策的通知 鲁发改价格〔2023〕559号
本科学校的本专科专业及专科学校基本学费标准文科类4000元,理科类及教育学中的体育学专业5000元,医学类专业6000元,非艺术院校艺术类专业8000元
» 关于印发《宜兴市节能环保产业集群发展三年行动计划(2023-2025年)》的通知
宜政办发[2023]23号;节能环保工业产值达到500亿元,省级工程技术研究中心、省级新型研发机构和省级企业技术中心等达到70家以上,建成3-5家智能车间
 
返回首页
AI大模型
劳模
AI自动驾驶
chatgpt智能
生成式AI应用
智能机器人行业
行业动态
行业资料
最新资讯
» 吉林省2024年政府工作报告-聚焦四大集群,六新产业,四新设施
» 黑龙江2024年政府工作报告-建设省级智能工厂4个、数字化车间41个
» 机器学习教育框架-学习结果和定义
» 人工智能素养:能力和设计的主要考虑因素
» 人工智能素养能力框架-17条能力
» TinyLlama 等小模型爆火,参数量为 11 亿
» 体系化人工智能(Holistic AI)技术探索-AI服务大闭环、AI能力原子化重构、网络原生AI及安全 可信AI
» 穿刺机器人的发展趋势:四大应用优势助力行业发展
 

人工智能 鲁ICP备18039973号-6