《2024年中国AI大模型产业发展报告:开启智能新时代.docx》由会员分享,可在线阅读,更多相关《2024年中国AI大模型产业发展报告:开启智能新时代.docx(40页珍藏版)》请在课桌文档上搜索。
1、开启智能新时代2024年中国Al大模型产业发展报告2024年3月,Z,1刖三伴随人工智能技术的加速演进,AI大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用前景广。近年来,我国高度重视人工智能的发展,将其上升为国家战略,出台一系列扶持政策和规划,为Al大模型产业发展创造了良好的环境。当前,通用大模型、行业大模型、端侧大模型如雨后春笋般涌现,大模型产业的应用落地将进一步提速。作为新一代人工智能产业的核心驱动力,AI大模型广泛赋能我国经济社会的多个领域,打开迈向通用人工智能的大门,推动新一轮的科技革命与产业变革。在大模型盛行的时代,产业发展到何种阶段,遇到何种
2、挑战,未来将走向何方,这些都是需要面对的问题,亟需社会各界共同努力。在此背景下,人民网财经研究院、至顶科技联合发布开启智能新时代:2024年中国Al大模型产业发展报告,报告对于Al大模型产业发展背景、产业发展现状、典型案例、挑战及未来趋势等方面进行了系统全面的梳理,为政府部门、行业从业者以及社会公众更好了解Al大模型产业提供参考。专家寄语2023年人工智能大模型全面爆发,给科技创新、生产生活带来重大变革、机遇和挑战。全球大模型竞争日趋激烈,众多国产大模型脱颖而出。大模型与电力、零售、出版等传统行业的成功融合,展现对传统产业改造提升的潜力。大模型赋能金融、医疗等行业提质增效,对推动新质生产力快速
3、发展起到重要作用。大模型持续健康发展,需要政策法规保驾护航,满足隐私保护、数据安全等多方面要求。期待未来大模型持续深耕技术创新并服务于各行各业,为全社会全方位地注入高质量发展的新动能。李君传播内容认知全国重点实验室专职副主任AI大模型的出现,使得利用人工智能技术来生成内容,从“可用”跨越到“好用”。生产内容是所有行业共有的需求,如今大模型已经在电商、影视、传媒等领域被规模应用。大模型的商业化需要供需双方同时发力:供给侧来看,以Transformer为代表的根技术存在显著成本问题,当前大模型还有进一步压缩成本、提高性价比的空间;需求侧来看,企业高效应用Al大模型的必然前提是,投入大量资金、人力、
4、时间以提升企业自身数字化程度。未来,人工智能生成内容从“好用”到“高效”,也许会再经历一次或多次技术范式的颠覆。王蕴韬中国信息通信研究院人工智能研究中心副总工程师2024年,多重利好因素将推动大模型快速发展,首先是“人工智能+”行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再加上科技公司加大对Al领域投入资金、人力、技术研发,各环节协同支撑大模型发展。当前大模型产业也面临挑战,包括算力分散不足、Transformer结构是否为最优的疑问、领域数据稀缺、缺少现象级应用的问题。就产业趋势而言,投入基础模型训练的公司未来可能会大幅减少,转而更多的公司会去寻找应用场景和爆款应用。
5、vivo结合自研大模型端侧化、矩阵化的技术优势并且会聚焦手机行业的应用经验,利用大模型重构手机各类功能,找到落地场景,普惠更多用户。周围vivo副总裁、vivoI全球研究院院长笫一章扬帆起航:中国Al大模型产业发展背景11.1 中国Al大模型产业发展政策驱动力11.2 AI大模型产业发展技术驱动力41.3 中国Al大模型产业发展市场驱动力9第二章百舸争流:中国Al大模型产业现状及典型案例122. IAI大模型主要特征122.1 AI大模型主要类型132.2 中国Al通用大模型典型案例152.3 中国Al行业大模型典型案例202.4 中国Al端云结合大模型典型案例27第三章大浪淘沙:中国Al大模
6、型产业发展所面临的挑战313. 1大模型产业遭遇算力瓶颈313.1 主流大模型架构仍存在诸多局限313.2 高质量的训练数据集仍需扩展323.3 大模型爆款应用尚未出现32第四章天阔云高:中国Al大模型产业趋势展望344.1 AI云侧与端侧大模型满足不同需求,C端用户将成为端侧的主要客群.344.2 AI大模型趋于通用化与专用化,垂直行业将是大模型的主战场.344.3 AI大模型将广泛开源,小型开发者可调用大模型能力提升开发效率354.4 AI高性能芯片不断升级,Al大模型产业生态体系将不断完善36结语37Al大模型将加快新质生产力发展,助力我国经济社会高质量发展37第一章扬帆起航:中国Al大
7、模型产业发展背景1.1 中国Al大模型产业发展政策驱动力近年来,我国始终高度重视人工智能发展机遇和顶层设计,发布多项人工智能支持政策,国务院于2017年发布新一代人工智能发展规划。科技部等六部门也于2022年印发关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见对规划进行落实。2024年政府工作报告中提出开展“人工智能+”行动。伴随人工智能领域中大模型技术的快速发展,我国各地方政府出台相关支持政策,加快大模型产业的持续发展。当前,北京、深圳、杭州、成都、福建、安徽、上海、广东等地均发布了关于Al大模型的相关政策。具体来看,北京着力推动大模型相关技术创新,构建高效协同的大模型技术产
8、业生态;上海强调打造具备国际竞争力的大模型;深圳重点支持打造基于国内外芯片和算法的开源通用大模型,支持重点企业持续研发和迭代商用通用大模型;安徽从资源方面着手吸引大模型企业入驻;成都着力推动大模型相关技术创新,重点研发和迭代CV大模型、NLP大模型、多模态大模型等领域大模型以及医疗、金融、商务、交通等行业大模型;杭州支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型。2023年以来我国各地出台的大模型产业相关政策发布时间发布机构政策标题政策内容2023年5月北京市人民政府北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)支持创新主体重点
9、突破分布式高效深度学习框架、大模型新型基础架构等基础平台技术。着力推动大模型相关技术创新。构建高效协同的大模型技术产业生态。建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。组建全栈国产化人工智能创新联合体,搭建基于国产软硬件的人工智能训练和服务基础设施,研发全栈国产化的生成式大模型,逐步形成自主可控的人工智能技术体系和产业生态。2023年5月北京市人民政府办公厅北京市促进通用人工智能创新发展的若干措施高效推动新增算力基础设施建设:加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心,形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、大型视觉模型、多模
10、态大模型、科学计算大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。开展大模型创新算法及关键技术研究:围绕模型构建、训练、调优对齐、推理部署等环节,积极探索基础模型架构创新,研究大模型高效并行训练技术和认知推理、指令学习、人类意图对齐等调优方法,研发支持百亿参数模型推理的高效压缩和端侧部署技术,形成完整高效的技术体系,鼓励开源技术生态建设。2023年5月中共深圳市委办公厅、深圳市人民政府办公厅深圳市加快推动人工智能高质量发展高水平应用行动方案(20232024年)重点支持打造基于国内外芯片和算法的开源通用大模型;支持重点企业持续研发和迭代商用通用大模型;鼓励大模型企业联合生态伙伴加
11、强大模型插件及相关软硬件研发,推动大模型与现有的操作系统、软件、智能硬件打通、互嵌。2023年7月杭州市人民政府办公厅杭州市人民政府办公厅关于加快推进人工智能产业创新发展的实施意见到2025年,基本形成“高算力+强算法+大数据”的产业生态,将我市打造成为全国算力成本洼地、模型输出源地、数据共享高地,人工智能创新应用水平全国领先、国际先进。算力设施先进泛在,算力供给普惠高效,全市可开放算力规模在使用半精度输出输入(FP16)下达到5000千万亿次浮点指令/秒(PFLOPS)以上,高性能算力占比达到60%以上。模型创新应用领跑全国,培育性能达到国际先进水平的通用大模型1个、具有行业重大影响力的专用
12、模型10个。支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型,鼓励相关技术和算法开源开放,形成“1+N+X”的协同创新、双向赋能产业生态。2023年8月成都市经济和成都市加快大模支持企业与科研机构开展数据与知识深度联合学习、大规模信息化局、成都市新经济发展委员会型创新应用推进人工智能产业商质量发展的若干措施认知与推理、可控内容生成等关键算法研发,着力推动大模型相关技术创新,重点研发和迭代CV大模型、NLP大模型、多模态大模型等领域大模型,以及医疗、金融、商务、交通等行业大模型。2023年9月福建省人民政府办公厅福建省人民政府办公厅关于印发福建省促进人工智能产业发展
13、十条措施的通知以普惠算力降低人工智能企业研发成本,支撑快速增长的算力需求,促进自然语言,多模态认知等超大规模智能模型开发训练。2023年10月安徽省人民政府安徽省人民政府关于印发打造通用人工智能产业创新和应用高地若干政策的通知对在皖落户的通用及行业大模型企业、跨领域应用企业、新兴算力企业、安全人工智能企业等,优先匹配算力、数据、场景、基金、场地等要素资源。2023年10月上海市经济和信息化委员会、上海市发展和改革委员会等五部门上海市推动人工智能大模型创新发展若干措施(2023-2025年)实施大模型创新扶持计划。支持引进高水平创新企业,支持本市创新主体打造具有国际竞争力的大模型,鼓励形成数据飞
14、轮,加速模型迭代,对取得重大成果的予以专项奖励。实施大模型示范应用推进计划。重点支持在智能制造、生物医药、集成电路、智能化教育教学、科技金融、设计创意、自动驾驶、机器人、数字政府等领域构建示范应用场景,打造标杆性大模型产品和服务。2023年11月广东省人民政府广东省人民政府关于加快建设通用人工智能产业创新引领地的实施意见围绕基础架构、训练算法、调优对齐、推理部署等环节,研发千亿级参数的人工智能通用大模型,形成自主可控的大模型完整技术体系。聚焦智能经济、智能社会等行业创新场景,研发具有多模态数据、知识深度融合的垂直领域大模型,支撑多任务复杂场景行业应用。制表:报告组根据公开信息整理1.2 Al大
15、模型产业发展技术驱动力近年来,AI大模型得到快速发展,当前大模型热潮主要由语言大模型相关技术引领。语言大模型通过在海量无标注数据上进行大规模预训练,让模型学习大量知识并进行指令微调,从而获得面向多任务的通用求解能力。2017年,Google提出基于自注意力机制的神经网络结构Transformer架构,奠定了大模型预训练算法架构的基础。2018年,OpenAI和Google分别发布了GPT-I与BERT大模型,预训练大模型成为自然语言处理领域的主流。2022年,OPenAl推出ChatGPT,其拥有强大的自然语言交互与生成能力。2023年,OPenAl多模态预训练大模型GPT-4发布,其具备多模
16、态理解与多类型内容生成能力。2024年,OpenAI发布视频生成大模型Sora,提出时空碎片和扩散Transformer技术,大模型的多模态生成能力的进一步成熟。本部分将从经典Transformer架构出发,通过全面梳理基于人类反馈强化学习、指令微调、提示学习等相关大模型技术,体现技术对于产业发展的带动作用。1.2.1 Transformer架构Transformer架构是目前语言大模型采用的主流架构,于2017年由Google提出,其主要思想是通过自注意力机制获取输入序列的全局信息,并将这些信息通过网络层进行传递,TranSfonner架构的优势在于特征提取能力和并行计算效率。Transfo
17、rmer架构主要由输入部分、多层编码器、多层解码器以及输出部分组成。其中,输入部分包括源文本嵌入层、位置编码器;编码器部分由N个编码器层堆叠而成;解码器部分由N个解码器层堆叠而成;输出部分包括线性层和Softmax层。Transformer架构图Nx位置编码输出概率位置编码输入输出(右位移)Nx制图:报告组根据公开信息整理自注意力机制作为TranSfOrnIer模型的核心组件,其允许模型在处理序列数据时,对每个词位置的输入进行加权求和,得到一个全局的上下文表示。在计算自注意力时,模型首先将输入序列进行线性变换,得到Q(查询)、K(键)和V(值)三个向量。然后,通过计算Q和K的点积,并应用Sof
18、tmaX函数,得到每个位置的权重。最后,将权重与V向量相乘,得到自注意力的输出。为提高模型的表达能力,TranSfOnner模型采用了多头自注意力机制,这意味着模型在同一时间关注来自不同表示子空间的注意力信息。多头自注意力的实现方法是将输入序列分成多个组,每个组使用一个独立的权重矩阵进行线性变换,并计算自注意力。最终,自注意力的输出被拼接起来,并通过一个线性层得到最终的输出表示。在计算自注意力和多头自注意力之后,Transformer模型使用前馈神经网络对输入序列进行变换。前馈神经网络由多个全连接层组成,每个全连接层都使用ReLU激活函数。前馈神经网络的作用是对输入序列进行非线性变换,以捕捉更
19、复杂的特征。1.2.2 人1语言大模型关键技术Al语言大模型关键技术主要涉及基于人类反馈强化学习、指令微调、模型提示等相关技术。(1)基于人类反馈强化学习基于人类反馈强化学习(ReinforcementLearningfromHumanFeedback,RLHF),是指将人类标注者引入到大模型的学习过程中,训练与人类偏好对齐的奖励模型,进而有效指导语言大模型的训练,使得模型能够更好地遵循用户意图,生成符合用户偏好的内容。基于人类反馈强化学习具体包括以下几个步骤:D训练监督策略模型:使用监督学习或无监督学习的方法,对一个预训练的语言模型进行训练,通过给予特定奖励或惩罚引导Al模型的行为,使其能够
20、根据给定的输入预测输出或行为。2)训练奖励模型:让标记员参与提供有关模型输出结果的反馈,对模型生成的多个输出或行为的质量或正确性进行排名或评分,这些反馈被转换为奖励信号,用于后续的强化学习过程。3)采用近端策略优化进行强化学习:先通过监督学习策略生成近端策略优化(PPO)模型,经过奖励机制反馈最优结果后,再将结果用于优化和迭代PPO6/37模型参数。具体而言,在PPO模型训练过程中,智能系统通过尝试不同的行为,并根据每个行为获得的奖励来评估其质量,智能系统逐步改进行为策略。基于人类反馈强化学习示意图第二步:训练灵岫慢型第一:果用近婚策略此化遴行强化学习从提示诃敛掘 集中取林一个 受承司取样一小
21、提示 词和强也多个的出散推标记工程 诱蛤出期望的出行为通建住IF学习-0 崩6岁小蓼解强化 学斗数樨林忆工覆 场给出优秀撑 序洲缘奖题情型CD ,位6,小段M特/牝A I B (碑“ XN.Pro嘿至由塔 女初始化DCAB, X DCAB从提示词数据 孽取祥一个新 蛉提示说模里生成一个 情出荚励横st计算 检出奖励值利用Pro猿出 姑合奖勘更新 菱略制图:报告组根据公开信息整理(2)指令微调指令微调(InstructionTuning),是一种帮助语言大模型实现人类语言指令遵循的能力,在零样本设置中泛化到未知任务上的学习方法。指令微调是让语言大模型理解人类指令并按照指令要求完成任务,即在给定指
22、令提示的情况下给出特定的回应。指令微调可被视为有监督微调(SupervisedFine-Tuning,SFT)的一种特殊形式,但两者目标有所差别。SFT是一种使用标记数据对预训练模型进行微调的过程,以便模型能够更好地执行特定任务,而指令微调是一种通过在(指令,输出)对的数据集上进一步训练大型语言模型(LLMS)的过程,以增强LLMs的能力和可控性。指令微调的特殊之处在于其数据集的结构,即由人类指令和期望的输出组成的配对,这种结构使得指令微调专注于让模型理解和遵循人类指令。(3)模型提示通过大规模文本数据预训练之后的语言大模型具备作为通用任务求解器的潜在能力,这些能力在执行特定任务时可能不会显式
23、地展示出来,在大模型输入中设计合适的语言指令提示有助于激发这些能力,称为模型提示技术。典型的模型提示技术包括指令提示和思维链提示。指令提示(InStrUCtiOnPrompt)。OpenAI在GPT-3中首次提出上下文提示,并发现GpT-3在特定领域少样本提示下能够达到人类水平,证明在低资源场景下非常有效。指令提示的核心思想是避免强制语言大模型适应下游任务,而通过提供“提示(Prompt)”来给数据嵌入额外的上下文以重新组织下游任务,使之看起来更像是在语言大模型预训练过程中解决的问题。思维链提示(ChainofThought,CoT)o推理的过程通常涉及多个推论步通过多步推理允许产生可验证的输
24、出,可以提高黑盒模型的可解释性。思维链是一种提示技术,已被广泛用于激发语言大模型的多步推理能力,被鼓励语言大模型生成解决问题的中间推理链,类似于人类使用深思熟虑的过程来执行复杂的任务。在思维链提示中,中间自然语言推理步骤的例子取代少样本提示中的输入,输出对,形成输入,思维链,输出三元组结构。思维链被认为是语言大模型的“涌现能力”,通常只有模型参数规模增大到一定程度后才采用思维链能力。激活语言大模型的思维链能力方法,在提示中给出逐步的推理演示作为推理的条件,每个演示都包含一个问题和一个通向最终答案的推理链。1.3中国Al大模型产业发展市场驱动力中国Al大模型产业发展源于多领域的广泛需求,例如来自
25、办公、制造、金融、医疗、政务等场景中降本增效、生产自动化、降低风险、提高诊断准确率、提高政务服务效率等诉求。相关领域的创新和发展共同推动着中国Al大模型产业的蓬勃发展,预示着未来更广阔的市场前景。1.3.1 办公场景近年来,随着文字、语音、图像等处理能力跃迁,大模型摇身变为“助理”走入办公室和会议室,结合传统软件使得办公和会议智能化。基于大模型的智能办公产品满足日常办公场景中文案生成、PPT美化、数据分析等各种需求。仅通过自然语言交互,用户便可将繁琐的文字、演示、数据处理工作交给“助理”,用节约的时间做更有创意的事情。智能文档负责协助用户构建文章大纲、一键生成模板、生成内容、优化表达、处理和理
26、解文档;智能演示承担自动排版美化、生成演讲备注、一键生成幻灯片等任务;智能表格通过对话即可生成公式、数据批量处理、自动生成表格。智能会议方面,大模型可从会议策划、同声传译、会议记录等各环节赋能。会议策划场景大模型根据会议主题等提示词,自动生成会议环节、会议分论坛、会议时间、会议预算等完整策划内容;在大模型能力加持下,同声传译的准确性、及时性和多语言能力得到显著提升;通过大模型处理后,结构清晰、要点明确的会议记录结果使得会后回顾更加高效。13.2制造场景人工智能崛起引领制造行业的深刻变革,改变研发设计、生产制造、供应链管理等流程。大模型+EDACAECAD,将传统研发设计软件效率进一步提升。大模
27、型助力数字李生和机器人,获得强大的感知场景和执行任务能力。大模型融合供应链管理,实现工厂管理的智能化转型。在研发设计阶段,以大模型+EDA为例,利用云端扩展性实现设计自动化,并确保设计在电气方面准确无误,同时简化系统设计流程,缩短PCB设计周转时间。企业借此缩短研发周期、降低研发成本、提升行业竞争力;生产制造中,利用AIGC和数字李生技术,可模拟真实生产环境派出虚拟人代替工人进行危险、故障排查,或是通过仿真设备操作场景,完成沉浸式作业教学。拥有大模型功能的机器人凭借机器视觉技术,可执行路径规划、物体识别等任务;大模型集成于供应链管理系统中,能重构数字化办公流程,通过自然语言指令实现人机交互,推
28、动企业进行更高效的管理决策、更便捷的数据分析与可视化,在需求端及时预测需求达到降本增效的目的,在仓库和物流端实现智能调度、智能跟踪和智能预警。1.3.3 金融场景金融行业存在前、中和后台的业务划分,在数字经济时代的浪潮中,相关业务已被大模型全局赋能提升效率。以银行为例,对话机器人、虚拟助理已经逐渐出现在个性化服务、电子营销、金融欺诈检测、信贷支持等服务场景中。个性化服务方面,银行大模型以客户数据为依据,为客户提供定制的财务和产品计划;电子营销方面,大模型根据客户行为偏好生成个性化电子邮件;金融欺诈检测方面,大模型赋能专业人员检索大量数据识别欺诈行为;信贷支持方面,大模型通过分析海量生产生活和信
29、用数据,为信贷部门人员生成高质量的信贷方案建议,减少银行贷款收益损失。1.3.4 医疗场景得益于近年来医疗大模型的不断迭代,复杂的医疗数据分析任务得以解决。由于患者行为数据的独特性,大模型通过个性化设计,满足患者“千人千面”的医疗服务需求,应用于智慧影像、智慧手术、智慧健康等领域。智慧影像覆盖CT、MR.DR、US.DSA,锢靶等医疗影像场景,为患者进行早期检测、诊断及健康风险评估;智慧手术功能大幅提高患者病情评价准确度,打牢术前风险评估、术中手术规划、术后预后估计的基础;智慧健康则作为一般患者的贴身健康助手,通过小程序等便捷方式为患者提供高质量导诊服务和个性化健康建议。1.3.5 政务场景在
30、办公、制造、金融、医疗场景得到助力的同时,政务场景下的效率、信息参考范围、经验共享、规范性等常见痛点也获得大模型能力加持得以解决。为提升效率,大模型利用自动化的政策检索、政策比对解决海量政策参考、人工分析比对的耗时问题;为缩小信息参考范围,政策撰写助手结合政策数据权威白名单,并接入政策全量库,避免不可靠信息来源引发舆论风险;为提高政策管理经验共享,大模型引入政策经验知识库,提升政务业务理解和政策管理能力;为规范政策撰写,政务大模型凭借规范化生成、检查功能维护成果的规范性、权威性。第二章百舸争流:中国Al大模型产业现状及典型案例2.1 Al大模型主要特征AI大模型具有泛化性(知识迁移到新领域)、
31、通用性(不局限于特定领域)以及涌现性(产生预料之外的新能力)特征。以ChatGPT为代表的Al大模型因其具有巨量参数和深度网络结构,能学习并理解更多的特征和模式,从而在处理复杂任务时展现强大的自然语言理解、意图识别、推理、内容生成等能力,同时具有通用问题求解能力,被视作通往通用人工智能的重要路径。Al大模型的三大特征:泛化性、通用性、涌现性制图:报告组绘制2.2 Al大模型主要类型按照部署方式划分,AI大模型主要分为云侧大模型和端侧大模型两类。云侧大模型由于部署在云端,其拥有更大的参数规模、更多的算力资源以及海量的数据存储需求等特点;端侧大模型通常部署在手机、PC等终端上,具有参数规模小、本地
32、化运行、隐私保护强等特点。具体而言,云侧大模型分为通用大模型和行业大模型;端侧大模型主要有手机大模型、PC大模型,从云侧大模型来看,通用大模型具有适用性广泛的特征,其训练数据涵盖多个领域,能够处理各种类型的任务,普适性较强。行业大模型具有专业性强的特点,针对特定行业(如金融、医疗、政务等)的需求进行模型训练,因而对特定领域具有更深的业务理解和场景应用能力。从端侧大模型来看,手机和PC大模型由于直接部署在设备终端,让用户体验到更加个性化和便捷的智能体验。AI大模型主要分为云侧大模型和端侧大模型两类云值大模型I仇大”吟慢?制图:报告组根据公开信息整理当前,我国Al大模型产业呈现蓬勃发展的态势。伴随
33、多家科技厂商推出的AI大模型落地商用,各类通用、行业以及端侧大模型已在多个领域取得了显著的成果,如在金融、医疗、政务等领域,AI大模型已成为提升服务质量和效率的重要手段。我国具有代表性的通用AI大模型主要包含科大讯飞的讯飞星火认知大模型、百度公司的文心一言大模型、阿里巴巴的通义千问大模型等;行业AI大模型主要涵盖蜜度的文修大模型、容联云的赤兔大模型、用友的YonGPT大模型;同时具有云侧和端侧大模型的端云结合Al大模型主要有vivo的蓝心大模型;端侧Al大模型主要以蔚来的NOMlGPT大模型为代表。中国Al大模型分类及典型案例类别AI大模型功能AI大模型案例AI通用大模型文本生成、语言理解、知
34、识问答、逻辑推理、数学能力、代码能力、多模态能力等科大讯飞一讯飞星火认知大模型百度公司一文心一言大模型阿里巴巴一通义千问大模型AI行业大模型1 .金融:文档处理、知识问答、内容生成、辅助决策2 .医疗:医学影像生成、知识问答、辅助决策3 .政务:政策检索、知识问答、辅助决策4 .电商:经营分析、商品推广、商品销售5 .传媒:录音转写、新闻写作、视频剪辑蜜度一文修大模型容联云一赤兔大模型用友一YonGPT大模型人民网一“写易”智能创作引擎AI端侧大模型物体识别、语言理解蔚来一NOMlGPTAI端云结合大模型语义搜索、知识问答、文本创作、图片生成、智慧交互等vivo蓝心大模型制图:报告组根据公开信
35、息J恪理2.3 中国Al通用大模型典型案例案例一:科大讯飞一讯飞星火认知大模型(1)大模型简介:讯飞星火认知大模型是科大讯飞推出的新一代认知大模型,可实现基于自然对话方式的用户需求理解与任务执行。讯飞星火从赋能万物互联时代的人机交互、赋能知识学习与内容创作、提升数智化生产力三个方面展现其应用能力。讯飞星火认知大模型具备七大核心能力:文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力。(2)大模型优势:2024年1月,讯飞星火认知大模型V3.5发布,七大核心能力全面提升。据科大讯飞宣称,数学、语言理解超GPT-4Turbo,在代码能力方面已经达到GPT-4TUrbO的96%。
36、另外,星火大模型在多模态理解方面达到GPT-4V的91%,其中语音的多模态能力已经超过GPT-4。讯飞星火认知大模型V3.5七大能力星火认知大模型V3.5七大能力全面提升+4.7%+9S%+9.8%7.6%8.0%ra三7.3%WmB936.6%U9代Im力XgHlH星火窗遢直理*IWMtMSGPTYTurbo,代码aGPT-4Turto96%,MES三M1GPT-4V91%KDBJB三三911BCWBuJEMKAOttMNMD.FJ0BnMBBMQIWflLRMFIMQMJKOSlMCVAK*VlYrnftM11tlttt*fO*nj图片来源:讯飞星火认知大模型V3.5升级发布会讯飞星火认知
37、大模型V3.5从三个角度展示了模型能力的提升,赋能万物互联时代人机交互、赋能知识学习与内容创作、提升数智化生产力。人机交互方面,讯飞星火V3.5在语义理解、指令跟随和多轮对话中展现优异能力,在情绪感知和拟人合成方面也有出色表现;知识学习与内容创作方面,要素抽取、问题生成等底层能力的进步,能够帮助知识学习和内容创作领域,产生更丰富更有用的智能体。讯飞星火大模型能够结合外部知识进行合理拓展,做到“旁征博引”;数智化生产力方面,逻辑推理能力和时空推理能力并重,数学则是大模型的基础能力,而代码能力用于生成各种工具链接虚拟和现实世界,最后多模态能力也是机器人、工业、家庭等场景中必备的能力。讯飞星火V3.
38、5在这些关键技术领域取得显著进步。(3)大模型应用:讯飞星火七大能力的提升,实现了各类应用场景性能升级。语言理解方面,情感分析可以提取文本情感色彩更好了解内容观点和态度。文本摘要总结简洁准16/37确的摘要,快速理解文章的核心观点;文本生成方面,科大讯飞推出可以一键快速自动生成文档和PPT的办公产品讯飞智文,主要功能有文档一键生成、Al撰写助手、多语种文档生成、AI自动配图、多种模板选择、演讲备注等;知识问答方面,讯飞星火对生活常识问答、医学知识问答、政策问答等任务“信手拈来”;逻辑推理方面,思维推理可以通过分析问题的前提条件和假设来推理出答案或解决方案,给出新的想法和见解。科学推理则使用已有
39、的数据和信息进行推断、预测和验证等科学研究中的基本任务;数学能力方面,讯飞星火可以解决方程求解、立体几何、微积分、概率统计等数学问题;代码能力方面,讯飞星火能根据注释、函数名智能生成代码,支持逐行代码注释,还可以精准定位代码语法、逻辑错误,甚至可以智能生成单元测试数据;多模态能力方面,讯飞星火可根据用户上传图片返回准确的图片描述,或完成针对图片素材的问答,还可以凭借用户描述,生成期望的音频和视频。案例二:百度公司一文心一言大模型(1)大模型简介:文心一言是百度研发的人工智能大语言模型产品,具备跨模态、跨语言的深度语义理解与生成能力,在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等众多
40、领域都能为用户提供高质量服务。文心一言拥有四大基础能力:理解能力、生成能力、逻辑能力、记忆能力。(2)大模型优势:2023年10月发布的“文心大模型4.0,相比上一代文心大模型,四大能力显著升级,其中逻辑提升幅度是理解的3倍,记忆提升幅度是理解的2倍。理解能力方面,文心一言能听懂潜台词、复杂句式、专业术语、前后乱序、模糊意图等复杂提示词,也能胜任代码理解与调试任务;生成能力方面,文心一言能快速生成风格多样的文本、代码、图片、图表、视频,比如进行文案创作、制定生活计划、编写高质量代码;逻辑能力方面,文心一言能帮用户解决复杂的逻辑难题、困难的数学计算、重要的职业/生活决策、代码纠错、常识推理、逻辑
41、校验、17/37立体几何、辩论灵感等;记忆能力方面,经过多轮对话后,文心一言依然能记住对话的重点,轻松胜任复杂问题、沉浸体验角色对话。文心大模型4.0的能力提升源自相关举措:(1)在万卡算力上基于飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。(2)通过建设多维数据体系,形成了从数据挖掘、分析、合成、标注到评估闭环,充分提高数据的利用效率,大幅提升模型效果。(3)基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证了模型能够更好地与人类的判断和选择对齐。(4)利用可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。
42、文心大模型40典型特征文心大模型4.0万卡JI力飞桨平台多缰可再生遍维图片来源:百度世界大会(3)大模型应用:文心大模型在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等方面已有应用面向用户开放。文学创作方面,文心一言可以清晰地表达观点、传递情感,因此可以应用于小说、散文、诗歌等文学作品的创作中;文案创作方面,在商业领域,文心一言可以撰写商业计划、市场分析报告等商业文案,提供有力的文字支持。文心一言可以激发创意思维,为广告行业提供新的灵感和想法,可以帮助广告人员快速构思出吸引人的广告文案和宣传语;搜索问答方面,基于文心一言的聊天机器人可以与用户进行自然语言交互,理解用户的意图和需求,并
43、提供相应的回答和建议。这种应用可以广泛应用于生活服务、教育辅导、客服等领域;多模态生成方面,文心大模型支持图像生成和处理,可以根据用户需求生成图像或者对已有图像进行处理编辑。文心大模型还支持语音合成、语音识别和音频分类。文心大模型还能对视频数据进行处理,或将文本转化为动态图像序列完成视频分类、目标检测等任务;数理逻辑推算方面,文心大模型可以解决复杂的数学问题,也可以成为代码编写助手,比如百度基于文心大模型研制了智能代码助手Comate,提供智能推荐、智能生成、智能问答等多种功能,支持多种编程语言和IDEo案例三:阿里巴巴一通义千问大模型(1)大模型简介:通义千问是阿里云研发的预训练语言模型,基
44、于先进的自然语言处理技术(NLP),执行理解、生成和解释人类语言、图片和文档等任务。通义千问能在创意文案、办公助理、学习助手、趣味生活等方面为使用者提供丰富的交互体验。通义千间具备中英文理解、数学推理、代码理解等能力。(2)大模型优势:2023年10月,千亿级参数大模型通义千问2.0发布,相比LO版本,其在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。中英文理解能力是大语言模型理解和表达的基础能力,英语任务中,通义千问2.0的MMLU(伯克利大学、哥伦比亚大学等联合发布)基准得分是82.5。中文任务中,通义千问2.0在模型训练中学习了更多中文语料,在OEVAL(上海
45、交大和清华联合研发的中文大语言模型测试集)基准上获得最高分;数学推理方面,在推理基准测试GSM8K(OpenAI发布的小学数学测试集)中,通义千问排名第二,展示了强大的计算和逻辑推理能力;代码理解方面,HumanEval(OpenAT发布)测试衡量大模型理解和执行代码片段的能力,通义千问排名第三,这一能力是大模型在编程辅助、自动代码修复等场景的基础。(注:得分排名信息均为各榜单2023年10月数据)通义千问2.O参数及指标评测图片来源:阿里云公众号(3)大模型应用:通义千问目前主要应用于四个方向:创意文案、办公助理、学习助手、趣味生活。创意文案应用包括:“撰写营销文案”,输入产品介绍获得量身定
46、制的金牌营销文案。“文章润色”能对用户提交的文章进行深度分析,挖掘其中表达不足之处,提供词汇句式变化建议。“直播带货剧本生成”,基于丰富的商品信息和用户需求,为电商主播提供生动有趣且具有营销力的脚本内容;办公助理应用于:“SWOT分析”为用户提供全面、深入且精准的战略决策支持,从多元视角理解并评估内外部环境对特定项目的影响。“PPT框架生成”,智能地为用户构建专业且逻辑清晰的PpT结构;学习助手应用包含了:”题目加工厂”,根据提供的专业以及学科领域进行高质量试题生成,大大节省了教师、家长以及教育机构在出题上的时间和精力。“学习计划站”可为用户提供个性化、系统化的学习路径规划,定制高效且科学的学
47、习日程安排;趣味生活应用有:“会放飞的菜谱”,输入菜名逐步指导提供美食烹饪秘诀。“AI健身教练”为用户制定专属健身计划。“写歌词”,根据用户提示的歌名写出生动歌词。2.4中国Al行业大模型典型案例案例四:容联云一赤兔大模型(1)大模型简介:赤兔大模型是容联云开发的面向企业应用的垂直行业多层次大语言模型,赋能企业搭建专属智能客服和数智化营销,完成从“降本增效”到“价值创造”的进化。丰富的智能应用为赤兔大模型能力保驾护航,包含会话洞察、业务话术、问答知识库、知识运用、数据分析、智能对话框架、流程管理。(2)大模型优势:赤兔大模型三个核心点分别是智能性、可控性和投产比。智能性方面是客户最关心的,首先能力是否足够丰富,能否解决以前不能解决的问题以及相关能力到底能做多好。智能性方面,包括检索增强、会话分析、逻辑推理、数据分析。检索增强是指在海量文档中快速定位到信息,经过整理给客户提供答案。会话分析能让模型在对话中发现多维度信息,包括情绪、立场、各种细节的意见,并且根据不同业务快