《2023人工智能行业大模型创新应用白皮书.docx》由会员分享,可在线阅读,更多相关《2023人工智能行业大模型创新应用白皮书.docx(64页珍藏版)》请在课桌文档上搜索。
1、北京市人工智能行业大模型创新应川白皮0(2023年)二o二三年十一月目录一.全妹夫程男於腐整体态必二.国内外大模型行业应用概述(一)DC仆大撵唤行量应用符况I二)我IS/#t型行先应用31Il三.北直市大程壑行亚应用情况1)(一)北京市大模里产业发履情况.iil,I三)大林中行业应用典型寰例2.金融犊城2J,卷象Jf衿阳瑟.,-.国1-*碌*i:里也智里城市。t53(四)北京市大捏型行业应用击炼的报脱59浩四、下一步iSt61id”:TirH打1打工综述作为新一抡科技革命和产业变革的核心引案,人工智能正在为经济社会发展持续注入新动能,今年以来,大横型技术引领着人工智能领域迈入新发展高度,在世界
2、范围内受到广泛关注.大模型对于人工智能厂商和企业用户而言,是一个重要发展机遇.人工智能厂商方面,谷歌、微软、Meta,亚马逊等全球科技巨头将大模型视为重要发展机遇,积极投入并且大动作魏发。我国众多厂商也投身大模型领域,包括百度、阿里、腾讯等互联网大厂,科大讯飞、商汤科技、旷视科技等垂直于Al领域的厂商,以及智诺华章、百川智能,MiniMax等大模型初创企业.市场上也不乏高校、研究机构的身影,清华大学,中国科学院自动化所、北京智源人工智能研究院等发布了各自的大模型成果.企业用户方面,大模型在企业便1的应用速度之快超乎想象.2023年初,企业管理层对大模型的话JS还停曾在大模型是什么,是不是概念炒
3、作.短短半年,大模型已经从饭后谈济走向薄地应用。大企业管理层关于大模型的对话变得比之前复杂很多,他们希望了解到大模型能为企业发展带来哪些变革,大模型的应用路径是什么,如何提升大模型的投济回报率,以及应该为拥抱大模型做哪些准备。而且,大模型吸引的人群位愈发广泛,不仅吸引&爪CTn等技术管理者的关注,(F0、20等非技术类看理者同样期待大模型在业务中发挥价值。这些转变表明,大模型的变革之力正日益得到产业界的认可.从传统行业到高科技行业,从行业黑马到行业龙头,诸多企业开始论证或试点应用大模型,期望在客户运营、软件开发、菅铺推动等领域有所提升,进而靖强市场竟争力。一、全球大模型发展整体态势(一)大模型
4、推动智能寸I3T,打开Al技术发展上网人工智能大模型,是指通过在海量数据上依托强大算力济源济行训练后能完成大星不同下游任务的模型.在技术层面上,大横型的.采用调训练+指今*调+人类反债的强化学习的训练范式。首先通过贪训练技术将深度学习网络在海量数据上进行自监督训练,然后利用指令数据进行有监督指令微调,提升模型对人类指令的迫随能力,最后,基于由人类价值标注数据训练得到的奖励模型所提供的奖励信息进行强化学习,控制大模型的输入符合人类价值判断。在大模型使用时,通过设计提示进行即时学习可以进一步提升大模型完成各类任务的能力.规膜化是使大模型强大的重要原因,研究表明当模型规模足婚大的时候,会涌现智能能力
5、,具备处理新的、更高层次的特征和模式的能力,能舒为一系列下游任务带来更好的任务效果.大模型不断扩大的规模由“量变引发质变,模型通用认知能力不断提升.大模型能力的迅速发展不仅有助于人类完成规定动作,还可能帮助人类去研究和发现未知领域,突破人类过去没有突破过的极限.大模型的技术变革呈现数据巨量化、模型通用化、虚用娥城中心化的特点.整个发晨历程可划分为三个阶段.2013-2018年的深度学习阶段,主要还是基于传统的针对特定任务的专用模型+大量标注数据方式,在监督学习的机制下训练得到一个个专用小模型,但是在词向后的自监督学习中,使用大规模数据进行预训练的方法已初见瑞倪,2017i、AfitrMf的提出
6、为基础架构带来了规横化构势和盘膜化运算的潜力.Tmn也)g鬻决丁RNN和LSTM中许可化训练和长距离依依问JK,解决了CNN的局部归纳偏差问JR,能婚容纳更多的麻数规模,并且具备更强的语义特征提取能力、长更棘征城获能力、综合特征提取能力2018年-2022年的预训练阶段,基于“海量无标注数据。在自监督学习机制下获得预训练大模型,诵过少量标注数据微调后得到领域专用模型.自监督学习机制的成功使得可利用的数据愈发巨置化L从标注数据拓展到无标注数据.Bert胃力汽UI的强训练数h量升大3到S信,成为自然语言理解任务中的条准模型。自此,预训练+微调的学习范式成为主流。在通用大模型上通过少量标注数据微调,
7、即可适用于一系列下磐在存,2022年下半年以来的大语言模型阶段,丘训练大模型的诵用能力愈发强大,引入指今二督训练使得模型能更好地追随人类指令完成各种任务,并提升了在下游任务上的泛化能力,通过人类反馈学习让机器与人类价值对齐成为可肌(二)大模型变革内容生产和技术服务模式,无限生产推动生产效率颠腹式提升内容生产方面,生成式大模型率先在内容创作,图像生成、数字人、游戏等娱乐媒体领域广泛应用,内容生产效率和质量显著提升,内容生产模式从辅助人到“暮代人演变.Gartner雉WI至2023vl20%It容彼七成式七模型所创建:至2025年底,生成丈大模型产生的数据挣占所育敌据的10%技术服务方而,大模型的
8、无限生产能力*塑企业生产引*L*着大模型能力的不新提升,AIAgent成为重要发展趋势,未来,大横型将不仅仅是一种生产工具,更多是作为企业合作者,持续为企业注入生产动能。(一)大模型作为新的根基础设此,庭露Al麓成变*;大模型实现模型生产从作妨式”到流水线的升级.大模型出现以前.。模型是“定制化、场景化的开发方式,针对特定应用场景需求训练一个个小模型,模型难以复用和积累,导致AT落地的高门程、高成本与低效率.大模型实现基础模型底座的标准化开发和泛在化应用,解决成本困境。通用大模型通过从海脑的、多场景、多领域的数据中学习共性知识,成为具有通用性和泛化能力的模型底座.基于通用大模型底座可搭建各行业
9、的垂类大模型,可以有效缩减垂类大模型训练所需要的算力和数据量,缩短模型的开发周期,提升垂直领域的应用开发效率.OpenAI以GPT4J-模型为底座,通过快速增量训练和个性化微调的方式,允许用户通过葡易对话界而自定义定制GPT,支持开发者果用私有数据对GPT进行个性化微司,他大模SI更易于访问和开发,产品形态更加丰富,以满足更广泛的市场需求。(四)中黑是大模型技术领域的主要区啜制%哀棒型市场竟争持续深入2023年5月发布的中国人工曹健大模型Jt图研究报告指出,美国和中国发布的通用大模型总数已占全球发布量的80%,美国方而,形成了ODenAl+微软kMetal谷歌等多个“阵营”,OpenAI市占.
10、图经GPT4底座横型完善上层开龙者生态,Meta而过开源LLaMa等大横型,引镇了全球大模型开源浪潮.及国方而,大模型再次诠择中国速度.发至2023年10月,我国10亿拿款规模以上的大模型厂商及高校Bt所共计254袁,.,汽箔F20余省市/地区.中国工程院院士郑纬民指出,美国作为全球科枝霸主,一直引领人工智能领域发展前沿,整个大模型的产业布局全面领先,在研发能力、人才储备、硬件设施及融资环境方面占据优势,相较而言,中国占据海量数据济源和应用场最优势,但顶尖的AT人才缺乏,在基础理论、原创模型第颠再型、阶沃型技术方面仍缺乏引领能力.产业基础层的整休实力较弱,高质量数据积累不足,在高端慈片、关谯基
11、础软件等领域受制于美国.二、国内外大模型行业应用概述(一)国外大模型行业应用情况美国大模型商业化应用进展全球领先,商业化进展迅it.一是网络、存储等基础设施建设完备,技术发展成熟,为大模型广泛应用打下良好某础。二是具备充足的用于大崔型训练推理的高端芯片,算力充沛。三是大模型技术领先,以OpenAI为代表的大模型公司对美国大横型在全球取得*先地位和广泛落地起到重要推动作用.OPenAl作为全球人工智能顶尖研究机构,以GPT4为底座,为个人、开发者和企业大模型应用持续赋能,其近期推出的GPTStOre为大模型应用带来爆发式增长.据不完全统计.美国大横型应用已经覆盖医疗、金融.房地产、媒体、军*、1
12、候强测等拿域,加微软将GPT4能力集成多office等办公软件中,提高办公效率和用户体歌:惟根士丹利也接入GPT4能力,优化财*管理*也注程:房地产及分Ii曜虹信忆对觎的大模型工具可根据用户提示自动生成房屋图值以及进行房源匹配:报纸出版商Gannett将大横敌集E出版系统中,简化运菅,帮助记者摆脱日常整琐任务、解放生产力。欧盟、英国、加拿大、新加坡、日本、印度等国家和地区的大模型应用尚处于前期尝试阶段,仅个别头部企业开始应用.在英国,会计,法律等行业的国际知名企业在部署大模型.如普华永道已在英国员工测试使用尽职调查.识别合规问题、审批交易等功能,未来将面向全球推广:英国最大律h*务所之一麦克法
13、兰宣布,与法律领域生成式Al企业HarVey达成技术合作,将在法律咨询.法律内容生成/查询、客户服务等领域全而应用生成式AL在日本,7-11,利店将大模型用于产品创意和规划,提升产品研发效率:本田汽车格大模型用于汽车设计.在印度,教育科技企业撒时3:Wm於藤考鼻AlakhAI平台.该平台将施励学生进行小组学习、解决学术和生活问题、提供支持和鼓励,甚至创建个性化的学习计划,1Sl外部分大模4应用案例国家魏条曲.1普密;,:.-43人的模式集成在Hft的多:Word、Excel.“-MnF.Outlook、Teams2023-,-U.二;I,.(LLM)BIoonbertGFT4kiKfltSSv
14、vWiiBJhnX*YA*耳现有仲公融KIPf,例情,-J,名室体IW别.新胡分举Io同等笨.PaIantir劫1工瑞喷下本美国KlTTW11HIT31FftWWHJfftW3tW化后勤保障E理.美国SCaIeAl公司与*(0HfM大学履合研爱HennC、,2丑BI又I工I卜V0j.INIE八-I.LoAMU孑.itrfcU*4.麻将泵IBM和NASANugfin(Face上开源全球,大的地直电同大-PriIhvl.PrithVi由NAM鼻住*4催烫等卫星:Ec敦播.在IHM的ntsox.*i1!用上一训练.微漕而成.PriIhyi主尊用于f测大候壹化.洪水映射.跟踪森林;:OpenAI亡盯七
15、1.%方注雁电皆翌金Uw匿皆M融KqMkBondGPT+开:.UFHealth;M:龄倒意yWTF由期4也J2-4-丹Ail上新技术栗动的AlpUi1上力,-4r,.;:Ll核油之达常年F,J株同望我Hopla田求疝”强M&匿:W盘Hopia寸?英国+疗E叉冗次占魂&OpenAI方症U漏港*据J臬飘点光tasks,国家凄工凡自自喻臬九3FClhaus.F.在*宣J国W备?.设计师可在几秒仲内设计整NIE)传用圣61玄州J船解HX涵电、AJw,L:瓜.:工心妇TfliMlrj工强京廷T-T成置:卧以口日本三,Eleven1.2024I.生物医药.集成电帛.智能化教育教学等笛城构建示范应用场趴m叶
16、依大椁寸产品和服务.广东省2023学m月.广东省发布广东。人艮关于加快Jtibt用人工智能产业创新引领地的实地意见次股项持续加快技术创新场景后用,加袋我术与经济.社会.科学偏域深度融合.打造一批东茶概强.带动性广、显示席高的典型应用场IL号才乐昱创新保济就用人工曾告Mfer打术工件升绩.而俄41术便给和场我解戈互小*#的料堂剑新力.带动升制造、匿疗,教育.金融.科学研究算械歧的发展水LW嘛翌2023年u月.4Ht/*/爱*h!,用人工*产业看和应用高地若干政策,加快智算中心势设,推养大悖型与关H菱心技术欢关.推后全面开放大模电应用场IL在政策指引下,全国各地大模型落地速度加快.北京大模型应用进
17、展全国领先,各领域全面开花.目前,北京大模型已在政务,金融,医疗等领域实现落地,大模型应用氛围浓厚.如北京市计算中心为帮助政协更好适应新时代政协提案工作新要求,开发了大横型相关的政协提案应用.如今,政协提案系统能嵌准确地从多源信息中凝练和关联语义.实现根据工作重点和社会热点丰富提案线索和选题.元保保险基于大模型构建智能客服和智能理赔应用,保险智能客服相较传统机昌人富服问JS解决率提升80露能理赔应用相较之时审核速度提升70%。北京友谊医院引入云如声科技的山海大模型,在内分泌科试点门诊电子病历生成,在医生问诊的过程中,电子病历系统能自动过i无关对话,医生和,息者为口语交流自动转化为标淮化的书面语
18、言,并从非结构化自动梳理为结构化的表述方式,形成电子病历文书初稿,随后经医生审核形成正式的电子病历.其他城市大模型落地以政务示范为主,当地领军企业尝试为辅.广州、深圳、厘门均积极推进大模型在政芬领域的落地,如广州白云区城管局与华为云合作探索华为云价古政芬大模型在城市治理领域的创新应用,并成立政务大模型实验室,对占道经营、垃圾堆积、城中村治理军城市治理典型场景展开探索.深圳福田政府借助华为克古大模型,已经在政府服务、城市治理、政府办公等方面实现政务创新.厦门人社发布了人社/城大语言模型,并应用于鼻门12333序%客服,通过Al智能坐席替代人工坐席完成咨询服务工作.在企业方面,四川领军企业发布长虹
19、大模型智堂家电AI平台“长虹云帆,通过云帆Al平台,用户可以通过语音指令一次性完成多个操作,同时电视还能够根据多维感知技术了解用户的身体信息,并提供相关健康建议.Jj3曰分大模0应用妻倒I城市/她区应用食域应用内容北京市政务In京IIr计算中心为更好支撑。时代政FG案工作斯要求.为政你升支大模型相关的政协提案应用,推出K舞套IiiXit洋育大语宣埠学学依同卷助羊.智能同若勖羊可安现基干法律注DL松关制摩等文次尊搔的基本问善功位,并他才不同来源的文件(看政府我告、政策法婉尊)势行分折、总结,归出大意并均出依据来濂(Ik需用源).并且.智能阿答IA手可以dt大祖母里那W一主U桂字与餐盟文衣(加剧一
20、至腰也情)语义层面相似度分折,再出提要与社情民虫同髓共振的程度.金廉元保基于大模学拘#智能客服和智胡理帖应用,保险tftJ.!口:.据寄刀?:命纵用门能冬涉鼓03#可以享受到健康济长、着暮计划制定、津通计剜Z嚼?L*蒙;I”*F,h,2鼠学介电标就:288HzMfljtftMriM月艮德疗展L文g分析内容生成SWMOItenMm*%*ns*msmaftIHMM*w*mm#害声ImeauM布ItMra分侪eMHMMMffwaMt*nma*WMKHVa*fl*n*BIHtaiNiSBWBM4WHiaAHMMI- 1比京市大模型典型案例应用场景图二是从应用4域着,大模型应用案例百花齐放,破赫产业赋能
21、和金融领域器雾头角.大模型在各个领域中已初步窿箪3北市传统产业威攸和金IHlJt应用爱展故快.具体面言,传统产业赋能领域有产业知识问答、图文生成、软件开发、智能机器人、智能工业就检等应用.金融领域有智能投研助理、智能客服、智能保险问答、信用偿侪能力审查等应用.政务领域有政芬问答,市民热线数据分析、公文写作与润色等应用.医疗领域有影像诊疗、生成电子病历、智能医药问答等应用.文化旅游领域有写作助手,如识检索、教学威量评估等应用.智堂城市辆域有城市交通规划、智能指标分析,空问感知、社会行为分析等应用.传统产业赋能和金融领域应用发展较快的主要原因在于央国企较为密集,它们具有栽强的数据某础设施、算力投入
22、和AI应用某础,同时有较强意愿自上而下推进大模型应用.三是从应用类型看,大模型在内容生成和智能问答两方面应用类型最为成熟.目前,大模型主要有内容生成.智能问答、IT支持、效务分析、售能识别和包能硬件等六个应用类型。其中,大模型在内容生成和智能问答两个方面的应用类型最为成熟.具体而言,内容生成不局限于生成文字报告,物依+2D/3D图片、视,、音发的生成.智位问善则包括Ifi向内部使用的智能知识库和面向外部的智能客服.大模型在内容生成和智能问答两方面应用类型最为成熟主要原因在于这两个应用类型具备降本增效显著、业务价值易衡量、落地速度快等优势,便于企业管理层快速看到大模型价值,达成进一步应用的共识.
23、四是从商业横式看,大模型已形成基础+行业+应用三屋架构.大模星商业横式形成了以通用大模型H*留邑主的基础层、以垂直行业领域Al服务为主的行业层和以大模型应用服务为主的应用层.三层服务相互促i,你同优化,共同支律产业转化和发展.基础层以MaaS(Model-as-a-service,模型即服亦)为商业变现接口,为下游应用提供安全、高效、低成本的模型使用与开发支持,助力低门椎.高效率的大模型复用和优化行业层可以结合自身业务和技术能力利用通用大模型底座的通用共识能力,开发具备领域特性的行业大模型,强化大模型在行业细分领域的专项能力,推动大模型在不同领域的快速落地应用.应用层则将基础层和行业层提供的大
24、模型能力赋能点至重塑上层应用结合,为用户提供更卓越的体验.2R脸4,(三)大模型行业应用典型案例围绕创新性,示范性、经济与社会效益性,可推广性等四个维度,选取IR个各自领域内的典型案例,呈现如下.,J;4*t*侧注传卅标评估指标用标破甯创折神应用的内容.模式、方奏具有胡折怪,运用了先进的技术或工理了关修技大的突破与创新.示范性P用*例具有B芥的应用1果.对同类学场U可提供表单与经验修筝、具有袋径的示械通义.船我忑注心骚鼓应用美知有机会产生可观的经济价值与社会价值,对场景业备先书.产业左网,社Z先/具有带动住声作(H.、,q虢T低应用里倒中的。用内K.0式、方1.技术等,上有我强的可迁移性与可复
25、制性,应用空间广阔,可以向更多场景进行It广.1.政务领域政务领域作为社会服务的核心,其业务背景包含庞大的政府数据、多元的社会信息,以及复杂的决策体系.然而,政务工作面临着庞大数据的低效处理、信息碎片化导致的决策滞后等痛点,不仅影响了政府工作效能,也直接关系到居民的体险和幸福感.领域痛点立足政务领域,梳理当前信息化、数字化解决不了或解决不好的共性篇点.一是政府数据的分散与庞杂对信息处理提出了更高要求,政务信息处理效率低下将直接影响到政府讨居民的服务质量.二是多源信息碎片化使得政府对社会状况、居民需求的把握难度加大,难以提供个性化和针对性的服务。三是决策滞后问题会影响政府在问题应对的及时性,拉长
26、了政务办事的周期,进而影响居民满意度.四是业务人员撰写公文和政策眇时伊力,工作效率有待提升.解决方案为解决这些问题,大模型技术的应用显得尤为迫切.大模型通过自动化处理庞大数据.提高政务信息的处理效率,从而优化服务流程,提升居民的服务体验通过深度学习等技术,大模型能够更全面、精准地理解多元信息,为政府提供更个性化、实时的决策支持,提高居民满意度.大模型的引入有望通过智能决策系统,使政府在问题应对上更具迅速反应能力,提升服务的及时性和质量.直接建强居民的幸福感.同时,大模型在公务员的公文和政策撰写上也能提高效率,减轻工作能担,使其更专注于重要的决策和问题解决上.政务领域大模型应用特点大模型在语义理
27、解与内容生成等方面的能力,在政务领域具有较为广阔的应用前景.问卷、生成、润色、纠借是政务领域主要应用方向,除此之外,企业开拓了更多新的应用领域,如税企沟诵、小微企业合同生成审杳,法院阅卷辅助等,给政务领域业务专家提供了更多思路和启发。政务领域大模型短期内难以具备直接面向公众提供精准政务问答的能力.政务问卷对淮确度要求极高,一旦生成错误的答案,将给工作人员带来额外的解释成本,这种风险尤其存在于审批和执法过程中.对问题理解有误、生成内容不准确、关联政策信息过时等问题普遍存在,大模型的幻觉问题短期内难以存到显著改善,尚不具备面向公众提供精准政务问答的能力.短期内在政务领域落地应用方向主要是面向政芬工
28、作人员内部使用.案例#1:瑞莱智蕙基于行业大模型打造政策撰写助手,显著提升政策制定效率a政策制定是一个高度专业,规范、产遂、多样,涉及多环节决策的过程.当前,政策制定场景存在四项痛点.一是效率痛点.找政策时从海量政策中找到参考,并由人工整理、分析,比对,耗时唐力:写政策时缺乏辅助撰写工具帮助提升效率。二是信息参考范围痛点.目前在广域范围中寻找参考,依施人工和公域搜索弓IiL可能存在不可象的信息来:除政策之外的数据资源,如企业数据,尚未打通。三是经验共享痛点.政策管理经验需要共享,对于业务的理解需要固化,从而让更多人可以快速上手并具备政策管理能力。四是规范性痛点.政策缺乏统一的规范,存在冲突、重
29、复、要素缺失等问题,限制了政策的服务效果C北京市政务服务管理局为实现全市政策支撑体系的一体化,希望通过行业大模型等前沿技术,优化政策分析与撰写业务流程.解决方集北京瑞莱智篁科技有限公司打话基于行业大模型的政策授写助手,通过大模型辅助的政策携写工具,帮助政策制定人员提升效率.扩大参考面、逐渐固化知识经验、提升规范性,从而最终提升政策的管理水平,促进政府治理流程优化和模式创新.针对北京市政务服芬管理局的四项痛点,瑞莱智悲设计了以下功能.一是面对效率痛点,引入政策检索、政策分析、政策撰写等自动化工具,辅助人员进行政策对比分析,政策撰写工作,大幅度提升工作效率a二是面对信息参考范围痛点,引入政策数据权
30、威白名单,限定数据范围,政策携写助手接入清洗、打标后、元信息完整的政策全量库,并接入权威来源的新闻、政策解读、市场等信息数据.三是面对经验共享痛点,引入“专业字典”“草稿箱等人机交互产品功能,将专家经验嵌入大模型应用流程,做到经验可使用、可维护、可共享.四是面对规范性痛点,引入政策规荒化生成与检查的智能体(Agent),使大模型暴写政策HaI循规范体例,并嵌入标准化的政策规范检查功能.项目成果项目取得三项成果.一是在政策检索任务上,可靠领域检索可以减少验证数据来源的工作,提升效率.二是在政策分析任务上,通过大横型辅助理解、辅助对比分析,可以大幅度提升政策分析的效率.三是在政策撰写任务上,大模型
31、辅助生成可以近乎实时的完成每个版本初稿。整体来说,在效率提升方面效果显著.案例#2:度推出智能校对镀城大语言模型一安度文修,实现高效智能化文本审校,fflL移动互联网为信息生产提供了极大的便利条件,用户可以l时随地生产内容,但同时也加速了信息传播的广度、深唐和速度,一旦有不准确、不合规或不合法的信息产生,便会迅在全阈爱IL引发奥晚风险.焦第按综合*务中心运营微博、公众号等多个新媒体账号,团队成员日常管理工作任务繁重、每天要发布几十篇稿件,如何能骆既保障发布时效性,又确保发布内容的准确性和安全性,成为新媒体中心必须要攻克的难题.因此,以人工智能为技术我体的技术解决方案成为政务机构审核内容必不可少的手段.解决方案北京蜜度信息技术有限公司推出文件大模型,该模型诵过运用高府量数据学习多种特色子任务,使用千亿级token,通过对新闻政务领域和多领域公开文本的大规模自动学习,让机器发现典型的语言规律,更现对文本的智能校对处理,自动发现其中潜在的错别字、常识错误、时政表述差错等问题,能够更进一步提升中文校对和润色能力的智能化程度.文修大语言模型搭栽在密度已有产品“校对通中,为客户提供更智能化的审校