《2024数字科技前沿应用.docx》由会员分享,可在线阅读,更多相关《2024数字科技前沿应用.docx(132页珍藏版)》请在课桌文档上搜索。
1、2024数字科技前沿应用过去一年,我们见证了数字科技的加速度。每个人都身处变革巨浪之中,既对大模型的突破进展无比兴奋,也对未来充满了无限憧憬。新年伊始,眺望未来2-3年的科技趋势。我们正驶向一个由连接衍生交互、由计算催生智能的时代。高性能计算、量子计算、云计算和边缘计算这“四大计算”融汇贯通,正催生全新的计算范式。通用人工智能渐行渐近,大型模型走向多模态,Al智能体可能成为下一代平台,”AI科学家”有望加速问世。全球已达共识,Al治理将引领我们踏上更智慧、更安全的未来。机器人演进加速,灵巧手让人形机器人更敏捷、更像人。Al与生命科学的交融,将帮助我们洞察更多的生命奥秘。我们会进入一个3D、全真
2、在场的新世界。脑机接口不仅在医疗实现突破,正拓展至更多的互动场景。或许不久的将来,我们将亲自见证意识上载从科幻成为现实。手机卫星电话、垂直起降飞机将改变我们的应急方式和出行模式。交通网、信息网、能源网的融合,将推动智能、绿色的能源变革。未来已来,一个充满韧性和重塑的全新时代即将揭开序幕。让我们拥抱变革,共同谱写人类与科技和谐共生的新篇章!Tencentitib力M202620211MMD+自计UJDT5?计算重塑BSKitwn-MII0智能升维aswaAF三A.A,*三数字科技星图鸿DIGITHLTECHHOLOGySTHRCHRRT/沉浸交互R*fil.Mfltt.XXKBK*未来连接城建通
3、7.evo.Ctiaerf?或外侨natt)Xtt3H舄O.,植”“2I.国回鼻灯的i*4*WMRWi.jnaeR.文*为.AtW一二他/、,2-JMGC引CTfBTWl21“二::配:f*Mttfi*!Md4JftttaesnJ,1.WW*l“Z检本wm6VtS10iCM*e一38,Ie1.”三6GWW三IWUI*.-一nfS:巩.三串H串Ge*NItIm83*HflU丽BJSB境BHIfVTL技术影响力KW1B*g技术成熟度B目录一、计算重塑高性能计算的四算聚变”二、智能升维多模态智能体加速AGl进程Al加速人形机器人手、脑“进化Al+基因计算解读生命密码三、沉浸交互数字交互引擎激发超级数
4、字场景脑机接口从医疗突破迈向交互革命沉浸式媒体催生3D在场四、未来连接星地直连通信推动泛在网络覆盖eVTOL加速空中出行奔赴新时代多能流实时协同重塑虚拟电厂高性能计算的I算聚亦”本章节与行业机构光子盒联合研究推出高性能计算的“算聚变”今年,全球各地高性能计算集群迎来向2.0架构(CPUGPU)的升级潮,高性能计算集群、量子计算、云计算和边缘计算的四算融合也成为高算3.0演进的新趋势,衍生新一轮科技探索。高算相关研究机构和企业纷纷加大了在计算单元、存储、网络互联、软件中间件、算法等关键技术上的科研投入以适应新形势,并努力寻找穿越内存墙”的有效路径。未来几年,高性能算力应用将爆发,以人工智能和科学
5、计算模拟为代表的应用算法、软件、以及相关的研究成果和记录将迎来一轮刷新。加之可持续计算的加大投入,高性能计算技术应用发展呈现快演进、重效能的新形势。量超云边高性能计算3.0将以高性能集群为基础,融合量子计算、云原生和边缘高性能,形成并行与分布式一体的计算架构。破墙而出模拟一切处理器、存储和网络等关键硬件技术,正在不断进化、重组甚至 是革新,试图突破现有的性能瓶颈,其中存算一体技术为后冯 诺依曼时代”提供新的发展路径.计算机模拟,因为算力的提升、软件工具的迭代、以及与人工智 能的结合,将成为大语言模型之后、迭代最快的应用发展路径。持续高企的耗能,使得计算能效成为可持续计算的重要指标, 高性能计算
6、各个层面为降耗提效”加紧探索。发展阶段与大事件1.0:CPU为核心计算单元2.0:CPU+GPU成主流3.0:CPU+GPU+QPU异构计算集群2023chronicle of events大事记纠错量子技术实现盈亏平衡点盘古气象模型投入首个RISCV高性能服务器集群交付 最新E级高性能计算机Jupiter开建2月,GoogleQuantumAl团队在自然杂志上发表名为通过扩展表面码逻辑量子比特来抑制量子错误的论文,证明将多个量子比特分组合成为一个逻辑量子比特的纠错方法可以提供更低的容错率,进而证明量子纠错达到盈亏平衡点”,量子计算机将“越纠越对”。这是量子计算发展的重要里程碑,为实现通用计算
7、所需的逻辑错误率指出了新的途径.7月,欧洲中期天气预报中心(ECMWF)发布了4月和7月进行的对比测试报告,将华为盘古气象模型于欧洲数值模型进行了对比.报告显示,盘古气象模型在一系列精度指标上展现出优势,在处理气象学家关心的极端天气预报方面表现出色.其1小时-7天的预测精度均高于传统算法OPeratiOnalIFS,同时预测速度提升IoOOo倍.相关论文也发表在自然杂志.9月,算能与山大共同研发了面向高密度计算和数据中心场景的RISC-V融合服务器集群方案正式交付,这是RISC-V在数据中心的首次商业落地,标志着RISC-V正式迈入高性能计算领域.该集群共有3072核,采用48颗算能科技SG2
8、042RISC-VSoC64核CPU芯片.10月4日,欧洲高性能计算联合组织Eur。HPC启动了欧洲第一台百亿亿级高性能计算机JUPlTER建设.该系统专为科学和M领域的最大可能模拟和人工智能应用而设计,预计2024年推出.aPlTER采用了当前最先进的高性能计算技术方案,包括欧洲自研CPURhea、英伟达GH200、液冷机柜等,此外系统还预留了量子计算和神经形态计算的扩展规划.高性能计算市场趋势(单位 百万美元)60000 oooo 4O0 30000 20000 IO(XX) KKB aM 研 ffiW IQOL55 *杓未来5年,高性能计算传统市场的CAGR将维持在8%,而高算云服务的C
9、AGR将超过18%.合并市场总量预计将在2027年达到592亿美元.数据来源htp!ypenOnrCsearchCQmwp-cq11h)ntUPloads/2023/11/EJoSCChHPCMarkeI-UPdaIe-IntrodUelIOnHyPenOn-ReSearCh-SC23-BrelinQ.DcH冯诺依曼架构下,限制高性能算与T展的“内存墙”越发明显https:/medium.coE/risegb/ai-and-memory-wall-2cb4265cbb8技术热点容错量子计算机RlSe高性能计肾量子计算软件开发工具包集群全柜化连接与测控技术Al+科学计算模拟量子计算飒以器浸没式相
10、变边缘高性能计Jl液冷技术量子云平台近存计理神经形态计黄高性能5服务量超融合分布式高性能计苴NISQ量子存储器硅光集成芯片量子机器学习3年以上23年以上0-1年以上影痢力中等影德力大JK电力大信息与计算科学T集成电路设计与系统T量子信息科技算融台,衍生新技术路径趋势要点7:高算集群、量子计算、云计算和边缘计算 随着高性能计算机群不断引入Web服务和容器化等云计算技术,以及云计算平台开始提供分布式高性能虚拟机服务,两者技术栈开始迅速同化; 传统高性能计算与量子计算的融合,成为未来高性能算力跃升的高潜路径,世界各大研究机构纷纷开展试验; 量子计算系统的扩展引入了集群的思路,量子云平台将成为量子计算
11、软件开发和应用探索的重要基础设施; 高性能、低功耗的芯片技术正在培育高性能边缘计算的基础,云边协同的分布式架构将成为高性能计算未来的典型架构之一。云超同化量超融合量子集群出现、云服务普及高性能计算走向云边协同高性能算力的充分利用,云计算技术的引 入是必要选择。现有高算集群云原生化脚 步进一步加快,如IBM云原生高算VHa, 以及AWS和英伟达联合的PrOjeCt Ceiba;量超融合成为行业共识:通过将计算任务在 量子计算机和高性能集群之间进行分解和调 配,实现量超协同,在大幅节约资源的情况 下,双向发挥量子计算机和超级计算机各自 优势。预计连接两者的量子测控系统将成为 量超融合“三步走”的关
12、键系统之一.量子计算集群出现:IBM公布可扩展量 子计算系统 IBM Quantum System Two,引入模块化架构和计算机集群设 计,可让系统容纳IoOOo个量子比特。另一方面云计算平台对于并行十分布式的 高性能计算方案实践,也展现了进一步释 放现有算力价值的可能.比如谷歌云提出 算力多切片训练”方案,以实现超出一 股高算集群负载的超大规模Al训练。2023年11月,芬兰VTT技术研究中心开放子计Il机. 并通过LUMlfiI8计Jl机遵行访问2023年9月,本海子与上海、郑州机构/公司共丽 造了中Sl营个超融合”先迸计首平台高性能边缘计算(HPEC)成长中:目前 HPEC单点算力可达
13、千万亿次每秒,自动驾 驶和机器人是典型应用场景。除传统计算平 台外,神经形态芯片、光电计算芯片等新技 术的成熟也在不断樨升边缘算力和能效.用M神鳗形态芯片 NorrthPoIe 比相同 副粗的CPU芯片能 物1升25倍,将在 自动驾驶等场景试点.Snapdragon可以运行文生!大 横悭的朝龙8Gen3 很快樗面世.清华大学研发的ACCEL 光电计算芯片在槐嵬Al 任务中,比同用途常规芯 片快三千余偌,能效IS升 四百万余倍.量子云服务普及:这有助于上层软件和 应用的高效研发。全球已有超过20家机 构推出该服务,机构从整机公司(如 IBM),发展到云服务商(如AWS), 再到科研院所(如北京量
14、子院)。云边协同:为获得实时计算决策以及更高的 信息安全环境,将部分数据处理、模型训练 以及推理等工作,从数据中心/云平台迁移 至云边协同架构下,是必要的技术路径.趋势要点2:高性能芯片多元发展,QPU发展由数量转向质量既谷歌和亚马逊,微软、Meta今年先后发布自研高性能芯片;而老牌芯片公司也相继补齐CPU和GPU产品矩阵;同时,ARM和RISC-V芯片1QQOQ在高性能领域的应用探索也在增加,高性能芯片性能之争加剧;冯诺依曼架构的“内存墙越发明显,业界纷纷采用存算一体技术,提升现有芯片性能的同时,研发神经形态计算芯片,探索破墙”之路;-w三-*三WWJ量子比特制备的各条技术路线均有进展,竞争
15、更加激烈;而芯片互联、逻辑量子比特制备等突破,显示量子计算芯片发展开始追求质量和实用。-OO-O芯片技术多元化发展加剧存算一体,突破“内存墙量子比特制备路径之争将更激烈QPU发展从数量到质量众多科技企业纷纷加入高性能芯片大 战的同时,芯片技术的多元化发展进 一步加剧.多条技术路径并迸:超导、离子阱、光量子、 冷原子等路径均有进展,竞争将更激烈.滩软的ARM架构 CPU CobaItIOOMeta RISC-V 架构SoC Al HQ5片英伟达、ImeL AMD等纷纷采用HBM和 LPDDR等内存技术实现近存计算,内存带宽 突破5TBs,算力再提升。AMD MI300X采用英伟达Grace CP
16、U采用192GBHBM3e 内存96OGB LPDDR5X 内存鹿能科技日前向山东 大学交付国内首台 RISC-V服务器集群, 该集群拥有48颗 RISC-V高性他芯片 SG042.QUantInUUm 推出 32?tt 特 GHZ状态的新一代H2离子防量 子计算机.川S三号首次突破255个可控 M国干级量子计算机达成:IBM 发布了 1121量子比特的 Condor 处理器;Atom COmPUting将在24年推出全 球首台超过IOOo量子比特 的中性原子量子计算机.芯片互联出现:IBM发 布133比特具备互联结构 的Heron处理器.这是 国际首次完成芯片互联 的结构,模块化量子计 算机
17、时代即将至悚.位于菊萄牙的高性能 计舞集群DeUCallOn 将采用高士通的 ARM架构高性能芯 片 A64FX.:神经形态计算(Neuromophic Computing) :是后冯诺依曼时代突破内存墙”的重 ;要计算技术路径.受人类大脑原理的启发, :神经形态计算芯片通过存内计算(Compute in Memory)方式,实现高算力的同时实现 ;超低功耗。目前该类芯片尚处研发早期, Intel, IBM,中科院和清华等发布阶段成果.Intel推出名为TUnnelAWS (亚马逊)发布超导量子芯Falls.含有12个娃自度片,提出“主动+被动.纠错方案.子比特的子芯片.专注提升纠错能力.逻辑
18、量子比特制备突破:哈佛大 学、QuEra 、 MIT和NIST/马里 兰大学联合实现在48个逻辑量子 位上执行复杂纠错量子算法.趋势要点3:云原生技术将释放高性能算力潜能,科学计算模拟应用大量增加云原生技术的加快普及,以及虚拟化和容器化技术与传统计算变成平台的结合,将加快Al计算和传统科学计算应用的大规模迁移,高性能算力的潜力将进一步得到释放;.一一一ao人工智能大模型的研发、科学计算应用软件的迁移,以及科学计算建模算法与人工智能技术的结合,将比预计的快许多,科学家和科研团队的生产力将迅速提高,科学研究将迎来快速进步的新形势。云原生技术加快普及科学模拟应用和成就将迎来大爆发更多高算集群尝试LL
19、M训练云平台HPC云服务容器眼努计算平台谷歌云H3, A3GKECUDATPU v5e亚马逊云EC2 UltraCLusterEKSOpenCL微软云NC H100 V5AKSOpenACC英伟达云DGX CloudNCT+IBM云VPCKSOpenMP腾讯云THCCTKESYCL阿里云SCCACKROCm百度云CHPCCCE华为云GACSCCEOneAPI云平台容器服务将加快对高性能计算服务的支持,并进一 步兼容CUDA等并行计算平台,为用户提供高度自动化的 高性能计算工作环境,大大提高研发和实验效率.算力骤增,算法升级:传统高算集群正在迅速的向CPU+ GPU的 计算架构升级,如芬兰的LU
20、MI;同时,全球新建高算集群也如雨 后春笋,如德国的川PlTER和沙特的Condor Galaxy;而云超同 化使各地高性能算力更易访问;此外,许多传统模拟数值算法经 Al技术优化后,性能大幅提升。需求强烈:各国科研团队、企业和研究机构纷纷基于高性能算力展传统高算集群通过加装GPU集群、结合 云平台高性能计算服务得到升级后,将具 备更强的Al加速计算能力,进而可以支 持人工智能大语言模型的训练。 智谱Al的ChatGLM3支持在神威高算 上运行; 芬兰将基于LUMI创建项目LumiLLM, 研制多语言模型,全面覆盖欧洲官方语 言; 美国阿贡国家实验室开始基于Aurora创建ScienceGPT
21、l预计参数数量达到1万亿,将为广泛的科学研究提供帮助.Aurora高算 集群于今年 完成安装, 理论峰值算 力达2E.趋势要点4:业界将加大可持续高性能计算的践行力度 可持续计算,是数字经济和双碳目标背景下,高性能计算技术演进历程中的路标和灯塔,拥有可持续高性能计算的技术,也将成为重要的竞争力; 环境可持续的同时,计算能效将成为评估高性能计算技术先进性的重要指标,存算架构、冷却技术、计算软硬件和供需匹配3条路径将并行展开探索; 机器学习、神经网络等人工智能技术与传统科学计算建模的结合,将有助于大大提升建模效率和模拟精度,进而提高能效;践行可持续的高性能计算计算能效将更受关注追求量子效用”高能效
22、软硬件持续探索更先进冷却技术包括Green500、CCF.以及业界机 构与企业,均采用“浮点运算次数/ 每瓦特(Flops/Watt) m作为能源 效率评估的核心指标.2023年11月Green500排名第一 的是位于美国的Henri高算集群, 能效达到 65.4GFIopsWatt浸没式液冷加快普及更合理的算力供需匹配更高能效的计算软硬件提高计算能效的3个途径英特尔将24 台装有至强处 理器的服务器, 置于一个充满 合成且非导电 油的槽中冷却.清华大学研发出全球首枚亿阻 器存总一体芯片.敏仪为同 类Al用途ASIC的3%以TOP500排名第一的Frontier高算集群为例,其算力可达1.6E
23、FIops,功率可达20兆瓦,相当于近1万户家庭用电水平。据统计,数据中心的耗电量约占全球耗电量的1%,我国2020年占比是2.7%.虽然当前尚无准确的数据中心能耗预测,但急剧增加的人工智能大模型训练等高耗能计算应用,势必会使这个数字继续增加.可持续计算,通常指在设计、建造和使用计算机技术(包括硬件、系统、软件)的过程中,力求实现最大的能源效率和对环境影啕的最小化.世界经济论坛发布(2023十大新兴技术报告,“可持续计算”位列其中.InteLIBM、英伟达等先进计算企业也在不遗余力的践行和推动可持续计算。IBM提出当曷子计茸机能够以超出攀力经典计算方法的规模执行可靠的计算,从而为计算问题提供精
24、确的解决方案时,即能获得量子效用。同时建议基于100多个量子位来探索能获得量子效用的应用案例.传统风冷所需能耗可占数据中心总能耗的20-30%.液冷,特别是浸没式液冷能耗相比风冷低30%以上.同时,利用环境水冷却的水下数据中心也在实验中。高带宽内存:H200采用高带宽内存HBM3e,能耗降至HlOO的一半;超低功耗计算单元:神经形态计算具有超低功耗下实现高算力的潜力,值得持续探索。IBM研发出屋于相变存续器、用于深度学习推理的存算片AlMC.在8位向量计算任务中,能效可达9.76TFIOPSwAl+科学模拟:深势科技团队将机器学习技术与科学模拟相结合,复现了今年戈登贝尔奖获奖实验,而相比获奖方
25、案,复现实验所需资源减少四个数量级,模拟速度提升三个数量级。多模态智能体加速RGl进程r趋势要点J多模态、Agent和端侧多模态川智能体的生成未来生成式Al推动技术迈入了通用Al的门槛,从理解到生成,从感知到决策,人工智能的能力进一步提升。加上多模态、Agent,以及具身智能等方向的持续探索,AI有望完成感知一决策T亍动的闭环。迈入AGl门槛后,Al将有望成为通用目的技术,进而成为新生产力,给全球经济、社会带来全方位的巨大影响。从文本到图像、音视频等更多维度,多模态将推动Al应用的广度;Agem为Al带来手和脚”,大幅拓展应用深度.端侧大模型成为各大硬件厂商重点,有望带来新生态.生成式Al对科
26、学研究的助力日益凸显,“AI科学家有望来临。RLHF和宪法性Al等多种技术和治理方式,持续强化与人类价值的协调,对齐也成为大模型的重要竞争力之一。发展阶段、学科背景、热点方向弱人工智能通用人工智能强人工智能GPT4迈进了AGI的门槛能否进化到下一阶段,存在争议在特定领域协助或主动完成某些任务.如驾驶、医疗对话等领域强于人类.具有可泛化的任务执行能力.可通过图灵测试,让人类误以为是人类,或通过大学考试.明显比人更有智裁,或解决问题能力明显超越人类,翻助解决危害人类的问题.Gartner:生成式Al阜当前炒作顶点AGI分子模拟技术预测行业预测因果Al端侪大模型文生图行业大模型合成数据代码生成文本生
27、成MaaS可解释Al向量数据库多模态西嬲Agent蛋白质生成负责任的AI3年以上23年以上0-1年以1影响力中等影响力大影响力极大420008000殁OoOaao2oo2Q0001*00010.000S1OOO02023chronicleofevents大事记12家中国Al大模型首批备案通过全球高度关注Al治理3月,在ChatGPT发布4个月后,GPT4正式发布,带来新的多模态识图能力演示,回答的准确性相比GPT3.5大幅提升了40%.其人类考试的成绩较GPT3.5大幅提升,达到ToP10%水平.11月6日,OpenAl开发者日发布GPT-4Turbo,允许用户上传资料,生成自定义的智能助理,
28、同时开放应用商店,打造类似APPStore的应用生态.8月31日起,12家大模型陆续通过生成式人工智能服务管理暂行办法备案.北京5家,百度”文心一言:百川智能mSJIP大模型、抖音”云雀、中科院紫东太初、智谙智谙清3;上海3家,商汤商量SenseChatw、MiniMaxABAB大模型、上海人工智能实验室“书生通用大模型”;安徽1家,讯飞”星火;浙江1家,阿里通义干问“;(5)天津1家,360智脑;(6)广东1家,腾讯“混元11月,第二批大模型备案通过”家.至此,国内已形成一批初见水平的Al创业企业,如minimax,智谱、百川、月之暗面(moonshot).11月1日,由英国倡议发起的首届“
29、全球Al安全峰会”在伦敦布莱切利园开幕,布莱切利庄园是二战期间盟军破译密码的主要地点。会议首日,美国、中国、欧盟和大约20个国家共同签詈了布莱切利宣言,重点在于识别人工智能产生的共同关注风险,建立对风险的科学认知,并制定跨国风睑缓解政策.趋势要点7:多模态解析世界的本来面貌,并实现“三生万物”多模态是人类世界的本来样貌,AGl的发展趋势一定是朝向多模态。技术将从单一的文本、图像、视频(2D和3D),再到声、光、电,甚至分子、原子等各类模态,而且具备跨模态迁移的特性。通过设计不同模态对应的解码器,可以实现多模态之间的切换。一IlOOl未来理想的框架是:多模态的对齐和融合+统一的编码器和解码器,可
30、以更好地解决多模态的理解和生成任务。从LLM走向LMM从专业单反到傻瓜相机图读世界超级“变形金刚”多模态大模型百花齐放:BIiP2、InstructBIipxLLaVA.VisuaIGLM.MiniGPT5.VideoLLaMA.ImageBindxMeta-Transformer、GPT4V、Gemini.Pika、Runway.混元、文心一言、ChatGLM,MiniMaX等。多模态具有更突出的优势:带来了更灵活和友好的用户交互。A是一个更完善的任务求解器,可以使用更多样化的任务类型.主要的实现方法:多模态指令、多模态上下文学习、多模态思维、LLM辅助视觉等将LLM(大语言模型)和文生图相
31、结合,让用户可以不必再学习复杂的PrOmOt技巧,直接用日常语言提示,即可生成专业级的图片。这种方式,巧妙地利用了LLM的理解能力,进一步提升了文生图的效果.1讯温元生成图片髀后不知天在水,触酒梦压星河多模态大模型可以实现对图像和视频的理解,包括数量、类型、空间关系、人物、地点、事件、时间序列,以及图像中隐含的信息(如搞笑图、医学诊断等)。GoogleGemini的演示北大联合腾讯提出LangUageBind的多模态预训练框架。用语言作为与其它模态之间的纽带,冻结语言编码器,然后用对比学习方法,将各个模态映射到一个共享的特征空间,实现多模态数据的语义对齐。由香港中文大学多媒体实验室和上海人工智
32、能实验室OPenGVLab联合开发的Meta-TranSfOrTner可以应用于许多应用领域,包括3D识别、夜间安全、天气预报等.趋势要点2:从大脑到AgRnt,大模型从SPiEt副驾,走向主驾驶 Agent是指能够独立思考、自主行动并可以与环境交互的软件程序或机器人等实体.Agent包含三步:PPA,即感知(PerCePtion)规划(PIanning)行动(ACtion)。 人工智能之父、图灵奖得主马文明斯基(MarVinMinSky)在198阵出版了一本里程碑式的著作思维的社会(TheSOCietyofMind),试图解读人类思维这个复杂的过程。MinSkyU为社会中的某些个体经过协商之
33、后可求得问题的解,这些个体就是Agent.Agem应具有社会交互性和智能性。 比尔盖茨撰文,表示AlAgent将是下一个平台,人工智能即将彻底改变人们使用计算机的方式并颠覆软件行业。在不久的将来,任何上网的人都将能够拥有由人工智)OOO能驱动的个人助手,远远超越今天的技术水平.Agen饯展如火如荼LLM+Memory+Planninq+Tool use对话式编程2021-12022 12023-22023-42023-62023-8Time (Year-Month )Figure 1: Illustration of the growth trend on the field of LLM-b
34、ascd autonomous agents. J麻省理工学院(MlT)的研究人员开发出 一种扩散模型一FrameDiff,该模型能 够生成自然界中不存在的新型蛋白质结构。该模型可以生成多达500个氨基酸序 的蛋白质主链,且无需依赖于预训练蛋白 质结构预测网络.趋势要点5.7:价值对齐是大模型的必由之路,将成印产品的核心竞争力 随着大模型,尤其是LLM成为人机交互的新界面,并涌现出强大的推理和内容生成能力,大模型的价值对齐日益成为一个关键问题,即让大模型的能力和行为跟人类(使用者)的价值、伦理原则和真实意图相一致,确保人类与人工智能协作过程中的信任与安全。 业界和研究人员已在探索实现大模型价值
35、对齐的技术和治理措施,诸如人类反馈的强化学习(RLHF)、宪法Al(ConstitutionaIAI),可扩展监督(如Al监督)、模型可解释性等,以构建更加安全可靠且有用的大模型.未来对齐技术的发展,需要更好将人类监督和Al监督结合起来.o-*-*0000-000-RLH F是当前比较有效的对齐技术Al对齐的多种技术和治理措施RLHF包括初始模型训练、收集人类反馈、强化学 习、迭代过程等几个步骤,其核心思路是要求人类 训练员对模型输出内容的适当性进行评估,并基于 收集的人类反馈为强化学习构建奖励信号.训练数据干预可解释、可理解的大模型红队测试基于检索或外部工具的时齐构建价值对齐的专门数据 集。
36、对训练数据进行记录,以 识别是否存在代表性或多 样化不足的问题。对训练数据进行人工或自 动化筛选、检测以识Slk 消除有害偏见.为了实现Al价值对齐,人 们需要理解人工智能如何 作出决策.例如OPenAl利用GPTY来 针对其大语言模型GPT2 的神经网络行为自动化地 撰写解释并对其解释打分; 有研究人员则从机制解释 性(mechanistic interpretability)的角度 来应对Al对齐问题.在模型发布之前邀请内部或外部的专业人员,对横型发起各种对抗攻击,以发现潜在问题并予以解决.将要对齐的价值观保存为 一个外部模块,大模型回 复时需要检索出要对齐的 价值观并作出合适的回复. 通
37、过外部工具(搜索引擎、 代码编译器、计算器等) 辅助回复的生成,以确保 生成内容的真实性.趋势要点5.2:以价值对齐确保人工智能的未来,更好实现科技向善 凝聚行业共识,推动形成大模型价值对齐的技术和伦理指南,总结推广最佳实践。 鼓励开放研究,支持关于Al安全性、公平性、可解释性、价值对齐和其他伦理议题的研究,并鼓励研究者公开其研究结果,促进全球社区协作。 将人类监督和Al监督更好地结合,当下的AI价值对齐工作还面临一个关键问题,即在人类的智能基本保持不变的前提下,随着Al能力持续提升,人类自己对前沿Al模型的有效监督将变得越来越困难。因此,为确保Al安全,需要使我们监控、理解、设计Al模型的能
38、力与模型本身的复杂性同步发展。例如,OPenAl成立超级对齐团队,核心是希望探索利用Al来帮助人类解决比人类强大的Al系统的价值对齐问题。 基于自然反馈对齐的探索:这是更天然的强化学习方式,如传言OPenAl的QK一方面突破了人类数据的限制,可以自己生产海量训练数据,另一方面,模型具备了自主学习和自我改进的能力。governancealignment foundations*Vaue* alignmentsFrontier Model ForumWeB formmg new IrXsUrtry body to promote the safe 3d responsible development of frotf AJ systems: atfvtncing Al safety research. KlentHying best practices and standards, and tMatmg nformtion sharing among PObCyrnaker5 andtt