《2023算力行业深度之“云基建”:AI浪潮持续催化云端配套升级加速.docx》由会员分享,可在线阅读,更多相关《2023算力行业深度之“云基建”:AI浪潮持续催化云端配套升级加速.docx(85页珍藏版)》请在课桌文档上搜索。
1、算力行业深度之“云基建”浪潮持续催化,云端配套升级加速目录大模型引领Al商业化,轻量应用价值亦凸显7Al行情持续催化,结构布局机会仍佳11存力算力封力三位一体,产业链再迎新机遇13算力需求高速增长,国产Al芯片正当时14DDR5渗透率盼加速,HBM助推AI笄力突破存力瓶颈19新平台推动PCB放量24投资建议28风险提示29寒武纪U30海光信息39通富微电46朗科科技54德明利61工业富联69图表目录图表L不同平台用户数破亿所需时间7图表2.全球数据总量增长情况7图表3.人工智能逐步商业化落地7图表4.AI大模型参数指数级增长8图表5.算力需求加速提升8图表6.国内外主要大模型参数量8图表7.A
2、I大模型从云到端发展趋势9图表8.谷歌发布“小参数”Al模型9图表9Chatgpt发布以来Al算力指数显著增长(截至2023.7.5)11图表10.WilldAl算力指数(8841678.WI)成分股明细11图表ILAl算力主要龙头业绩表现(收盘价及对应市值截至2023年6月30日,涨跌幅区间为2023.1.1-2023.6.30)12图表12.全球服务器出货量预测13图表13.全球Al服务器出货量预测13图表14.普通服务器和Al服务器配置对比13图表15.重视以服务器为基石的云基础设施产业链投资机遇14图表16.全球Al芯片市场规模14图表17.2022年全球独立GPU市场份额15图表18
3、.NVIDIAGH200Superchip16图表19.AMDInstinctMI300加速卡16图表20.壁仞科技BRlOO系列通用GPU芯片16图表21.曦云通用计算GPU16图表22.国内GPU、Al加速芯片产品械理及与国外GPU产品对比17图表23.边缘计算示意图18图表24.高通Al“端”的应用解决方案18图表25.高通QCS8550/QCM8550支持伙伴18图表26.英伟达JetSOIl模组19图表27.英伟达JetSOn软件路线图19图表28.瑞芯微边缘SOC产品矩阵19图表29.全志科技边缘SOC产品矩阵19图表30.全球服务器存储市场规模预测20图表3LDDR发展趋势20图
4、表32.全球SerVer和PCDDR5渗透率快速提升21图表33.DDR5PMIC芯片21图表34.HBM2014-2022年发展历程21图表35.HBM市占率预测22图表36海力士HBM内存迭代22图表37.应用于主流GPU的HBM内存技术持续升级22图表38.英伟达GH200内存互联23图表39.DGX系列显存指数级增长23图表40.2022-2026EHBM市场规模预测情况23图表41.SK海力士基于CXL的高性能计算存储解决方案24图表42.2022-2027全球PCB市场产值及增长率预测24图表43.2021-2026年多层板产值CAGR预测24图表44.英伟达144个GPU核心25
5、图表45.浪潮NF5280G7结构图25图表46.英伟达DGXGH200超级芯片架构25图表47.平台服务器线宽变化26图表48.平台服务器线宽示意图26图表49.联茂电子高速材料体系26图表50.18层以上多层板价值量明显提升26图表51.全球服务器PCB市场规模预测27图表52.2022-2026年全球车用PCB产值预估27图表53.公司估值28图表54.寒武纪主要产品和服务31图表55.行歌科技发展历程32图表56.寒武纪主营业务收入和毛利率32图表57,2022年各云端厂商AI服务器采购量占比32图表58.全球Al服务器出货量预测32图表59.通用服务器和Al服务器配置差距33图表60
6、.人工智能厂商的Al芯片性能对比33图表6L乘用车自动驾驶定义34图表62.全球和中国自动驾驶乘用车销量预估34图表63.寒武纪自动驾驶SoCSD5223C产品规格35图表64.寒武纪营业收入和毛利泗预估36图表65.寒武纪可比公司估值36图表66.海光信息产品矩阵40图表67.全球服务器销量预估41图表68,2020年全球X86服务器市场份额41图表69.中国X86服务器销量预估41图表70.中国X86服务器芯片销量预估41图表71.海光信息的CPU产品和同行性能对比42图表72.海光信息的CPU产品和英特尔定位对比42图表73.海光信息的GPGPU产品和同行性能对比42图表74.海光信息营
7、业收入和毛利润预估43图表75,同行可比公司估值44图表76.2022年通富微电为全球第四大委外封测商47图表77.通富微电股权结构图47图表78.通富微电营收逐年增长48图表79.通富微电在中国半导体封测行业中规模成长最快48图表80.通富微电持续扩大研发投入48图表81.通富微电在HPC领域积累深厚49图表82.AMD全线产品已采用ChiPIet设计49图表83.2.5D封装技术原理示意49图表84.先进封装带动封装环节价值量提升50图表85.通富微电盈利预测51图表86.通富微电可比公司估值51图表87.朗科科技发展历程55图表88.朗科科技主要产品55图表89.公司股权结构(截至202
8、3年3月31日)56图表90.朗科科技营收情况56图表91.朗科科技各产品营收占比情况56图表92.朗科科技盈利能力情况57图表93.朗科科技各产品毛利率情况57图表94.朗科科技期间费用率情况57图表95.朗科科技归母净利润情况57图表96.朗科科技盈利预测58图表97.朗科科技可比公司估值59图表98.德明利发展历史62图表99.德明利主要产品63图表100.德明利股权结构(截至2023一季报)63图表101.德明利营收情况64图表102.德明利各产品营收占比情况64图表103.德明利盈利能力情况64图表104.德明利各产品毛利率情况64图表105.德明利费用率情况65图表106.德明利归
9、母净利润情况65图表107.盈利模式65图表108.德明利盈利预测66图表109.德明利可比公司估值67图表110.工业富联大事记70图表111.工业富联主要产品70图表112.工业富联公司股权结构70图表113.工业富联营收情况71图表114.工业富联各产品营收占比情况71图表115.工业富联盈利能力情况71图表116.工业富联各产品毛利率情况()71图表117.工业富联期间费用率情况72图表118.工业富联归母净利泗情况72图表119.工业富联全球化布局72图表120.工业富联实施2+2战略布局73图表121.工业富联研发能力73图表122.工业富联盈利预测74图表123.工业富联可比公司
10、估值74大模型引领Al商业化,轻量应用价值亦凸显2022年11月3()日,美国人工智能研究公司OPenAl正式发布全球嘱目的人工智能聊天机器人ChatGPTo该技术的推出轰动了全球,仅仅5天的时间,ChatGPT的注册用户数量就突破了100万大关,到了2023年1月末,ChaIGPT的月活跃用户数突破了1亿,成为了历史上增长最快的消费者应用之一。这一突破性的成就使得ChatGPT为代表的人工智能聊天机器人,将全球带入了一场前所未有的科技革命,标志着智能时代正式拉开帷幕,人工智能从技术升级开始向商业化落地迅速演进。英伟达创始人黄仁勋则形容这一时刻为AI领域的iPhone”时刻。二十一世纪被称为信
11、息时代。各种新兴技术如人工智能、机器学习、区块链、5G和物联网等,每时每刻都在产生海量的数据,并将这些数据应用于人们日常生活的各个领域。数据已经成为继土地、劳动力、资本和技术之后的第五大生产力要素。根据IDC预计,2021年全球数据总量达到85ZB,并将在2025年达到175ZB,CAGR达到约20%,庞大的数据为Al模型的诞生孕育了肥沃的土塘。图表1.不同在用f数破亿所需时间图表2.全球数据总量增长情况资料来源:格隆汇,中银证券资料来源:IDC,中银证券人工智能正逐渐走进我们的日常生活,与人们的生活越来越密切地联系在一起。而这一切的基础是数据和算力。数据的丰富和高效的算力,为人工智能的快速发
12、展和商业应用提供了坚实的支持。在人工智能的浪潮中,数据被盼为“新的石油”,而强大的算力则是推动Al技术腾飞的引擎。图表3.人工智能逐步商业化落地技人升煤险段为北落地除收场号爆发价收及件龙头主导攻件和算法快M法速修代模曳应用均录算力突破阳值,下游客求号动上游及件客求量大爆发同时规模化效应推动良本快速下降模型成熟叵头包i桁商先化落地变现应用场景如总客求仝面爆发资料来源:中银证券整理OpenAI在从GPT-2模型升级到GPT-3模型时,其参数数量从15亿增长至1750亿级别。随着参数规模的增大,算力负担也相应增加。如果要在更短的时间内运行更大的模型,就必须进一步增加算力。在可预见的未来,算力将成为各
13、大AI企业必须提升的关键技术能力。只有拥有足够的算力,才能支持更复杂、更庞大的人工智能模型,使其能够在实际应用中发挥更高的效能。AI企业将不断探索和投资于新的计算技术,以确保其在竞争激烈的市场中保持领先地位。同时,算力的提升也将推动着人工智能技术的不断进步。更强大的算力意味着更复杂的模型和更深层次的学习,这将有助于改善人工智能系统的性能和智能化水平。因此,算力的不断增强不仅是Al企业的必然需求,也是人工智能技术发展的驱动力。图表4. AI大模型参数指数级增长图表5.算力需求加速提升资料来源:CSDNf中银证券(2二群小纠骅资料来源:物多美网智库,中银证券海外主要大模型包括OPenAl的Chat
14、GPT-3、Anthropic的Claude、英伟达与微软的MegatronTUring-NLG以及Meta的OPT等。中国大模型主要包括百度文心、华为宜古、阿里通义、腾讯混云以及商汤的视觉模型等。百度推出文心大模型,基本实现跨模态和多下游多领域的应用,目前已上线文心一言。腾讯主要通过多模态解决语言理解与图像生成的问题。图表6.国内外主要大模型参数量厂商预训练模型应用参数量域BERT语言理解与生成4,810亿NLP谷歌PaLM语言理解与生成,推理、代码生成5,400亿NLPImagen语言理解与图像生成110亿多模态Parti语言理解与图像生成200亿多模态微软Florence数据额识别6.4
15、亿CVTuring-NLG语言理解、生成170亿NLPMetaOPT-175B语言模型1,750亿NLPM2M-100I(X)种语言互译150亿NLPGaio多面手的智能体12亿NLPDeepMindGopher语言理解与生成2,800亿多模态GPT3语含理解与生成、推理等1,750亿NLPCodex代妈生成120亿NLP英伟达文心一言文本理解与创作2,6(X)亿NLPERNIE-ViLG2.0语言理解与图像生成多模态华为(盘古)CV大模型视觉识别30亿CV科学计算大模型气象预测科学计算阿里通义-AIiCeMind文本理解与创作270亿NLP通义-彳见觉视觉识别CV月年讯混元Al大模型语言理解
16、和图像生成1,000亿多模在多模态大模型迈向商业化的同时,边缘级轻量化应用亦凸显价值。随着深度学习模型在各个领域的广泛应用,算力的消耗需要足够的硬件支持才得以运行。对于如何将大型模型轻量化部署到端测设备以及如何在小数据领域进行轻量化微调亦成为业界关注的焦点。一方面,在云端运行Al大模型,成本往往极高,受众较少。另一方面,如果能在本地运行,将带来如隐私保护等诸多优势。自ChatGPT发布以来,业内正对边缘级轻量化应用进行持续探索。图表7.AI大模型从云到端发展是势t*lr odr4d * M JL 附 MaM DUTZoa 时 UM2t(r* M1,让“ 欢岸”不为色.petltNsMCiUtG
17、fM .UT. 0 HILHHaHfWAiC类俵域It /13 MKMSk 今6.4JHf- IIn 9).*1. C催/卬X 曜(1上号力三人.中*+223H娄伟达*WMM”2W4S月2日I41为大帽拿.小J发模里*rttf;aJhh2DAtKlJe%看先御丹ONiiaSR,仿人4*4h.人Xy人来月1,1m.资料来源:中银证券整理以谷歌PaLM2为例,2023年5月11日,谷歌发布全球首个支持边缘端的大模型PaLM2,开启了从云到端的终端交互革命。谷歌在大语言模型的小型化上,取得了非常重要的进步。而且在谷歌1/O大会上,还同时发布了4个参数更少的模型。其中最小的一款模型Gecko(壁虎),
18、甚至可以在智能手机上运行。我们认为轻量化应用将直击大模型训练成本高昂的痛点,配合特定行业场景以及参数调优,端侧的应用将为Al商业化带来更广阈的空间。图表8.谷歌发布“小参数”Al模型替料耒源:googlePaLM发布会,澎湃新闻,中银证券7月20日,2023世界半导体大会开幕式在南京举行,中国工程院院士倪光南发表主题演讲。他提供了一组数据:中国单位GDP的数据存储量只有美国70%左右,而人均数据存储量,美国是中国的9倍。美国为212GB/人,中国约为25GB/人。从闪存占比看,全球是41.3%,美国是56.4%,而中国只有20.3%。因此,倪光南建议通过政策引导力推SSD(固态硬盘)取代HDD
19、(机械硬盘)。中国新型半导体存储产业链相对完整。上游芯片方面,NANDFlaSh领域有长江存储;DRAM有长盆。闪存主控芯片方面生产厂商较多;NANDFlaSh存储芯片的核心设备刻蚀机方面,中微公司的刻蚀机已经突破5nm工艺,达到国际领先水平。生产SSD主控芯片和DRAM的光刻机工艺为1228nm,不需要EUV光刻机,“卡脖子”风险较低。Al行情持续催化,结构布局机会仍佳自ChatGPT正式发布以来,国内国际市场Al算力投资均表现亮眼。国际方面,步入2023以来英伟达作为AI算力龙头股价一路走高,累计最大涨幅逾160%。5月24日英伟达交出亮眼财报,FY1Q24实现收入71.92亿美元(YOY
20、-13%,QOQ+19%),公司指引,FY1Q24公司数据中心业务达到42.8亿美元,创历史新高。展望2024财年第二季度,公司预计收入将达到110亿美元,大超市场预期。受此催化影响,英伟达市值一度上破万亿美元大关,成为全球首家市值达到1万亿美元的芯片制造商,市值在5个月内暴增6300亿美元。国内方面,我们选取WindAl算力指数(8841678.WI)作为参考,该指数共含等成分股51支。2023年1-4月,AI算力指数走势整体与英伟达走势趋同,并于4月20日达到最大累计涨幅71.53%,而同期沪深300指数区间累计涨幅仅为6.88%,Al算力指数超额收益大幅跑羸市场。5月以来宏观经济弱复苏,
21、受此影响板块迎来分化调整,我们认为Al算力板块目前正处于分化调整阶段,伴随经济基本面的边际改善以及政策面的持埃推出,Al算力板块有望再度迎来布局良机。图表9.Chatgpt发布以来Al算力指数显著增长(截至2023.7.5)122H102H42H22H-ISHAl算力相数-行情图2023年5H29日,英伟达发布GH200理纵202345用25H.英伟达FY241Q24财报大题候斯火大根暨发布2023年3月14日.ChatGPT4发布2023年3月27日.百度“文心一方”上煤2023年2月23H.关伟达公布23FY财报2023年1月末.ChatGPT打破TikTok保持的9个月用户数破亿的记录.
22、32个月用户数破亿.成为史上刖户数增长最快的洸伸者应用.2022年11月30日.ChatGPT3.5正式发/J%衰涔*5次&J耍;AI*X达(NViDlA)资料来源:wind,中银证券图表10.windAI算力指数(8841678.WI)成分股明细序号股票名称序号股票名称序号设票名称序号设票名称序号股票名称1中国长城Il南兴股份21依米康31立昂技术41中科曙光2常上北明12英维克22初灵信息32富瀚微42数据港3紫光股份13赛为智能23中际旭创33奥飞数据43佳力图4浪潮信息14天源迪科24涧和软件34首都在线44海光信息5智微智能15中青宝25光环新网35铜牛信息45龙芯中科6通富徼电16
23、欧比特26天孚通信36同方股份46优刻得-W7证通电子17科泰电源27泗泽科技37云赛智联47开普云8拓维信息18东方国信28高伟达38浙大网新48耒武纪-U9光迅科技19东软载波29景嘉微39宝信软件49青云科技-U10天娱数科20天讥科技30新易盛40工业富联50芯原股份51云创数据资料来源:Wind,中银i正券个股方面,我们选取了16家有代表性的AI算力龙头公司,覆盖包括芯片,内存,PCB,服务器代工以及数据中心配套建设。极至2023年6月3()日,16家公司平均涨幅为56.63%,其中涨幅最高的是寒武纪,区间累计涨幅达244.57%,这也反映了算力需求下高性能芯片的重要性;受全球个人电
24、脑及服务器市场景气度下滑、内存接口芯片起量不及预期等因素,澜起科技、聚辰股份表现欠佳,区间分别下跌8.27%,30.20%OPCB方面表现较为分化,与各家产品结构有关:工业富联作为服务器代工龙头,股价亦有近翻倍表现。此外,液冷作为数据中心低能耗日趋严苛下的必由之路,高澜股份、申菱环境、英维克等亦有亮眼的表现。图表ILAI算力主要龙头业绩表现(收盘价及对应市值截至2023年6月30日,涨跌幅区间为2023.Ll2023630)股票名称4V收盘价总市值年初至今PEPS(亿元)派跌幅2023E2024E2023E2024E寒武纪688256.SH188.00783.20244.57%-72.8749
25、.66海光信息688041.SH68.271,586.8370.25%121.8983.7821.311535CEU+UEU龙芯中科688047.SH114.79460.3134.34%247.66122.6128.1117.65景嘉微300474.SZ89.99409.6165.15%100.3071.0223.5116.94内存澜起科技6888.SH57.42653.07-8.27%54.1232.8316.4010.54聚辰股份688123.SH53.7284.72-30.20%16.2812.116.264.64沪电股份002463.SZ20.94398.9277.06%24.2619
26、.174.093.36鹏鼎控股002938.SZ24.29563.63-8.97%10.909.371.381.22PCB深南电路002916.SZ75.37386.565.82%20.9117.222.452.12生读电子688183.SH12.10l.6532.02%27.5120.252.582.22兴森科技002436.SZ15.50261.8860.96%47.1434.263.882.92胜宏科技300476.SZ24.11207.9988.24%21.9517.542.201.83服务器代工工业富联60I138.SH25.205,006.35174.51%21.0418.650.
27、870.77英维克OO2837.SZ29.94169.1517.49%43.4031.934.153.08服务器配套申菱环境301018.SZ35.9995.225.64%31.7622.212.772.02高澜股份300499.SZ17.6254.3877.44%47.0729.394.232.80平均值53.33701.4056.63%55.7536.1612.328.57资料来源:WEd,中银证卷存力算力封力三位一体,产业链再迎新机遇AIGC有望拉动全球云或件需求增长,服务器则是Al算力的核心。由于全球经济疲软及通胀等因素,IDC预计全球服务器出货量增速在2023年下滑,2024年有望重
28、回稳健增长轨道。AI服务器方面,TrendForce不断上修AI服务器出货量,预计2023年AI服务器(包含搭载GPU、FPGA、ASIC等)出货量近120万台,年增38.4%,占整体服务器出货量近9%,至2026年将占15%,同步上修20222026年AI服务器出货量年复合成长率至22%。我们认为AI创新引发的算力“军备竞赛”将推动云基础设施超预期成长。图表12.全球服务器出货量预测(万台)2.0001,800Leoo1.400IJOO1.0008000040020001.S9014%12%102020202120222023E2024E2025E2026E资料来源:IDC,中银证券图表13
29、.全球Al服务器出货量预测资料来源:TrendForcet中银暹券从服务器产业结构来看,服务器行业的上游主要由组成服务器的核心部件构成,其中包括CPU、内存、硬盘、电源以及连接器等关键组件。在服务器产业中游,主要由系统集成商和服务器厂商构成。从硬件角度来看,与传统服务器相比,人工智能(AI)服务器通常配备高性能的GPU或TPU加速器,拥有大容量的显存和存储器,并且有较多的PCIe显示设备作为外设。这样的配置旨在实现图像识别、人工智能学习等复杂任务,以实现更快、更高效的数据处理和计算能力。Al服务器的设计旨在满足人工智能等大数据应用的需求,因为这些应用对计算性能和数据处理速度有着更高的要求。随着
30、人工智能技术的快速发展,对服务器的性能和配置提出了更高的要求。我们认为伴随AlGC的不断催化,以服务器为基石的云基础设施产业链将驱动硬件端加速迭代更新。图表14.普通务器和Al服务名配置对比*标普通雇务器(以浪潮、F5280G7为例AIJBl务器(以DGXA100为例)计算GPU4*32G_NVIDIA-V100S-PCIe3_4096b8颗英伟达AloOCPU2颗Intel至强可犷展处理器双路AMDRome7742显存HBM-80GB*8存储DRAM512GB2TB32(X)MHz硬盘SSD标配4T;支持最大28个热插拔NVMeSSD4*3.84TB+2*1.92TBSSD互联接口板内芯片互
31、联最高支持16个标准PCle槽位NVLink和PCIe服务器互联NVSwitch8个单端口NVIDIAConnectX-7I/O网卡支持2个OCP3.0x16网卡,双万兆网卡200Gbs的InfiniBand端口2个双端口NVIDIAConnectX-7VPI10/25/50/100/200Gbs以太网PCB高速多层板16层以上高速多层板其他系统(电源)最大6.5KW功耗800w图表15.玄视以服务骞为基石的云基础设施产业链投资机遇资料来源:中银证券算力需求高速增长,国产Al芯片正当时AI芯片是算力的“心脏”。根据WSTS数据,2020年全球人工智能芯片市场规模约为175亿美元,随着人工智能技
32、术的日益成熟和不断完善的数字化基础设施,人工智能商业化应用正迅速推动AI芯片市场的高速增长。这一趋势得益于多方面的推动因素,将为AI芯片产业带来前所未有的机遇,据WSTS预计2025年全球人工智能芯片市场规模将达到726亿美元。图表16.全球Al芯片市场规模(亿美元)2019202020212O22E201JE2024E2O25EI-AI芯片市场现檀yoy|浮祥未於;WS75,中银证券Al芯片主要分为三种类型,分别是GPU、FPGA和ASIC芯片。每种类型的AI计算芯片都有其突出的优势和适用领域,并在Al训练和推理阶段发挥作用。目前,在人工智能领域中,CPU的应用相对有限,主要是因为CPU在A
33、I训练方面的计算能力不足。在独立GPU领域,英伟达是主要的市场领导者,其份额高达88%。据新浪科技报道,英伟达在其高端GPU上已经导入了至少1万个ChatGpT模型。由于人工智能浪潮带来的互联网、云服务商、人工智能初创公司以及企业对Al技术的需求不断增加,英伟达持续向台积电增加订单,全球万亿美元的数据中心基础设施正在迅速从CPU转向AI计算。目前GPU仍然是Al应用的主导芯片,受下游算力竞赛驱动,景气度有望延接。图表17.2022年全球独立GPU市场份额4%88%英伟达ANID英特尔资料来源:JPR,中级证养为应对AI订单需求激增,供给端亦在发力.据台湾经济日报报道,作为Al芯片标配的先进封装
34、需求远大于现有产能,台积电被迫紧急增加产能。公司莹事长刘德音指出,台积电今年CoWoS产能已较去年实现倍增,明年将在今年基础上再度倍增。同时,为应对先进封装产能的持续紧缺,台积电CoWOS封测产能不足的部分订单已外溢日月光、矽品与Amkor,同时晶圆代工厂联电也分到英伟达COWoS中的“W(SiinterposerWa饱r)”部分订单,联电预计下半年开始量产出货,之后再由封装厂商完成“oS”部分。我们认为伴随着订单外溢及先进封测六厂的启动,AI订单产能瓶颈将有望趋于缓解。此外,国际巨头仍不遗余力的进行技术创新,以期在竞争日趋激烈的算力大战中获得更多非对称性优势,CPU+GPU异构计算成芯片巨头
35、新宠:首先,随着高性能计算应用的不断发展,驱动了对算力的需求不断增加。传统单一计算类型和架构的处理器已经无法满足处理日益复杂、多样化数据的要求。其次,由于数据量和多样性的不断增加,数据处理的地点、时间和方式也在不断变化。在这样的背景下,CPU+GPU架构尤为适用于处理数据中心产生的大规模数据。采用CPU+GPU架构,可以更高效地处理这些海量数据。此外,CPU+GPU架构还具有共享内存空间的优点,能够消除冗余内存副本,从而改善处理效率。通过将CPU与GPU集成在同一架构中,处理器无需再将数据复制到专用内存池来访问或更改数据,也无需使用第二个连接到CPU的DRAM内存芯片池。芯片三大巨头英伟达、A
36、MD、英特尔也纷纷集中动作,分别推出Grace.M1300、和FaIConShoreS等架构,“超异构计算”已逐渐成为业界升级趋势之一。早在2022年的GTC大会,英伟达GraCeHOPPerSuPerChiP首次发布,14个月后的COMPUTEX2023上,GH200GraceHoPPer超级芯片被正式宣布已经全面投产,将为大规模HpC和Al应用带来突破性的加速计算。与英伟达GH200超级芯片类似,AMD在2023下半年即将推出的MI300也将采用CPU+GPU架构,同样发力于AI训练市场。AMD于CES2023介绍了新一代InstinctMI300加速器,结合CPU与GPU,重点发力数据中
37、心的HPC及Al领域,对标英伟达GraceHopper,一改过去AMD的GPU产品主要应用在图像处理及Al推理领域的局限。公司早前在22Q4财报电话会里提及,MI3()()已开始送样给重要客户,而正式推出将会在下半年,2024年将看到明显贡献。图表19.MDInstinctMI300加速卡图表18.NVIDIAGH200Superchip资料来源:NVIDIA.中银证券AMDInstinctMBOOXLMdenhipgenerativeAlKceteratorAMD1119208SJTB/s896GBs1538CONA3MiMmXYtUnvdU*mfWwtftbrttaTfMMort资料来燎:
38、AMZ中银证券图表21.曦云通用计算GPU资料来源:沐跟官网,中银证券国内GPU赛道厂商中,景嘉微通过自主研发GPU并规模化商用,是国内显示控制市场龙头企业。此外,海光信息、寒武纪等公司均有布局GPU产品。在加速计算GPU领域,国内壁仞科技发布的BRloo产品,在FP32单精度计算性能实现超越NVIDIAAlOo芯片,但是不支持FP64双精度计算:天数智芯推出的天垓100的FP32单精度计算性能实现超越A100芯片,但是在INT8整数计算性能方面却低于AlO0;海光推出的DCUZIoO实现了FP64双精度浮点计算,但是其性能为AIOo的60%左右。因此,从高精度浮点计算能力来看,国内GPU产品
39、与国外产品的计算性能仍或有一代以上差距。此外,沐曦旗下的曦思NlOO也已经量产,成为其首款人工智能推理GPU,它能够兼容多种视频格式,提供最高128路编码和96路解码的视期处理能力。图表20.壁仞科技BR100系列通用GPU芯片资挣来汲.里仞科技官网.中银证券图表22.国内GPU、Al加速芯片产品植理及与国外GPU产品对比产品型号产品臭型推出时间制造工艺工艺淳点算力(TFlops)FP64FP32BF161NT8定点算力生态互取帚宽星存(GB)接口功札华为界腌910ASIC20187nm320640MindSporePCIe4.0350w家武纪思元370ASIC20217nmChiplet24
40、256CambriconNeuware200GBs16PCIe4.0250w无数霄芯夭垓100GPU20217nm2.5DCowos37147295SIMT64GBs32PCIe4.0250w海光深第一号DPU20217nm5.4兼容ROCm32PCIe4.0350w壁仞BR1-OAMGPU20227nm2.5DCowos25610242048Birensupa512GBs64PCIe5.0550w壁仞BR1O4-3WPCIeGPU20227nm2.5DCowos1285121024Birensupal92GBs32PCIe5.0300w英伟达TeSIaV100GPU201712nmVolta
41、7.815.712562CUDAl50GBs32PCIe4.0300w英伟达AlPcleGPU20207nmAmpere9.719.5312624CUDA600GBs80PCIe4.0400w英伟达HlOoSXM5GPU20224nmHopper2.5DCowos34679891979CUDA900GBs80SXM5700w英伟达HlOOPCIeGPU20224nmHopper2.5DCowos26517561513CUDA600GBs80PCIe5.0350w英伟达GH200CPU+GPU20232.5DCowos-CUDA900GBs546PCIe5.010wAMDInstinctMIIGPU20207nmCNDA1-11.523.192.3184.6AMDROCml76GBs32PCIe4.0300wAMDInstinctMI250GPU20216nmCNDA2-47.945.3362362AMDROCm-128PCIe4.0560wAMDInstinctMI250XGPU20216nmCNDA2-47.947.9383383AMDROCm-128PCIe4.0560wAMDInstinctMI3CPU+GPU20235nmCNDA3-AMDROCm-128PCIe4.0600w资料来