《我国人工智能硬件产业现状分析.docx》由会员分享,可在线阅读,更多相关《我国人工智能硬件产业现状分析.docx(10页珍藏版)》请在课桌文档上搜索。
1、我国人工智能硬件产业现状分析随着人工智能新兴产业得到高速发展,传统计算架构已无法满足海量数据和复杂模型对大规模并行计算能力的需求,对人工智能硬件设备性能提出了更高要求。人工智能芯片和超级计算机是保障人工智能产业持续高速发展的核心硬件基础设施,以人工智能为载体的算力更是人工智能发展水平的重要衡量指标之一,对人工智能的应用影响深远。1、人工智能芯片(1)人工智能芯片的概念内涵目前对于人工智能芯片尚无统一的定义,广义上认为专门用于人工智能大量计算任务的芯片都可称为人工智能芯片,狭义上认为针对人工智能算法特殊设计的芯片称为人工智能芯片。人工智能芯片的发展一方面依赖于数字模型和算法的发展,一方面依赖于半
2、导体集成电路设计、制造、封装等技术进步和新材料的发展使用。从技术架构来说,人工智能芯片可分为图形处理单元(GPU)、半定制化的现场可编程门阵列(FPGA)、全定制化的专用芯片(ASIC)f以及神经拟态芯片即类月固芯片(表1)。技术架构定制化程度可编辑性算力优点缺点GPU通用型编辑中通用性较强,适合大规模并行计弊并行运算能力在推理段无法完全发挥FPGA半定制化容易编辑可灵活配置芯片架构适应算法迭代.性能较高,开发时间短峰值计算能力较低,量产成本高ASIC全定制化难以编辑高算法固化实现机制效能,体积小.功耗低开发周期较长,难度较大,技术风险较高类脑芯片类脑芯片不可编辑高功耗低,通信效率高,认知能力
3、强探索阶段表1芯片技术架构对比2015年前后,深度学习在产业界爆发,GPU也随之崛起。其具有超过CPU数十倍的计算能力,已成为通用计算机和超级计算机的主要处理器。当前已逐渐衍生出了通用计算GPU(GPGPU),即利用图形处理器进行非图形渲染的高性能计算。超级计算机、大数据处理、人工智能等对算力要求非常高的应用场景中,算力大都采用CPGP或搭配专用加速芯片的构建方式。FPGA芯片是在PAL(可编程逻辑阵列)、GAL(通用阵列逻辑)、CPLD(复杂可编程逻辑器件)等传统逻辑电路和门阵列的基础上发展起来的半定制芯片,具有现场可编程性,既解决了半定制电路的不足,又克服了原有可编程器件门电路数有限的缺点
4、。与GPU、ASlC等类型芯片相比,FPGA芯片底层逻辑运算单元的连线及逻辑布局未固化,其具有灵活、可快速开发、延迟低等优点,适用于底层算法需要持续更新迭代的领域。ASIC芯片是一种根据特定算法定制的芯片架构其定制程度相比于GPU和FPGA更高。ASIC算力水平一般高于CPU、GPU、FPGA,但初始阶段需要较大的成本投入。ASIC专用性强,同时也限制了其通用性,算法一旦改变,计算能力会大幅下降,需要重新定制。但对于一些特定的领域,其数据量庞大,算法趋于固定,ASIC芯片成为首选。近年来出现的张量处理器(TPU)、神经网络处理器(NPU)、视觉处理器(VPU)等都是ASIC专用芯片。类脑芯片通
5、过模拟人脑进行设计。相比于GPU、FPGA.ASIC等基于深度学习并行计算的AI芯片,类脑芯片基于神经形态计算,即脉冲神经网络,可以通过小样本数据训练,支持无监督学习,具有效率更高,功耗更低,延时极低等优点。目前用于实现类脑芯片的硬件器件材料主要有忆阻器、自旋电子器件、光子器件、电化学器件,石墨烯等新型二维材料等。此外,从功能任务角度,AI芯片可以分为训练芯片和推理芯片。从部署位置来分,可分为云端和边缘端两类AI芯片。云端主要部署训练芯片和推理芯片,承担训练和推理任务,具体指智能数据分析、模型训练任务和部分对传输带宽要求比高的推理任务;边缘主要部署推理芯片,承担推理任务,需要独立完成数据收集、
6、环境感知、人机交互及部分推理决策控制任务。(2)人工智能芯片专利计量分析对人工智能算法芯片进行计量分析,由inc。Pat专利数据库检索获得全球发明申请专,检索时间为申请日在2000年1月I日以后,简单同族处理后,共获得433874条专利数据。从全球专利总量来源分布来看(图1),我国人工智能芯片总专利申请量达157652项,位居全球第一,美国总专利申请量为126810项,居世界第二。从专利授权数年度申请趋势来看,全球人工智能芯片领域专利申请量在2000-2009年间波动缓慢增长,2009年后专利申请涨幅增加,AI芯片全球专利布局数量呈现快速增长态势。2000-2022年间美国人工智能芯片申请量基
7、本稳定,呈显出缓慢、小幅度的增长趋势。而这期间我国专利数量大幅度增长,2013年专利申请数超过美国,位居世界第一。Bxw全球九国-中国图1人工智能芯片专利数量全球分布及年度趋势从娜伸请机构分布角度来看(图2),AI芯片专布局机构主要来源于日本、美国、韩国和中国,同时专利布局优势机构主要以企业为主。其中,三星公司人工智能芯片专利数达6659项位居全球第一,美国研制处理器公司英特尔以4642项专利排在第二。全球机构T0P15中仅有我国两家企业,分别是排在第12位的国家电网和第14位的苏州浪潮智能科技有限公司。日本有7家企业入围TOPl5专利申请机构,包括佳能、理光、索尼、富士胶片、东芝、爱普生和夏
8、普。美国有4家公司入围,包括英特尔、IBM、高通以及美光科技。韩国企业三星和LG(排名第6)入围T0P15机构,排名靠前。整体来看,我国在AI芯片专利布局数量在TOP15机构的四个国家中实力较为建弱。图2人工智能芯片专发表机构ToPl5从专利数量年度趋势(图3)来看,我国国家电网在2013-2017年内专利布局较多,浪潮公司2019年以来专利布局大大增加,或与我国战略政策导向高度相关。对比而言,美国企业人工智能芯片布局普遍较早,英特尔、IBM和高通公司在2013年左右加大了人工智能芯片专利布局,其中英特尔公司的专利申请量此后持续保持较高的增长率。反观优势专利布局机构最多的日本,包括专利申请数量
9、排名较为靠前的佳能、理光、索尼等大多数日本企业都仅在2010年以前布局数量较多,而后专利数量减少,整体呈现出衰落的趋势。l 英特尔IBM理光LG索尼高通士胶片东芝3事电网公司爱生浪潮美光科技图3T0P15机构专利申请年度趋势对比(3)人工智能芯片产业发展现状目前,全球GPU已经进入寡头垄断的格局。在通用GPU市场,英特尔、英伟达、AMD三分天下;独立GPU领域,几乎是英伟达和AMD的天下,前者市场份额甚至超出2/3。英伟达凭借CUDA计算平台构建了良好的开发者生态,目前处于行业龙头地位。我国GPU技术领域起步较晚,厂商数量不多,既有面向云端市场、人工智能的厂商,也有在图形GPU领域寻求突破的创
10、业者。我国FPGA市场需求量全球最大,占全球市场的30%以上,市场空间约为100亿人民币,主要应用于数据采集和接口、高性能视频解码等领域。国产FPGA过去多用于中低端市场,伴随5G、AL自动驾驶、医疗、工业等发展,未来具有较大的增长空间。表2人工智能芯片国内外主要产品进展公司最新产品技术架构工艺算力/性能功能任务国外英伟达HlOOGPU4nmINT8:2000T0PSBF16:1000TFL0PSfp16:100otflopsTF32:500TFLPoS云端训练和推理AMDEPYC2Zen2构架5nm云端推理英特尔NervanaNNP-TNNp-T100O16nm云端训练NervanaNNP-
11、INNp-T100OIOnm云端推理IBMTrueNorth类脑芯片28nm边缘端推理谷歌TPUv3ASIC20nn云端训练和推理EdgeIPUASIC4tops,功耗为2w边端推理苹果A16ARM架构SoC4nm17TOPS边端推理国内天数智芯BIGPU7nm工NT8:256TOPS云端训练壁仞科技BRlOOGPU711jrINT8:2048TopsBF16:1024TFLoPSTF32+:512TFLoPSFP32:256TFLOPSAiIjZIV而沐曦集成电路智铠100GPU5nm云端训练+推理登临科技GoldwasserGPU/ASIC12nmGoldwasserUL(MXM)最局可实
12、现32路视频解码能力,但其最低功耗仅为IOW边缘至云端+推理和训练摩尔线程“苏堤”全功能GPUGPU12J11TS60台式机显卡基于“苏堤”核心晶片制成,包含2048个MUSA核心,单精度算力最高可达6TFlops,配置8GB显存兆芯子公司格兰菲Arise-GTIOCOGPU28n1.5TFL0PS阿里巴巴含光800ASIC12n性能峰值算力达820TOPS,在业界标准的ResNet-50测试中,推理性能达到78563IPS,能效比达500IPS/W云端推理华为海思昇腾910ASICTnmINTS:640T0PSFP16:320TFLOPS云端训练百度昆仑2XPU-RASIC7nmINT8:2
13、56TOPSXFP16/FP16:128TFLOPS,最大功耗为120W云端训练燧原科技邃思2.0ASIC12nIN1B:32OTOPSTF32:160TFLOPS云端训练瀚博半导体SV102INT8:200T0PS(单芯片INT8峰值算力200TOPS,也支持FPl6/BF16数据类型)云端铀缘推理嘉楠科技勘智K510RISC-V7nm搭载第二代自研KPlb峰值算力2.45TFLoPS,支持INT8和BF16数据精度云端推理寒武征程5ASIC16nINT8:128T0PS云端推理纪天数智芯BIGPU7nmINT8:256TOPS云端训练Gp麻智能华山二号AlOOOProINT8:106ToP
14、SIIfr4:196ToPS边端推理炫原科技“邃思”2.5第二代GCU-CARA121町8:256TOPSBF16:128TFLoPSFP16:128TFLOPSTF32:128TFLoPSFP32:32TFLOPS推理2、超级计算机根据2022年11月国际TOP500组织最新发布的超级计算机500强名单,我国超级计算机拥有量为162台,占全球前500名超级计算机的32.4%,仍位居全球第一,美国拥有量为127台位列第二。前10名中有2台来自我国,分别是排名第7和第10的神威太湖之光和天河二号。5台来自美国,其中性能最优的是由AMD公司与制造商HPECray为美国橡树岭国家实验室制造的Fron
15、tiero我国在高性能超级计算机数量上连续多年位居世界第一,但整体性能上美国更有优势。虽然我国一直努力追改缩小差距,但2020年来我国在数量上的优势呈现出弱化趋势,同时美国仍然保有其在性能上的领先优势。3、总结综上,在技术创新方面,我国在过去几年里迅速崛起,为人工智能芯片和超级计算技术领域的重要力量,积极推动自主研发和创新,在一些关键领域已经取得了重要突破。但美国作为人工智能和计算技术领域的先之一,一直在保持技术领先地位,在人工智能芯片和超级计算技术领域有着丰富的经验和先进的技术积累,且拥有世界一流的科研机构、企业和研发团队。在产业布局方面,中美两国在人工智能芯片和超算产业的产业布局也存在差异。美国在芯片和超算领域拥有众多世界领先的公司和研究机构,形成了完整的产业生态链。而我国在人工智能芯片和超算产业方面的产业布局相对较年轻,尚处于不断发展壮大阶段,尽管在一些领域取得了显著的进展,但整体产业生态链尚未完全成熟。