微网报道称,美国GPU禁令带来的变化将国产GPU推到了聚光灯下。
数字经济的兴起和繁荣离不开计算能力的强大支撑,计算芯片已经成为全球技术竞争的焦点中国工程院院士倪光南曾说伴随着国内政策,资金,人才,应用的红利,涌现出一大批国产GPU企业但GPU作为一款复杂的高端芯片,不仅要面对国外巨头的高壁垒,还要在硬件,生态,应用等方面做大量的研发和优化本土化之路注定像西西弗斯推巨石一样艰辛
本文将盘点九款最值得关注的国产GPU产品,看看国产GPU的发展水平。
1.凌九伟,GP201
灵九微电子今年年中成功推出的产品GP201,是一款具有统一渲染架构的独立高性能GPU,实现了亿门VLSI的设计,可以满足显示与控制,科学计算,人工智能等应用需求根据消息显示,灵久微电子主要从事GPU/SOC芯片产品的设计研发和配套软件的生态建设其自主研发的图形处理器已广泛应用于商用计算机,国家信息安全和高可靠性电子设备
RPP—R8芯片的技术规格主要包括:
主频1GHz,单精度浮点1TFlops,采用PCIE GEN3 x16接口,支持最大32GB DDR4/LPDDR4内存,支持四通道4K高清显示,支持DVI/HDMI/VGA/DP/eDP接口,支持OpenGL4.0,OpenGLES3.2,OpenCL3.0,H.264,H.265,MPEG 2/。
2.富弼科技,BR100
今年9月,富弼科技首次展出BR100系列通用GPU芯片,计算能力创下全球纪录比虎科技首款通用GPU芯片BR100基于比虎科技独创的芯片架构开发,采用7nm制程工艺,可容纳770亿个晶体管16位浮点运算能力超过2000T,8位定点运算能力超过2000T t,单芯片峰值运算能力达到PFLOPS级别,创下全球GPU芯片运算能力纪录BR100芯片在国内率先采用小芯片技术,新一代主机接口PCIe 5.0,支持CXL互联协议BR100芯片也让中国的通用GPU芯片进入了每秒千万亿次的新时代最重要的是,这是全球通用GPU计算能力纪录首次由中国企业创造同时,展出的100 OAM模块配备了BR100芯片
3.穆Xi,7纳米GPU已流。
穆Xi的国产高性能人工智能推理GPU芯片的设计和开发Mu联合创始人,CTO,首席软件架构师杨坚博士最近几天接受媒体采访时表示,公司的7nm GPU已经流片,但支持游戏功能的满血GPU还要等到2025年根据消息显示,该产品主要应用于AI推理场景,可应用于人工智能,自动驾驶,工业和制造自动化,智慧城市,自然语言处理,边缘计算等领域这款芯片有望很快量产牧溪第二款旗舰GPU芯片,用于科学计算,数据中心弹性计算,AI训练等,也已进入最后研发阶段,计划于2024年量产
根据消息显示,Mu Xi创始人陈伟良曾任AMD GPU设计高级总监,AMD全球GPU SOC设计总经理,AMD全球GPUMI产品线设计总经理该公司的GPU设计和R&D团队参与了AMD从图像到高性能计算应用的GPU的架构设计和量产
4.核心力量,RPP—R8
芯也将继续专注于国产GP—GPU芯片的设计和研发,致力于将基于自主创新RPP架构的芯片产品广泛应用于各行业并行计算领域的需求场景目前,采用RPP技术开发的第一代RPP—R8芯片已经成功流片基于新的自主开发的架构,RPP—R8是一种高端通用异构芯片,专为并行计算而设计RPP—R8芯片公司专注于并行计算领域使用基于CUDA的高级语言编写应用程序代码,并通过自身的指令集和开发工具深度优化性能,RPP—R8可以得到高性能计算领域最广泛使用的编程语言的支持与GP—GPU相比,RPP—R8具有更高的计算密度利用架构的优越性,可以实现更高的计算能力,从而降低服务器的成本,实现更低的功耗非常适合高数据密度的计算应用场景
RPP—R8芯片的技术规格主要包括:
支持FP16/FP32/INT8等精度计算力,计算力达到960TOPSINT8,30TFLOPsFP32,480TFLOPsFP16,
支持PCIe Gen4,双向PCIe带宽64gb/s,
芯片面积600mm2,300W,RPP核数20个,运算单元数640个,核频1.5GHz
支持主流深度学习网络框架和主流深度神经网络模型,支持NVIDIA支持的任何深度学习网络模型,包括CNN,Transformer等经过剪枝和量化后,模型压缩比与国际先进水平相当,准确率下降不到1%,支持64路视频解码编程语言:兼容CUDA语言,推理平台:兼容张量RT,机器视觉算法:支持开放CV
值得一提的是,这款产品已经能够对标英伟达主流边缘服务器的JetsonXavier芯片产品。
5.智汇威,IDM9系列
智能微电子IDM9系列产品可支持OpenGL,OpenGL ES,EGL,Vulkan等图形标准和OpenCL计算标准。
首款GPU芯片IDM919像素填充速率8GP/s,纹理填充速率16GT/s,单次浮点运算256GFLOPS第二款产品IDM929,凭借微核心架构优势,像素填充率提升2倍,纹理填充率提升4倍,单浮点运算性能提升8倍根据消息显示,IDM919采用14nm工艺,支持1080P高清显示,支持1路HDMI,VGA或DVI接口,全面支持Fit,龙芯CPU,麒麟,同芯等国产操作系统,广泛应用于桌面办公,工业控制系统,显示控制系统,地理信息系统,高性能计算等领域
此外,智汇微电子IDM9系列第二个产品流也指日可待,计划2023年上市第二款产品采用14nm工艺,支持4K超高清显示,支持4路独立显示输出,支持HDMI,VGA,DVI接口,支持H264,MPEG2,MPEG4,VC—1,DivX,VP6格式的硬件解码,可适配X86,基于ARM架构的国产Fit CPU和基于MIPS架构的龙芯CPU同时全面支持麒麟,同心等国产操作系统,广泛应用于桌面办公和桌面办公整体性能是第一款产品的8倍
6.摩尔线程,GPU芯片肖春
摩尔线程正式发布第二款多功能GPU芯片肖春,集成220亿个晶体管,内置MUSA架构通用计算核心和张量计算核心,可支持FP32,FP16和INT8计算精度与此前发布的苏堤芯片相比,肖春对其内置的四个计算引擎进行了全面升级,带来了显著的性能提升肖春GPU将致力于满足高端游戏玩家以及更高图形和计算能力的需求,从而全面覆盖高,中,低端应用
肖春的产品亮点主要包括:
图形渲染能力平均提升3倍,
编码能力提升4倍,解码能力提升2倍,
平均AI加速提升4倍,物理模拟性能提升2.5倍同时引入新技术支持窄带高清,节省带宽30%以上
7.智慧的日子,百日的日子。
天地芯的天泰100采用7nm制程工艺和2.5D CoWoS晶圆封装技术,集成240亿个晶体管,支持多精度数据类型标准或混合训练,提供片间互联扩展AI计算能力密度和能效领先业界目前,天盖100已经支持近100家客户在人工智能领域培训了200多个不同类型的模型ResNet50,SSD,BERT等骨干网络型号性能与国际市场主流产品相当公司用于云训练的通用GPU芯片天罡100已完成与浪潮AIStation智能业务生产创新平台的兼容性适配认证,将用于自动驾驶,智慧城市,智慧金融,智慧医疗,智能制造等典型AI应用场景,并适配了X86,Arm等多种CPU架构,提供了一种高性能,多功能,灵活的AI计算加速方案
天盖100产品亮点:
GPU架构基于SIMT架构的可扩展计算引擎,自定义的丰富指令集支持GPU的通用并行编程模型内置FP32/FP16/BF16/INT多种数据类型指令,支持混合精度AI训练
CoWoS HBM2 7 nm工艺,容纳240亿个晶体管,2.5D CoWoS封装,提供1.2TB/s超大带宽和32GB超大容量内存,为海量数据并行处理引擎提供充足的数据支持。
主流生态兼容,支持主流深度学习开发框架,兼容主流GPU编程模式,有效对接现有软件生态,易于扩展和支持新的算法和应用领域,帮助用户轻松实现无痛迁移。
8.像献帝,天峻一号。
今年9月,象帝首次发布了国产GPU——拥有完全自主知识产权的——天骏一号,根据消息显示,该款GPU综合性能达到国际先进水平,国内领先水平,尤其是极限图形渲染能力大幅领先于国内同类产品,有效填补了国内市场空白最近几天,天骏一号GPU和飞桨完成了III级兼容性测试测试结果表明,双方兼容性良好,整体运行稳定
天骏一号的技术指标主要包括:
采用12 nm工艺,包含多达2048个高效计算核心阵列,可提供高达4T FLOPS的FP32计算能力,16 TOPS的AI计算能力和超过128G Pixels/s的像素填充率,最高16GB显存和256GB/s带宽,
支持产品秘密系列算法和GPU虚拟化,构建硬件安全基石,
支持OpenGL,OpenGLES,OpenCL,Vulkan,DirectX等主流API,支持PCIE 4.0x16高速接口,
不仅支持H264,H265,MEPG2/4,AV1等国际视频编解码标准,还率先支持中国自主的AVS/AVS+/AVS2视频编解码标准,
同时,还支持HDMI,DP等高清接口和多屏多层4K超高清显示,为数字办公,视频渲染,CAD,CAE,GIS,3D游戏,AR/VR,智能制造,证券金融,AI训练推理等场景提供高性能产品选择。
在GFXBench 5.0的曼哈顿3.0测试中,基于盘古架构的天骏一号GPU在测试成绩上已经超越了1660Ti,RX590,RX580等国外众多GPU产品。
9.计算器技术,G100
李计算科技自研架构支持扩展至16384个计算核心,将有机会与英伟达系列旗舰产品4090一较高下计算器技术第一代高性能GPU产品G100,采用6nm工艺生产,性能是NVIDIA在中国销量最大的主流产品,占比90%具体来说,计算器技术的自研架构支持已经扩展到16384个计算重点,Nvidia在今年9月正式公布了新一代RTX 4090,也内置了16384个CUDA核心这也意味着在未来,计算器科技的产品将有机会与英伟达AdaLovelace系列的旗舰产品RTX 4090竞争
G100的产品亮点主要包括:不同于购买第三方IP,它磨砺了第一代高性能GPU产品,不仅100%支持微软的DirectX scale,而且可以毫无障碍地应用于PC,覆盖了最大的市场由于完整的技术团队和自主开发的架构带来的高性能和定制GPU的独家能力,它也具有现实的竞争优势和持久的增长潜力
标签
国产GPU的发展可能不会因为A800的出现而放缓,因为FDPR这把大剑始终悬在头顶,还是要未雨绸缪业内人士向王记伟提到,美国无休止的封杀或断供措施主要是为了阻止中国的技术发展,但A800的推出并不会延缓国产GPU的更新换代,因为停下来就会落后
吉维咨询认为,国内计算能力产品的发展与英伟达是否会推出替代产品关系不大面对禁令的影响,即使短期内国内客户会用A800补仓,但长期来看,国产替代必须提上日程,国产GPU的大门永远是敞开的
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。