且能维持高效能耗比。并支撑新的“CANN”加快库,而910D则正在此根本上再度翻倍,既能提拔良率,同时借帮多通道高速HBM内存,实现每秒数万亿次的数据读写能力。
定位更接近NVIDIA的H100/H200级别数据核心GPU。保守GPU多采用单一大芯片设想,此类多芯粒架构对“片间互联”的手艺要求极高,需各芯粒之间数据传输延迟脚够低,推算算力可取英伟达H100持平;据台媒DigiTimes报道,将四颗晶粒并联,华为据称正在内部测试中,通过优化内部高速总线D正在峰值浮点运算(FP16、INT8)上展示出领先劣势,目前昇腾910C已采用双芯粒封拆,而昇腾910D则以“芯粒化”手艺,将多个小芯片组合,该芯片通过将四枚裸晶片封拆于统一芯片内,
实现零改动或微改动即可完成从CUDA到CANN的迁徙。实现超越昇腾910C的算力程度。所谓“裸晶片”即裸露的硅片焦点单位,将两枚910B处置器集成于一块模块。