华为的昇腾910C显卡在性能方面表现出色,被认为是目前市场上性能最强的AI芯片之一。根据华为发布的信息,昇腾910C的半精度(FP16)算力达到256 Tera-FLOPS,整数精度(INT8)算力达到512 Tera-OPS,而且其达到规格算力所需的功耗仅为310W,明显低于设计规格的350W。在实际的AI训练任务中,如ResNet50网络的训练,昇腾910C与MindSpore配合使用时,与现有主流训练单卡配合TensorFlow相比,显示出接近2倍的性能提升。
在与其他主流GPU的比较中,昇腾910C也表现不俗。例如,与英伟达的A100和H100相比,昇腾910C在某些方面具有竞争力。尽管昇腾910C的GPU间带宽(392GB/s)与A800的NVLink(400GB/s)相当,但英伟达的NVLink采用全网状拓扑,而华为的HCCS采用对等拓扑,因此它们的GPU-to-GPU最大带宽不同。英伟达的NVLink在8*A100模块时可以达到600GB/s的速率。
此外,华为在GPU集群方面也有显著进展。虽然目前国内厂商普遍还没有实现万卡集群的能力,但华为在集群技术方面具有优势,尤其是在并行技术和互联速度方面。华为的目标是实现千卡集群,并在全国范围内形成一个超过万卡的大集群。这些集群将用于训练华为自己的模型,特别是在AI领域。
综上所述,华为的昇腾910C显卡在算力、能效和互联技术方面均表现出色,使其成为市场上颇具竞争力的一款AI芯片。
发表评论 取消回复