国信证券-软件与服务行业:寒武纪发布MLU100、1M芯片,中国制造实现端云全覆盖-180504

《国信证券-软件与服务行业:寒武纪发布MLU100、1M芯片,中国制造实现端云全覆盖-180504(3页).pdf》由会员分享,可在线阅读,更多相关《国信证券-软件与服务行业:寒武纪发布MLU100、1M芯片,中国制造实现端云全覆盖-180504(3页).pdf(3页精品完整版)》请在悟空智库报告文库上搜索。
事项:
5月31日,寒武纪在上海国际会议中心发布了MLU100芯片及板卡样品、1M终端处理器IP产品。
评论:
.1M 产品:稳固端的优势
寒武纪1M 芯片是公司第三代IP 产品,在TSMC 7nm 工艺下8 位运算的效能比达5Tops/watt (每瓦5 万亿次运算),功耗比再次超越了竞争对手。不仅如此,该产品支持多核互联功能,并且可以灵活选择算力(2Tops/4Tops/8Tops)。对于语音识别来说,2Tops 足矣,但是对于复杂的自动驾驶任务,可能需要16Tops 以上的算力。通过灵活配置1M 处理器,开发者可以实现资源的最大化利用,降低功耗和成本。1M 的上一代1A 仅支持终端的推理,而1M 还支持终端的训练。通过将训练下放在终端,开发者可以避免敏感数据的传输,而且可以实现更迅速的相应。
.MLU100 芯片:中国制造挑战NVIDIA 云的霸权
NVIDIA 的芯片被大量运用于云端的训练场景。本次寒武纪发布的MLU100 芯片,采用寒武纪最新的MLUv01 架构和TSMC 16nm 的先进工艺,可工作在平衡模式(1GHz 主频)和高性能模式(1.3GHz 主频)下,平衡模式下的等效理论峰值速度达每秒128 万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4 万亿次定点运算。根据寒武纪公布的数据,其在执行人工智能网络运算时,比NVIDIA 的Tesla V100 拥有更低的计算延迟,且能耗低30%。寒武纪MLU100 芯片及其板卡的成功发布,标志着中国制造正式打破了美国公司在人工智能训练芯片领域的霸权,并且达到了世界领先水平的高度。
.下一步,形成生态
NVIDIA 在人工智能领域已经形成了生态。其从底层硬件、中间件到上层的开发语言、调试工具都形成了一套完善的产业链。寒武纪也在这方面加速追赶。通过寒武纪的NeuWare 软件工具链,开发者可以方便地进行智能应用的开发,迁移和调优。未来,寒武纪还将发布专用的人工智能编程框架,进一步挖掘寒武纪架构的潜力。我们认为,只有形成了生态,寒武纪的护城河才算建好。
.中国自主可控最尖端的成就之一
中兴通讯的事件让国人意识到了核心技术的重要性。未来毫无疑问是人工智能的时代,而人工智能芯片在其中扮演的角色不亚于目前CPU 在电脑体系中的角色。只有将人工智能芯片的核心技术掌握在手中,我国才能打破国际封锁,真正跻身于世界一流国家。寒武纪本次发布的两款芯片,代表着目前世界范围内人工智能芯片端、云的最高水准,是我国自主可控最尖端的成就之一。