科技巨头加速入场算力战局
外国媒体报道,互联网科技巨头亚马逊正开始探索 RISC-V,以考虑替代 Arm 处理器的方案,因为后者正在被英伟达收购。 此前,亚马逊已经拥有了自己专属的 AWS 数据中心芯片、人工智能芯片以及各类移动智能设备上的 Arm 芯片。 像亚马逊一样,国内外很多此前只涉及软件和互联网的科技巨头都拥有了自主研发的芯片,并且取得了经市场验证的良好效果。 谷歌的 TPU 和自身的 TensorFlow、算力平台共同组成了全世界最好的人工智能技术生态;亚马逊的 Inferentia 集群比英伟达 T4 降低了 25% 延迟和 30% 成本。 其他互联网巨头也正在加速入场,微软去年12月份表示正在研发Arm芯片;字节跳动近期也开始芯片人才的招聘,探索Arm芯片。字节跳动的相关负责人回应媒体询问时证实,「是在组建相关团队,在AI芯片领域做一些探索。」跳动官网上芯片工程师的招聘信息。 在外界看来,互联网巨头自研芯片已经成为必然,这势必会对原本以芯片为主业的半导体巨头和芯片创业公司产生较大影响。 在这个过程中,需要搞明白一个最核心的问题——互联网巨头为什么要自己造芯片,以及在何种情况下才会选择自研芯片。 业务边界的持续扩展,数据量的激增,人工智能技术的发展,让互联网巨头对芯片的需求持续增加。 同时,外部的芯片设计工具和 IP 服务也逐渐变强,芯片产业链的完善为巨头自主做芯片提供了成熟的产业基础。博通每年都会给客户提供大量定制芯片;苹果引人关注的 M1 背后,其实也有很多其他公司的身影。这种产业链协同和合作帮助互联网巨头降低了研发芯片的门槛。 对计算需求的增加和制造门槛的降低只是提供了一个必要背景,在应用层面上,同一个任务会有无数种硬件解决方案,互联网巨头们的工作就是选择哪种硬件方案以及是否需要自己做,自研芯片只是众多选择中的一项。他们真正关心的是最具性价比的解决计算任务,而非必须要有自己的芯片。 而决策的唯一依据就是不同方案的成本与收益对比,也就是找到 ROI 最大的方案。 自主研发芯片有着非常高的整体研发成本,包括购买 IP、人员成本、实验和流片等。互联网巨头们大部分的成功经验都集中在软件和互联网领域,他们进入芯片领域也是从零开始,没有太多可以节省的成本。 湾区一位芯片专家介绍说,谷歌开始做芯片时,从博通挖了很多 ASCI 业务的人,从上到下组建一个全新领域的专业团队和运营体系,而这种体系与公司此前所擅长的是完全不同的,这又带来在企业文化和管理上的额外成本和风险。 自主研发芯片的高投入决定了它只适用于可以带来更高收益的应用场景——芯片能和公司自身业务系统、网络结构和训练框架等紧密结合,实现计算成本的显著下降,产品性能和和用户体验的显著增长。 只有这样,自研芯片才能获得最高的 ROI,企业选择自研方案才有意义。下面以 Arm 芯片、训练芯片、Codec 和 Smart NIC 等四种芯片为例。 众所周知,摩尔定律的速度已经开始变缓,数据中心同构体系下基于 x86 的硬件成本没办法继续下降。想要实现计算成本的下降,只能将负载拆分,然后用不同架构和处理器来分别处理,很多负载又是和企业自身网络结构强相关的,那企业就需要针对这些任务去定制芯片,在这种情况下,企业自主研发 Arm 芯片就是有助于节省成本的。
除了与网络结构强相关,与训练框架强相关也会促使公 (编辑:唐山站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |