一种设计计算机芯片的新方法可能给全世界最神秘的行业之一带来巨变。

14.1

一边是阻碍芯片供应的大堆问题——全球疫情、贸易战、制造工厂火灾以及包括干旱和暴风雪在内的恶劣天气;另一边是对芯片的前所未有的热烈渴求——仅2021年1月,全球芯片市场的销量就达到了400亿美元。

旺盛需求之下,2021年早些时候关于全球计算机芯片短缺的消息,推高了从笔记本电脑到冰箱一系列电子产品的价格。除了让世人惊愕,这场芯片危机也促使世界各国和各地公司争先恐后地发展壮大自身的芯片生产能力。许多人因此得到启示:芯片行业需要根本性的变革。批评者指出,少数芯片巨头对市场的垄断会阻碍创新,扼杀行业革命的希望。

一些知名人士现在支持另一种模式——把协作与开源这两条曾改变软件编写方式的原则应用于芯片制造。对于其支持者来说,新标准成为主流范式仅仅是时间问题。

计算机芯片无处不在——不只藏于笔记本电脑、台式机和智能手机内部,还在运行着我们每天使用的网络邮件、网上银行和其他数字服务的无数神秘服务器中,甚至很多微波炉、电视机、洗衣机以及手表都少不了它们。你是否知道,我们现在生产的汽车平均每辆都拥有数百枚芯片?

如果你把芯片放大来看,一项已有60年历史的发明仍然是如今所有芯片的技术核心:金属氧化物半导体场效应晶体管(MOSFET)。贝尔实验室研究人员穆罕默德 · 阿塔拉(Mohamed Atalla)和道恩 · 康(Dawon Kahng)在1959年灵光乍现,把晶体管用作微型开关,以特定方式连接它们,用来执行基本的逻辑运算,如加、减或乘法。

最初的处理器芯片是定制的,可将晶体管连接到特定的计算任务中。

然而,随着计算机越发普及且复杂,IBM于1964年发布了IBM System/360,一款可以运行一系列不同程序的大型计算机,其处理器带有一个基本的“指令集”操作,比如将两个数字相加或比较,或跳转到内存中的某个位置。更复杂的操作正是从这个指令集中创建。

需要用到芯片的软件编程过程可迅速得到工具的帮助——这些工具能分析、调试和验证特定于指令集及其底层芯片“结构”的代码。这意味着程序员不再需要担心芯片在晶体管级别的工作方式,但也宣告着那少数的能提供易于理解、稳定的指令集和架构的老牌芯片制造商掌控了大量权力。

这种情况一直持续到今天。美国西部数据公司(其制造的硬盘存储了全球40%的数据)的西瓦 · 西瓦拉姆(Siva Sivaram)表示:“(芯片架构)已经存在这么久的事实意味着有一个完整的内置基础设施。很多软件都写在它上面,操作系统也以它为载体。每个人都知道它是什么。”

台式机或笔记本电脑中的主处理器可能在英特尔或另一家美国公司AMD设计的芯片上运行x86指令集,AMD最初对英特尔的芯片进行了逆向工程以创建兼容的设计。数据服务器可能使用IBM z/Architecture(System/360的后辈)。手机通常使用由英国的ARM公司拥有的ARM架构。到目前为止,ARM芯片的销量已超过1 250亿枚,这令其成为有史以来最成功的架构之一。

14.2

美国西部数据公司的西瓦·西瓦拉姆

所有芯片公司都对其知识产权有着绝对控制。例如,英特尔芯片的唯一掌握者就是英特尔公司,它的设计和制造只有英特尔公司知道。另一方面,设计和制造新的芯片是一项高度复杂且专业的工作。随着我们设计晶体管的尺寸小到极限——目前的标准是5纳米——以及单个芯片上可容纳晶体管数量多到极限,“造芯”难度越发凸显。现在一个标准的中央处理器或CPU由多个“核心”——即芯片上有多个并行工作的芯片——组成。像那些作为手机虚拟助手基础的人工智能算法,或是进行高速3D物理计算以使计算机游戏图形更显逼真的算法,越发需要经过特定优化而能更快运行相关指令的芯片。

专有模型为围绕给定芯片构建硬件的公司提供了稳定性和确定性,但也可能阻碍他们的创新能力。西瓦拉姆这样说道:“一个内核可以连接多少内存?这是英特尔决定的。如果你想增加更多内存,他们会说‘再买一个核心’,这就好比‘你想要一个新浴室吗?那就买套新房子吧’。”西瓦拉姆所在的西部数据公司每年购买数千万枚芯片,但仍无法精准得到真正需要的芯片。

ARM的工作方式略有不同:它设计芯片,但将芯片的各种基本“风格”授权给终端用户,让他们按照自己认为合适的方式制造芯片。美国数据存储巨头希捷公司(Seagate)在20多年前过渡到这种模式。希捷硬盘团队的成员塞西尔 · 麦格雷戈(Cecil Macgregor)表示,这提供了更大的灵活性,但对定制几乎没有帮助:公司仍然必须从少数预先确定的选项中进行选择。“他们也是为了赚钱,对吧?所以他们必须决定哪种方式更为世界所接受,他们要确保会有很多人购买它。”像苹果这样的大公司可以解决这个问题:他们目前正从英特尔转向ARM的芯片,但也额外花费大量成本,同时利用其巨大影响力来创建自己的处理器——M1芯片。

计划收购ARM的英伟达是一家为智能手机、平板电脑、汽车导航和娱乐系统设计图形处理器(GPU)和芯片的美国公司,此外他们也会自己生产游戏机。英伟达的收购宏图引起了一些不安。麦格雷戈表示:“如果你是英伟达的竞争对手,你会认真思考,因为你的芯片来自他们。”英伟达的一位发言人表示,未来所有用户都可以像今天一样继续授权ARM,但英国政府对此深表怀疑,而近期的新闻报道也让我们知道政府在思考以反垄断或国家安全为由否决收购的选项。

随着芯片变得越来越复杂,其安全性和可靠性也变得越来越重要。现阶段我们测试芯片的方式要么是随机抽查样本寻找缺陷,要么就是规范地测试每一个可能的输入和输出。第一种方式很容易遗漏问题,第二种方法则几乎没有可操作性(除非是最简单的芯片设计)。1995年,英特尔召回了大约100万个奔腾P5处理器,原因是他们发现了一个可能导致某些计算错误的缺陷;2011年,英特尔发现自家的Sandy Bridge处理器存在一个缺陷,而其修复成本达到了10亿美元。不过1995年和2011年的这两次事故的严重性都比不了他们在2018年发现的两个漏洞——Meltdown(熔断)和Spectre(幽灵);此二者影响了一大批制造商,以及一整代芯片的研发。甚至苹果全新的M1芯片也被证明存在无意导致的设计缺陷:允许两个本应严格分开的程序共享数据。不过该问题被认为无伤大雅。

再加上美国和中国的芯片行业存在的地缘政治紧张局势,你就会开始明白为什么一些制造商渴望采用不同的工作方式。

所谓的精简指令集计算机(RISC),起源于20世纪80年代在加州大学伯克利分校开始的一个学术项目。研究团队最初的想法是,他们可以通过创建只包含几条指令的精简指令集——而非涵盖每个复杂任务的庞大指令库——来让芯片更简洁,但一个客观障碍是他们自己没有设计,而芯片公司的造芯诀窍又是秘不外传的。鉴于此,RISC的研究人员从2010年开始着手创建自己的芯片和指令集作为教育工具。他们将其称为RISC-V,因为这是共同创始人大卫 · 帕特森(David Patterson)参与的第五个RISC研究项目(罗马数字V对应自然数5)。随着项目不断推进,RISC-V开始出现在实际应用中。

2015年,RISC-V从项目里独立出来,同时RISC-V国际(RISC-V International,非营利公司)也就此成立,负责监督芯片研发。RISC-V的一大优点在于它是开源的,其应用的模型也越来越成为软件开发的标准。值得注意的是,Linux开源操作系统已成为谷歌开发的安卓系统的基础,而安卓系统又是全球最受欢迎的智能手机操作系统。此外,RISC-V还为全世界一半以上的最强大的超级计算机提供动力。

芯片开源时代

开源方法允许所有开发者不断优化RISC-V标准,确保其正常工作,没有任何令人讨厌的安全漏洞。西瓦拉姆表示:“我能做的最棒的事情就是开源,让无数人尝试在我的代码中找到错误。”所有设计决策的基本原理都公开记录在案,任何个人或公司都能参与开发——并免费将其重新用于自己的产品。麦格雷戈说道:“你可以制作各种口味,也可以添加一些小的调整。”

开源的RISC-V芯片对设备制造商的吸引力是显而易见的:以更低的许可获取成本打造更经济实惠的产品,使用专为特定任务定制的芯片,可能意味着更好的性能以及更长的电池寿命。RISC-V让一部分芯片公司疯狂,例如希捷。尽管他们尚未正式宣布他们使用了任何包含RISC-V芯片的产品,麦格雷戈也并未说明希捷公司使用RISC-V的目的,只说定制芯片比竞争对手更具优势。其他同行则没那么腼腆了,西瓦拉姆就大方表示,西部数据现在已经“完全订阅”了RISC-V,相比于现成芯片,为特定功能而设计的RISC-V芯片会略小一些,但能以更低的功耗提供更好的性能,因为它“没有遗留的包袱”。早在2016年,英伟达就宣布将在其GPU中使用RISC-V,而眼下计划接管ARM的他们自然早已用上了开源神器。

西瓦拉姆认为这些进展还只是开始。“我并不是说它会立即实现,但半导体芯片的全面开源只是时间问题。当你购买福特或丰田汽车时,你知道发动机是谁制造的吗?”

帕特森对此表示认同:“人们对开源有着像对宗教那般的热情。他们喜欢并希望实现开源。我认为RISC-V的普及是大势所趋,它将成为一种为所有规格的计算机所通用的语言。”

RISC-V国际基金会的卡莉斯塔 · 雷德蒙德(Calista Redmond)说:“因为它开源,所以没有任何公司、国家或其他实体控制它。一旦分发给社区,它就无法再被收回。”RISC-V国际基金会于2019年宣布将其总部从美国迁往瑞士。

许多中国公司都在RISC-V基金会的合作伙伴名单中。阿里巴巴不久前开发了一款名为XT910的16核RISC-V芯片,据称可用于人工智能或自动驾驶。印度也正式批准了RISC-V架构用于国防和基础设施项目。欧盟选择RISC-V作为其正在建造的新型超级计算机的基础,以处理一系列科学和数据处理工作。半导体营销和咨询研究公司Semico Research预计,到2025年,RISC-V的销量将超过600亿枚。(2020年最后一个季度制造的使用ARM技术的芯片数量为67亿。)

雷德蒙德表示:“像 AMD、英特尔和ARM这样的‘传统’公司应该担心。他们花费数十年时间才建起来的道路,被我们更快速地推进着。”

ARM的首席架构师理查德 · 格里森斯韦特(Richard Grisenthwaite)指出,开发指令集相对容易,难点在于构建支持工具的生态系统来帮助在该平台上开发芯片。对于新的指令集,这些工作必须从头开始。“从头开始打造生态系统,而非使用已有的ARM,似乎是一桩难事,我们花了30年的时间才将ARM打造成熟。”

另一方面,成熟的芯片公司对自己产品的指令集有着绝对控制——是否做出更改必然需要经过掌控者的批准,但开源产品的最大特性就是其更改权限的不受限,换言之,每个开发者都有资格决定RISC-V的未来,那么任何根本性分歧的出现都可能减小其成功的可能——或者只是增加了一个新的垄断者,例如,安卓可能是开源的,但它的主要作用是巩固了谷歌的商业地位。

制造商能否完全摆脱传统技术是不确定的。对于许多制造商来说,他们需要保持与旧产品的向后兼容性,这意味着在设备中保留ARM或英特尔芯片。现代设备已经包含数十种使用不同架构的芯片,而且这种情况不太可能改变。无论谁设计芯片、获得许可或订购芯片,芯片制造商仍然必须生产出真正的芯片。至少在接下来的几年里——在新工厂上线之前——这将是瓶颈。

从这个意义上说,RISC-V革命就算到来,很可能也不会被终端用户注意到。但如果研发人员造出了更便宜、更专业、更高效的设备,所有人都会因此受益。芯片会继续嗡嗡作响地开启我们的数字生活——但或许是以更公开一些的方式。

资料来源 New Scientist

——————

本文作者马修·斯帕克斯(Matthew Sparkes)《新科学家》(New Scientist)杂志科技记者