英伟达的前世今生

作者:考拉汤员

来源:雪球

1993 年成立的英伟达 Nvidia,开始的 20 年,是一家专业做显卡的公司。

令人讶异的是,2015 年后,英伟达突然业绩狂飙、估值狂飙,股价 6 年上涨 70 倍,目前市值超过 8000 亿美元,成为了全球市值第八大的公司。(位列 Facebook 之后)

英伟达近年业绩和估值突涨的原因是什么?

这家公司与元宇宙、智能驾驶、人工智能有什么关系?

带着这些问题,下面我们来看看英伟达的前世今生。


创始人

提到英伟达,不得不提它的创始人兼 CEO 黄仁勋。

黄仁勋,祖籍浙江,1963 年出生于宝岛。9 岁时,他和哥哥被父母送到了美国,原本父母想着两个孩子能去美国找舅舅接受点好的美式教育,然而结果却是被穷困的舅舅送到了当时不怎么太平的肯塔基州的乡村寄宿学校 —— 传说那里的孩子们出入带刀,身上刺青,黄仁勋在这里学会了抽烟和爬墙上树。而为对付恶劣环境,黄仁勋找到了一个保护自己的方式,那就是课余帮学校最强壮好斗的 “大哥” 补习功课。

智商摆在那里,学霸到哪里都是学霸。

即便进的是渣渣学校,勤奋好学的黄仁勋 16 岁仍然轻松考上了俄勒冈州立大学学习电子工程。随后他在斯坦福取得了硕士学位,而这也是他迈入硅谷的第一步。

毕业之后,黄仁勋先后在 AMD 以及 LSI Logic 工作过,并取得了丰富的技术经验。在这期间,对黄仁勋之后的事业有着重要影响的一件事就是他在设计部门工作了两年之后主动调到了销售部门。这让他对于产品开发设计与市场都有了更深刻的认识。

1993 年,30 岁的黄仁勋和另外两个伙伴一起创立了公司,并担任 CEO,成为了那个时代半导体行业最年轻的 CEO 和创始人。

黄仁勋在一次演讲中说:

创立公司时,我清楚地记得当时兜里只有 200 美金,而市场上当时已经有 250 个竞争对手,而且还包括很多大的公司,像 IBM、HP、索尼、富士通、东芝等等,还有太阳微系统(SUN),以及其他的半导体公司。

是什么使得英伟达成为历史上成长最快的半导体公司?

黄仁勋认为,是因为他们专注于世界上最复杂的、最困难的视觉计算问题。

很多人认为 NVIDIA 公司是一个游戏公司,倒也没什么错。

过去,人们的娱乐就是读书、听音乐,看电影,但今后人们会希望有更多的互动,希望有三维图形,讲述一些更加互动的生动的故事。

我们做的最重要的事情之一就是鼓励或者调动全球人民的激情,让他们了解什么叫三维的图形处理器,给他们提供很多工具,让他们达到创新和受鼓舞的感觉。

困难的开始

1993 年,当 NVIDIA 始做显卡,同类已林立,有些风投判断 “市场已基本饱和,再成立类似公司前景不光明”。黄不相信,他在两年后坚持推出第一款产品,结果市场也给了他一张冷漠的脸。

工程师们经常会犯的一个毛病是:做出一些宏大的设计,引起技术圈的阵阵惊叹,但未必能让市场掏钱 ——“NV1” 正是这样一出骄傲的悲情剧。

虽然这款产品在 3D 图形娱乐行业开初即表现了不拘传统的风格,并相当有野心想成为全方位 PC 平台娱乐霸主,但因性能不具备比竞争对手太多的优势,而且与系统格式兼容性不够,NV1 销量冷淡。意气风发的 NVIDIA 为此举步维艰,一度运营资金只能维持 30 天运转。

那时,如果不是日本世嘉公司及时给了一张订单,NVIDIA 可能早已消亡。因 NV1 同时集成了声卡功能,世嘉希望 NVIDIA 能为其设计一个类似芯片,后来世嘉意识到计划不可行而中途放弃,但照样支付了钱,NVIDIA 却为此逃过 “30 日生死劫”。


新 “显卡王”

此后,黄仁勋偶尔还会将 “Thirty Days” 挂在嘴边,这是 NVIDIA 的第一堂课 —— 教导黄要向市场学习,要足够谦逊 —— 但在这堂课中,形成了黄仁勋信念中重要的一条也是后来成为公司文化准则之一的东西,那就是 “及时纠错,绝不把时间浪费在悔恨上”。

事实上,此时全球 PC 图形硬件市场已如同战国,以研发芯片为主的厂商多如牛毛,而如新贵 3dfx 甚至已抓住机遇成为 PC 3D 游戏新领袖,它在 1995 年发布的第一款产品 Voodoo 赢得了市场阵阵掌声 —— 还显稚嫩的 NVIDIA,急需在新产品上有所突破。

1997 年,AGP 作为 PC 平台显卡接口出现在主板上,专门应付对宽带需求越来越高的 3D 加速卡,这项技术变革成了 NVIDIA 快速上升的一个 通道 —— 次年,当 NVIDIA 推出芯片代号为 NV3 的 AGP 3D 加速卡,这一极具锋芒的 “Riva 128” 成为当时市场上唯一真正具有 3D 加速能力的 2D+3D AGP 显卡,Voodoo 在性能和价格优势等方面遭致重大威胁。

1998 年,英伟达与台积电达成战略合作,将其显卡交付台积电生产。双方合作的第二年,英伟达提出了 GPU 概念。这一处理器后来被整个电脑和游戏行业所采用。

随着英伟达的 GPU 备受市场追捧,为其代工的台积电也快速成长。

1987~1991 年,台积电的销售复合增长率一度达到 74%。多年以来,台积电的销售平均复合增长率也达到了 19.7%。业界人士都认为这是个奇迹。

英伟达也在那几年里也保持了每年 70% 的复合增长率。英伟达 CEO 黄仁勋半开玩笑地说:“如果等我自己建厂生产 GPU 芯片,我现在可能就是一个守着几千万美元的公司的安逸的 CEO。”

1999 年,NVIDIA 出货量达到 1000 万个,他攒下了第一桶金。随后,NVIDIA 乘胜追击的产品成功拿下 3D 系列性能王冠,在多个领域打垮了竞争对手。

当经典产品 “Riva TNT2“到来时,NVIDIA 市场份额已首次超越 3dfx。2000 年 12 月,NVIDIA 将后者收购并取而代之成为新为了 “显卡之王”,中间仅用了 22 个月。


冒险成为 GPU “之父”

由于现代计算机 (尤其是家用系统、游戏发烧友) 中,图形处理器正变得越来越重要,黄感觉到,计算机行业开始需要一个专门的图形核心处理器。这正是 GPU 的由来,它是相对传统 CPU 的一个概念。

GPU 未来的趋势,就像眼睛一样,透过眼睛看到外部的世界。

对专业领域外人而言,要理解 GPU 的原理有点复杂。构建游戏画面渲染的模型为三角形,通常,渲染分两步走,第一步是决定三角形顶点位置和颜色,这部分工作以前都在 CPU 上进行;第二步才是显示芯片上决定三角形内部的所有点和颜色。

而 GPU 已能把三角形顶点的渲染从 CPU 中解放,改由显示芯片做。换言之,GPU 开始使显卡能分担 CPU 在 3D 计算机中的几何运算工作,让显示芯片不再只是像像素填充机和三角形生成器,从而减少对 CPU 的依赖,

但革命是很痛苦的。通过案例分析,管理大师克里斯坦森曾在《创新者的困境》一书中指出:那些真正重要、突破性的创新常在起步之初遭至主流市场的拒绝;同时,已成规模的大公司须时刻提防只将资本与技术集中在当前客户需求量最大、最能使公司获利的产品上,因为过分关注客户意见而不去寻求未来产品的新用户,这只会毁掉公司。

这是黄仁勋记忆深处感受最深刻的一本书,它直击了他的痛苦,但也指引了希望。事实上,当 NVIDIA 在做第一个 GPU 产品时冒了相当风险,因为前期调查没有客户表示要这个东西。想起这段日子,黄仍然心悸,他后来说:“其实可能也没有人知道自己需要什么。因为事情经常是这样,你没看到过一个东西,就不会知道自己是否需要。”

所幸黄选择了坚持,原因是:他认为虽然没有看到眼前市场,但看到了客户方向。

1999 年 8 月,NVIDIA 启用 GeForce 作为品牌推出了第一款 GPU 产品 ——“NV10”,即 “GeForce256”


“摩尔定律” 与 “黄氏定律”

英伟达推出了 GPU 概念后,有了台积电等代工厂的生产能力加持,黄仁勋提出了与 “摩尔定律” 并称的 “黄氏定律”。

业界的摩尔定律是每 18 个月推出新品,性能翻一番;而英伟达会投入三倍人力做同一件事,6 个月就推出新品。用速度抢生意。

那时候,英伟达产品每 6 个月升级一次,功能翻一番。而也正是在这种快速的产品更新频度下,使之后跟不上 NVIDIA 节奏的对手们陆续离场。

黄仁勋的投资也从不手软,每年研发支出约达营业额的 20%至 30%之间。相较之下,一般美国科技业者平均仅约 3%。

坚持做只有你能做而别人做不来的事,追求独特是英伟达的基因。

那时候英伟达出了显卡性能好,但发热情况也很让人头痛,因此被中国网友调侃为:“老黄核弹”,黄仁勋被称作 “核武狂魔”。比如 GTX 系列的旗舰卡,以致于 2010 – 年左右的用户圈子里还流行过用显卡煎蛋的活动。

同一时期,芯片领域除了 GPU,还有另一战场,即英特尔与 AMD 在 CPU 领域的对垒,但相较于后者,黄所从事的行业之战更为残酷,原因是 —— 这里的玩家不仅包括 NVIDIA、ATI,还有其它一些能生产中低端 GPU 产品的厂家,比如英特尔,因为它们产品虽不如前者,但在很多应用方面也能满足用户需求。

也由此,NVIDIA 只有拼命往前跑才不会死掉。

这就是科技公司一个相当危险的地方,你得时刻警惕未来在哪里,否则根本无法判断现在身处何方,因为没有足够清醒的反应能力,冷不丁你就会被甩出场外。

2004 年初,黄仁勋再次抓住新接口标准 PCI Express 大普及的机会,依靠其产品 Geforce 6800 Ultra 重夺回 3D 性能头把交椅,并通过 2006 年底发布的革命性产品 Geforce 8800 GTX,创下了其旗舰级 3D 娱乐显卡的销售记录。

从 1999 年至 2006 年,在 NVIDIA 与 ATI 双雄并进与对抗 7 年后,ATI 被 AMD 收购。合并伊始,业界不看好这对 “CPU 老二 + 显卡老二 “的” 弱弱联合 “,但这一行业急火流星般的竞速结果远超品牌等要素。


撞上时代大运

到 2012 年,上天为准备好了的英伟达掉下一块 “大馅饼”,这个馅饼就是 2012 年的 ImageNet 比赛。在这个比赛中取得突破的 AlexNet 的发明人亚历克斯就使用了英伟达的 GPU,证明了 GPU 非常适合用于有许多并行计算的神经网络,比 CPU 快得多。在这之后的几年,其他人都开始采用 GPU,比谁能将网络做得更大,层数更多。从此以后,GPU 成了神经网络计算的引擎,相当于 CPU 对电脑的作用一样。

黄仁勋年轻的时候从来没有想到,计算能力可以通过神经网络突飞猛进,他以为在他一生中不可能实现的事情,在人工智能的时代到来时实现了。

为什么 GPU 会成为神经网络计算的引擎?训练神经网络就相当于调黑盒子上的旋钮,调旋钮是通过数学的算法调的,这些旋钮动辄几十亿个,需要大量的计算。传统电脑用的是 CPU,用 CPU 去调旋钮相当于调完第一个再调第二个,一个一个按顺序来,虽然现在 CPU 很快,但神经网络的旋钮实在太多了,连 CPU 都招架不住了,这时候 GPU 就出现了。

GPU 和 CPU 不一样的地方是它一次可以同时调成千上万个旋钮,原来 CPU 几年才能调完的活 GPU 几天就干完了。GPU 的出现,让神经网络可以更大,因而处理能力更强,从一个纯学术的研究项目变为有巨大商业价值的工具。

深度学习需要用 GPU 的主要有两类:模型训练和识别。前者不光要处理大量训练数据,还要不断地试验不同的模型和参数,因此运算量巨大,一个训练模型可能要成百上千个 GPU 来算。识别的计算量少很多,但是用户多(例如谷歌、Facebook 的用户都以 10 亿计),所以总的运算量更大,通常是模型训练的几十倍甚至上百倍。由于几乎所有的深度学习都从英伟达买 GPU,所以英伟达芯片一直供不应求,其股价此后一路飙涨。

面对如此大的权力和利润,其他公司都心有不甘。首先是英特尔不甘心被摘下霸主桂冠,开始在 CPU 里集成更多的核心,2017 年的 Xeon Phi(处理器)里面多达 72 个核。但 CPU 毕竟还要做许多其他事情,单论深度学习还是远不如同档次的 GPU。


智能驾驶

芯片在汽车自动驾驶或机器人上使用需求很大,这一类芯片的耗电不能太大,例如在电动汽车里,芯片耗电不能使电池巡航距离降低超过 1%。对成本有一定的要求,计算速度也要比较快。目前英伟达的 GPU 是各大汽车厂商的首选,英伟达也将自动驾驶作为最重要的布局领域。

AMD、高通、英特尔都在竞争这块市场。高通曾经想以 440 亿美元收购荷兰半导体厂商恩智浦(NXP)公司,因为恩智浦的芯片已经广泛用在汽车的各个控制系统里。2017 年 3 月,英特尔以 153 亿美元收购以色列汽车视觉公司 Mobileye,从而在高级辅助驾驶系统(ADAS)市场实现领先。AMD 联合了原本是英伟达合作伙伴的特斯拉开发适用于自动驾驶的 AI 芯片。在巨大的市场潜力的吸引下,一些新创公司也进入这个领域。但整体而言新创公司在这个市场的机会也比较小,原因类似:研发成本太高,客户(汽车公司和它们的一级供应商)大而保守等。

医疗、生命科学、能源、金融服务、制造业、娱乐业和汽车业的研究人员正以疯狂的速度进行创新。2017 年,特斯拉(TSLA)展示了一款配备英伟达 Drive PX 硬件的自动驾驶汽车。这辆车成功地通过了繁忙的住宅区街道、蜿蜒的乡村道路和州际公路,然后在公司门前停下。

戴姆勒、奥迪等传统公司也在使用 Nvidia 提供的神经网络算法来推进它们的自动驾驶平台。Nvidia 最新制造的人工智能计算机 Drive PX Pegasus 每秒可以进行 320 万亿次计算。这足以处理相机、激光雷达、超声波和任何其他需要完全自动化的传感器数据。它装在一个饭盒大小的容器里。

与此同时,Nvidia 正在推出人工智能新产品,占领新市场。

2017 年 12 月,Nvidia 发布了 Titan V,这是一个价值 3000 美元的显卡工作站。然而,它并不是用于图形处理,而是将 Nvidia 的 GPU 计算平台扩展到下一代工作站。投资者应该关注这种前瞻性思维,这就是伟大的公司该做的。如今,GPU 是人工智能领域的标准配置。从大学研究人员到比特币矿工,聪明的程序员正在利用这个平台挑战学习的极限。在这个过程中,Nvidia 试图摆脱半导体业务的周期性。


元宇宙与孪生虚拟世界

“我们今天所做的一切将会自动化。” 黄仁勋在最近的一次演讲中描绘了对未来数字和人工智能自动化的设想,从虚拟人、工厂到城市,NVIDIA 的 Omniverse 平台正助力创造一个又一个虚拟世界。

他认为虚拟世界的规模将远大于物理世界,在虚拟世界中,创意人员将制造出比物理世界里更丰富多样的东西。

虚拟世界有很多建设者,而创建数字孪生虚拟世界的基础平台 Omniverse 则是为这些建设者而生,无论是设计师、科学家、创意人员还是企业,均可用它来大规模建造虚拟世界。

黄仁勋说,NVIDIA 专注于虚拟世界模拟引擎,以便每个公司都能在很多方面使用它解决现实问题。“我们是做技术基础设施的。” 他强调,NVIDIA 不是做应用平台和服务,引擎、算法、数学、计算机系统、硬件、系统软件等,这些才是 NVIDIA 所擅长的。

“Omniverse 与游戏引擎大不相同。” 黄仁勋说,它是面向数据中心规模设计的,有朝一日有望能达到全球数据规模。

每个公司几乎都可以从数字技术中受益,大公司有很多数字孪生世界用于工程、运营或软件开发,包括设计、训练和持续监控未来机器人建筑、工厂、仓库和汽车的平台。

NVIDIA 的自动驾驶汽车也有数字孪生,用于生成数据、模拟、绘制地图等。黄仁勋也多次展示过 NVIDIA 如何在 Isaac 训练机器人中用到数字孪生。

自去年年底推出以来,Omniverse 已被 500 家公司的设计师下载了 7 万次。

黄仁勋表示,3D 图像与电子游戏图形截然不同,电子游戏的大部分内容是在人类创造的虚拟世界中预先渲染的,而在 “元宇宙” 世界,必须强调环境、光线、物理、堆叠等所有的东西,必须完全实时,也必须能扩展到非常大的世界。

另外,这必须是个让人工智能可以适应的地方。无论是自动驾驶、自主机器人还是会说话的机器人,都离不开人工智能的支撑。


重新定义英伟达

在黄仁勋看来,虚拟世界将如同今天的互联网站那样不断涌现。技术不仅催生了虚拟世界,还允许不同的代理,不同的人连接到虚拟世界。

首先,加速计算,正在重塑从芯片、系统、加速库到应用的全栈式计算,这会带来 50 倍的提升。

其次,深度学习的兴起引发了现代 AI 革命,从根本上改变了软件。深度学习编写的软件具有高度并行性,这使其更有助于 GPU 加速并可扩展到多 GPU 多节点,扩展到像 DGX SuperPOD 这样的大型系统,使速度又提高 5000 倍。

最后,通过深度学习编写的 AI 软件,预测结果的速度能够比人工编写的软件快 1000-10000 倍,这彻底改写了我们解决问题的方式,甚至是可以解决的问题。

50 x 5000 x 1000 = 2.5 亿倍。

当一个重大问题的解决方案触手可及时,投资就会到来,比如当下对 AI、机器人和自动驾驶的投资,通过加速计算在数据中心大规模实施人工智能将极大提高模拟性能。

科学遵循物理定律,而研究人员正在创建 AI 模型,使其学习物理并做出符合物理定律的预测。机器学习在改善物理模拟方面的应用,一直在以难以置信的速度增长。

黄仁勋相信,加速计算、Physics-ML 和巨型计算机系统的结合,可实现 Million-X 百万倍的飞跃,并提供更多机会。

这也是 NVIDIA 的特别之处,不仅在晶体管层面,而是实现包括系统层、算法层、应用层在内的全栈优化。在某些非常重要的应用中,我们可以看到加速 100 万倍计算。

在演讲结束时,黄仁勋宣布将构建 Earth Two(E-2)数字孪生地球,来模拟预测气候,并透露 “将需要使用迄今为止发明的所有技术,来造第二个地球”。

除了在气候科学外,他相信在分子动力学和生命科学领域,也有机会将计算规模提高 100 万倍。

总结

从做显卡、3D 显示、到成为人工智能计算的引擎;再到创建数字虚拟世界的基础平台;

英伟达一直致力于研究最困难的技术问题,黄仁勋提出 “黄氏定律”,比摩尔定律对产品迭代创新的要求更高,通过在超高的研发投人,不断狂奔式的提高产品性能。

同时,在技术线路的选择上,充分把握客户与市场的发展方向;终于使英伟达打败了 3DFX,战胜 ATI,市值超过了 AMD,英特尔等一众老对手。

英伟达的突围之路,就是技术和研发公司的取胜之道。