历史对于人类科技发展进程的记忆,其实往往是集中在某些闪光的瞬间。
PART-01 AI 的 iPhone 时刻,不再属于 iPhone
能够在智能手机上阅读到这篇文章的读者,无一不直接或者间接受惠于 iPhone。
2007 年 1 月 9 日,在一场举行于美国旧金山 Moscone Center 的 Macworld 活动上,乔布斯发布了初代 iPhone。从此,以 iPhone 和它所代表的智能手机为载体,一场在真正意义上改变了世界的新一轮人类科技史发展进程,正式开启。
即使是用「划时代」来形容 iPhone 在人类科技史的地位,也毫不为过。
时间来到 16 年后,iPhone 本身作为一个成绩斐然的商业资产,依旧存在于苹果公司的产品更新序列中,它拥有更好的芯片、更强的功能,以及更贵的价格——但是,乔布斯带给 iPhone 的历史光辉,却被另外一位具有巨大影响力的行业领导者、英伟达创始人黄仁勋所致敬、铭刻和阐释。
2023 年 3 月 21 日,在英伟达一年一度的 GTC 大会上,针对 OpenAI 旗下 ChatGPT 给整个 AI 行业带来的巨大影响,黄仁勋表示:
一个崭新的计算平台已经被发明出来,而 AI 的 iPhone 时刻已经开始。
就这样,以这场大会为节点,「AI 的 iPhone 时刻」成为一个行业热门词汇。
而考虑到 iPhone 这个名词本身所指代的革命性意义,以及 AI 的长期发展对于一个关键技术质变点的强烈呼唤,这个词汇迅速得到了行业的广泛认同,而整个科技行业对于 ChatGPT 的关注和对它的潜在行业影响力的重视,也随着「AI 的 iPhone 时刻」这个词汇到达前所未有的高度。
但当时,ChatGPT 的诞生也仅仅不到半年的时间,而它的发布过程也并不像 iPhone 那样被一家类似于苹果这样的备受瞩目的科技巨头来做背书,也没有类似于乔布斯这样的营销天才来精心安排。
回过头来看,2022 年 11 月 30 日,由 Sam Altmam 担任 CEO 的 OpenAI 仅仅是选择在官网上不动声色发布了 ChatGPT,没有任何的线下仪式——然后,在短短几个月时间里,ChatGPT 如同星火燎原一般,彻底火了。
当然,对 ChatGPT 的行业重要性拥有深刻认知的,除了黄仁勋,还有马斯克。
2023 年 5 月 16 日,在出席特斯拉年度股东大会之后,特斯拉 CEO 马斯克接受了美国媒体 CNBC 的访谈。
他在访谈中揭露了自己与 OpenAI 的关联,比如说:他本人其实正是 OpenAI 的发起人和命名者,投入了 5000 万美元左右的资金,而且在人才的招募方面发挥了关键作用(比如 ChatGPT 背后的核心技术人员 Ilya Sutskever 正是由马斯克从 DeepMind 招募而来)。
在这次访谈中,马斯克也谈到了特斯拉和 ChatGPT,他表示:
我认为特斯拉也会迎来一个所谓的「ChatGPT 时刻」,就算不是今年,我认为也不会迟于明年。突然之间,300 万辆特斯拉汽车可以自己驾驶……然后是 500 万辆,然后是 1000 万辆……
如果我们颠倒彼此的位置,特斯拉来做一个输出结果不弱于 ChatGPT 的大语言模型,而微软和 OpenAI 去做自动驾驶,我们把彼此的任务互换。
毫无疑问地,我们会赢。
从马斯克接受采访时的话语来看,很明显,在他的定义中,特斯拉的「ChatGPT 时刻」指向的是特斯拉的自动驾驶业务。在马斯克看来,特斯拉的自动驾驶也会迎来一个非常关键的时刻,到时候,它会像 ChatGPT 一样迎来一次爆发和质变。
基于马斯克在整个科技行业的巨大影响力,尤其是他所任 CEO 的特斯拉在自动驾驶行业的领头羊角色,如今,「ChatGPT 时刻」往往被自动驾驶行业所引用,并被各家普遍指向为「自动驾驶在某一天能够真正实现的时刻」。
于是,自动驾驶的 ChatGPT 时刻,也成为一个行业在预期层面热衷于讨论的话题。
值得一提的是,就在马斯克提出「ChatGPT 时刻」这个词汇的两个月后,他就在 2023 年 7 月宣布成立了一家目标为「理解宇宙的真实本质」的 AI 企业 xAI;而从业务层面上看,这家企业与 OpenAI 存在着某种对标和竞争关系——在马斯克的执掌下,xAI 已经推出了 ChatGPT 的对标产品 Grok。
而到目前为止,该公司最新发布的重大动态是:
2024 年 5 月 26 日,它宣布完成了高达 60 亿美元的 B 轮融资。
当然,在 xAI 快速成长的同时,Sam Altman 领导的 OpenAI 也在商业合作上取得了令人瞩目的突破。
其中,2024 年 6 月 10 月,苹果在 WWDC 活动上正式宣布了与 OpenAI 的合作,通过这一合作,苹果将 ChatGPT 的能力(基于 GPT-4o,包括图像和文档理解)整合到 iOS、iPadOS 和 macOS 的体验中去。这个业务动态本身,也可以意味着 iPhone 也在拥抱 ChatGPT,如果强行命名的话,仿佛此处也应该存在一个所谓的「iPhone 的 ChatGPT 时刻」。
但遗憾的是,世殊时异——即使有 ChatGPT 的加持,属于 iPhone 的历史高光时刻也早已远去了。
毕竟,不同的赛道,在历史长河中呈现出的变迁方式,往往不同。
比如,iPhone 在初代产品诞生之时就已经备受瞩目,后来经历了三次迭代之后,凭借 iPhone 4 的惊艳产品体验创造了一个新的历史高度,此后更是一路直上,为苹果的万亿市值立下汗马功劳。
当然,智能手机领域的战争精彩、残酷,却又无比短暂;无论如何,属于这个领域的精彩故事,已经基本结束。
PART-02 马斯克与黄仁勋之间的三个历史切片
与 iPhone 和以它为代表的智能手机赛道相比,AI 这条未知的道路过于漫长,也过于泥泞,但实际上,属于它的精彩才刚刚开始——其中,就过去十余年的发展而言,这条路上最精彩的故事是自动驾驶。
同时,从汽车行业的角度来看,对于自动驾驶的拥抱,也成为了汽车智能化的关键一环;而不得不强调的是,以蔚来、小鹏、理想为代表的中国新势力车企,无疑也已经成为这一波自动驾驶在商业落地层面的重要角色。
考虑到这一轮自动驾驶与 AI 之间的深刻关联,特斯拉和英伟达这两大科技公司的掌门人——马斯克和黄仁勋,成为了这个故事的两大关键主角。在过去十年间,他们二人用各自的方式推动了 AI 与自动驾驶的共同发展。
关于马斯克和黄仁勋几个历史切片,依旧值得回顾。
第一个切片是:马斯克和黄仁勋唯一一次在一个面向公众的公开舞台上同台亮相。
当时的背景是,2015 年初,英伟达刚刚发布自家的第一代自动驾驶计算平台 DRIVE PX,而黄仁勋正在努力为这一领域寻找潜在的客户群体,特斯拉正是它瞄准的第一个客户。与此同时,特斯拉虽然已经在自动驾驶业务上与 Mobileye 达成了合作,但是双方合作不畅,因此特斯拉也在寻找新的供应商。
于是,黄仁勋和马斯克都在需求双方合作的可能性。
2015 年 3 月 18 日,在英伟达当年的 GTC 大会主旨演讲的收尾环节,黄仁勋请来了当时正在全力推进特斯拉自动驾驶业务的马斯克,双方在舞台上进行了一场关于 AI 和自动驾驶发展的对话。
在这次访谈中,当双方谈到 AI 对人类的潜在影响时,马斯克表示,AI 的确有可能比核武器更加危险,但是人们不用太担心自动驾驶,因为这是一种更加狭义的人工智能。而在黄仁勋问到自动驾驶的实现路径时,马斯克表示:
你需要一些硬件基础,比如说传感器和计算设施,然后你可以持续更新软件,至少特斯拉可以如此,因为它是一直联网的,然后车的功能就可以不断提升……如果要实现自动驾驶,我们需要更大的传感器组合和更强的计算能力……
马斯克还在这次访谈中提到了自动驾驶实现所需要面临的监管问题:
即使到了汽车绝对比人安全的那一刻,我们仍需经历两到三年的时间,监管者才会允许这种情况发生。因为他们想要看到大量的统计证据。它不仅要和人一样安全,而且要安全得多。
我认为这个问题的解决方案是「影子模式(shadow mode )」,也就是对众多情况下计算机的决策是否会发生车祸进行大量样本的判断,从而通过数据说服监管部门。
此处需要注意的是:此后在特斯拉自动驾驶发展过程中扮演了重要角色的「影子模式」,其实在 2015 年 3 月份之前,就已经出现在马斯克的构想中。
第二个历史切片,与 OpenAI 相关。
2016 年 8 月,黄仁勋来到 OpenAI 位于旧金山的办公室,并且在马斯克(当时的身份是 OpenAI 的发起人)的见证下,向 OpenAI 团队交付了世界上第一台英伟达 DGX-1 超级计算系统(该超级计算系统在 2016 年的 GTC 大会上正式发布)。
在这个超级计算系统的外壳上,黄仁勋用马克笔写道:
To Elon & the OpenAI Team! To the future of computing and humanity. I present you the World‘s First DGX-1!(致 Elon 和 OpenAI 团队!致计算和人类的未来。我为你们呈上全球首台 DGX-1!)
而作为回应,马斯克则用一句 Thanks 表达了谢意。
有意思的是,当时的背景是:英伟达和特斯拉之间已经就自动驾驶芯片的合作达成了协作,双方正处于合作的蜜月期——但需要强调的是,由于特斯拉已经在 2016 年初就开启了自研芯片的工作,所以特斯拉与英伟达之间的分道扬镳是注定的。
第三个历史切片,则是马斯克和黄仁勋之间的一次隔空对话。
2018 年 8 月,在一次财报电话会议中,黄仁勋回应了关于「特斯拉自研自动驾驶芯片」的提问。他谈到了自动驾驶芯片和软件栈的难点,然后对马斯克隔空喊话说:如果最终不是你们想要的样子,可以给我打个电话,我会非常乐意帮忙。
对此,马斯克也在推特上回应说:
英伟达做出了非常棒的硬件,对黄仁勋和他的公司有很高的敬意;但我们的硬件需求非常独特,需要跟我们的软件紧密地匹配。
那时候的马斯克和黄仁勋,已经注定要在自动驾驶芯片的合作上分道扬镳了。
以上三个切片,是马斯克和黄仁勋在过去十年间分别带领特斯拉和英伟达在 AI 和自动驾驶行业前行的缩影,当然,二人依旧关系很好——而且,非常幸运的是,在此后的 AI 和自动驾驶发展浪潮中,马斯克和黄仁勋都在继续以行业领导者的身份参与其中,并且扮演了关键角色。
有意思的是,在特斯拉的探索和带领下,BEV + Transformer、端到端相继成为自动驾驶行业的参与者(包括中国车企)进行算法演进时的共同范式;而英伟达的 Orin 计算平台,则为包括中国众多车企在内的自动驾驶从业者提供了端侧算力基础。
当然,在 AI 和自动驾驶的赛道中,英伟达和特斯拉的故事还将延续下去。
PART-03 一个科学家的「星光璀璨的重要时刻」
在历史发展的宏大叙事面前,个体能够扮演什么样的角色?
这固然是一个因人而异的问题,但对于 Andrej Karpathy(本文简称 AK)这样的计算机科学家来说,他也在历史的偶然性和必然性的缝隙中,努力地寻找到自己的历史坐标,并且幸运地收获了属于他个人的高光时刻。
AK 出生在斯洛伐克,15 岁随家人来到加拿大,并在 19 岁年进入到多伦多大学的计算机专业学习,并在这里遇见了他在 AI 领域的重要引路人——著名的计算机科学和人工智能领域专家、后来的图灵奖得主、有着「深度学习之父」之称的 Jeffery Hinton。
到了 2012 年 6 月 ,当特斯拉 Model S 正式开启量产交付之后,AK 已经完成硕士学业,并且在斯坦福大学攻读计算机科学博士学位,师从另外一位 AI 领域的大神李飞飞,专注于自然语言处理、计算机视觉和深度学习领域。
当时,在特斯拉看到 Model S 发布之后,25 岁的 AK 喜爱不已,他非常迫切地希望自己拥有一辆 Model S,并表示「从来没有像现在这样希望自己是一个有钱人」。
当然,AK 很早就是马斯克本人的迷弟。当时,他甚至在推特上毫不掩饰地表示,他对马斯克产生了一种激赏(Man-Crush)。
不过,在 2012 年秋季, AK 与马斯克并无交集,他也并没有多少空闲时间去研究 Model S——毕竟,他要在导师李飞飞教授的指导下,参与到本年度的 ImageNet 图像识别竞赛的具体事务中。正是在这一年的 ImageNet 大赛中,AlexNet 脱颖而出,并正式开启了这一轮 AI 爆发热潮。
可以说,AK 是当时离这起浪潮的爆发核心最近的几个人。
2015 年 1 月 ,著名的《连线》杂志发表了一篇以 AK 本人为主角的文章,这篇文章的主要内容是:通过自己的学习,AK 在 ImageNet 竞赛中战胜了 Google 打造的面向图像识别的深度卷积神经网络系统。
这篇文章被马斯克在 Twitter 上转发——这成为马斯克注意到 AK 的开始。
2015 年 3 月,在英伟达 GTC 的主旨活动中,AK 与黄仁勋一起,向现场观众展示了一个非常有新意的 AI 应用:识别一张图像,再生成一个描述图像的句子。同样是在这场主旨活动中,马斯克也登台,与黄仁勋进行了一次对话。
这是 AK 第一次离马斯克如此之近。
不过,马斯克与 AK 真正有机会共事,要归结到 2015 年底 OpenAI 的正式成立。OpenAI 成立时,AK 刚刚博士毕业,他以创始成员的身份加入 OpenAI 并待了一年多的时间。
至于 AK 为何选择在 2017 年 6 月加入特斯拉,在一次采访中,AK 是这么说的:
当我在 OpenAI 工作两年的时候,我已经做了十年的研究,包括硕士、博士和 OpenAI 三个阶段。我花了十年的时间,基本上都是在学术框架下去读论文、训练神经网络。
那个时候,我觉得有点焦躁不安。因为我意识到,这些算法非常强大,可能会在社会上解决一些非常重要的问题,我希望在这个方面扮演更加积极主动的角色。
所以我就开始看各种不同的机会,包括创业公司之类的。恰好这个时间,我遇见了这么一个情况:OpenAI 当时也是属于整个 Elon 布局下的一部分,有时候我会跟他探讨关于特斯拉的一些问题,我也在帮助 Autopilot 遇见的一些问题做咨询。
我意识到,他们基本上正在解决的是一个深度学习计算机视觉的难题,这个难题是决定产品能够正常运行的关键。我对这个事情提起了兴趣,但当时只是一些咨询工作,我也会跟团队沟通。
而当我开始感到焦躁不安的时候,Elon 找过来了,他说你已经为团队做了一些咨询,你是否有兴趣真正加入特斯拉并领导整个计算机视觉团队和 Ai 团队,从而让车能够动起来。
所以其实 Elon 是在一个非常正确的时间找到了我,我当时也在看新机会,就觉得这个机会非常完美。我觉得自己可以搞定,觉得自己可以在这里做出贡献。这确实是一个非常有影响力的机会。
我喜欢这家公司,我也喜欢 Elon,所以我觉得那是星光璀璨的重要时刻,那一刻,我也强烈地觉得那是我应该做的事情。
于是,在马斯克的慧眼识英雄下,AK 离开了 OpenAI,并在 2017 年 6 月加入特斯拉,并直接向马斯克汇报。
值得一提的是,当 AK 入职特斯拉的时候才发现,那时候特斯拉只有两个人在训练深度神经网络。这几乎相当于从零开始。不过也正是基于这个背景,他才有足够大的机会和空间去在通过 AI 赋能 Autopilot 的过程践行自己的理念。
从后来的情况来看,AK 在待在特斯拉的五年多时间里,帮助特斯拉构建了数据引擎、构建了高速 NOA 功能。更重要的是,在他的主导之下,特斯拉选择将 Transformer 架构融入到感知算法架构中去,并由此推动 Transformer + BEV 成为整个自动驾驶领域在面向行业落地时的经典范式。
可以说,AK 在自动驾驶发展史中的地位,已经由这段职业生涯奠定。
不过,在上述范式完成之后,出于对 AGI(通用人工智能)的追求,2022 年 7 月,AK 选择从特斯拉离职,并且又在 2023 年 2 月又加入到 OpenAI——他一直处于 AI 领域发展的前沿。
然而,关于 AK 的最新动态是:2024 年 2 月,他又选择从 OpenAI 离开。
这,就是他作为一个计算机科学家在科技发展大历史的个人际遇和抉择。他当然是幸运的,但不可否认的是,他也一直在遵从自己的内心,努力地抓住了所有的机会,也在努力地在这个时代发出个人的光彩。
当然,他的故事也将延续。
PART-04 因为相信,所以看见
AI、自动驾驶、ChatGPT、Transformer、大模型……这些归属于新一轮技术变革的众多技术名词,正在成为改变当前社会发展的最新驱动力的代名词。
当然,在此过程中,类似于特斯拉、英伟达、苹果、微软、Google 、英特尔、OpenAI 等这样的美国科技公司,以及类似于华为、百度、小米、蔚来、小鹏、理想、地平线等这样的中国科技企业,也正在以某种方式成为科技在历史演进层面不可分割的一部分。
身为这一演进过程中的个体,每个人也正在以不同的方式参与其中,无论是黄仁勋和马斯克这样的行业领袖,还是类似于 AK 这样的技术专家,都在躬身入局,推进着整个行业前进的方向——当然,即使是你我这样的普通人,也可以是这一演进过程中在行业应用层面的参与者、见证者。
当然,AGI(通用人工智能)还没有实现,自动驾驶还是一团迷雾,这一波技术发展的过程,也正如历史前进过程中曾经出现的种种困境那样,模糊不清。但人类之所以能够在迷雾中继续前行并取得成功,在于我们中的很多人选择了相信,也就是所谓的「因为相信,所以看见」。
比如在 2022 年 10 月,在离开特斯拉数个月后,AK 接受采访并谈到他对「自动驾驶是否能够穿越迷雾」的信心:
有雾,你正在取得进展,并且你看到接下来的方向是什么。你看着剩下的一些挑战,它们并没有干扰你,它们没有改变你的哲学,而且你没有扭曲自己。你会说,实际上这些就是我们仍然需要做的事情。
毫无疑问,说出这段话时的 AK,正在发光。
而我们之所以对类似于这样的闪光时刻如此津津乐道,正是我们深刻体会到一个道理,也就是正如本文开头所言:历史对于人类科技发展进程的记忆,其实往往是集中在某些闪光的瞬间。
而我们,已经做好了深刻地见证这些瞬间的准备。