一个个“奇点”何时到来,写在英伟达GTC发布新路线图之时

一个个“奇点”何时到来,写在英伟达GTC发布新路线图之时


一周内,我被不同的人问到了好几个关于时间的问题:

1、“什么时候投资研究将被彻底颠覆?”,我想了想,谨慎地说两年。其实,巨大的变化已经开始;

2、“什么时候机器人可以在家护理老人了?”,我想了想,自信的说五到十年。也许,最终的解决方法不是我们现在能线性外推的;

3、“什么时候AGI(通用人工智能)出现?”,我想了想,答案或许是,现在不已经是了吗?只是还不够那么智能而已,但“通用”已经开始了;

许多人认为2025年AI领域里最重要的是Agentic AI。在中文世界里,Agent被普遍翻译成“智能体”,我一直觉得奇怪,但也说不出问题在哪里。

但是上面这本书里,明明讲的跟我们中文理解的“智能”并没有什么直接的关系。

Agency被翻译成“能动性”更准确,那么,Agent应该不叫“智能体”,而叫“能动体”,可以自主干活的主体。

所以,它其实不需要“智能”,对吗?只要能“主动干活”就行。

如今的AI模型最重要的是实现了两个功能:

1、生成:不断“预测下一个token”来实现自动完成任务的功能,如今最用价值的,就是生成代码:几分钟就生成上百行可以正确执行的代码,这不是任何人力所能达到的了;

2、搜索:搜索模型训练时“压缩”的知识是一种搜索,搜索互联网上的信息是一种搜索,搜索用户上传的数据和资料,也是一种搜索。但是搜索不仅仅是获取信息的手段,更是“借脑”的方式:要实现一个交互式页面的功能,对于不熟悉前端开发的人比如我而言不是做不到,而是要花费很多学习时间,在人有限的时间精力约束下,这个技能点对我而言不是首选,如今,通过模型“压缩”过的“前端大神”的代码和知识,我可以在很短的几分钟里“借脑”实现需要的前端功能;

是的,生成与搜索,相互迭代,成为一个理论上可以“永动”的“能动体”。

花费了七百字的“开场白”在上面,这是在过去很长一段时间里去思考更远的未来时,无论线条多寡,似乎都会回到的原点。所以,作为铺垫,也许是合适的。

另一块重要的,是今天凌晨由黄仁勋献上的英伟达GTC2025的Keynote(主题演讲),这是ChatGPT发布以来第三个年头了,对于这项年度盛事的关注与报道已经几乎无死角了。所以,完整的点评不会是这篇文章的目标了,仅拿出演讲中提到的“路线图”。

1、是的,下一代架构Rubin的出货时间已经延迟到2026年二季度了。如果按照Blackwell从发布到延期的经验看,这个26年二季度的预期都有可能会落空的。我从去年下半年开始就一直在说的“技术挑战打乱产品节奏”已经从预期成为了妥妥的现实;

2、但是,今天英伟达面临的所有技术挑战,每一家芯片公司都会遇到,自研芯片会遇到,其他独立芯片会遇到;

3、但是但是,从一个完整系统(大算力集群)的层面看,目前“真正可用”的依然只有两套方案:英伟达的通用GPU和Google的TPU;

4、所以,当ChatGPT后的第三个GTC时,无论老黄的两小时演讲都多么尬,未来产品路线图,其实给出了未来一段时间里Scaling面临的硬件或者所谓“AI Infra”约束,与“可预期”;所以,也许未来三到五年,英伟达就是能见度最强的公司了,其他的,就是市场怎么看了;

是的,在这个稳定的预期下,我们可以看到,如果一切顺利,每一年算力的增长,就是到2027年下半年,如果相比现在已经开始部署的GB200 NVL72,单节点算力增长1.5X3.3X14=69.3倍。

Compute Growth

而单节点的意义是让大集群(数据中心内)在同样的面积下可以容纳更多的算力。所以,保守一点看,到2028年到2029年,我们可以预期前沿模型的算力增长一百倍。

简单而言,在不做任何优化的前提下,我们可以压缩百倍的数据(效率另说),或者为了效果和效率等因素考虑,我们也可以做其它的trade-off。但是,就是在差不多五年内,我们可以看到硬件还能给我们百倍的能力增长。

还有算法层面的优化呢?工程方面的优化呢?那些Deepseek做过的创新尝试的方向呢?

在当前“human in the loop”的代码生成也好,深度研究任务也好,我已经开始跟不上AI的速度了,那么如果五年左右,它的能力还有至少百倍提升呢?

是的,以上,就是我一直考虑的第二个部分的铺垫,那个“奇点”已经到来,通过GTC大会里大家最关心的英伟达的产品节奏来具象化的表达。

两个部分,共同构成了我回答开篇三个问题的基础,“可预期”已经告诉了我答案:两年,五到十年,以及“now”的答案。

1、我们已经可以很清晰的看到AI的生成和搜索能力,已经严重的动摇了软件工程 and 商业研究的基础,在过去的一段时间里,我做的尝试,发的文章,生成的视频,都在说明这个“现状”;

2、既然这种搜索和生成实现了某种“借脑”,它的所有知识来自于人类,那么为了防止被“借”,每一个人的个体会走向更为“封闭”吗?这个问题,见仁见智,我其实也有我自己的答案;

3、如果在可见的五到十年,我们逐渐从“Human in the loop”走向“AI Iteration by themselves”,社会会发生什么?我们可能都需要做好充分的准备,我相信,不是“卷”;

4、我们正处在一个无时无刻数字化率都在提升的世界中,人类视野中的“物理”都将逐渐走入数字:交通,我们从A点到B点的位移,将快速的变成计算;工作?我开始想不清楚这个定义在未来意味着什么了;知识?同样的道理……

5、说到底,这就是一个数据与计算的世界,巨大的算力、能源消耗背后,只有改变生产,才能使投入变得更为值得,所以,这是个B端的故事;

6、但是,如果那个所谓的B端环境本身就是我们一个又一个个体呢?B与C会有多大的区别吗?

7、我们可能是一个人,但我们可能同一时间使用几个、几十个,甚至成百上千个模型或者“能动体”Agent,这不一定能让我们变得更好,但一定会改变我们的社会关系;

8、说到底,生成和搜索,改变了软件与知识;

← Back to Blog