Sep 3, 2025

一个个“奇点”何时到来，写在英伟达GTC发布新路线图之时

中文 (Chinese) English

一周内，我被不同的人问到了好几个关于时间的问题：

1、“什么时候投资研究将被彻底颠覆？”，我想了想，谨慎地说两年。其实，巨大的变化已经开始；

2、“什么时候机器人可以在家护理老人了？”，我想了想，自信的说五到十年。也许，最终的解决方法不是我们现在能线性外推的；

3、“什么时候AGI（通用人工智能）出现？”，我想了想，答案或许是，现在不已经是了吗？只是还不够那么智能而已，但“通用”已经开始了；

许多人认为2025年AI领域里最重要的是Agentic AI。在中文世界里，Agent被普遍翻译成“智能体”，我一直觉得奇怪，但也说不出问题在哪里。

但是上面这本书里，明明讲的跟我们中文理解的“智能”并没有什么直接的关系。

Agency被翻译成“能动性”更准确，那么，Agent应该不叫“智能体”，而叫“能动体”，可以自主干活的主体。

所以，它其实不需要“智能”，对吗？只要能“主动干活”就行。

如今的AI模型最重要的是实现了两个功能：

1、生成：不断“预测下一个token”来实现自动完成任务的功能，如今最用价值的，就是生成代码：几分钟就生成上百行可以正确执行的代码，这不是任何人力所能达到的了；

2、搜索：搜索模型训练时“压缩”的知识是一种搜索，搜索互联网上的信息是一种搜索，搜索用户上传的数据和资料，也是一种搜索。但是搜索不仅仅是获取信息的手段，更是“借脑”的方式：要实现一个交互式页面的功能，对于不熟悉前端开发的人比如我而言不是做不到，而是要花费很多学习时间，在人有限的时间精力约束下，这个技能点对我而言不是首选，如今，通过模型“压缩”过的“前端大神”的代码和知识，我可以在很短的几分钟里“借脑”实现需要的前端功能；

是的，生成与搜索，相互迭代，成为一个理论上可以“永动”的“能动体”。

花费了七百字的“开场白”在上面，这是在过去很长一段时间里去思考更远的未来时，无论线条多寡，似乎都会回到的原点。所以，作为铺垫，也许是合适的。

另一块重要的，是今天凌晨由黄仁勋献上的英伟达GTC2025的Keynote（主题演讲），这是ChatGPT发布以来第三个年头了，对于这项年度盛事的关注与报道已经几乎无死角了。所以，完整的点评不会是这篇文章的目标了，仅拿出演讲中提到的“路线图”。

1、是的，下一代架构Rubin的出货时间已经延迟到2026年二季度了。如果按照Blackwell从发布到延期的经验看，这个26年二季度的预期都有可能会落空的。我从去年下半年开始就一直在说的“技术挑战打乱产品节奏”已经从预期成为了妥妥的现实；

2、但是，今天英伟达面临的所有技术挑战，每一家芯片公司都会遇到，自研芯片会遇到，其他独立芯片会遇到；

3、但是但是，从一个完整系统（大算力集群）的层面看，目前“真正可用”的依然只有两套方案：英伟达的通用GPU和Google的TPU；

4、所以，当ChatGPT后的第三个GTC时，无论老黄的两小时演讲都多么尬，未来产品路线图，其实给出了未来一段时间里Scaling面临的硬件或者所谓“AI Infra”约束，与“可预期”；所以，也许未来三到五年，英伟达就是能见度最强的公司了，其他的，就是市场怎么看了；

是的，在这个稳定的预期下，我们可以看到，如果一切顺利，每一年算力的增长，就是到2027年下半年，如果相比现在已经开始部署的GB200 NVL72，单节点算力增长1.5X3.3X14=69.3倍。

Compute Growth

而单节点的意义是让大集群（数据中心内）在同样的面积下可以容纳更多的算力。所以，保守一点看，到2028年到2029年，我们可以预期前沿模型的算力增长一百倍。

简单而言，在不做任何优化的前提下，我们可以压缩百倍的数据（效率另说），或者为了效果和效率等因素考虑，我们也可以做其它的trade-off。但是，就是在差不多五年内，我们可以看到硬件还能给我们百倍的能力增长。

还有算法层面的优化呢？工程方面的优化呢？那些Deepseek做过的创新尝试的方向呢？

在当前“human in the loop”的代码生成也好，深度研究任务也好，我已经开始跟不上AI的速度了，那么如果五年左右，它的能力还有至少百倍提升呢？

是的，以上，就是我一直考虑的第二个部分的铺垫，那个“奇点”已经到来，通过GTC大会里大家最关心的英伟达的产品节奏来具象化的表达。

两个部分，共同构成了我回答开篇三个问题的基础，“可预期”已经告诉了我答案：两年，五到十年，以及“now”的答案。

1、我们已经可以很清晰的看到AI的生成和搜索能力，已经严重的动摇了软件工程 and 商业研究的基础，在过去的一段时间里，我做的尝试，发的文章，生成的视频，都在说明这个“现状”；

2、既然这种搜索和生成实现了某种“借脑”，它的所有知识来自于人类，那么为了防止被“借”，每一个人的个体会走向更为“封闭”吗？这个问题，见仁见智，我其实也有我自己的答案；

3、如果在可见的五到十年，我们逐渐从“Human in the loop”走向“AI Iteration by themselves”，社会会发生什么？我们可能都需要做好充分的准备，我相信，不是“卷”；

4、我们正处在一个无时无刻数字化率都在提升的世界中，人类视野中的“物理”都将逐渐走入数字：交通，我们从A点到B点的位移，将快速的变成计算；工作？我开始想不清楚这个定义在未来意味着什么了；知识？同样的道理……

5、说到底，这就是一个数据与计算的世界，巨大的算力、能源消耗背后，只有改变生产，才能使投入变得更为值得，所以，这是个B端的故事；

6、但是，如果那个所谓的B端环境本身就是我们一个又一个个体呢？B与C会有多大的区别吗？

7、我们可能是一个人，但我们可能同一时间使用几个、几十个，甚至成百上千个模型或者“能动体”Agent，这不一定能让我们变得更好，但一定会改变我们的社会关系；

8、说到底，生成和搜索，改变了软件与知识；