Sep 3, 2025

Agent智能体的诱惑与陷阱

计划里，这是篇非常短的文章，只想快速的把脑子里的结论梳理一下。

因为一个产品，Agent智能体又火了起来，抛开资本因素的考虑，就这个概念本身，真的足够有吸引力：让AI替自己干活，是每个人的梦想，大模型基础上构建Agent越来越低的门槛又让这件事情看起来变得无限接近。

然而，这或许就是个“美丽的陷阱”。

1、Agent再强，能力来自于底层的基础模型：语言模型来理解和交互，来生成代码，来构建指令，进行computer use，browse use等各种use。靠多模态模型来识别图片、视频，甚至声音。离开基础大模型，Agent将一无用处。这是模型进步到现在，agent能够越来越有用的原因，但也是所有基于大模型开发所谓通用Agent应用的一个巨大瓶颈；

2、如果Agent能够完成某项工作了，我们为什么还需要这项工作？最简单的例子，如果Agent可以生成word、ppt了，而且把门槛降到大家希望的“小白”程度，那么，我们为什么还需要word、ppt？我们正在进入一个重建“各种协议”的阶段；

3、如果把Agent作为生产力工具，那么就需要跟具体的生产环境相结合，离不开人和私有数据的磨合。这个过程，既有巨大的技术障碍，也产生了很大的管理障碍；然而，解决这些障碍要付出的不仅仅是努力，还有巨大的信任与空间，以及相互的理解与包容；

4、如果把Agent作为C端工具，可是好像在过去的时代里，那些成功的C端产品似乎都有某种情感连接在里面，似乎都是通过当时最好的技术手段或者算法解决了99公里的问题，把最后1公里留给了人或者人与人的连结上。我相信，未来，但不是现在，一定会有这样的通过进一步的“技术压缩”，解决99.99公里的问题，将最后0.01公里，留给人，人与人的连结，甚至，人与机器的情感连结上。

可是，我们现在需要为了这种目标做更多，在这个已经明显进入hyper cycle的一段时间里。