Agent智能体的诱惑与陷阱

Agent智能体的诱惑与陷阱


计划里,这是篇非常短的文章,只想快速的把脑子里的结论梳理一下。

因为一个产品,Agent智能体又火了起来,抛开资本因素的考虑,就这个概念本身,真的足够有吸引力:让AI替自己干活,是每个人的梦想,大模型基础上构建Agent越来越低的门槛又让这件事情看起来变得无限接近。

然而,这或许就是个“美丽的陷阱”。

1、Agent再强,能力来自于底层的基础模型:语言模型来理解和交互,来生成代码,来构建指令,进行computer use,browse use等各种use。靠多模态模型来识别图片、视频,甚至声音。离开基础大模型,Agent将一无用处。这是模型进步到现在,agent能够越来越有用的原因,但也是所有基于大模型开发所谓通用Agent应用的一个巨大瓶颈;

2、如果Agent能够完成某项工作了,我们为什么还需要这项工作?最简单的例子,如果Agent可以生成word、ppt了,而且把门槛降到大家希望的“小白”程度,那么,我们为什么还需要word、ppt?我们正在进入一个重建“各种协议”的阶段;

3、如果把Agent作为生产力工具,那么就需要跟具体的生产环境相结合,离不开人和私有数据的磨合。这个过程,既有巨大的技术障碍,也产生了很大的管理障碍;然而,解决这些障碍要付出的不仅仅是努力,还有巨大的信任与空间,以及相互的理解与包容;

4、如果把Agent作为C端工具,可是好像在过去的时代里,那些成功的C端产品似乎都有某种情感连接在里面,似乎都是通过当时最好的技术手段或者算法解决了99公里的问题,把最后1公里留给了人或者人与人的连结上。我相信,未来,但不是现在,一定会有这样的通过进一步的“技术压缩”,解决99.99公里的问题,将最后0.01公里,留给人,人与人的连结,甚至,人与机器的情感连结上。

可是,我们现在需要为了这种目标做更多,在这个已经明显进入hyper cycle的一段时间里。

← Back to Blog