Oct 6, 2025

OpenAI正在堕入“自证陷阱”

中文 (Chinese) English

OpenAI DevDay，有点小期待的已经被预告Agent Builder功能，于是醒过来就过来看通知（年纪大了，看不了直播了）。

当然不看直播也没任何损失，我也不用看视频回看，Gemini就可以，以下是Gemini的总结：

OpenAI开发者日2025：Sam Altman主题演讲摘要

引言

Sam Altman的演讲重点是让开发者更容易地使用人工智能（AI）。[02:07]

此次演讲将涵盖四个主要领域：在ChatGPT内构建应用程序、构建代理、编写软件以及模型和API的更新。[02:16, 02:42]

ChatGPT中的应用程序

OpenAI正在推出一个应用程序SDK，让开发者能够在ChatGPT中构建真正的应用程序。[03:47]

这些应用程序将是交互式、自适应和个性化的，用户可以与之聊天。[03:40]

SDK构建在开放标准MCP之上，让开发者可以完全控制其后端逻辑和前端UI。[04:02]

通过应用程序SDK构建的应用程序可以触达数亿的ChatGPT用户，为开发者提供一个重要的产品扩展平台。[04:09]

演示展示了Figma、Spotify、Coursera、Canva和Zillow等应用程序如何在ChatGPT中使用，展示了其多样化的功能。[04:55, 11:26]

应用将通过直接应用名称搜索和在对话中推荐的方式被发现。[04:50, 05:08]

构建代理

为了简化代理的构建，OpenAI推出了Agent Kit，这是一个完整的构建模块集，可帮助将代理从原型阶段推向生产。[16:52]

Agent Kit的核心功能包括：

Agent Builder： 一个用于构建代理的可视化画布，可以快速设计逻辑步骤和测试流程。[17:17]
Chat Kit： 一个简单的可嵌入聊天界面，可将聊天体验带入开发者的应用程序中。[17:36]
Evals for Agents： 专门用于衡量代理性能的新功能，包括跟踪分级、数据集和自动提示优化。[17:58]

Albertson's和HubSpot等公司已经在使用Agent Kit来改进他们的运营和客户服务。[18:42, 19:38]

现场演示展示了如何使用Agent Kit在八分钟内在DevDay网站上构建和部署一个代理。[21:17]

编写软件

Codex是OpenAI的软件工程代理，旨在与开发者协同工作，加速软件创建。[31:18]

Codex现在可以在IDE、终端、GitHub和云端等各种编码环境中使用，并通过ChatGPT帐户连接。[31:35]

它运行在新的GPT-5 Codex模型上，该模型经过专门的代码重构和代码审查等任务训练。[31:51]

Codex的新功能包括Slack集成、Codex SDK和新的管理工具和报告。[33:15, 33:34]

现场演示展示了如何使用新的Codex和API将周围的任何东西都变成可行的软件，包括控制摄像头和灯光系统。[34:11]

模型和API更新

GPT-5 Pro现在可以通过API向所有开发者提供，为金融、法律和医疗保健等领域的复杂任务提供更高的准确性和推理深度。[46:41, 46:56]

Sora 2现在也通过API提供预览版，让开发者可以将由Sora 2驱动的令人惊叹的视频输出直接整合到自己的应用程序中。[47:47, 47:54]

Sora 2的进步包括增强的可控性、将声音与视觉效果配对的能力，以及将现实世界元素融入生成视频的能力。[48:00, 48:45]

美泰等合作伙伴已经在使用Sora 2 API将产品创意更快地变为现实。[49:55, 50:02]

结论

Sam Altman的演讲强调了OpenAI致力于为开发者提供构建人工智能未来的工具和平台。[51:04]

此次开发者日发布的公告，包括应用程序SDK、Agent Kit、Codex和更新的模型，旨在支持开发者创造新一代的人工智能应用程序和体验。[51:14]

Altman对人工智能的未来表示兴奋，并鼓励开发者利用这些新工具将他们的想法变为现实。[51:38]

有图有真相。

对于不愿意看太多文字的，没关系，SVG也好了。

这已经可以看出巨大的差距，相比之下，GPT只能看Blog网页的文字。

是的，我第一时间想尝试Agent Builder，毕竟我大概从两年前就开始“鼓吹”这种drag-and-drop形式的workflow了。

虽然，我现在其实已经很少用这些东西了。但是，当我看到这是在所谓的Developers平台里的功能后，略有期待的心一下子就没了，我产生了一个非常不好的直觉：OpenAI会按API收费。

是的，看起来它都是希望加入所谓的更多功能拉动API收入，拉动企业客户收入。

所以，很顺利的按照上图所示，我跑不成功，我甚至懒得去探究到底是因为我用了一个没有‘余额’的开发者账号，还是因为OpenAI自己产品还没调好就上线，为了公平，我直接使用的是它的例子。

当然，我还是细看了一下各项内容，那些使用n8n、dify之类的用户，不需要切换了，这个产品，跟Google的Opal差的不是一点半点，是差了两个时代。在面向开发者这点上，Gemini产品线太全面了，每天还有大量的免费额度，告诉我OpenAI可以“颠覆”Google？就凭这？

我在介绍Gemini所有应用的文章里，介绍过Opal。

很简单的道理：如果用户有能力自己做workflow，一样是需要为调用API付费，那么，n8n等当然是更好的选择，因为可以用到各家模型，还可以自己加入非常多的三方功能。

再说一遍，OpenAI搞这么个发布，只是为了卖API挣钱。

于是，这个功能，过，一个我完全不可能去使用的东西。

但是，发布会也有小亮点，就是在ChatGPT中的APP功能，如下截图，当然，目前可用的极其有限，加上我已经设置好的Figma，一共六个。

在Figma支持的方法里，基本都是get类，获取信息类，就一个是generate。

其实，就是个MCP，不过，既然官方集成，那就试试：生成一个咖啡制作流程图。

是的，即使打开Figma，也是这样的。

就是如MCP定义里一样，只是支持基于mermaid.js的生成，不能再多了。

对了，Kimi在第一版模型发布时在对话结果里就可以直接渲染mermaid.js，Excalidraw的Obsidian插件在两年前就支持输入mermaid.js然后自动画出图表了。

最近的，TLDraw发布的Starter Kit里的workflow，可以自动画流程图。

以上这些，都比OpenAI早很多，体验好很多。

好，这个功能再过，我想我应该会用到，毕竟在ChatGPT里，有方便性。

但是，如果就是基于MCP的，那，谁做不一样呢。

总结，一句话，我很庆幸没有起来看直播，否则，会有种被“羞辱智商”的感觉。

其实，昨天已经对于OpenAI跟AMD合作的事情憋着不说了，市场愿意信，我何必对抗呢。

但是，今天发了这么“一坨”后，我基本很确定的是，OpenAI已经非常非常着急了，因为它玩不出什么新东西了，Sora2？用了这么长时间Veo3的人，不会觉得这有多惊艳的，无非是另一个社交出圈而已，目的，依然很简单：搞钱。

OpenAI模型也许还在水平线上，但是口碑和用户黏性，其实已经大幅下降了，代码生成有Claude，各种多模态生成与融合有Gemini，我一直反复说的，对我而言，依然还在用的是它的ChatGPT-Agent，因为现在舍得下“算力”把结果搞对；

OpenAI在Scaling Law上“赌注”太大了，以至于看起来在跟微软渐行渐远（依然参考我去年底的前瞻）的背景下，到处找“算力”，到处“找钱”，跟Google，博通的合同，跟英伟达的合作，如今跟AMD的合作，你看到的不是它的“优势”，而是到处下注，可能到了今天，极少数人还会相信它没有“overbook”了吧；

为什么会有 Agent Builder，因为它的 ChatGPT 付费订阅潜力看起来就这么大了，在这么大的投入下，它必须快速证明自己商业化的潜力和故事，所以有所谓的挑战“tiktok”的 Sora2，有挑战亚马逊的“购物”，有今天意图挖掘巨大 API 付费潜力的 Agent Builder。

然而，在当下，一家领先的模型公司每做一件事情，想的首先是“商业化”，这本无可厚非，但只会损失口碑。更何况，它一点都不领先。

前段时间，很多朋友都在说，OpenAI越来越只像一家产品公司，我其实还做了不少解释：GPT-5实际上还不错，ChatGPT-Agent体验还不错，Codex还不错，加入了GPT-5支持的Copilot其实在企业客户那里认可度和使用率是有明显提升的。

今天以后，我不会在为OpenAI说话了，除非它为了更好的模型重新“脚踏实地”。

我越来越坚持目前的巨额投资是有非常大的泡沫的。

不过，我愿意给这个结论进行一下修正：如果不考虑OpenAI，AI就没有泡沫。它是一家没有道德的公司，虽然没有几家有道德的公司。

那么，在修正一下，这是一家正在“作恶”的公司。

By the way，对OpenAI而言，这是一个自证陷阱。