OpenAI正在堕入“自证陷阱”

OpenAI正在堕入“自证陷阱”


OpenAI DevDay,有点小期待的已经被预告Agent Builder功能,于是醒过来就过来看通知(年纪大了,看不了直播了)。

当然不看直播也没任何损失,我也不用看视频回看,Gemini就可以,以下是Gemini的总结:

OpenAI开发者日2025:Sam Altman主题演讲摘要

引言

Sam Altman的演讲重点是让开发者更容易地使用人工智能(AI)。[02:07]

此次演讲将涵盖四个主要领域:在ChatGPT内构建应用程序、构建代理、编写软件以及模型和API的更新。[02:16, 02:42]

ChatGPT中的应用程序

OpenAI正在推出一个应用程序SDK,让开发者能够在ChatGPT中构建真正的应用程序。[03:47]

这些应用程序将是交互式、自适应和个性化的,用户可以与之聊天。[03:40]

SDK构建在开放标准MCP之上,让开发者可以完全控制其后端逻辑和前端UI。[04:02]

通过应用程序SDK构建的应用程序可以触达数亿的ChatGPT用户,为开发者提供一个重要的产品扩展平台。[04:09]

演示展示了Figma、Spotify、Coursera、Canva和Zillow等应用程序如何在ChatGPT中使用,展示了其多样化的功能。[04:55, 11:26]

应用将通过直接应用名称搜索和在对话中推荐的方式被发现。[04:50, 05:08]

构建代理

为了简化代理的构建,OpenAI推出了Agent Kit,这是一个完整的构建模块集,可帮助将代理从原型阶段推向生产。[16:52]

Agent Kit的核心功能包括:

  • Agent Builder: 一个用于构建代理的可视化画布,可以快速设计逻辑步骤和测试流程。[17:17]
  • Chat Kit: 一个简单的可嵌入聊天界面,可将聊天体验带入开发者的应用程序中。[17:36]
  • Evals for Agents: 专门用于衡量代理性能的新功能,包括跟踪分级、数据集和自动提示优化。[17:58]

Albertson's和HubSpot等公司已经在使用Agent Kit来改进他们的运营和客户服务。[18:42, 19:38]

现场演示展示了如何使用Agent Kit在八分钟内在DevDay网站上构建和部署一个代理。[21:17]

编写软件

Codex是OpenAI的软件工程代理,旨在与开发者协同工作,加速软件创建。[31:18]

Codex现在可以在IDE、终端、GitHub和云端等各种编码环境中使用,并通过ChatGPT帐户连接。[31:35]

它运行在新的GPT-5 Codex模型上,该模型经过专门的代码重构和代码审查等任务训练。[31:51]

Codex的新功能包括Slack集成、Codex SDK和新的管理工具和报告。[33:15, 33:34]

现场演示展示了如何使用新的Codex和API将周围的任何东西都变成可行的软件,包括控制摄像头和灯光系统。[34:11]

模型和API更新

GPT-5 Pro现在可以通过API向所有开发者提供,为金融、法律和医疗保健等领域的复杂任务提供更高的准确性和推理深度。[46:41, 46:56]

Sora 2现在也通过API提供预览版,让开发者可以将由Sora 2驱动的令人惊叹的视频输出直接整合到自己的应用程序中。[47:47, 47:54]

Sora 2的进步包括增强的可控性、将声音与视觉效果配对的能力,以及将现实世界元素融入生成视频的能力。[48:00, 48:45]

美泰等合作伙伴已经在使用Sora 2 API将产品创意更快地变为现实。[49:55, 50:02]

结论

Sam Altman的演讲强调了OpenAI致力于为开发者提供构建人工智能未来的工具和平台。[51:04]

此次开发者日发布的公告,包括应用程序SDK、Agent Kit、Codex和更新的模型,旨在支持开发者创造新一代的人工智能应用程序和体验。[51:14]

Altman对人工智能的未来表示兴奋,并鼓励开发者利用这些新工具将他们的想法变为现实。[51:38]

有图有真相。

对于不愿意看太多文字的,没关系,SVG也好了。

Image

这已经可以看出巨大的差距,相比之下,GPT只能看Blog网页的文字。

是的,我第一时间想尝试Agent Builder,毕竟我大概从两年前就开始“鼓吹”这种drag-and-drop形式的workflow了。

Image

虽然,我现在其实已经很少用这些东西了。但是,当我看到这是在所谓的Developers平台里的功能后,略有期待的心一下子就没了,我产生了一个非常不好的直觉:OpenAI会按API收费。

是的,看起来它都是希望加入所谓的更多功能拉动API收入,拉动企业客户收入。

所以,很顺利的按照上图所示,我跑不成功,我甚至懒得去探究到底是因为我用了一个没有‘余额’的开发者账号,还是因为OpenAI自己产品还没调好就上线,为了公平,我直接使用的是它的例子。

当然,我还是细看了一下各项内容,那些使用n8n、dify之类的用户,不需要切换了,这个产品,跟Google的Opal差的不是一点半点,是差了两个时代。在面向开发者这点上,Gemini产品线太全面了,每天还有大量的免费额度,告诉我OpenAI可以“颠覆”Google?就凭这?

Image

我在介绍Gemini所有应用的文章里,介绍过Opal。

很简单的道理:如果用户有能力自己做workflow,一样是需要为调用API付费,那么,n8n等当然是更好的选择,因为可以用到各家模型,还可以自己加入非常多的三方功能。

再说一遍,OpenAI搞这么个发布,只是为了卖API挣钱。

于是,这个功能,过,一个我完全不可能去使用的东西。

但是,发布会也有小亮点,就是在ChatGPT中的APP功能,如下截图,当然,目前可用的极其有限,加上我已经设置好的Figma,一共六个。

Image

在Figma支持的方法里,基本都是get类,获取信息类,就一个是generate。

Image

其实,就是个MCP,不过,既然官方集成,那就试试:生成一个咖啡制作流程图。

Image

是的,即使打开Figma,也是这样的。

Image

就是如MCP定义里一样,只是支持基于mermaid.js的生成,不能再多了。

对了,Kimi在第一版模型发布时在对话结果里就可以直接渲染mermaid.js,Excalidraw的Obsidian插件在两年前就支持输入mermaid.js然后自动画出图表了。

最近的,TLDraw发布的Starter Kit里的workflow,可以自动画流程图。

以上这些,都比OpenAI早很多,体验好很多。

好,这个功能再过,我想我应该会用到,毕竟在ChatGPT里,有方便性。

但是,如果就是基于MCP的,那,谁做不一样呢。

总结,一句话,我很庆幸没有起来看直播,否则,会有种被“羞辱智商”的感觉。

其实,昨天已经对于OpenAI跟AMD合作的事情憋着不说了,市场愿意信,我何必对抗呢。

但是,今天发了这么“一坨”后,我基本很确定的是,OpenAI已经非常非常着急了,因为它玩不出什么新东西了,Sora2?用了这么长时间Veo3的人,不会觉得这有多惊艳的,无非是另一个社交出圈而已,目的,依然很简单:搞钱。

OpenAI模型也许还在水平线上,但是口碑和用户黏性,其实已经大幅下降了,代码生成有Claude,各种多模态生成与融合有Gemini,我一直反复说的,对我而言,依然还在用的是它的ChatGPT-Agent,因为现在舍得下“算力”把结果搞对;

OpenAI在Scaling Law上“赌注”太大了,以至于看起来在跟微软渐行渐远(依然参考我去年底的前瞻)的背景下,到处找“算力”,到处“找钱”,跟Google,博通的合同,跟英伟达的合作,如今跟AMD的合作,你看到的不是它的“优势”,而是到处下注,可能到了今天,极少数人还会相信它没有“overbook”了吧;

为什么会有 Agent Builder,因为它的 ChatGPT 付费订阅潜力看起来就这么大了,在这么大的投入下,它必须快速证明自己商业化的潜力和故事,所以有所谓的挑战“tiktok”的 Sora2,有挑战亚马逊的“购物”,有今天意图挖掘巨大 API 付费潜力的 Agent Builder。

然而,在当下,一家领先的模型公司每做一件事情,想的首先是“商业化”,这本无可厚非,但只会损失口碑。更何况,它一点都不领先。

前段时间,很多朋友都在说,OpenAI越来越只像一家产品公司,我其实还做了不少解释:GPT-5实际上还不错,ChatGPT-Agent体验还不错,Codex还不错,加入了GPT-5支持的Copilot其实在企业客户那里认可度和使用率是有明显提升的。

今天以后,我不会在为OpenAI说话了,除非它为了更好的模型重新“脚踏实地”。

我越来越坚持目前的巨额投资是有非常大的泡沫的。

不过,我愿意给这个结论进行一下修正:如果不考虑OpenAI,AI就没有泡沫。它是一家没有道德的公司,虽然没有几家有道德的公司。

那么,在修正一下,这是一家正在“作恶”的公司。

By the way,对OpenAI而言,这是一个自证陷阱。

← Back to Blog