前两天,分析了 First Mark 的 AI 全景图:
AI 全景图分析
道明,公众号:道明 AI 实验室
这是 AI 应用元年吗?2024 全景图简评
其实,作者 Matt Turck 关于 2024 年思考的 24 个问题,更值得讨论,其中很多问题,也是我这段时间一直在思考的。对于作者的讨论,考虑 IP 问题,不直接引用了,感兴趣的可以访问:
Full Steam Ahead: The 2024 MAD (Machine Learning, AI & Data) Landscape https://mattturck.com/MAD2024/
同时,我选择了四个模型对文章里的 “PART II”,也就是 24 个问题的讨论进行了分析,四个模型分别是 Claude3 Opus,Kimi Chat,GPT-4,Gemini 1.5 Pro。其中,换了几种提示次,GPT-4 都只是列出了 24 个问题,而没有对回答进行总结(OpenAI 必须加快推出 GPT-5 了),其他三个模型都完整的列出了 24 个问题,并给出了简要回答。
模型回答结果分别粘贴如下,我没有对格式进行任何调整:
一、Claude3 Opus(693字)
- 结构化数据和非结构化数据: 结构化数据管道正在降温, 而非结构化数据管道和生成式 AI 正在升温。
- 现代数据技术栈是否已死? 现代数据技术栈正面临巨大压力, 可能会被 AI 技术栈取代。
- 数据基础设施领域将出现整合, 大公司会做大做强。
- Databricks 与 Snowflake 的竞争将加剧, 同时 Microsoft Fabric 的推出将对二者构成威胁。
- 商业智能软件行业的转型较慢, 但生成式 AI 有可能带来巨大变革。
- AI 基础设施初创公司将重新定位为 "AI 基础设施公司", 但从结构化数据转向非结构化数据需要根本性的产品改变。
- 随着 AI 炒作的持续, 2024 年我们处在 AI 炒作周期的什么阶段值得思考。
- 2023 年的生成式 AI 繁荣可能只是一次 "伪热潮", 很多还停留在实验阶段。
- 语言模型公司之间存在差异化竞争, 并不会像想象的那样同质化。
- 大语言模型和小语言模型将共存, 专业化模型也在兴起, 未来是多模型混合架构。
- "传统 AI" 并没有死, 它与生成式 AI 是互补的, 未来是二者混合应用。
- "薄包装" 生成式 AI 创业公司需要通过深度垂直整合等方式实现差异化。
- AI 代理和边缘 AI 将是 2024 年值得关注的趋势。
- 生成式 AI 距离 AGI 还有多远, 存在不同看法。进展速度是加快还是趋于平缓有待观察。
- GPU 芯片供需关系及英伟达的估值是个有趣的话题。长期看好 AI 芯片制造商。
- 开源 AI 社区过于膨胀, 需要自我纠正。
- 随着开源模型的兴起, AI 模型的使用成本正在下降, 这对商业公司是利好。
- 微软在 AI 领域全面布局, 但这是否意味着它已经取得胜利, 初创公司是否还有机会值得讨论。
- OpenAI 的战略路径和与微软的关系值得持续关注。
- 2024 年有望成为企业级 AI 落地年, 但仍面临诸多挑战。
- AI 不太可能完全取代 SaaS, 但会让 SaaS 产品更加智能。
- AI 投资对 VC 模式提出挑战, 可能催生大型 AI 基金, 也可能催生极简 AI 初创公司。
- 生成式 AI 有望重振消费级应用, 催生出新的巨头。
- AI 与区块链结合是一个有趣的方向, 但能否应用还有待观察。
二、Kimi Chat(891字)
- 结构化数据与非结构化数据:作者指出,目前非结构化数据(机器学习/人工智能)受到更多关注,而结构化数据(现代数据栈等)则相对较少。
- 现代数据栈是否已死:作者认为现代数据栈面临挑战,包括成本问题和与生成性 AI 的竞争。
- 数据基础设施的整合与大公司变得更大:预测将有更多的整合和初创公司失败,大公司将加强平台功能。
- Databricks 与 Snowflake 的现状:Snowflake 增长放缓,Databricks 则表现出强劲的势头,并成为生成性 AI 的关键玩家。
- 2024 年的 BI 和生成性 AI 是否会改变数据分析:BI 领域变革缓慢,生成性 AI 可能对数据分析产生深远影响。
- 现代 AI 栈的崛起:非结构化数据基础设施领域正在经历不同的时刻, AI 基础设施公司正在快速发展。
- 我们在 AI 炒作周期中的哪个阶段:当前的 AI 炒作周期非常激烈,但存在泡沫的可能性。
- 实验与现实:2023 年是否只是一个假动作:一些企业投资于概念验证,而非解决实际业务问题。
- LLM 公司:可能并非最终会商品化:LLM 提供商可能会成为新的云服务提供商。
- LLMs、SLMs 和混合未来的兴起:小型语言模型和专业模型正在兴起,企业将采用混合架构。
- 传统 AI 是否已死:传统 AI 和生成性 AI 是互补的,处理不同类型的数据和用例。
- 从薄包装到全栈的竞争:企业需要成为特定问题的“全栈”解决方案提供商。
- 2024 年值得关注的领域:AI 代理和边缘 AI 是两个令人兴奋的领域。
- 生成性 AI 是朝着 AGI 前进还是达到一个平台期:生成性 AI 的进步可能会放缓,而不是一直加速到 AGI。
- GPU 战争:NVIDIA 是否高估:NVIDIA 在 AI GPU 市场上占据主导地位,但未来竞争和市场变化可能会对其构成挑战。
- 开源 AI:好事过多了吗:开源 AI 模型的激增可能导致市场自我调整。
- AI 的实际成本是多少:生成性 AI 的经济正在快速发展,成本下降对用户是好消息,但对供应商而言建设成本仍然很高。
- 大公司和 AI 的政治经济:微软是否已经赢得了 AI 领域的竞争。
- 对 OpenAI 的狂热或不是:OpenAI 的估值、收入增长和公司内部动态令人着迷,但它是否试图做太多,以及它与微软的关系如何发展。
- 2024 年是否会是企业中 AI 的一年:企业对 AI 的兴趣很大,但仍有许多关键问题需要解决。
- AI 是否会杀死 SaaS:AI 可能会使 SaaS 产品变得更加强大,而不是取代它们。
- AI 是否会杀死风险投资:AI 可能会改变风险投资的规模和模式。
- AI 是否会复兴消费者市场:消费者市场正在寻找下一个增长点,生成性 AI 可能是答案。
- AI 和区块链:是胡说八道还是令人兴奋:AI 和区块链的结合可能会创造新的去中心化网络和机会。
三、Gemini 1.5 Pro(1178字,去掉Markdown字符约1200字)
- 结构化数据 vs 非结构化数据: 非结构化数据(机器学习/人工智能)目前比结构化数据(现代数据堆栈等)更受关注。
- 现代数据堆栈是否已死?: 现代数据堆栈面临成本高和关注度下降的问题,未来可能出现整合、创业公司失败和大公司平台化的趋势。
- 数据基础设施的整合和大公司的壮大: 许多初创公司将转型为“AI 基础设施初创公司”,行业将出现整合和失败,大公司将加强平台化。
- Databricks 与 Snowflake 的竞争: Snowflake 增速放缓,Databricks 势头强劲,Microsoft Fabric 的推出为竞争格局增添了新的变数。
- 2024 年的商业智能和生成式 AI 对数据分析的变革: 商业智能领域变革缓慢,生成式 AI 有潜力改变数据分析,但仍需克服一些挑战。
- 现代 AI 堆栈的兴起: 现代 AI 堆栈与现代数据堆栈有许多相似之处,但也面临着类似的挑战,例如市场规模和竞争。
- AI 炒作周期: 当前 AI 炒作周期非常激烈,但未来可能出现回调,需要警惕市场风险。
- 实验与现实:2023 年是否只是虚晃一枪?: 2023 年 AI 领域取得了一些成功,但也存在一些担忧,例如企业应用的真实需求和消费者应用的高流失率。
- 大型语言模型公司:也许并非商品化: 尽管模型性能没有明显优势,但大型语言模型公司仍然有很大的商业机会,可能类似于云供应商的模式。
- 大型语言模型、小型语言模型和混合未来: 小型语言模型和专业模型正在兴起,未来将出现混合架构,结合多种模型以满足特定需求。
- 传统 AI 是否已死?: 传统 AI 和生成式 AI 相互补充,未来将以混合方式应用于不同的数据和用例。
- 薄包装器、厚包装器和全栈竞争: 厚包装器可以通过专注于特定问题、构建工作流和深度集成以及进行模型级别的开发来实现差异化。
- 2024 年值得关注的领域:AI 代理和边缘 AI: AI 代理是自动化的圣杯,但目前还处于早期阶段;边缘 AI 也值得关注。
- 生成式 AI 是走向通用人工智能还是走向平台期?: 生成式 AI 发展的速度是否会放缓尚不清楚,但即使如此,未来几年仍然存在巨大的商业机会。
- GPU 战争(NVIDIA 是否估值过高?): NVIDIA 的股价可能面临短期压力,但 AI 芯片制造商的长期前景依然光明。
- 开源 AI:是否过犹不及?: 开源 AI 发展迅速,但也存在项目质量参差不齐的问题。
- AI 的实际成本是多少?: AI 模型的价格正在下降,但构建和服务的成本仍然很高。
- 大公司和 AI 的政治经济学:微软是否已经胜出?: 微软在 AI 领域布局积极,但谷歌、亚马逊、Meta 等公司也在积极参与竞争,初创公司面临的挑战依然很大。
- 对 OpenAI 的狂热 – 还是不?: OpenAI 雄心勃勃,但执行力面临挑战;OpenAI 和微软的关系未来可能发生变化。
- 2024 年会是企业 AI 之年吗?: 企业对 AI 的兴趣很大,但仍需解决用例、工具选择、人才短缺、模型可靠性和投资回报率等问题。
- AI 会扼杀 SaaS 吗?: AI 可能会使 SaaS 产品更加强大,而不是完全取代它们。
- AI 会扼杀风险投资吗?: AI 投资可能需要更大的基金规模,但也可能导致创业公司对风险投资的需求减少。
- AI 会复兴消费市场吗?: 生成式 AI 有可能为消费市场带来新的增长,例如搜索、AI 伴侣、AI 硬件和个性化娱乐。
- AI 和区块链:胡说八道还是令人兴奋?: AI 和区块链的结合具有潜力,但需要警惕行业内的炒作和欺诈行为。
初步结论:Gemini 1.5 似乎回答的是最长也是最好的,结构,用 Markdown 输出,也是最好的。
我又分别使用了 Claude3 Opus 和 Gemini 1.5 对三个模型的回答进行了比较,结果如下。有趣的是,Claude3 也认为 Gemini 1.5 回答得更好。
各模型观点对比(由 Claude3 总结)
| 话题 | Claude3 | Kimi Chat | Gemini 1.5 Pro |
|---|---|---|---|
| 2024年BI和生成式AI | 提到 BI 变革慢, AI 可能带来变革 | 提到 BI 变革慢, AI 可能影响数据分析 | 更具体指出 AI 可改变数据分析, 但有挑战 |
| 对 LLM 公司前景看法 | 未明确提及 | 认为不会完全商品化, 或成为类云服务商 | 尽管模型优势不大, 但商业机会很大 |
| 对 OpenAI 的分析 | 未太多涉及 | 估值、增长、内部动态都值得关注 | 雄心勃勃但执行有挑战, 与 MS 关系或生变 |
| 2024企业AI能否落地 | 有望但面临诸多挑战 | 企业有兴趣, 但仍有关键问题待解 | 除了兴趣, 还列举了具体待解决的问题 |
| AI 与区块链结合 | 是个方向, 但能否应用有待观察 | 提到可能带来新的去中心化网络和机会 | 提到要警惕其中的炒作和欺诈行为 |
各模型对比详细表格(由 Gemini 1.5 Pro 总结)
| 主题 | Claude3 | Kimi Chat | Gemini 1.5 Pro | 异同点 |
|---|---|---|---|---|
| 结构化 vs 非结构化数据 | 非结构化更受关注 | 非结构化更受关注 | 非结构化更受关注 | 三者观点一致 |
| 现代数据堆栈是否已死 | 面临压力,可能被 AI 取代 | 面临挑战 | 面临成本和关注度下降 | Claude3 较激进,其他两者认为面临挑战 |
| 数据基础设施整合 | 大公司做大做强 | 大公司加强平台功能 | 大公司加强平台化 | 三者观点一致 |
| Databricks vs Snowflake | 竞争加剧,MS Fabric 威胁 | Snowflake 增长放缓 | Snowflake 放缓,MS Fabric 威胁 | 基本一致,Kimi 未提 MS Fabric |
| AI 基础设施初创 | 需根本性产品改变 | 快速发展 | 将转型为 AI 基础设施公司 | Claude3 强调难度,其他较乐观 |
| AI 炒作周期 | 需思考阶段 | 激烈,存在泡沫 | 激烈,可能回调 | 均认为激烈,Claude3 和 Gemini 更谨慎 |
| GPU 战争 | NVIDIA 估值是话题 | NVIDIA 面临挑战 | 短期压力,长期看好芯片 | 均看好芯片,对 NVIDIA 观点略异 |
| AI 成本 | 下降是利好 | 下降是好消息 | 下降,但构建成本仍高 | 均认为成本下降,Gemini 关注供应商 |
那么,我对这些问题怎么看的?
我挑取一些自己有心得的回答如下:
- 结构化数据 vs 非结构化数据:非结构化数据显然是现在更重要的部分,但是很有意思的是,其实 AI 对结构化数据理解的并不好,这反而是 AI 下一步的重要改进方向;
- 数据栈与数据基础设施:过去五年,我大概尝试了所有能够找到的数据栈,我非常同意,未来只有大公司存在的空间;
- Databricks 与 Snowflake,MaaS 与 SaaS:MaaS 毫无疑问是最大的增长点,但是如我昨天所说:云与模型,缺一不可,我很看好 Databricks 这种模式;
- 炒作周期与 GPU:我认为现在至少是一个炒作周期的阶段性高点,大家对英伟达的预期也给的非常乐观了;
- 应用落地与大语言模型的商品化:单独的大语言模型很难成为好的商品化产品,但是,模型绑定云可以。其实,AI 落地的隐性门槛是非常高的。落地,是跨多学科的工程问题。
- 边缘 AI、消费市场、 AI 成本:AI 成本其实主要考虑的是推理成本,毫无疑问,推理成本会快速下降。但话说回来了,真到考虑 AI 成本了,意味着本身已经有使用场景了。
- 开源:每次都是闭源升级后,开源跟上,然后闭源借鉴开源中一些新的思想,再升级,开源再跟上。这其中的差距,其实,数据比算力更重要。