关于AI的24个问题及讨论

关于AI的24个问题及讨论


前两天,分析了 First Mark 的 AI 全景图:

AI 全景图分析

道明,公众号:道明 AI 实验室

这是 AI 应用元年吗?2024 全景图简评

其实,作者 Matt Turck 关于 2024 年思考的 24 个问题,更值得讨论,其中很多问题,也是我这段时间一直在思考的。对于作者的讨论,考虑 IP 问题,不直接引用了,感兴趣的可以访问:

Full Steam Ahead: The 2024 MAD (Machine Learning, AI & Data) Landscape https://mattturck.com/MAD2024/

同时,我选择了四个模型对文章里的 “PART II”,也就是 24 个问题的讨论进行了分析,四个模型分别是 Claude3 Opus,Kimi Chat,GPT-4,Gemini 1.5 Pro。其中,换了几种提示次,GPT-4 都只是列出了 24 个问题,而没有对回答进行总结(OpenAI 必须加快推出 GPT-5 了),其他三个模型都完整的列出了 24 个问题,并给出了简要回答。

模型回答结果分别粘贴如下,我没有对格式进行任何调整:

一、Claude3 Opus(693字)

  1. 结构化数据和非结构化数据: 结构化数据管道正在降温, 而非结构化数据管道和生成式 AI 正在升温。
  2. 现代数据技术栈是否已死? 现代数据技术栈正面临巨大压力, 可能会被 AI 技术栈取代。
  3. 数据基础设施领域将出现整合, 大公司会做大做强。
  4. Databricks 与 Snowflake 的竞争将加剧, 同时 Microsoft Fabric 的推出将对二者构成威胁。
  5. 商业智能软件行业的转型较慢, 但生成式 AI 有可能带来巨大变革。
  6. AI 基础设施初创公司将重新定位为 "AI 基础设施公司", 但从结构化数据转向非结构化数据需要根本性的产品改变。
  7. 随着 AI 炒作的持续, 2024 年我们处在 AI 炒作周期的什么阶段值得思考。
  8. 2023 年的生成式 AI 繁荣可能只是一次 "伪热潮", 很多还停留在实验阶段。
  9. 语言模型公司之间存在差异化竞争, 并不会像想象的那样同质化。
  10. 大语言模型和小语言模型将共存, 专业化模型也在兴起, 未来是多模型混合架构。
  11. "传统 AI" 并没有死, 它与生成式 AI 是互补的, 未来是二者混合应用。
  12. "薄包装" 生成式 AI 创业公司需要通过深度垂直整合等方式实现差异化。
  13. AI 代理和边缘 AI 将是 2024 年值得关注的趋势。
  14. 生成式 AI 距离 AGI 还有多远, 存在不同看法。进展速度是加快还是趋于平缓有待观察。
  15. GPU 芯片供需关系及英伟达的估值是个有趣的话题。长期看好 AI 芯片制造商。
  16. 开源 AI 社区过于膨胀, 需要自我纠正。
  17. 随着开源模型的兴起, AI 模型的使用成本正在下降, 这对商业公司是利好。
  18. 微软在 AI 领域全面布局, 但这是否意味着它已经取得胜利, 初创公司是否还有机会值得讨论。
  19. OpenAI 的战略路径和与微软的关系值得持续关注。
  20. 2024 年有望成为企业级 AI 落地年, 但仍面临诸多挑战。
  21. AI 不太可能完全取代 SaaS, 但会让 SaaS 产品更加智能。
  22. AI 投资对 VC 模式提出挑战, 可能催生大型 AI 基金, 也可能催生极简 AI 初创公司。
  23. 生成式 AI 有望重振消费级应用, 催生出新的巨头。
  24. AI 与区块链结合是一个有趣的方向, 但能否应用还有待观察。

二、Kimi Chat(891字)

  1. 结构化数据与非结构化数据:作者指出,目前非结构化数据(机器学习/人工智能)受到更多关注,而结构化数据(现代数据栈等)则相对较少。
  2. 现代数据栈是否已死:作者认为现代数据栈面临挑战,包括成本问题和与生成性 AI 的竞争。
  3. 数据基础设施的整合与大公司变得更大:预测将有更多的整合和初创公司失败,大公司将加强平台功能。
  4. Databricks 与 Snowflake 的现状:Snowflake 增长放缓,Databricks 则表现出强劲的势头,并成为生成性 AI 的关键玩家。
  5. 2024 年的 BI 和生成性 AI 是否会改变数据分析:BI 领域变革缓慢,生成性 AI 可能对数据分析产生深远影响。
  6. 现代 AI 栈的崛起:非结构化数据基础设施领域正在经历不同的时刻, AI 基础设施公司正在快速发展。
  7. 我们在 AI 炒作周期中的哪个阶段:当前的 AI 炒作周期非常激烈,但存在泡沫的可能性。
  8. 实验与现实:2023 年是否只是一个假动作:一些企业投资于概念验证,而非解决实际业务问题。
  9. LLM 公司:可能并非最终会商品化:LLM 提供商可能会成为新的云服务提供商。
  10. LLMs、SLMs 和混合未来的兴起:小型语言模型和专业模型正在兴起,企业将采用混合架构。
  11. 传统 AI 是否已死:传统 AI 和生成性 AI 是互补的,处理不同类型的数据和用例。
  12. 从薄包装到全栈的竞争:企业需要成为特定问题的“全栈”解决方案提供商。
  13. 2024 年值得关注的领域:AI 代理和边缘 AI 是两个令人兴奋的领域。
  14. 生成性 AI 是朝着 AGI 前进还是达到一个平台期:生成性 AI 的进步可能会放缓,而不是一直加速到 AGI。
  15. GPU 战争:NVIDIA 是否高估:NVIDIA 在 AI GPU 市场上占据主导地位,但未来竞争和市场变化可能会对其构成挑战。
  16. 开源 AI:好事过多了吗:开源 AI 模型的激增可能导致市场自我调整。
  17. AI 的实际成本是多少:生成性 AI 的经济正在快速发展,成本下降对用户是好消息,但对供应商而言建设成本仍然很高。
  18. 大公司和 AI 的政治经济:微软是否已经赢得了 AI 领域的竞争。
  19. 对 OpenAI 的狂热或不是:OpenAI 的估值、收入增长和公司内部动态令人着迷,但它是否试图做太多,以及它与微软的关系如何发展。
  20. 2024 年是否会是企业中 AI 的一年:企业对 AI 的兴趣很大,但仍有许多关键问题需要解决。
  21. AI 是否会杀死 SaaS:AI 可能会使 SaaS 产品变得更加强大,而不是取代它们。
  22. AI 是否会杀死风险投资:AI 可能会改变风险投资的规模和模式。
  23. AI 是否会复兴消费者市场:消费者市场正在寻找下一个增长点,生成性 AI 可能是答案。
  24. AI 和区块链:是胡说八道还是令人兴奋:AI 和区块链的结合可能会创造新的去中心化网络和机会。

三、Gemini 1.5 Pro(1178字,去掉Markdown字符约1200字)

  1. 结构化数据 vs 非结构化数据: 非结构化数据(机器学习/人工智能)目前比结构化数据(现代数据堆栈等)更受关注。
  2. 现代数据堆栈是否已死?: 现代数据堆栈面临成本高和关注度下降的问题,未来可能出现整合、创业公司失败和大公司平台化的趋势。
  3. 数据基础设施的整合和大公司的壮大: 许多初创公司将转型为“AI 基础设施初创公司”,行业将出现整合和失败,大公司将加强平台化。
  4. Databricks 与 Snowflake 的竞争: Snowflake 增速放缓,Databricks 势头强劲,Microsoft Fabric 的推出为竞争格局增添了新的变数。
  5. 2024 年的商业智能和生成式 AI 对数据分析的变革: 商业智能领域变革缓慢,生成式 AI 有潜力改变数据分析,但仍需克服一些挑战。
  6. 现代 AI 堆栈的兴起: 现代 AI 堆栈与现代数据堆栈有许多相似之处,但也面临着类似的挑战,例如市场规模和竞争。
  7. AI 炒作周期: 当前 AI 炒作周期非常激烈,但未来可能出现回调,需要警惕市场风险。
  8. 实验与现实:2023 年是否只是虚晃一枪?: 2023 年 AI 领域取得了一些成功,但也存在一些担忧,例如企业应用的真实需求和消费者应用的高流失率。
  9. 大型语言模型公司:也许并非商品化: 尽管模型性能没有明显优势,但大型语言模型公司仍然有很大的商业机会,可能类似于云供应商的模式。
  10. 大型语言模型、小型语言模型和混合未来: 小型语言模型和专业模型正在兴起,未来将出现混合架构,结合多种模型以满足特定需求。
  11. 传统 AI 是否已死?: 传统 AI 和生成式 AI 相互补充,未来将以混合方式应用于不同的数据和用例。
  12. 薄包装器、厚包装器和全栈竞争: 厚包装器可以通过专注于特定问题、构建工作流和深度集成以及进行模型级别的开发来实现差异化。
  13. 2024 年值得关注的领域:AI 代理和边缘 AI: AI 代理是自动化的圣杯,但目前还处于早期阶段;边缘 AI 也值得关注。
  14. 生成式 AI 是走向通用人工智能还是走向平台期?: 生成式 AI 发展的速度是否会放缓尚不清楚,但即使如此,未来几年仍然存在巨大的商业机会。
  15. GPU 战争(NVIDIA 是否估值过高?): NVIDIA 的股价可能面临短期压力,但 AI 芯片制造商的长期前景依然光明。
  16. 开源 AI:是否过犹不及?: 开源 AI 发展迅速,但也存在项目质量参差不齐的问题。
  17. AI 的实际成本是多少?: AI 模型的价格正在下降,但构建和服务的成本仍然很高。
  18. 大公司和 AI 的政治经济学:微软是否已经胜出?: 微软在 AI 领域布局积极,但谷歌、亚马逊、Meta 等公司也在积极参与竞争,初创公司面临的挑战依然很大。
  19. 对 OpenAI 的狂热 – 还是不?: OpenAI 雄心勃勃,但执行力面临挑战;OpenAI 和微软的关系未来可能发生变化。
  20. 2024 年会是企业 AI 之年吗?: 企业对 AI 的兴趣很大,但仍需解决用例、工具选择、人才短缺、模型可靠性和投资回报率等问题。
  21. AI 会扼杀 SaaS 吗?: AI 可能会使 SaaS 产品更加强大,而不是完全取代它们。
  22. AI 会扼杀风险投资吗?: AI 投资可能需要更大的基金规模,但也可能导致创业公司对风险投资的需求减少。
  23. AI 会复兴消费市场吗?: 生成式 AI 有可能为消费市场带来新的增长,例如搜索、AI 伴侣、AI 硬件和个性化娱乐。
  24. AI 和区块链:胡说八道还是令人兴奋?: AI 和区块链的结合具有潜力,但需要警惕行业内的炒作和欺诈行为。

初步结论:Gemini 1.5 似乎回答的是最长也是最好的,结构,用 Markdown 输出,也是最好的。

我又分别使用了 Claude3 Opus 和 Gemini 1.5 对三个模型的回答进行了比较,结果如下。有趣的是,Claude3 也认为 Gemini 1.5 回答得更好。

各模型观点对比(由 Claude3 总结)

话题 Claude3 Kimi Chat Gemini 1.5 Pro
2024年BI和生成式AI 提到 BI 变革慢, AI 可能带来变革 提到 BI 变革慢, AI 可能影响数据分析 更具体指出 AI 可改变数据分析, 但有挑战
对 LLM 公司前景看法 未明确提及 认为不会完全商品化, 或成为类云服务商 尽管模型优势不大, 但商业机会很大
对 OpenAI 的分析 未太多涉及 估值、增长、内部动态都值得关注 雄心勃勃但执行有挑战, 与 MS 关系或生变
2024企业AI能否落地 有望但面临诸多挑战 企业有兴趣, 但仍有关键问题待解 除了兴趣, 还列举了具体待解决的问题
AI 与区块链结合 是个方向, 但能否应用有待观察 提到可能带来新的去中心化网络和机会 提到要警惕其中的炒作和欺诈行为

各模型对比详细表格(由 Gemini 1.5 Pro 总结)

主题 Claude3 Kimi Chat Gemini 1.5 Pro 异同点
结构化 vs 非结构化数据 非结构化更受关注 非结构化更受关注 非结构化更受关注 三者观点一致
现代数据堆栈是否已死 面临压力,可能被 AI 取代 面临挑战 面临成本和关注度下降 Claude3 较激进,其他两者认为面临挑战
数据基础设施整合 大公司做大做强 大公司加强平台功能 大公司加强平台化 三者观点一致
Databricks vs Snowflake 竞争加剧,MS Fabric 威胁 Snowflake 增长放缓 Snowflake 放缓,MS Fabric 威胁 基本一致,Kimi 未提 MS Fabric
AI 基础设施初创 需根本性产品改变 快速发展 将转型为 AI 基础设施公司 Claude3 强调难度,其他较乐观
AI 炒作周期 需思考阶段 激烈,存在泡沫 激烈,可能回调 均认为激烈,Claude3 和 Gemini 更谨慎
GPU 战争 NVIDIA 估值是话题 NVIDIA 面临挑战 短期压力,长期看好芯片 均看好芯片,对 NVIDIA 观点略异
AI 成本 下降是利好 下降是好消息 下降,但构建成本仍高 均认为成本下降,Gemini 关注供应商

那么,我对这些问题怎么看的?

我挑取一些自己有心得的回答如下:

  1. 结构化数据 vs 非结构化数据:非结构化数据显然是现在更重要的部分,但是很有意思的是,其实 AI 对结构化数据理解的并不好,这反而是 AI 下一步的重要改进方向;
  2. 数据栈与数据基础设施:过去五年,我大概尝试了所有能够找到的数据栈,我非常同意,未来只有大公司存在的空间;
  3. Databricks 与 Snowflake,MaaS 与 SaaS:MaaS 毫无疑问是最大的增长点,但是如我昨天所说:云与模型,缺一不可,我很看好 Databricks 这种模式;
  4. 炒作周期与 GPU:我认为现在至少是一个炒作周期的阶段性高点,大家对英伟达的预期也给的非常乐观了;
  5. 应用落地与大语言模型的商品化:单独的大语言模型很难成为好的商品化产品,但是,模型绑定云可以。其实,AI 落地的隐性门槛是非常高的。落地,是跨多学科的工程问题。
  6. 边缘 AI、消费市场、 AI 成本:AI 成本其实主要考虑的是推理成本,毫无疑问,推理成本会快速下降。但话说回来了,真到考虑 AI 成本了,意味着本身已经有使用场景了。
  7. 开源:每次都是闭源升级后,开源跟上,然后闭源借鉴开源中一些新的思想,再升级,开源再跟上。这其中的差距,其实,数据比算力更重要。
← Back to Blog