OpenAI 2024 发布会第 5-7 天小结

注：全文 1500 字，阅读 3 分钟。

openai-release-day7

这几天的 OpenAI 的直播发布会确实太水了，没啥太大的意思，我们按照顺序简单过一下。

第 5 天

今天主要是凑时间，配合上 macOS 15.2 版本的正式更新。因为这个版本可以在 macOS 内设置 ChatGPT 了，Apple Intelligence 可以在 macOS 上调用 ChatGPT。OpenAI 团队跟大家演示了一下如何使用这些基础的功能。

第 6 天

OpenAI 的多模态团队这一天对外公布了高级视频功能，在更早之前大家已经用上了高级语音功能，到此，今年早些时候发布的 GPT-4o 的全部能力就算是实现了。

OpenAI 还发布了一款圣诞老人音色的高级语音作为彩蛋。完整的多模态版本的 GPT-4o 确实还是会让人感觉有很大的惊喜感。不过 OpenAI 并没有直接对外发布 API 的访问，这就失去了相当大的作用。

有媒体也认为这一天其实 OpenAI 并没有打算发布完整版的多模态 GPT-4o，因为 OpenAI 在今天发布过后仍然说过段时间大家才能用得上。而是为了应对在前几天 Google 发布的完整多模态的 Gemini 2 Flash 而被迫为了不被落下，临时打乱了发布节奏。我也认为这种推测听上去非常合理，OpenAI 这一次持续 12 天的直播说实话很多时候是在水内容，可能是为了拉长时间，持续获得媒体的曝光度而设计的发布模式吧。

另外值得怀疑的是 OpenAI 对外展示的视频多模态实时对话的场景，虽然大模型有记忆能力，能分辨主体等，但是完全没有对外公布可以持续多长时间的记忆、以及用户可以免费或者 Pro、Plus 用户每天的额度。

有媒体认为，共享自己的桌面给大模型，是个非常好的场景。确实是非常好的场景，但是这些场景还是要基于多模态大模型，比如完整版的 GPT-4o 的成本、上下文长度以及实际的能力上。常识来看，即便完全发布了，价格也会非常贵，记忆时间会很有限。

这两天我也正在体验完整多模态版本的 Gemini 2 Flash，体验非常丝滑非常棒，我会继续做一些体验和测试，稍晚点来写关于 Gemini 2 Flash 的文章。

第 7 天

这一天 OpenAI 发布了 ChatGPT 的 Projects 功能。这个功能也并不新了，Claude 早在半年前就推出了，其他基于 LLM 的产品也都存在。这一次产品功能的更新 OpenAI 也像是追随者，而不是创新者。

但是在一些细节里，可以看到 OpenAI 定义的 ChatGPT Projects 功能并不是大部分产品里存在简单的语意检索这种 RAG，而是存在一定的 Planing ，结构可能更复杂，效果应该也更好一些。（由于我现在放弃了付费 ChatGPT Plus，所以没有体验到，因为第一波只有 Plus 和 Pro 用户以及团队版本、教育版本的用户可以使用）。

OpenAI 在 ChatGPT Projects 功能上的创新更多的在于跟 Canvas 的协作。我们在上一篇文章里提到 Canvas 功能对比 Artifacts 的创新，Projects 功能让 Canvas 更加完整。我相信这两个功能结合起来，ChatGPT 还是有一定的产品创新和产品力上的领先的。

应该在圣诞节前后，国内的大部分产品都会继续跟进 ChatGPT 的 Canvas 设计，强化过去的 Artifacts。

希望 OpenAI 不要继续水了

这几天之所以没有每天都跟着发，确实是 OpenAI 的发布会太水了。而且也可以看的出来 OpenAI 在应用层反倒更加用力的去更新了，应用入口上的竞争还会持续变得更加激烈。

让我们继续期待 OpenAI 过两天希望能放个大招吧，另外这几天大家应该就可以陆续看到和体验到基于 Gemini 2 Flash 超强能力的各种新的小产品和新形态出现了，我也会重点保持关注，遇到值得分享的案例会及时跟大家分享。

如果你也喜欢这篇内容，欢迎转发给你的朋友。

作者：Erlich Liu

微信号：geekthings