OpenAI 2024 发布会第 5-7 天小结
注:全文 1500 字,阅读 3 分钟。
这几天的 OpenAI 的直播发布会确实太水了,没啥太大的意思,我们按照顺序简单过一下。
第 5 天
今天主要是凑时间,配合上 macOS 15.2 版本的正式更新。因为这个版本可以在 macOS 内设置 ChatGPT 了,Apple Intelligence 可以在 macOS 上调用 ChatGPT。OpenAI 团队跟大家演示了一下如何使用这些基础的功能。
第 6 天
OpenAI 的多模态团队这一天对外公布了高级视频功能,在更早之前大家已经用上了高级语音功能,到此,今年早些时候发布的 GPT-4o 的全部能力就算是实现了。
OpenAI 还发布了一款圣诞老人音色的高级语音作为彩蛋。完整的多模态版本的 GPT-4o 确实还是会让人感觉有很大的惊喜感。不过 OpenAI 并没有直接对外发布 API 的访问,这就失去了相当大的作用。
有媒体也认为这一天其实 OpenAI 并没有打算发布完整版的多模态 GPT-4o,因为 OpenAI 在今天发布过后仍然说过段时间大家才能用得上。而是为了应对在前几天 Google 发布的完整多模态的 Gemini 2 Flash 而被迫为了不被落下,临时打乱了发布节奏。我也认为这种推测听上去非常合理,OpenAI 这一次持续 12 天的直播说实话很多时候是在水内容,可能是为了拉长时间,持续获得媒体的曝光度而设计的发布模式吧。
另外值得怀疑的是 OpenAI 对外展示的视频多模态实时对话的场景,虽然大模型有记忆能力,能分辨主体等,但是完全没有对外公布可以持续多长时间的记忆、以及用户可以免费或者 Pro、Plus 用户每天的额度。
有媒体认为,共享自己的桌面给大模型,是个非常好的场景。确实是非常好的场景,但是这些场景还是要基于多模态大模型,比如完整版的 GPT-4o 的成本、上下文长度以及实际的能力上。常识来看,即便完全发布了,价格也会非常贵,记忆时间会很有限。
这两天我也正在体验完整多模态版本的 Gemini 2 Flash,体验非常丝滑非常棒,我会继续做一些体验和测试,稍晚点来写关于 Gemini 2 Flash 的文章。
第 7 天
这一天 OpenAI 发布了 ChatGPT 的 Projects 功能。这个功能也并不新了,Claude 早在半年前就推出了,其他基于 LLM 的产品也都存在。这一次产品功能的更新 OpenAI 也像是追随者,而不是创新者。
但是在一些细节里,可以看到 OpenAI 定义的 ChatGPT Projects 功能并不是大部分产品里存在简单的语意检索这种 RAG,而是存在一定的 Planing ,结构可能更复杂,效果应该也更好一些。(由于我现在放弃了付费 ChatGPT Plus,所以没有体验到,因为第一波只有 Plus 和 Pro 用户以及团队版本、教育版本的用户可以使用)。
OpenAI 在 ChatGPT Projects 功能上的创新更多的在于跟 Canvas 的协作。我们在上一篇文章里提到 Canvas 功能对比 Artifacts 的创新,Projects 功能让 Canvas 更加完整。我相信这两个功能结合起来,ChatGPT 还是有一定的产品创新和产品力上的领先的。
应该在圣诞节前后,国内的大部分产品都会继续跟进 ChatGPT 的 Canvas 设计,强化过去的 Artifacts。
希望 OpenAI 不要继续水了
这几天之所以没有每天都跟着发,确实是 OpenAI 的发布会太水了。而且也可以看的出来 OpenAI 在应用层反倒更加用力的去更新了,应用入口上的竞争还会持续变得更加激烈。
让我们继续期待 OpenAI 过两天希望能放个大招吧,另外这几天大家应该就可以陆续看到和体验到基于 Gemini 2 Flash 超强能力的各种新的小产品和新形态出现了,我也会重点保持关注,遇到值得分享的案例会及时跟大家分享。
如果你也喜欢这篇内容,欢迎转发给你的朋友。
作者:Erlich Liu
微信号:geekthings