DeepClaude额度查询 | 充值文章联系我

Proma — 下一代 AI 软件的身影

image-20260117113326455

要想介绍 Proma,就需要回到 DeepClaude,我想看到这篇内容的朋友,大概率都是因为 DeepClaude 这个开源的项目认识我的,你现在仍然可以在 Github 搜索 ErlichLiu/DeepClaude 来找到这个开源的项目。DeepClaude 在 2025 年 2 月做了一件很小的事,我把 DeepSeek R1 模型的思考跟 Claude 3.5 Sonnet(对,那时候 Claude 的命名的顺序还是数字在中间)结合在一起,可以实现更好的推理效果,获得更强大的输出。随后更知名和用量更大的其实是 DeepGeminiPro,这是 DeepSeek + Gemini Pro 系列模型的组合,在文字的表现效果上更好。于是,因为这些简单的工作,得到了一些朋友们的照顾,服务了一小批用户。

在这一整年的过程里,我们几乎推荐所有的用户去使用 Cherry Studio 或者 Chatbox 等开源的聊天对话软件,因为我没有去做前端,我只做了 API 上的工作。但是整个 2025 年里,我收到了非常非常多的用户朋友的反馈,以及亲眼看到 Manus 等等一大批软件是如何实现惊人的 Agents 能力的,但是 Cherry Studio 和 Chatbox 总是无动于衷,仍然只有最简单的 Chat 的模式,我也非常能理解这其中的原因,因为他们太追求兼容了,导致动弹不得。

但 DeepClaude 的用户几乎都是非常前沿的用户群,属于先锋和早期使用者,我几乎每天都能在群里看到大家的期待和讨论。我本身也是开发者,我更是惊叹于这一年的 Agents 的进化速度之快,如果你关注了我的视频号或者小红书、或者朋友圈之类的,你一定经常看到我提到这类的内容。但这些通用的能力其实并不是只能局限在 Claude Code 或者 Manux 这类产品里,它一样可以很简单的进入到 DeepClaude 的先锋用户和前沿用户里。

于是从 2025 年的 12 月开始,我终于下定决心还是我自己做一款这样的带有通用 Agents 能力,我可以 100% 控制并能以我的能力 2-3 天就能快速迭代一版的软件,来跟上最前沿的技术并把这些技术转换成产品输送给 DeepClaude 的用户。这接近一个月的时间里,除了出差在飞机上的时间外,我几乎每天都在疯狂的开发,于是就有了当前的 Proma 的网页端、Windows 和 macOS 的版本。

说了这么多,Proma 到底有什么特别的呢?有什么特别的想法吗?当然有,Proma 首先是对话的体验会更好,并且比 Cherry Studio 以及 Chatbox 多了云端存储,这样你的多平台和多设备都可以同步了。最重要的其实是 Proma 的 Flow Agents 模式,这背后是 Claude Agent SDK,而 Claude Agent SDK 另外两项最知名的应用分别是 Claude Code 和 Claude。是的,你没听错。Proma 从现在开始理论上能实现跟 Claude 以及 Claude Code 一样的功能。并且支持最近大火的 Skills(接下来 Proma 也会设计基于你的场景来自动生成高质量 Skills 的功能),让你处理工作流更顺畅。

举个简单的例子,这是开篇的一张图,这是我的实体公司需要做备案的一些文书工作,我非常不喜欢这类文书工作,现在我就可以直接打开当前这个处理文书工作的和包含了很多公司资料的文件夹,然后让 Proma 的 Flow Agents 帮我自动整理所需要的文件,现在已经有了的资料可以自动帮我整理到文件夹,现在没有的文件可以标记清楚让我具体做哪些工作来补充。甚至文书工作里要求的需要声明的 AI 使用情况的文档也都帮我写好了,我只需要打印盖章扫描即可。

image-20260117113752200

除了这类场景以外,Proma Flow Agents 还可以做几乎任何事。

先从一个小的执拗开始吧,Proma 在 2025 年 12 月底刚开始 Beta 测试时,那时候还只有 Chat 模式,几乎所有的朋友都想要跟文件对话的功能,但是我一直没有做,原因也很简单,因为现在最常见的处理方式基本都是转换成文字,很少很少一部分场景是可以直接 base64 输入给模型,那这种场景就非常容易误导用户,但是用户是感知不到的,如果用户本身的专业知识不足够或者没看过文档的话。

现在所有上传非图片的文件,都会默认跳转到 Flow Agents 模式,Flow Agents 会根据你的需求处理的很好,它可以多次访问这个文件,甚至拆分和利用自己的反思能力来校验等等。Flow Agents 的能力非常通用,几乎什么都可以做,但是这仍然需要用户们动用自己的想象力以及逐渐摸索自己的使用边界,我也会尽可能多的分享。

比如就在刚刚,一位用户朋友反馈了一个 Proma 的数据问题,想要研究这个问题过去人来做会比较麻烦,我把需求描述给 Flow Agents,并允许它直接链接我的数据库,5 分钟的时间 Flow Agents 完成了分析结果。

Snipaste_2026-01-17_12-35-28

Flow Agents 可以联网,大家普遍需要的 DeepResearch 功能其实也可以直接在 Flow 模式里实现,需要你先创建一个文件夹,如果你有研究的资料需要跟 Flow Agents 一起协作,然后完成联网的深度搜索,需要你指明你的参考文件和联网上的校验或者搜索需求,Flow Agents 就能够完全理解并遵循。因为 Flow Agents 是基于文件系统的,所以非常建议你在提示词里添加一句类似的话:请帮我把最终的调研报告写到当前文件夹下,保存为 markdown 文档。

Flow Agents 也支持预览这些生成的文件,对于 markdown 文档更可以直接编辑。如果你对其中的部分不满意,可以直接复制这个部分,然后继续跟 Flow Agents 对话要求修改这个文档的部分,或者重新生成新的。

Flow Agents 现在也支持 Skills,默认集成了 Claude 内置的一些 Skills,接下来还会做更方便的外部导入和支持用户自己编写 Skills。Skills 可以理解为做事的一套流程、要求以及方法的组合,比如当你想把上述的调研报告生成 Docx 的格式时,Flow Agents 就会自动调用 docx 的 Agents。接下来还会整合一些常见的非常好用的 Skills 进一步提升大家的体验,比如 Superpowers。

了解到这里,其实 Flow Agents 的核心你就理解了。

当然,Flow Agents 肯定还有很多场景是可以变得更好用的,如果你有需求,欢迎留言给我,我来帮助你完成这个流程。对于后续的一些非常长尾的需求,Flow Agents 未来会允许用户自己生成在 Proma 里的 App,Proma 会逐渐变成一个基础设施的平台。

举一个小例子,比如很多用户朋友都希望我能支持生成图和视频的功能,这个部分的基础功能我肯定后续会做,但是可能你需要的生图的流程和处理流程是特定的,甚至是类似我们之前飞书插件的批量式的,甚至要写回到飞书文档里。这种情况接下来会支持 Flow Agents 生成一个专属你的应用,背后需要的链接能力以及大模型、生图等 api 会由 Proma 主动通过协议暴露给 Flow Agents,这样你就可以在 Proma 里实现一种自定义的产品了,再未来我也会尝试去帮助大家做这种类型的产品的分享甚至分发。

目前阶段 Flow Agents 的成本确实还比较高,我正在开发我们自己的新一代的中间层服务,预计 3 - 4 天后我们就会上线新的配套服务,届时我也会跟国内模型厂商一起合作,推出可选的国内模型。比如做的很不错的智谱的 GLM 4.7 模型、MiniMax 的 M2.1 以及 Kimi 的 K2 等,也会推出新的 Agents 包或者订阅模式来一起降低大家的使用成本。

大家还有一种担心,认为 Flow Agents 模式会比较费钱,并且速度比较慢,这些问题都存在。成本的问题会通过上面说的方案来解决,至于速度上,我们会继续支持流式输出以及模型本身会越来越快,预计可能 2 个月后大家的体验会更丝滑。我并不担心消耗更多的 Tokens,反倒我基本是瞄准如何消耗更多去做的,并且是自动化的消耗更多,Proma 会逐步支持更多这方面的需求。原因也很简单,Tokens 某种程度上是智能,我能感觉到所有的产品和需求都在加速,那么最好的方式一定是智能自主驱动的自动化,Proma 肯定是瞄着这个方向去做的。

接下来 Proma 还有非常非常多的想法和需要实现的东西,Proma 里也有非常多的小设计,欢迎大家使用体验,也欢迎大家关注我的视频号(ErlichLiu)或者小红书(Erlich),可以更及时的看到更多关于 Proma 的开发和使用技巧分享。

再次感谢大家的支持,欢迎大家使用 Proma https://proma.cool/download