Proma 教程 v2
Proma 教程 v2
编辑时间:2026 年 6 月 11 日
编辑时版本:v0.12.0
作者:Erlich Liu
写在开始之前(推荐看)

大家好,我是 Proma 的开发者 Erlich。大家可能已经看过一些第一版本的教程了,间隔时间也已经有点久远了,本次是更完整的教程更新。
虽说是教程,但这些更多的是带了一些观点和判断的“说明书”而不是知识。我知道很多朋友希望抱着“学习”的态度来,希望能体系化的了解和学习所谓的 Agent。但我想说,毕业之后就再也不存在这种东西了,这些是教育给成年人来带的伤害(不多展开了,有机会的话我会在我的个人博客 https://erlich.fun 上分享我的观点)。
请大家抛开一切要学习的想法,就是解决真实的问题,你只要有兴趣,遇到了真实的问题,那么就解决真实的问题。这也是 Proma 的核心理念,如果你想了解接下来的第二季度和第三季度 Proma 的思考和即将要做的工作,欢迎访问:https://erlich.fun/articles/proma-2026-q2-q3-thinking
其实阻挡大家用好 Agent (其实几乎是做好任何事)的核心原因是没有合适的使用环境。如果你现在能说出来 2 个以上你在用 Agent 解决的真实问题,那么你已经是有真实环境的了,你接下来要思考的是如何迭代和循环,而实现这个点的方式也极其简单,无论你用任何 Agent,都尝试在处理一个问题时,下次比上一次迭代一点点,可能是多说一句话(表达更完整的上下文)、多加一个限定条件或者思考如何重复和设计规则,关于这些我们一会也会谈到。
这世界上其实绝大部分的东西都非常简单,之所以很困难,几乎全部都被错误的认识和错误的知识给误导了(我有机会也会在我的博客展开讲)。Agent 也无比简单,即便是你想做的比 Proma 好的多也很简单。我们换个说法,请问今天的摩托车市场竞争激烈吗?任何一个分析师都会告诉你竞争激烈,因为这些分析师并不具备真正的知识,他们只知道这些信息并希望加工他们,并且他们希望以竞争激烈这个观点来赖以生存和获得回报,实际上竞争激烈吗?或者竞争是真的吗?我想未必,没有任何一家企业可以像张雪机车一样在两三年内就做出来这样的规模,他们很厉害吗?并不,其实都是组装厂而已(Proma 也是组装厂),但同时也没有任何一家企业真的在直播里用 5 分钟的时间真正面对用户解决用户的问题,这难吗?一点都不难,完全不难。这市场竞争激烈吗?并不激烈,遵照常识和尊重用户,率性而为就可以做的很好了不是吗?有何之难呢?
这就是我想说的,如果你看媒体,媒体就会说 Agent 如何困难、Agent 应用竞争如何激烈、企业转型如何困难等等。但实际上呢?如果你完全不被这些没有真正知识的人误导,你只是想如何做,那么这一切都非常简单、非常跟随直觉行事,是错误的知识让你的大脑认为这件事很难,然后它就真的如愿地变难了。这个社会很容易给成年人逐渐灌输某某事物很难这样的观点,但却完全不对等的很少的灌输某某很简单的观点(除了教大家做饭),这完全不符合现实。
开发 Proma 很简单,更别提用它了,更简单,这是事实,不是观点。Agent 竞争并不激烈,因为几乎没多少开发者真的在为用户考虑,他们都在忙着提升估值和创造虚假的世界第一呢,他们连多加一句提示词都懒得给用户,有何之难?摆脱掉那些坚信某件事很难,那些默认以困难的心态应对事物的环境,大部分的事都会很简单,如它实际该有的简单,这是 Proma 短短走过的半年时间看到事实,希望对大家有所鼓励。
你能看完这个部分,我相信我们的价值观已经对齐了,如果你还愿意继续尝试,跟随你的直觉和兴趣,解决真实的问题,你将无疑成为 Agent 时代的人才。接下来就是附带观点的“说明书”的部分了,按需索取是最好的。
默会知识、Know How、纳瓦尔所说的无法传授的知识这些一直都很重要,但今天格外的重要。你将通过你真实的实践,逐渐掌握这些无法传授的知识,这些是最有价值的一些东西,并且他们可以从零开始积累,并且不依赖任何学历或者背景。真正的知识是经过你的实践最后留下的那些无法解释但就是生效的一整套事物运转的方式,他们通常会以一些下意识的、模糊的方式运行。希望大家在跟 Proma 协作的时间里会逐渐体验到并增强这些真正有价值的部分,共勉。
BTW,这篇内容很长很长,Erlich 专属加持鼓励!这确实是个说明书,完全没有超过说明书的范围,但是我会写的尽可能通俗易懂,但它仍然会很长,所以你会天然有很大的认知压力,如果你没有的话,请让我叫你声学霸。你完全不必要一次看完,什么时候觉得自己需要了解点为什么的时候来翻翻看,你几乎总能在这里找到答案,因为我不但会解释这个功能怎么用,还会解释为什么是这样(当然,变化很快,可能你看到的时候已经是好几个版本之后了,但我可以保证的是你不会觉得看完是浪费)。然后你会从更根本的层面收获到一些启发或者信息,你会更能动用你的主观能动性来解决问题(这也是今天无比重要的品质,它的重要程度可能会排在第一或者第二位)。
我也是一样喜欢逃避压力的人,但我的体验是所有这些让我逃避的概念和认知压力,当我逃避四五次,但每次都看了一点点时,几乎我就完成了对这些知识的了解和学习了,我从没完整的一次从头到尾的看过任何大模型头部厂商的文档,但我三番很多次地看了很多个碎片,每当我需要的时候我都会反复去对应的文档和细节,我也基本掌握了。这或许也不是逃避,而是大脑和人类本该有的正常现象。之所以有一次性完整的、成体系地学习某件事这基本是传统教育的误导,并不存在这类事,三番五次地放弃和三番五次地重新查看,带着不同的问题、视角和心境地查看、感知、实践,这才是真正意义上的学习。好了,继续读两段你今天就收工,记得下次不知道怎么用的时候或者困惑的时候来看就可以了,不要默认困难化任何事,不要掉进这个认知陷阱。
快速开始(包含配置)
下载和安装
**Proma 开源下载地址:https://github.com/proma-ai/Proma/releases **
**Proma 商业版下载地址:https://proma.cool/download **
这两个版本有什么区别?
Proma 商业版跟开源版目前只有内嵌 AI 供应商渠道的功能,Proma 商业版完全采用官方 API 并且同价,包含所有主流模型以及多模态模型,适合开箱即用。Proma 商业版还包括团队版本,可以团队间共享额度以及实现自动的额度分配和预算控制,未来 Q2-Q3 还会增加团队协作功能。开源版本需要用户自己配置自己的 AI 供应商渠道,并且无法使用 Proma Cloud 功能。
必要的依赖安装
注明: 如果你是 Windows 用户(答应我,下次买 Mac 吧),你会看到更复杂的必要依赖安装,跟随我们的向导完成安装即可,Windows 在这一轮 Agent 里确实是会更麻烦一点,工具链上没那么方便。
你可以在初始阶段就导入或者从同事/朋友处获得到 Skills 等内容导入,立即开始使用。

配置 AI 供应商
AI 供应商概念:其实就是各家 AI 厂商提供的大模型 API 配置入口,我们支持几乎全部的大模型厂商
注明:如果你使用的是 Proma 商业版本,Proma 已经内置了 AI 供应商,并提供 SLA 以及数据安全保证,可直接使用

以 DeepSeek 为例:供应商类型比如 DeepSeek、Kimi、Kimi Coding Plan、GLM Coding Plan、MiniMax、OpenAI 、 Anthropic 等都支持,按需选择即可,包括这些渠道的兼容格式。选择正确的情况下只需填写 API KEY 后点击右上角的创建即可,然后就完成了一个渠道的配置了,如果你还有其他渠道,则如法炮制即可。
注:仅 Anthropic 协议的可以支持 Agent,上述提到的国内的模型都支持 Agent 能力,但 OpenAI 的 GPT 系列以及智谱的 GLM 非 Coding Plan 套餐暂不支持

解释 Agent 和 Chat 模式的区别
所谓 Agent 的中文就是代理,也就是 AI 模型 + Proma 具备了一定的动手能力,这是今天最主流的也是能力最强和使用最广泛的模式。你可以在 Agent 模式下做任何工作,这会涉及到一些专业的知识,但是别害怕,最初谁都不会,今天用的好的也很少。这是完完全全依赖经验和主动学习的,没有完全的教程,这也是为什么海外开始重新推崇落地工程师的原因。核心还是普通用户因为不具备技术视角,导致很多实际业务上的拆解无法完成导致的,当然对于国内来说被自媒体毒害也比较严重。
**Erlich 推荐:**这一次我认为是完完全全需要自己实践和逐渐迭代才能掌握的能力,市面上的绝大部分的 Agent 无论是 Claude Code 还是 Codex 还是其他,其实大家的核心运作方式是一样的。让 Agent 能真正发挥能力的是我们前面提到的你需要有一个真实的可以迭代和反馈的环境。目前这些对于非开发者来说可能还有点抽象,如果哪天想起来你可以回头来继续翻看翻看。
更通俗一点理解,Chat 模式不能直接帮助你“实现”一件事,但是 Agent 模式可能能直接帮助你“实现”一件事。Agent 具备一部分的工具能力,比如把某个内容写成文档,你可以直接使用这个文档等等。对于这个阶段的你,Proma 其实也有准备,你可以明确跟 Proma 表达你的需求或者不满,Proma 有内置 Proma Coach Skills,它可以更好的帮助你合适地使用 Proma,通过在 Agent 模式下输入斜杠命令,输出 Coach 字样就可以选择使用和这个 Skills 了,当然很多时候它也会自动运行。
文件设计(如何组织好给 Agent 的文件)

Proma 的右侧是文件区域,为什么需要文件呢?因为我们很多时候确实是在处理各种各样的文件,包括希望 Agent 可以修改或者生成文件。这就是这一轮 AI Agent 的核心 —— 读写文件的能力。
而文件本身其实就是上下文,而且通常是一些更好的上下文,以为这些文件本身很多时候被精心组织过和筛选校验过的内容,所以他们是很好的上下文。
Proma 右侧的文件区域核心都是给 Agent 准备的,凡显示在右侧的文件或者文件夹,Agent 都有能力主动访问和使用,但不保证每次都一定会访问和使用。如果你很明确地知道需要 Agent 做一件事,这件事本身依赖 Agent 读取或者编写某个或某些文件,那么就需要明确指示给 Agent,你可以通过 Agent 输入框里采用 @ 的方式或者明确地自然语言描述。
Erlich 插播:讲到完整的、明确的、清晰的上下文
在刚刚的语言里,我们说明确地自然语言描述,这非常重要。人类跟人类表达的时候,很多时候我们是借助了环境作为上下文,省略了很多明确的表达,但因为人在环境和语境里,是可以理解的。比如你可以跟身边的同事说:帮我把那个那个下周的报表做一下给小李。这在人的理解里是有意义的,但是这句话不能直接输入给 Agent,这是个非常糟糕的语义。我们需要更明确地指示给 Agent,你需要的是尽可能完整的自然语言描述给 Agent 完整的上下文,这句话转换成一个好的 Agent 提示词可能是:在当前工作区文件夹下有个 @xx.excel 文档,这个文档是我们的本月销售报表,其中核心产品是我们的 a、b、c,我们的成本在另外一个 @xx.execl 文档,成本项和销售项的对照关系在 sheet2,我希望你先访问一下文档,然后帮我整理我们的销售毛利率到文档 @xx.excel 的 sheet1。关于具体的格式我们有一个说明,你可以先参照整理,如果数据有缺漏的部分可以明确指出,我来补充;有任何不确定的部分都停下来跟我确认;完成任务后给我一份你的分析方法的总结。
是的,就是可能需要这么长,长到让人感觉到厌烦的程度,这就是一个好的提示词。我非常能理解很多人觉得是在太烦,甚至表述能力也不允许这么做。大家可以尝试采用语音输入,Proma 也支持豆包的流式语音识别,效果还不错,可以加快输入节奏,更口语化的表达也没关系。
更进一步,如果这个工作你经常做,或者你的同事朋友经常要做,那么你可以把这个流程沉淀成 Skills,我们会在后续的部分来讲。
不要嫌烦,这是一种很有价值的能力和素养。
文件设计前提 — 什么是好的会话
回来我们继续。现在你可能会好奇,Proma 的右侧为什么要有三个文件的 Tab 呢,这些分别怎么用?怎么设计的,最佳实践如何?
这需要先来解释一个更基本的概念 —— 会话。我们需要先指出一种错误的用法,尽可能不要长时间几十次甚至几百次在 Agent 模式下在一个会话里持续交互。我知道这里会引出来一大堆的新的问题,比如如何做到 Agent 能记住一些事,你希望它能持续处理工作不需要你反复说等等,这些我也会在下面给你解答。
我们还是继续回到会话。一个会话就只处理一个很简短的任务,这要求你需要具备合适的拆分任务的能力。这个能力并不难,更多的是一种意识而已。我们以不同的场景举两个例子,然后你就更能理解会话、会话文件、更干净更合适的上下文了。
比如运营数据分析场景下,我们上面插播的部分,这一次执行完,就是一个会话。如果这时候还有需要修改运营文案跟这件事并不相关的工作,那最好的方式就是创建一个新的会话。创建新会话很简单,在左侧列表的项目目录右侧点击加号就可以了。
如果你处理的是编程任务,那么一次会话可能是一个小的功能的迭代或者 Bug 修复,而不是完整的项目开发都放在一个会话里。
随着模型上下文能力的增强,一百万上下文的模型也有很多,你确实是可以在相当多的会话里持续工作和处理不同任务,这在很多时候都没问题,但这不是最佳实践。这会导致你的上下文变长、上下文变得更脏,这会直接导致每次的请求 Tokens 消耗更多,对应的成本就更高;越长的上下文,也会拉长模型的响应时间,会让你的任务变慢;越长的上下文也会降低任何模型的能力,这反向也会对你的提示词、模型方面的基础知识要求更多等等。所以更长的上下文完全没有必要,我们要追求的是更短的、干净的上下文,这样可以有效地在同等提示词下的 Agent 表现能力,并更省钱更快。当然,也没必要过度追求,什么是过度追求呢?比如还是上面的原因数据分析的任务,可能我做完这一次的分析之后,第二天还有一次要处理,你继续在昨天的会话下简单表达一次说:我们的原始数据更新了,你按照刚刚的方案帮我重新分析一下。这就是更好的选择,当然你也可以选择更完整的描述+开新的会话,但没太大的必要。
文件设计——什么是好的文件划分
铺垫完关于会话的部分,你其实就自然理解会话文件了。所谓会话文件,其实就是当前会话关联的文件。这里会有更进一步的问题,我在过去被多次问到,那就是什么时候我的文件/Agent 产生的文件需要放在会话文件夹下,什么时候又要放在工作区文件夹下呢?以及我们还有附加文件的功能,什么时候要用附加文件呢?
我先来讲一下基本的原则,你就能根据你的业务来实际判断了。会话文件更多承担的是当前这一次小的任务、小的迭代工作所需要的临时性的文件内容。比如我跟 Proma Agent 协作增加一项 Proma 的功能。在开始之前,我可能已经有一些参考内容了,但这些参考内容都是只跟这个功能相关的,也就是跟本次会话有关系,我就会把它们加入到会话文件夹(直接拖动文件到输入框也会默认添加到会话文件夹);我会要求 Proma 做一下这个功能的设计,并要求它把具体的设计结果也写入到当前会话文件夹下,因为同样这次设计只适用于当前的会话,下次就用不上了。所有这类内容都更适合放在会话文件夹下。很多用户可能会嫌麻烦,一股脑的都放在工作区文件夹下,这当然可以,但并不推荐。我们说人类的更好的上下文组织者,我们的很大一部分工作就是在提供判断力和组织上下文,这些上下文你组织的越是简洁、干净、合理,你的 Agent 输出的就会又快又好又便宜。 你的每一次微小的决定,其实都在不断帮助 Agent 迭代上下文设计。
那什么时候放在工作区目录下呢?工作区目录更合适那些这一类任务可能都会用到的参考文件或者最终输出结果文件等。比如我开发 Proma 时,Proma 这个项目本身的文件夹就会通过附件的方式添加到工作区,我会有个叫 Proma-Dev 的项目,每次开发新的功能我就在这个项目下创建一个新的会话,这样每个会话都可以用到工作区下的 Proma 项目文件;还有些时候我也会跟 Agent 一起设计些更长期的功能,这些功能我可能一时半会不会去做,但未来某天可能会做,我会让 Agent 把这些设计文件写入到工作区目录下,这样就可以更好的保存和未来使用我们的产出成果。
当然,你可能还是很难一时半会把这些内容区分的非常清楚,不必追求一次做好,这些文件你可以随时删改。当你意识到下次还会用的时候,及时更新它就好,你就完成了一次上下文组织的迭代,这本身就是最佳实践,最佳时间并不意味着你第一次做就要一劳永逸和完美。
文件设计 —— 关于附加文件
Proma 还支持附加文件和文件夹的功能,可以附加到工作区也可以附加到会话。附加的含义是文件本身就存在,并且可能比较大比较多,这时候可以以文件夹的形式附加会更合适,因为这会更少的重复占用你的电脑磁盘的空间。
通过附加文件,你还可以实现跟现有的你的文件体系或者其他软件的文件结构协作,比如你可以附加 Obsidian 的原始文件目录到 Proma,这样就实现了 Obsidian 文件跟 Proma 的打通,Proma 可以读取这些内容也可以编辑这些内容。
文件设计进阶 —— 主动设计更符合语义的文件
Proma 更进阶地使用文件的方案有很多,这更多的取决于你对技术的敏锐感知和想象力。我们先从大家可以看得到的部分来讲再额外加一两个案例。
首先是会话文件和工作区文件夹下都有个 .context 的文件夹,这个文件夹是专门给 Proma Agent 做 Agent 自己生成文件时的上下文衔接用的文件夹,Agent 会经常写一些文件到这个文件夹下,这个文件夹更符合语义,更容易被 Agent 自动处理。你可能会经常看到它在这个文件夹下写 Note 或者 Todo、Plan 等文件。同样的,如果你有明确的需求,也可以更主动地表达你的需求让 Agent 遵循你的需求来写入到不同的文件夹。
如果你有一些可能很长的任务,对于一个会话来说可能完不成或者上下文太长已经很难做好了,这时候就是你主动通过文件设计的方案可以解决的。比如你可以在进行到一定阶段时,让 Agent 开始主动维护一个设计 + 进度追踪 + 踩坑记录的文档到工作区的 .context 下,尽可能的完善或则符合实际要求的完善度即可。这样,你就能随时开启另外一个新的会话,然后跟 Agent 表述 .context 文件夹下有个做了一半的任务,你来继续做完,不确定的部分还可以访问某某会话,访问某某会话 Proma 也支持你用 & 符号来引用。这样就能实现一个比较大型的任务的在不同会话下还可以持续可迭代可新开会话的继续下去了。
还有一些更高级的用法,比如文件夹里存储的文件本质上也是数据库对吧。有一些工作你可能需要一些更格式化的数据,比如你是一位面试官或者投资人,你希望能每次接收到新的建立或者项目的时候,可以让 Proma 帮助你提炼分项目或者简历里的必要信息(这些是你提前规划好的,或者也可以临时跟 Agent 规划一下决定),然后将这些提炼出来的信息可以存储到工作区的某个文件夹下,用 jsonl 或者其他 Agent 推荐的数据格式。这样你就相当于维护了一个自己的数据库了,有了这个数据库你就可以实现比如在新的会话里提问:xxx 和 xxx 在某些方面的差别是什么?我们上次聊的是什么话题?这个人的背景是什么样的这类需要组织信息的工作了。而且你还可以持续的迭代下去,这份数据库的价值就会越来越高。
还有无穷无尽的这些用法,等着你可以探索。甚至,你可以直接主动要求 Proma Agent 读取你工作区最近一段时间的会话,让它来主动给你提建议,如何优化你的工作区文件使用,推荐更进阶的数据组织方案。当然,这些也要对应有更清晰的提示词表述,如果不确定要怎么说,可以先保持开放的方式跟 Agent 一起先来讨论再决定,一起讨论几乎总是一个好的选择。
Skills 和 MCP
这是个新的比较大的话题了,我会从基础概念和一些我自己的认知上讲,然后分成一些大家关心的话题,比如如何寻找 Skills、迭代 Skills、共享等等。Skills 本身不是一个复杂的概念,其次创建 Skills 也基本不需要人来写,人只是提供一个初始的想法,然后让 Agent 逐步跟你确认就可以完成 Skills 的创建,Proma 完全支持为 Proma 创建 Skills。
Skills 的核心还是更好的提示词,通过更高质量的提示词来驱动某些流程可以达到某种质量来稳定运行,这就是它的核心意义。
关于 Skills 的认知
Skills —— 技能,其核心是你对你的工作技能的核心认知,然后通过语言以层级化的方式表述出来。首先 Skills 并不是一个行业或者场景就只有唯一一种,你也可以完全通过自然语言创建你自己的 Skills,只要它能帮助你更好的完成工作;其次是互联网上已经存在大量的 Skills,但质量也参差不齐,推荐先通过对话的方式查找,然后测试甄别,筛选出来高质量的 Skills 可以事半功倍。Proma 支持 Skills 的开关功能,对于不需要的 Skills 可以直接关掉,在 Agent 模式下的左下角会展示当前工作区的已经开启的 Skills 和 MCP,点击即可管理。
当你不知道如何思考 Skills 时,或许可以试试换个视角,如何把你的工作交给一个新人来做,这个流程是什么,核心的判断是什么,你在这个过程里总结出来的知识的结晶,最能体现你的自我能力的是什么,可以详细的把这些判断让 Proma Agent 来帮助你变成 Skills,并且你还可以持续优化这个 Skills,Skills 不是一成不变的。
这就是通过自然语言来对你的工作流程进行编程的方式,只是知识和 Know How 的运行核心不再是 CPU 而是大模型 Agent。除此之外,你还可以共享你的 Skills 给其他人,让他们也能拥有你的先进生产力和判断力,Skills 的一大特点就是自适应 + 复用,无需你再指定一套系统提示词,Agent 会自动判断;你可以无限次地在一个工作区使用 Skills,也可以分享给别人复用。
如何创建 Skills
首先 Proma 内置了 skills-creater 这个 Skills,你可以在 Agent 模式下直接跟 Proma Agent 对话,表述你的工作流,并让 Proma Agent 将这一系列的工作转换成 Skills,这样你就可以下次在同一工作区内无需再次声明的应用这个工作流了。比如 Proma 有一个处理合并请求 ->分析代码质量 -> 赠予贡献者赠金的一套工作流,Proma Agent 将这套工作流变成了 Skills,我只需一句话:帮我处理最新的 PR,就可以触发整个流程的处理。
另外一个比较好的创建 Skills 的场景是你在某个会话下完成了一项工作,然后意识到刚刚做的还不错,下次也要用到。这时候你就可以跟 Agent 表达,让它把你刚刚的工作抽象成一个 Skills。
但需要注意的是,Skills 是反复运行的比较严格的提示词,你需要更多的为这件事负责,你需要尽可能的检查这个 Skills 具体是怎么写的,是否真的符合你的要求。
Skills 创建成功后,你会收到通知,也可以在左下角看点击 Skills 管理区域来查看。未来这个区域我会把它的重要性提高到更上层的位置,会变得更好查看和管理,以及附带 Proma 自己的团队内部的 Skills 协作能力,这个会在 Q2 结束前就能实现。
如何用别人的 Skills
互联网上已经存在了大量的 Skills,也有专门的 find-skills 的 Skills,Proma 已经将其内置。如果你不知道如何找到,可以在 Proma Agent 模式下新开一个对话,可以直接输入你找到的这个 Skills 的公开网页地址、也可以通过自然语言表述比如:帮我找一些可以提高我做生物学领域研究的 Skills。
Proma Agent 会自动帮你找到这些信息,并询问你的建议,你可以访问这些 Skills,阅读他们的能力,进而决定是否要将 Skills 安装到 Proma。安装的过程也很简单,只需要自然语言告知 Proma Agent,继续在刚刚的会话里回复:帮我把 xxxx skills 安装到本地即可,Proma Agent 会自动处理完接下来的所有工作。
如何共享我的 Skills 给别人
Proma 支持导出 Skills,你可以通过数据迁移的方式来打包 Skills 发给其他人,其他人收到文件后双击就可以使用了。
更简单的方法是你可以直接要求 Proma Agent 帮你把这个 Skills 压缩,然后你把压缩包共享出去,对方也用 Proma Agent 表示解压后安装到当前工作区即可。
Q2 结束前 Proma 应该会上线我们自己的 Skills 管理和共享机制,尤其是团队版本内部的共享和协作。
如何在不同工作区之间复制 Skills
Proma 的 Skills 和 MCP 都是分工作区的,这也是为了更干净的上下文。麻烦的地方在于有些 Skills 可能需要你通过 Proma Agent 表述让它帮你复制到其他的工作区,或者你手动在设置里复制迁移。
Erlich 插播:Skills 迷思
另外,我们并不推荐安装太多的 Skills,这会导致它的语义更加的模糊,并且市面上绝大部份的 Skills 并不好,只是为了存在而存在,甚至不如你沉下心来跟 Agent 一起协作创建一个,经过实际检测的才是好 Skills,完全不必盲信盲从互联网上已经存在的,这并不等于可信或者有洞见和能力。
比如被太多自媒体炒作和过度高估的 Kapathy 的开发 Skills 以及 YC CEO Gray Tan 的 Skills,他们只是名声大,他们也需要被关注,自媒体需要炒作,但实际上花费的是你的 Tokens,这里有非常多的不对等回报。如果你不是他们的粉丝,就没必要因为他们的名气而转变务实的想法,你和 Agent 能解决的实际问题创造出来的 Skills 可能远好于这些被高估和虚无缥缈的 Skills。
对于任何人来说,创建一个 Skills 的难度并不比发一条微博更难,甚至简单的多,所以完全不要认为 Skills 多么神秘、困难、无法理解或者胜任,它的实际门槛低到无法想象,所以你要的是更谨慎和真实,仅此而已,现在就可以去跟 Proma Agent 一起创建一条你真心关注的、流程性的、解决实际问题的 Skills,如果你还没场景就等等,这不是什么变革性的东西。
关于 MCP
关于 MCP 我觉得需要讲的并不多,你可以完全跟 Agent 交互,让它帮助你安装你需要的或者探索一些你需要的即可。MCP 这项技术已经有点显现出疲态了,应该会在不久之后被逐渐淘汰掉。
关于自动任务

大概两个月前,我仍然非常抵触做自动任务这个功能,因为那时候人们用 Agent 远没有今天这么多,有这么多实际的经验,所以大家对自动任务的场景更多的被用在像是定时抓取新闻这类伪需求上。但今天已经不一样了,短短两三个月的时间,我无论是在我们自己的身上还是在用户的身上,都看到了一些真实地自动化需求,这些需求其实早就存在,但是因为对 Agent 的使用时间太短,大家对自己的用法的迭代还没到今天这么自动化的程度,今天是真的到了。
比如 Proma 的自动任务会包含每天的自动审计、每天的用户问题反馈收集,我后续会继续尝试让它做自动修复等等。
自动任务非常简单,我们设计的也比较好。我们通过 automation 这个 Skills 来完成一系列的自动任务创建要求。
如何创建一个好的自动任务
最天然的场景仍然是我们之前提到的,当你跟 Agent 一起协作做完一件事,突然意识到刚刚做的还不错,竟然没出错,我 xx 时间之后还要做。这就是最好的信号,你可以在这个会话下继续跟 Agent 明确要求帮你创建一个这个流程的自动任务。
然后你可以立即执行一次,确定这个任务是可以稳定执行的。如果不满意也可以继续跟 Agent 交互来完成对提示词的迭代。
好的自动任务不是定时提醒你喝水或者站立,而是有真实的场景,只有这才是可持续有足够价值的。
如果你暂时还没想法也没关系,这会随着你 Agent 使用的增多,你会逐渐把自己的工作流迭代到可以自动化的阶段。
自动化任务也支持通过飞书推送,在完成后也可以通过手机飞书查看,这会更方便。
远程访问和使用
远程访问我们做的已经非常简单了,支持主流的飞书、微信、钉钉这些渠道。其中飞书上的体验是最好的,这完全得益于飞书积极的拥抱变化和做了很多资源的开放。

飞书支持流式卡片,体验非常不错,如果你经常不在电脑前,推荐开启可以远程使用,可以实现 80% 手机端 Agent 的体验。飞书还额外支持 CLI,滑动到配置页面底部即可安装配置,完成后可以非常丝滑无缝地打通飞书的全部能力,包括飞书的文档、会议、日程等等,体验非常棒。这才是 Agent 时代该有的基础设施能力。
整个配置过程也无需多言,全部都是扫码即可完成配置。
目前微信和钉钉的跟进非常不积极,更多的推荐大家转向飞书。未来如果钉钉和微信支持更多的能力,我们也会尽快完成适配。
如何更进一步
说明书部分已经接近尾声了,此时是 6.11 日的凌晨 3:03 分。
我想表达的一半的更进一步是你要做的工作,你有足够的好奇心和真实能得到反馈的场景,你就会非常容易地随着正常的使用而更进一步。
如果你能在每次跟 Agent 完成一次迭代之后,都能稍微想到一点我该如何做,下次它能做的更快更准,我要多说一句话多加一个限定条件吗?我敢保证更进一步的路总是这么简单,更进一步完全不是我要使用 Agent Teams 吗?
这世界真的很简单,把一件事做的相对还不错也很简单。但是相当多的人希望能把自己的事解释复杂,比如 Harness Engreenering,以此来证明自己的工作是有价值和有意义的。但我想说,这恰恰走在了错误的路上,这恰恰是离更进一步更远了。Proma 就充分说明了这一点,这些东西完全不难,好的体验和好的能力是一万五千个细节堆叠起来的,是我们一万五千次的主观意识的迭代产物而不是一个 Harness Engreenering 就能替代的(BTW,这词也很不 make sense,一切你不能字面理解的东西的中间过程都基本有问题)
另外一层的更进一步是 Proma 将要去做的,你更多的负责好奇、主观能动性、积极地体验,你能保证做到这些,Proma 或者说任何负责人解决真问题的产品都能保证你能更进一步。
首先最简单的是 Proma 会迭代 Proma Coach 这个 Skills,这可以在一些场景下主动帮助到你。我们的 Q2 和 Q3 会来做更多的 Proactive,其实就是更主动的通过花费更多 Tokens 的方式来主动给你提一些建议或者可能,比如我们可能承担一定的成本,来定期扫描一下你的本地的交互记录,然后写一段 Agent 提示词,判断是否有一些优化的点可以帮你做。这些可能包括:改善你的 Proma Agent 的使用方式、给你 offer 几个合适的 Skills、帮你生成两个你点几下检查一下就能稳定运行的定时任务,甚至如果这些我们做的很不错,那我们应该也会尝试更进一步比如根据你长久的使用,Proma 觉得专门在 Proma 内给你写个软件或许更适合你的工作。
所有这一切的第一原则是:解决真实的问题,而不是追求世界第一个 xxx。
这一切的第一原理是 Proma 对软件的核心理解:软件是更先进的生产理念的传递,为了保证这种理念可以执行所以需要有对应的一部分的流程固化和提供工具本身,而只有解决真实地问题才能保证我们的理念是真的可能领先。
我所看到的更确定加速的世界(结语)
至此,Proma 的说明书就结束了,Proma 还在飞快的进化当中,这份说明书也会随着迭代。
我到今天,突然有种前所未有的确定的感觉,不是未来一周我会做什么,而是我大概知道我预期到的 AI 的三个月后的世界会怎么样,会有多快。只是这种世界到底 Proma 是否是绝对的参与者或者实现者。
我不想传播任何的恐慌,我自己也没有恐慌,我只是经常性的反思我自己的过去的惯性、自大以及懒惰之类的事,我作为开发者本人也在想我应该如何更好的适应这种世界。Proma 的本意和目的并非替代任何人,但替代这件事本身是一定会发生的,只是程度不同,这不是 Agent 本身决定的,是过去的生产力、权力结构和分配机制决定的,Agent 是一个巨大的变量,一种巨大的要素的变化。但我也并不知道这种变化会导向什么结果。
我只是在这个过程当中看到了一些很重要的东西,希望我们都能拥有。
第一件事:做你喜欢做,你开心的事,但这件事不是刷短视频和看小说之类的,是其他的事,这些东西带来的精神是无比宝贵的。我记得我好多年前瞎胡说,未来可能不需要人有技能,你陪人在城市里瞎溜达半个小时可能也会很值钱,这是人的部分。
第二件事:这世界开始变得无比的平,但资源本身还是有一定的门槛,但从未如此之平。大胆点、主动点、不要被过去的“一看 xx 就不行”的想法给限制住,新的基础设施(Agent)回来带新的产品和可能,Proma 就是这种基础设施和不被限制的产物。
第三件事:保持简单和健康,即便你不想参与 AI 的世界,那么也要保护好我们的大脑,摧毁大脑的最快的方式就是刷短视频和滥用 AI,注意力也将是评判健康与否的重要标准。
最后,感谢你的阅读,感谢你关注 Proma,如果你有任何想法,欢迎跟我聊(微信:geekthings),也欢迎为 Proma 提供 PR。