DeepClaude额度查询 | 充值文章联系我

Proma - 你需要了解的最小学习集合

在这个系列开始之前(推荐看)

大家好,感谢大家关注开源通用 Agent 项目 Proma,我是 Proma 的开发者 Erlich。在正式开始关于 Proma 的使用教程前,我想先简单做个本次系列教程的介绍。

首先因为我们是开源免费的软件,并且 Agent 运行有所需的环境要求,所以需要大家去安装环境并配置大模型的 API 提供商信息,我们会从最基础的配置开始介绍,这个部分可能会涉及到一些陌生的概念,但请相信我,你只需要克服这种恐惧,大概 3-5 分钟就可以完成配置了。

然后我们会从简单到复杂开始讲解 Proma 的设计以及对应的 Chat 和 Agent 以及 Agent 进阶的使用方式,并在这些正式开始之前来介绍各种基础的知识比如工具调用SkillsMCP 等。

然后我们会结合真实的场景来跟大家讲解对应的功能,尽可能让大家在不同的场景下能自己组合出来最佳实践。

另外,这里会涉及到一些我个人的认知以及偏好,我希望这个教程尽可能是个简单通用但又详细的教程,可以给你提供足够的安全感跟着完成教程。即便未来你不使用 Proma,那么这份教程里的认知和概念也会对你使用其他 AI 产品有很大的帮助。

Proma 希望能在 3 月结束前实现 Pro Active Agent,白话讲就是更主动的 Agent,可以根据你的本地数据积累的个人偏好、工作场景、记忆等来主动为你提供各种可能性,尤其是在自动生成适合你的工具层面上。如果你用的越多,那么未来的 Pro Active Agent 的表现大概率会更好。

我们在 2 月 8 日发布了完全重构且开源的通用 Agent 软件 Proma,然后紧接着一个月的时间我们非常频繁的迭代和进步。Proma 使用的用户开始增长,并且也发现因为这一轮 Agent 太过于通用,导致很多过去对 Agent 接触比较少的朋友一时间不只如何下手。与此同时,我也看到很多朋友在对 AI 等工具的使用上存在一些错误的理解。所以我决定停下来两天时间,来尝试写这篇非常基础的教程,我希望尽可能做的通用、简单,希望能传达一些认知和理念,这些结合起来可以让大家在任何 AI 工具的使用上都能受益,而不一定是要使用 Proma。这期内容会是图文 + 视频的版本,如果你的时间足够,我非常推荐你可以从头看到尾,简单跟着完成实践,这一定能对你有所帮助。

当然,如果你感到本系列的内容有点多,认知压力很大,也可以不用一次看完,可以只看个开头,然后告诉自己过两天再来看一点点。我也是一样喜欢逃避压力的人,但我的体验是所有这些让我逃避的概念和认知压力,当我逃避四五次,但每次都看了一点点时,几乎我就完成了对这些知识的了解和学习了。这或许也不是逃避,而是大脑和人类本该有的正常现象。

我希望当 Proma 完成整个 Q1 的想法之后,这些人机协作的智能可以帮助大家更好的完成类似这种事。感谢大家的支持。

Proma 项目地址、版本、下载和安装

项目地址

Proma 是一个开源的软件,我们的所有的代码都是公开的,Proma 开源地址https://github.com/ErlichLiu/Proma.git

版本(开源版本和商业运行版本)

为了更好的服务大家,减少大家的麻烦,我们同时也提供商业的版本,商业的版本跟开源的版本一致,只是内置了 Proma 官方的 AI 供应商渠道,这样大家可以无需配置就可以直接使用,更加的简单。Proma 商业版本地址https://proma.cool/download

商业版本提供更优惠的订阅方式,所有模型都是官方原价计价,订阅会提供更低的折扣,起步折扣就是 7 折,最低是 4 折左右。商业的版本也会帮助 Proma 提供更多的资源来推进开源版本和商业版本的发展。

下载和安装

开源版本下载地址https://github.com/ErlichLiu/Proma/releases

商业版本下载地址https://proma.cool/download

Windows 用户我们推荐安装到 C 盘,这样会对接下来的 Agent 执行会更加友好。

说明:开源版本的下载需要向下滚动并找到对应的下载区域,然后按照这个部分的指引下载安装即可: image-20260308125017458

商业版本的则很简单,直接访问 https://proma.cool/download 后下载对应版本即可,下方可以下载到更早的版本。

image-20260308125051182

依赖安装(Node JS 和 Git)

说明:因为 Agent 的原因,我们需要 Node JS 和 Git 作为基础的环境依赖。但请不要害怕,Proma 提供了引导流程,只需跟着引导流程默认完成安装即可。Windows 用户注意,在安装这些依赖时务必保证安装到 C 盘,并在软件安装完成前勾选安装流程内的 Add to Path 字样的选择框即可

完成对 Proma 的安装后,第一次启动会看到这个界面:

image-20260308125408836

到此,恭喜你已经完成了对 Proma 的安装,接下里是对 Proma 的基础的设置,包含 AI 供应商的配置以及 Chat 和 Agent 的模式使用讲解和技巧等。

AI 供应商渠道和模型配置

AI 供应商渠道这个大家应该不陌生了,比如常见的 DeepSeek、豆包、千问、SiliconFlow 以及众多 API 中转商都是 AI 供应商渠道。同样 Proma 商业版也内置了 Proma 官方供应商渠道,如果你采用的是商业版,则无需额外配置,跳过本节即可

Proma 支持全部的供应商渠道和主流格式(OpenAI 兼容格式、Anthropic 格式以及 Gemini 格式)。

image-20260308144809298

AI 供应商渠道配置

1.首先点击 Proma 的左下角的设置,然后选择设置内的渠道 ,然后点击右上角的 添加渠道

2.填写你的渠道名称,可以任意填写,可以区分你的渠道即可

3.供应商类型 需要选择你的供应商类型,如果该渠道将用于 Agent 模式,则必须要求该渠道支持 Anthropic 类型的格式,并且要选择 Anthropic 格式

4.BaseUrl 也是你的供应商提供给你的,无需在网址结尾添加 /v1 或者 /v1/xxx 格式,Proma 会自动处理。如果这个部分你不确定如何填写,请咨询你的供应商

5.API KEY 是你的 AI 供应商渠道的凭证,以上均完成配置后可以点击测试链接按钮来验证你的 BaseUrl 和 API KEY 是否填写正确

接下来我们继续完成模型的配置

AI 模型配置

继续查看下方的模型列表区域,绝大部分的供应商都支持通过我们的从供应商获取 按钮完成对所有模型的拉取。Proma 并不推荐配置所有模型,只推荐配置必要的模型即可,因为通常一个模型供应商都会支持数十种模型只多,但对于实际场景可能我们只会使用几个性能不错的模型。

也存在一些 AI 供应商并不支持通过 从供应商获取 的方式拉取模型,那么就需要参照你的供应商相关的配置文档来手动填写模型 ID 完成配置了。

这个部分你可以通过滚动 + 勾选的方式来选择模型;也可以在顶部使用搜索框来筛选合适的模型。切记,完成模型配置后需要滚动到顶部点击创建渠道来完成保存(这个部分 Proma 做的还不算直观,我们会在接下来的版本里做设计上的优化)

至此,Proma 的渠道配置已经完成。如果你配置好了 Anthropic 协议的渠道,你会在渠道的下方看到Agent 供应商 这一栏,点击一次完成勾选。这样就可以在接下来使用 Chat 和 Agent 模式了。

记忆工具 / 联网工具配置

Proma 支持通过 MemOS 和 Tavily API 来分别实现记忆能力和联网搜索能力。这两项能力会极大的增强 Chat 模式的使用体验,强烈推荐完成配置。同样,配置的过程也很简单,总耗时大概需要 3-5 分钟。

image-20260308145353048

MemOS API 配置

MemOS 提供每月免费用户的 5 万次记忆的存储和 2 万次的记忆的调用,对于绝大部分用户都足够用,这是 Proma 第一阶段的选择。Proma 未来也会构建自己的记忆系统和记忆能力。

  1. 点击第一步当中的访问链接,打开 MemOS API 的官网并完成账户的注册
  2. 在控制台的界面生成一个 API KEY
  3. 将 API KEY 粘贴到 Proma 的记忆部分的输入框,然后点击测试链接

当测试链接通后,即表示记忆能力已经完成配置。记忆功能可以同时在 Chat 模式和 Agent 模式生效,需要打开右上角的记忆开关

记忆能力会自动在你表达事实和偏好时触发,并将你的记忆存储到 MemOS,并在模型可能发现需要调取记忆时来调用这些记忆,实现更了解你,更懂你,同时可以跨对话/会话的拥有一致持久的记忆能力。当然,如果你希望 AI 记住一些关于你的信息,也可以主动输入帮我记住 xxxx 之类的表述,模型也会主动触发记忆工具来记住这些对应的信息。

【实际效果】,需要在 Chat 模式下输入框的工具按钮打开记忆按钮。

image-20260308145840794

联网搜索配置

Proma 同样也支持联网搜索工具,原因是模型本身并不支持联网,全部通过工具来实现。而联网能力可以帮助模型获取到最新的信息以及模型训练知识范围以外的信息,可以极大的提高使用模型对话的体验。Tavily 每月提供 1000 次的免费联网,对于绝大部分用户来说也是完全足够的。

具体的配置方法如下:

  1. 点击设置区域里的工具,然后打开联网搜索部分的开关,继续点击配置步骤里的 Tavily 官网链接打开并注册
  2. 在 Tavily 官网的控制台区域获取 API KEY,然后复制
  3. 将复制的 API KEY 粘贴到下方,并点击测试链接,通过即表示配置完成

注意:由于 Tavily 为海外产品,所以测试和接下来的联网搜索均需要你有访问国际互联网的能力。

【实际效果】,需要在 Chat 模式下输入框内打开联网搜索开关

image-20260308150620825

image-20260308150639466

Agent 模式推荐(无需配置)

这个工具是个默认内置的工具,是 Proma 专门的设计。在传统的 Chat 模式下,我们发现很多用户其实并没有采用最佳实践,比如有大量的用户会在 Chat 模式下向模型输入 Excel/CSV 或者一连串的数据集,并要求模型对此进行修改或者数据分析,在这种情况下并不适合采用 Chat 模式,这个会更适合 Agent 模式。于此类似的还有很多场景,比如涉及到任何的文件修改的请求、涉及到深度研究方向的请求,都更适合采用 Agent 模式,Agent 模式会完成超乎你想象的效果。

【实际效果】,该工具默认打开

image-20260308151316467

比如遇到这类复杂的任务时,需要联网进行广泛的搜索、提出假设验证假设,并最终完成报告还要输出报告到本地的情况就是典型的 Agent 擅长的场景。此时在 Chat 模式下就会触发 Agent 模式推荐功能,会主动弹出切换到 Agent 模式的按钮,点击即可切换到 Agent 更好地完成任务。

Chat 模式

Chat 模式的功能和注意事项

  1. 支持文件解析,支持 PDF、Word、markdown、图片等格式的信息,但需要格外注意,对于文档的解析通常的做法会丢掉内部的图片和格式,如果格式和图片是重要信息,那么请采用 Agent 模式来处理;
  2. 支持通过剪贴板的方式来粘贴图片或者文本到输入框,无需截图后保存再附加,直接复制粘贴会更方便;
  3. 支持切换所有已经配置的模型和渠道;
  4. 支持思考模式(需要你的 AI 模型供应商的模型本身也支持)
  5. 飞书通知(待实现 Chat 模式下的飞书通知)
  6. 语音输入,目前采用的是浏览器自带的语音识别能力,效果不佳,未来会通过语音模型 API 或本地语音模型来优化
  7. 支持联网和记忆能力,需要打开相关的开关并完成配置(见上述的配置)
  8. 支持上下文调整,上下文越短越节省 tokens,但同时也会让当前这一轮的模型本身的‘记忆’能力降低,根据场景可以主动调整,未来会退出无限上下文功能;
  9. 清除上下文,如果接下来的对话并不需要前序的对话信息,那么可以点击清除上下文来节省 tokens 并避免新的信息受到前序内容的影响,支持通过快捷键来清除,Ctl + K / Command + K;
  10. 支持切换系统提示词,Proma 内置了提示词,也可以在设置内点击提示词进行添加或者编辑,支持在对话界面的右上角点击提示词按钮快速完成切换和编辑;
  11. 置顶对话,对于某些话题或者提示词我们会经常性的使用,此时推荐点击右上角的置顶按钮或者左侧对话列表栏的置顶按钮将对话置顶,方便下次快速使用。

Chat 模式的认知

Chat 模式无法对文件进行操作,只能进行读取和文本上的回复。任何一个模型,在处理聊天信息时,本质上都是对当前这条信息的一种映射,不代表模型的回复一定是准确的,更多的时候是对你能触发的信息的一种道德和能力对其后的响应,并且缺乏反驳和反思的能力。

所以提示词很重要,如果当你对一个问答并不确定是否可以问到点子上,并且没有能力判断输出结果时,那么最好的策略是先充分的进行探索,在提示词内可以降低绝对化的用词比例,并主动提出要求模型给出多种选择和必备的基础知识,以及如果在做判断时需要任何你来补充的信息,请停下来要求你来补充。你可以用你的方式来组织这类描述或者创建一种更优版本的系统提示词。

然后人类在互动的环节里学习和了解各种周边的知识和信息,并逐步掌握一些新的能力,跟模型一起进步。

当遇到实时性质比较强的问答时,可以采用联网搜索能力;当遇到一点疑问时,请继续查询数据源进行验证。模型本身并不具备准确输出参考内容或者数据源的能力,可以通过 Agent 模式将你的需求转换成一种研究,并在 Agent 模式下完成对数据源的校验和对结果的审查工作。

如果想要对文件内容进行非读取式的处理时,请采用 Agent 模式,无论是生成还是编辑 PDF、Word、Excel 以及其他,都更适合 Agent 模式来处理。

Chat 模式的定位和场景

Chat 模式会长期存在,Chat 更适合一些简单的问答问题。Chat 适合用来满足人类的学习的需求、满足好奇心、以及一部分替代记忆等场景的简单一问一答,或者仅仅是聊天等场景。

Chat 模式不适合用来做深度研究、不适合修改文件、不适合处理多个步骤的工作序列等。

Agent 模式

前提

渠道配置

Agent 模式目前的内核是 Claude Agent SDK,因此需要在设置里包含至少一个 Anthropic 协议的渠道,并且处于开启状态。Proma 商业版本已经默认内置 Proma 官方渠道,无需配置,可以跳过配置部分直接开始

环境配置

Agent 模式要求用户必须具备 Node JS Git 基础环境,如果本地还未安装,请跳至本教程开头的部分完成基础环境的安装。

Agent 模式的基本概念

Agent 其实是个很模糊的概念,Proma 将其定义为:一种需要模型提供智力,通过利用系统环境并调动工具(MCP、Skills、Bash、Grep)等方式,完成一系列长程复杂任务的工作模式。其实人类白领工作就是一直在做这类的工作。

这就会涉及到一些新的概念,Skills 和 MCP,我们将在这个部分做个初步的解释,然后再接下来的实际的用法教程里做更详细的场景指导。

Skills

无论是 Skills 还是 MCP,其核心目的都是为模型提供一种节省 Tokens 的、通用的增强模型与人交互或者与外部交互的一种固定的格式或者流程。比如 Skills 的核心是渐进式披露上下文,过去我们可能会希望通过使用系统提示词的方式来让模型尽可能多的完成更多更长的文本工作,但是随着模型周边的工具调用能力和框架的发展,模型开始逐渐能自己做更多的处理了,那么如何让模型知道某一类工作的处理方式呢?如果全部写入到系统提示词里,那么可能系统提示词可以长达数万字,这样会既消耗大量 Tokens,又会导致长上下文情况下模型能力减弱。但于此同时人们发现即便是一类工作全部要求也并非是一次性处理完所有的工作,那么实际上对于一类工作的处理就可以转换成一系列的处理方式+处理引导之类的东西,通过机制的设计让模型在需要用到这个部分的知识的时候只读取对应的部分,从而实现:减少 Tokens 的消耗、结构化层次化的提供实际的工作技能组合、模型可以持续稳定的运行

因此 Skills 只是一种更高级的系统提示词。但也不止如此,你可以在 Skills 里规定各种调用系统能力的方式,继续扩展你的工作技能组合。

创建 Skills

首先 Proma 内置了 skills-creater 这个 Skills,你可以在 Agent 模式下直接跟 Proma Agent 对话,表述你的工作流,并让 Proma Agent 将这一系列的工作转换成 Skills,这样你就可以下次在同一工作区内无需再次声明的应用这个工作流了。比如 Proma 有一个处理合并请求 ->分析代码质量 -> 赠予贡献者赠金的一套工作流,Proma Agent 将这套工作流变成了 Skills,我只需一句话:帮我处理最新的 PR,就可以触发整个流程的处理。

image-20260308155135715

我在不同的工作区有不同的 Skills + MCP 的组合可以帮助我来处理不同的工作,我们会一会继续来做实际的演示。

在 Skills 创建这里有一个难点,哪些工作是模型可以做的好呢?如何通过各种基础技术设施做的更好呢? 这是个更难的问题,也是考验大家使用 AI 能力的问题,目前还没有人能解决好这种元问题。Proma 会未来增加新的 Agent 来辅助大家做的更好。

如何用别人的 Skills?

互联网上已经存在了大量的 Skills,也有专门的 find-skills 的 Skills,Proma 已经将其内置。如果你不知道如何找到,可以在 Proma Agent 模式下新开一个对话,可以直接输入你找到的这个 Skills 的公开网页地址、也可以通过自然语言表述比如:帮我找一些可以提高我做生物学领域研究的 Skills。

Proma Agent 会自动帮你找到这些信息,并询问你的建议,你可以访问这些 Skills,阅读他们的能力,进而决定是否要将 Skills 安装到 Proma。安装的过程也很简单,只需要自然语言告知 Proma Agent,继续在刚刚的会话里回复:帮我把 xxxx skills 安装到本地即可,Proma Agent 会自动处理完接下来的所有工作。

关于 Skills 的认知

Skills —— 技能,其核心是你对你的工作技能的核心认知,然后通过语言以层级化的方式表述出来。首先 Skills 并不是一个行业或者场景就只有唯一一种,你也可以完全通过自然语言创建你自己的 Skills,只要它能帮助你更好的完成工作;其次是互联网上已经存在大量的 Skills,但质量也参差不齐,推荐先通过对话的方式查找,然后测试甄别,筛选出来高质量的 Skills 可以事半功倍。Proma 支持 Skills 的开关功能,对于不需要的 Skills 可以直接关掉,在 Agent 模式下的左下角会展示当前工作区的已经开启的 Skills 和 MCP,点击即可管理。

当你不知道如何思考 Skills 时,或许可以试试换个视角,如何把你的工作交给一个新人来做,这个流程是什么,核心的判断是什么,你在这个过程里总结出来的知识的结晶,最能体现你的自我能力的是什么,可以详细的把这些判断让 Proma Agent 来帮助你变成 Skills,并且你还可以持续优化这个 Skills,Skills 不是一成不变的。

这就是通过自然语言来对你的工作流程进行编程的方式,只是知识和 Know How 的运行核心不再是 CPU 而是大模型 Agent。除此之外,你还可以共享你的 Skills 给其他人,让他们也能拥有你的先进生产力和判断力,Skills 的一大特点就是自适应 + 复用,无需你再指定一套系统提示词,Agent 会自动判断;你可以无限次地在一个工作区使用 Skills,也可以分享给别人复用。(目前 Proma 还未提供分享这项能力,但是你也可以让 Proma Agent 将你的 Skills 压缩后导出到桌面,然后发给另外一个朋友,以同样的方式让 Proma 把 Skills 安装到 TA 的电脑)

MCP(Model Context Protocol )

MCP 的全程是模型上下文协议,但发展到今天我认为它更多的偏向于几种不同的场景,而不是承担泛化到如此广泛的模型上下文协议层面。还是先来举个我的个人的例子,我有个日常的工作区,这个工作区里配置了 Gmail 的 MCP,这样可以实现帮我检查我的几个邮箱的未读邮件,也可以帮我直接回复一些比如海外服务的客服邮件等工作,甚至可以联动 Github 来处理各种问题。

image-20260308160835274

MCP 在今天更多的是第三方来提供,我们自己创建的会相对较少。而 MCP 背后更多的是 API 工具的一种包装,因为这些 API 服务本身是外部提供的,但是直接提供 API 给模型和用户都会很麻烦,所以通过 MCP 包装(携带了提示词)过后给 Agent 就可以更准确的来调用这些 API 服务。

比如我安装的 Gmail MCP,核心就是利用 Gmail 的 API 来帮我收发邮件;有用户可以利用安装完整的飞书 MCP,实现利用 Proma Agent 修改或者创建飞书的文档、表格等信息。现在整个互联网上也已经存在了相当大量的 MCP 以及关于这些 MCP 的教程等信息,所以它天然适合直接通过 Proma Agent 自己为自己安装 MCP 了。

如何安装 MCP?

首先还是分为两种情况,一种是你知道大概的 MCP 是什么,这取决于你是如何设计你的工作的,就像上文一样,当你用着 Proma Agent 时突发奇想为什么不能直接编辑飞书文档呢?于是才产生了对飞书 MCP 的需求,此时就可以直接跟 Proma Agent 在当前工作区对话帮你搜索是否有飞书 MCP 进行安装,全程自然语言对话即可完成,完成后重启 Proma 即可生效。

另外一种情况是更泛的,比如你在设计一套工作流,你希望你的工作更顺畅更丝滑,那么你也可以主动在这个会话上下文上表达更细节的这种期待,比如:我现在希望我可以直接对接我的 Gmail 邮箱,然后将我的深度研究结果直接通过邮箱发给我的同事,你有什么 Skills 或者 MCP 可以帮助我找一下实现这些吗?

这样就可以完成对应的 MCP 的安装了。通常这类 MCP 都会涉及到一定的授权,比如 Gmail 和飞书都需要你来生成一些授权信息,同样可以跟着 Proma Agent 的引导即可完成。

MCP 的核心其实更多的是外部复杂服务的包装简化,并直接提供给 Agent。

中间插播

看到这,你或许也会感受到这一轮 Agent 有那么点不一样了。或许你也会开始感觉到恐慌或者退缩,这些都无比正常。我想说,这一轮 Agent 能用的好的人一定是主观能动性比较高的人,截止到目前的 Agent 的发展,受益最大的群体就是具备这类特质的群体。这种主观能动性本身对实际的执行力要求可能也并不高,因为 Proma Agent 可以帮助你做很大部分的工作了,无需花费一整天的时间配置等等。

而这种主观能动性的背后,还有一些跟我们的社会环境和教育有关。我经常会收到很多朋友反馈类似说:

  • Proma 是否有教程呢,我不知道 Agent 怎么用
  • 我年纪大了,我学不会了,你能教我吗
  • 我愿意付费,你可以教我我的工作里如何用 Proma 吗

我并不批判这种状态,我想我自己很多时候也是这种状态,但这种状态是如何来的呢?可能是我们本身的爱好或者兴趣在逐渐流式,可能是我们接受了太久的教育,在职场呆了太长的时间,导致我们逐渐逐渐从爱好兴趣驱动转变成了基于恐惧的预期受益驱动。也就是我经常跟大家说的:不要现有结论再有体验,而是现有体验再有结论。

而这种驱动方式本身非常不利于这一路的 AI 发展,原因很简单,因为 Agent 本身就是在提高工作效率和产出的,而能实现这种效率和产出提升的人,在最初的阶段很难是主观能动性很低的人。

如果我们以打字对比的话,过去所有人都会经历一轮学习打字的过程,原因是接下来所有的工作都需要用到这份技能;而 Agent 的核心是个人生产力的极速提升,生产工具和生产关系都改变了,可能不需要人人都学习了,因为先掌握的人会超额完成这些工作。

但这些并不意味着我们的工作会替代,我们会进入到新的生产关系和生产工具的待定状态。但用好 Agent 则可以在这种关系还没完成切换时继续获得到上一轮分配的优势。

为什么要基于工作区来用 Proma Agent?

image-20260308163611105

Proma Agent 在左侧顶部的区域有个工作区目录和切换的区域,这个区域可以滚动,你可以创建很多工作区。工作区这个概念对于国内的很多用户来说可能是比较陌生的。工作区的假设是我们可能都有很多类型的工作,比如我日常处理 Proma 的 Github,处理我的 Gmail ,这是两类工作。而你又了解了上述的 Skills 和 MCP,不同的工作类型可能需要不同的技能组合(Skills)以及不同的外部资源(MCP),那么区分不同的工作区在 Agent 处理上就会更高效,并且节省 Tokens,不需要担心一个工作区的配置会影响全局。

你可以在这个部分创建或者删除工作区,不同的工作区有不同的假设。

每个工作区可以有很多的会话,每个会话是在处理一件或者几件具体的事或者具体的流程,常开新的对话也可以减少 tokens 的消耗。

Proma Agent 是基于文件系统工作的

image-20260308164800297

Proma Agent 是基于文件系统工作的,因为这样可以提供更完善的上下文,你可以给 Proma Agent 很多参考内容,也可以让 Proma Agent 分析很多内容,尤其是产出型工作,可以让 Proma Agent 将结果输出到本地。

image-20260308165146243

image-20260308165944256

Proma Agent 也内置 PPTX 的 Skills,使用前可以打开方便生成对应的 PPT。

0aea50dbe47d28baed1129f8963041f5

当文件变得更多,并希望 Proma Agent 能明确知道哪个文件时,此时可以采用 @ 的方式来选择对应的文件,提供更精确的上下文。image-20260308170141782

Agent Teams 是如何使用的?

Proma 也支持使用 Agent Teams 功能,Agent Teams 是指会同时创建多个 Agent 组成一个团队,每个 Agent 会为完成目标而分配对应的工作,相互协作,最后由主 Agent 来输出报告结果。

Agent Teams 首先可以自动触发,当你描述复杂任务时或者提到希望采用 Agent Teams 来运行时,都会触发;其次是 Agent Teams 可以自动创建 Agent 并给他们分配工作,你也可以手动要求创建多少个 Agent 并给每个 Agent 指定工作范围。

Agent Teams 非常适合做极其深度的研究工作,或者并行处理大项目的探索等工作

image-20260308170608403

你可以在右侧看到 Team 侧边栏,了解到 Agent Team 的运行情况,以及 Agent 间相互的通信信息。Proma 接下来还会继续迭代这个部分的设计。

飞书-远程使用 Proma Agent

image-20260308171044380

现在 Proma Agent 也支持通过飞书远程访问,只要你的电脑没有进入到睡眠模式即可。整个的配置过程也很简单,我们的文字教程非常精简,总体耗时也是 3-5 分钟即可完成配置。

点击设置里的飞书选项,然后跟着文字教程一步一步完成配置即可。

image-20260308171158472

为什么要远程使用?

比如我自己经常会有一些研究性的需求,尤其是探索一些 AI Agent 方面的工作,但是我可能总是在走路的时候灵机一动产生的想法。那么这时候我就会用飞书直接指派任务给 Proma Agent ,甚至可以让它完成研究之后将研究内容发回到我的邮箱,这样我不在电脑前也可以获得到必要的信息。

还有一些紧急和高危的场景我也会用到。比如我现在可以用手机远程处理 Proma 的 PR 了,上述提到的整个流程都可以完成;Proma 生产环境的一些紧急的 Bug,也可以让 Proma Agent 直接修复并推送更新等。

我所看到的更确定加速的世界

至此,Proma 的教程就结束了,Proma 还在飞快的进化当中,这份教程也会随着迭代。

我到今天,突然有种前所未有的确定的感觉,不是未来一周我会做什么,而是我大概知道我预期到的 AI 的三个月后的世界会怎么样,会有多快。只是这种世界到底 Proma 是否是绝对的参与者或者实现者。

我不想传播任何的恐慌,我自己也没有恐慌,我只是经常性的反思我自己的过去的惯性、自大以及懒惰之类的事,我作为开发者本人也在想我应该如何更好的适应这种世界。Proma 的本意和目的并非替代任何人,但替代这件事本身是一定会发生的,只是程度不同,这不是 Agent 本身决定的,是过去的生产力、权力结构和分配机制决定的,Agent 是一个巨大的变量,一种巨大的要素的变化。但我也并不知道这种变化会导向什么结果。

我只是在这个过程当中看到了一些很重要的东西,希望我们都能拥有。

第一件事:做你喜欢做,你开心的事,但这件事不是刷短视频和看小说之类的,是其他的事,这些东西带来的精神是无比宝贵的。我记得我好多年前瞎胡说,未来可能不需要人有技能,你陪人在城市里瞎溜达半个小时可能也会很值钱,这是人的部分。

第二件事:这世界开始变得无比的平,但资源本身还是有一定的门槛,但从未如此之平。大胆点、主动点、不要被过去的“一看 xx 就不行”的想法给限制住,新的基础设施(Agent)回来带新的产品和可能,Proma 就是这种基础设施和不被限制的产物。

第三件事:保持简单和健康,即便你不想参与 AI 的世界,那么也要保护好我们的大脑,摧毁大脑的最快的方式就是刷短视频和滥用 AI,注意力也将是评判健康与否的重要标准。

最后,感谢你的阅读,感谢你关注 Proma,如果你有任何想法,欢迎跟我聊(微信:geekthings),也欢迎为 Proma 提供 PR。

Proma 开源地址:https://github.com/ErlichLiu/Proma.git