Reddit AI Agent 报告 - 2026-04-11¶
1. 人们在讨论什么¶
1.1 AI 自动化 agency 经济与定价 (🡕)¶
r/AI_Agents 和 r/AiAutomations 的主导讨论围绕如何给 AI 自动化服务定价、销售并持续经营。多位独立实践者收敛到同一个结论:按小时计费是陷阱,基于 outcome 的定价会吸引更好的客户。
u/Warm-Reaction-456 以 $65/hr 收费 9 个月后发现,便宜客户消耗了 80% 带宽,而 fixed-fee 客户带来更好的工作。一个客户甚至明确要求他停止使用 Cursor,“因为它让你更快,所以我拿到的东西更少”。转向 fixed-fee packages(最低 $2,500,生产构建 $10k,retainer $3k)后,3 个客户 ghost,但留下的 2 个客户支付金额超过失去的 9 个客户总和(帖子)。
u/stevekotev 独立得出同一框架:量化客户问题的成本,再把方案定价为该价值的 20-30%。一次性构建落在 $1,500-5,000,持续管理为 $500-2,000/月。“$500 客户会微观管理你并质疑一切。$3,000 客户信任你,让你做自己的工作”(帖子)。
u/Expert-Sink2302 介绍了一位 6 个月清掉 $20K 的 agency owner。转折点是从“我给你做一个 lead follow-up system,$3,000”转成“我保证没有 lead 会变冷,每月 $800”。经常性收入在 6 周内从 $0 到 $4,200/月。帖子还提出了“影子跟班观察”这一概念——花半天观察客户如何工作,而不是做 discovery calls——并把采用本身当作一个可交付成果,而非事后补充(帖子)。
u/Admirable-Station223 发布了现实检查:第 1-2 个月通常没有收入,第一个客户大约在第 3 个月出现,金额 $1,000-2,000,真正收入从第 4-6 个月开始。几位评论者持怀疑态度。u/Particular-Sea2005 问“到底什么东西是真的卖得出去”,并指出多数 offering“看起来像没什么软件创建经验的人做的新手 MVP”(帖子)。
讨论要点: u/Admirable-Station223 与怀疑者之间的讨论揭示了一种张力:一边是“钱在无聊的单步 AI 任务里”,另一边是评论者怀疑当前任何 AI 智能体生意是否长期可持续。u/ContextLengthMatters 认为行业正处在“大家都在探索的过渡期”,“没人知道可靠的长期现金流究竟会从哪里来”。
与前日对比: Agency 定价在 2026-04-10 也很活跃,同一篇 u/Warm-Reaction-456 帖子出现,并伴随围绕自动化 agency 增长的类似讨论。趋势明显在增强。
1.2 智能体记忆与持久状态 (🡕)¶
记忆管理主导了技术讨论,至少 5 篇帖子探索了给智能体提供持久 recall 的不同方式。
u/Cold-Cranberry4280 在运行 always-on agent 10 个月后,分享了一份详细技术拆解。核心洞察是把记忆分成两条独立检索路径:对话历史按时间顺序加载,以保持 thread continuity;抽取出的知识则按语义相关性检索,不管它何时被记录。仅这个拆分就是他们做出的“最大质量跃迁”。其他优化包括:用轻量 pre-filter 把记忆处理的 LLM calls 降低 80%,topic-based retrieval 每次调用低于 $0.0001,以及 decay system 区分永久事实(电话号码、纪念日)与短期数据(旧航班号)。对于矛盾(“我住在 New York”之后又说“我搬到 London”),旧记忆会被标记为 superseded,而不是删除,从而保留 audit trails(帖子)。
u/GabrielMartinMoran 发布了 Mind,这是一个跨 Claude Code、OpenCode、Cursor、Gemini CLI、Windsurf、Codex、VSCode 和 Antigravity 的持久记忆系统与 session manager。它提供用于复杂查询的结构化 MCP tools、用于状态快照的 checkpointing system,以及用来查看智能体记住了什么的 visual neural map(帖子)。
在“What are you guys building?”讨论串中,u/ultrathink-art 描述了一个两层存储系统——最近上下文放 hot markdown files,长期 recall 放 SQLite 和语义 embedding——并强调“去重这一步比存储层本身更重要”,因为没有 cosine similarity filtering 时,“智能体会存下几乎一模一样的条目,检索质量就会崩掉”(帖子)。
讨论要点: 多位构建者独立收敛到同一种架构:快速短期层 + 语义长期存储,并配合激进去重。这种收敛说明它正从实验模式变成既定模式。
1.3 智能体安全与信任边界 (🡒)¶
出现了 3 类不同安全担忧:工具调用 payload inspection、managed-agent 不透明,以及 MCP 访问控制。
u/Healthy_Owl_7132 演示了一个 CrewAI agent 读取 Jira ticket 后,将完整客户记录——SSN、信用卡、email——发到 Slack。智能体完美遵循了指令;它只是不知道什么是敏感信息。后续对抗测试显示,智能体可以从 Drive 窃取 credentials、提升 AWS IAM 权限,并外传到外部域名,而 agent 与 API 之间没有任何检查。修复方案是 inline gateway,扫描每个 payload 中的 PII 和 secrets,并能剥离敏感数据后转发干净版本,而不是硬阻断(帖子)。
u/WhichCardiologist800 提出了 Anthropic managed agents 的“猫看牛奶”问题:模型和安全层被打包在同一个黑盒里,运行中的工具调用没有独立验证。帖子提到 NVIDIA OpenShell 和 Node9 可能成为独立安全层(帖子)。
u/ismaelkaissy 构建了 MCP Harbour,这是一个开源代理,位于智能体和 MCP server 之间,用来执行按 agent 划分的安全策略。它支持 glob patterns 和 regex,过滤每个 agent 可使用的工具和参数值。该项目是 GPARS spec 的实现(帖子)。
讨论要点: u/prowesolution123 指出,“所有人都盯着 prompt injection,但现在真正的风险半径其实在工具边界上。”u/Deep_Ad1959 类比 E2E testing:“你不会在没跑过浏览器、没对输出做断言的情况下就发布一个 web app。”
1.4 Demo 到生产的缺口 (🡒)¶
几篇帖子探讨了为什么 demo 中可用的智能体到生产中会失败,实践者分享了具体失败模式。
u/EveningWhile6688 询问智能体在生产中到底坏在哪里,并收到详细回应。u/Icy_Host_1975 把根因归为“状态和控制平面会发生漂移:auth 会过期、工具只返回部分成功、后台 job 会活得比用户上下文更久,而智能体会丢失对已发生事情的跟踪。Demo 会掩盖这些问题,因为它们运行在短而干净的循环里。”u/RegularOk1820 估计“意料之外的用户行为大概就占了 80%”(帖子)。
u/Admirable-Station223 认为“现在构建的 90% AI agents 永远赚不到钱”,因为构建者追逐炫目的多智能体 demo,而钱在“无聊的单步 AI 任务”里,例如读取公司网站写一句个性化文本、把邮件回复分桶、从招聘帖中抽取 intent signals。“赚钱的 agents 是为某一类企业解决一个具体问题的 agents”(帖子)。
与前日对比: 2026-04-10,u/LumaCoree 发布“我们 4 个月内从 3 个智能体到 40 个,没人知道一半在做什么”(得分 91),显示 agent sprawl 正成为增长中的担忧。Demo-to-production gap 主题已连续多天稳定出现。
1.5 智能体编排与智能体间通信 (🡕)¶
多位构建者分享了协调多个智能体的新方法。
u/Negative-Border1439 构建了 Agent Mailer Protocol(AMP),让智能体借助 email-style async messaging 通信:inbox、send、reply、forward、thread。该项目用 Python/FastAPI 构建,开发支持 SQLite,生产支持 PostgreSQL。他们报告 17 个智能体跨 5 个团队运行,每天处理数千条消息。PM agent 接收任务、拆解任务并委派给 coder,coder 发给 reviewer,reviewer 转给 DevOps 部署——全程自主(帖子)。
u/i_serghei 发布了 Sortie,一个 Go 单文件 binary,可以监控 issue tracker、启动 coding agent session、把 CI failure 反馈回 agent loop,并把一切持久化到 SQLite。它是 vendor-agnostic 的——可把 Claude 换成 Copilot,也可把 GitHub Issues 换成 Jira——并以 Apache 2.0 开源(帖子)。
u/Unique_Champion4327 发布 TigrimOS v1.2.1,这是一个自托管 workspace,能分析任务并自动生成 agent topology,内置可复用 swarm templates,用于 hierarchical delegation、peer coordination 和 pipeline workflows。此次发布新增了 YAML-based agent configuration,以及带 reasoning traces 的结构化 per-agent logs(帖子)。
1.6 MCP server 管理与 token 效率 (🡒)¶
u/geekeek123 发现,把 MCP server 打包进 skill 目录,而不是全局加载,可以把 token overhead 从每条消息约 44,000 token schema 降到约 780。SKILL.md frontmatter spec(agentskills.io)可在 Claude Code、Cursor、VS Code、Goose 和 Codex 中使用。在一次安全审查测试中,skill-scoped 方法抓到了与全局加载 MCP 相同的 6 个问题,但每次运行 token 成本低 144x(帖子)。
这与 MCP Harbour 项目(第 1.3 节)形成呼应,都是向更受控、更高效的 MCP server 使用方式移动。
1.7 软件产品的未来 (🡒)¶
u/gravitonexplore 连发两帖,探讨当 AI 能为每个用户构建定制自动化后,传统软件产品是否仍有防御性。核心场景是:一个智能体观察你一周如何工作,然后围绕你的模式构建自定义工作流,并按 usage credits 收费。如果自动化变成定制、按需生成,“现有产品还剩什么防御性?”讨论指出剩余护城河包括分发、信任、集成、专有数据、合规和 lock-in(帖子)。
2. 令人困扰的问题¶
销售自动化与交付自动化之间的技能缺口¶
严重程度:High。u/Novel-Marionberry661 在面试中声称熟悉 Claude Code 和 n8n,获得了一个强调 AI automation 的 executive assistant 岗位,随后意识到这些说法与实际交付能力之间的差距。“我这个笨蛋还以为,那只是更高效地使用 ChatGPT 而已。” 该帖有 66 条评论(数据集中最高),社区给了很多实际建议,但这个案例说明了广泛缺口。类似地,u/ahmedhashimpk 寻求一份“成为 expert AI agent developer 的完整 roadmap”,因为“youtube 视频成千上万,我有时会被搞糊涂,不知道到底该跟哪一个”(帖子)。
Demo 质量的智能体在生产中失败¶
严重程度:High。实践者持续报告,受控 eval 中可用的智能体,一旦真实用户参与就会崩。u/Icy_Host_1975 点出根因:“状态和控制平面会发生漂移:auth 会过期,工具只会返回部分成功,后台 job 会活得比用户上下文更久。” u/AurumDaemonHD 说得更直接:“如果你的 agent 没有自我感知、不会随时间进化、不会在 hitiled data 上 finetune/lora……你就需要一个工程团队永远 babysit 这个 app。”权宜方案是人工监控和持续迭代,这削弱了自动化承诺。
已部署自动化的静默失败¶
严重程度:Medium。u/Expert-Sink2302 描述了一个 lead routing system,因为 CRM 数据变脏,把 leads 发给错误的人,持续 19 天才被发现。“它就那样跑了 19 天才有人抓到。那时客户已经损失了一大块机会。”修复方式是给输出异常加基础 Slack/email 告警,并为每个 workflow 指定 owner。
智能体框架设置复杂度¶
严重程度:Medium。u/Hereemideem1a 发现,“大多数 demo 看起来都很顺,但真到实际使用时,我花在处理 config、API 和修工作流上的时间,比真正拿到结果还多。”这个 41 条评论的讨论串显示出对智能体框架营销与现实可用性之间差距的广泛挫败。权宜方案是退回更简单工具:u/HumzaDeKhan 建议直接从 Claude 或 Codex 开始,而不是 OpenClaw 或 Hermes。
模型即便有搜索工具也从记忆回答¶
严重程度:Low。u/JayPatel24_ 指出一个细微失败模式:模型拥有搜索工具,但面对隐含需要新鲜信息的问题时仍从记忆回答。“你不会看到崩溃。不会看到工具错误。你只会得到一个自信给出的过期答案。”建议修复方式是加入 supervised trigger examples,教模型什么时候该检索以及为什么。
3. 人们期望的功能¶
结构化 AI 智能体学习路径¶
多人对碎片化教育资源表达挫败。u/ahmedhashimpk 明确说想要“真人经验”,而不是 AI 生成 roadmap。u/Novel-Marionberry661 需要在 90 天期限下学会 n8n 和 Claude Code。u/DetectiveMindless652 试图用一个 24 模块指南填补这一缺口,覆盖从 agent 基础到生产部署。需求实际而非愿景型——人们已经拿到 agent work 岗位,需要交付。机会:direct。
可靠的智能体评估框架¶
u/sie7kf 询问是否“还有别人也在给 AI 智能体搭 evals 时卡住过吗”,u/sipsgn 则描述自己陷在“Excel 地狱”里,试图让领域专家评估智能体输出。缺口不在评估理论,而在非技术领域专家真正能用的实用工具。机会:direct。
独立智能体安全层¶
3 篇帖子共同指向一个需求:安全层要独立于智能体和模型提供商。u/Healthy_Owl_7132 构建了 payload inspection inline gateway,u/WhichCardiologist800 呼吁独立 tool-call verification,u/ismaelkaissy 构建了用于按 agent 策略执行的 MCP Harbour。需求紧迫——一位实践者演示了在没有 guardrails 的情况下完整外传 credentials。早期工具已经部分覆盖,但还没有广泛采用。机会:direct。
面向非专家的简单智能体框架¶
关于 OpenClaw 替代品的 41 条评论串显示,对优先 execution reliability 而非 configuration flexibility 的智能体框架存在强需求。u/Hereemideem1a 想要更少设置、更多结果;评论者推荐 Ductor、直接使用 Claude,以及 ai-flow.eu 等更轻替代品。机会:competitive。
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| n8n | Workflow automation | (+) | 可视化工作流构建器,适合 non-coders,连接多数 API | 有学习曲线,需要手工搭 node |
| Claude Code | Coding agent | (+) | 强大的编码辅助,基于 OAuth,推理强 | 生产使用需要编排层 |
| OpenClaw | Agent framework | (+/-) | 灵活,适合复杂 agents | 设置重,真实使用中 config 和 API 多于结果 |
| Hermes | Agent framework | (+) | 适合 coding、personal assistance、marketing tasks | 讨论少于 OpenClaw,社区报告较少 |
| Ductor | Agent CLI wrapper | (+) | 通过 Telegram/Matrix 包装 Claude Code/Codex/Gemini CLI,使用官方 CLIs | 新,采用数据有限 |
| CrewAI | Agent framework | (+/-) | 多智能体编排 | 无内置 payload inspection,agents 可泄露敏感数据 |
| LangGraph | Agent framework | (+/-) | 生产级,适合复杂 flows | 对简单 use case 比纯 Python 更重 |
| Pydantic | Validation/framework | (+) | Fast API projects,类型安全 | 不如 LangGraph agent-specific |
| Gamma API | Presentation generation | (+) | 可与 Zapier 集成,自动生成 pitch decks | slideshow generation 质量不稳定 |
| Pangea | Security/vaulting | (+/-) | Vault 并 scrub 敏感数据 | 有时 scrub 太激进,破坏输出 |
| MCP Harbour | MCP security proxy | (+) | 按 agent 安全策略,glob/regex filtering | v0.1,早期 |
| OpenUI Lang | UI generation language | (+) | 比 JSON token-efficient 67%,streaming-first | 新,采用有限 |
总体技术格局呈现清晰分裂。智能体逻辑方面,实践者在完整框架(OpenClaw、Hermes、CrewAI、LangGraph)与更简单方法(直接用 Claude/Codex、用 n8n 做 no-code)之间选择。迁移模式也很明显:几位实践者从复杂框架转向更简单、单用途工具。安全工具层(Pangea、MCP Harbour、inline gateways)仍处胚胎期,但在真实生产事故推动下正在增长。
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| Agent Mailer Protocol (AMP) | u/Negative-Border1439 | AI agents 之间的 email-style async messaging | 复杂 DAG/RPC agent communication | Python, FastAPI, PostgreSQL/SQLite | Shipped | GitHub |
| Sortie | u/i_serghei | 监控 issue tracker、管理 coding agent sessions、把 CI failure 反馈回去的 orchestrator | 手工 babysit terminal agent sessions | Go, SQLite | Beta | brew install sortie-ai/tap/sortie |
| TigrimOS | u/Unique_Champion4327 | 带自动生成 agent topologies 的自托管 AI workspace | 多智能体编排复杂,调试不透明 | Python, YAML config, sandboxed Ubuntu | Beta | v1.2.1 |
| Mind | u/GabrielMartinMoran | 面向 agents 的持久记忆系统和 session manager | agent 跨 session、跨平台失忆 | MCP, multi-IDE support | Beta | Link in comments |
| MCP Harbour | u/ismaelkaissy | agent 与 MCP server 之间的安全代理 | 每个 agent 的 MCP server access 不受控 | GPARS spec implementation | Alpha | Link in comments |
| Engram | u/Mobile_Discount6363 | agent tool connections 的语义互操作层 | 脆弱集成、schema drift、协议碎片化 | Python, OWL + ML, MCP/CLI/A2A/ACP | Beta | GitHub |
| OpenUI Lang | u/Mr_BETADINE | LLM UI generation 的 line-oriented language | UI generation 中 JSON 冗长和 streaming latency | Custom parser | Shipped | Video demo |
| Tool-call security gateway | u/Healthy_Owl_7132 | 扫描 agent payload 中 PII/secrets/threats 的 inline gateway | agents 通过 API calls 泄露敏感数据 | CrewAI, inline proxy | Alpha | Demo available |
| Ductor | u/BadRegEx (mentioned) | 为 Telegram/Matrix 包装 Claude Code/Codex/Gemini CLIs | 远程访问 coding agents | Python 3.11+ | Shipped | GitHub |
| Clawhub | u/ananandreas | agents 共享经验和 learnings 的平台 | agents 重复解决已经解决过的问题 | Web platform | Shipped | clawhub.ai |
Agent Mailer Protocol 因概念简单而突出:与其再构建一个 DAG engine 或 message queue,它把 agent communication 映射为熟悉的 email metaphor。团队报告称它已在生产中运行,覆盖 5 个团队的 17 个 agents。问题在于 email metaphor 是否能扩展到小团队之外,或者 enterprise scale 仍需要结构化 workflow engine。
Sortie 填补了 coding agents 开发者的具体缺口:它自动化 issue assignment、agent session management 和 CI feedback loop,而且不要求特定 LLM vendor 或 issue tracker。单 Go binary 方式让部署保持简单。
反复出现的模式是构建者在解决自己的痛点。u/Cold-Cranberry4280 在折腾数周后构建 split-retrieval memory system;u/Healthy_Owl_7132 在看到智能体泄露 PII 后构建 payload scanner。获得牵引力的项目解决的是构建者亲自在生产中遇到的问题,而不是读完 agent 文章后想象出来的问题。
6. 新动态与亮点¶
George Hotz vs. Anthropic 零日主张¶
最高分帖子(得分 1080,144 条评论)是一张 George Hotz 批评 Anthropic 关于 AI agents 发现零日漏洞说法的截图。最高赞评论来自 u/Hsoj707(得分 92),称其为“这就是一场制造恐惧的营销,而且看起来正按预期奏效”。u/stealstea 反驳说,零日发现有“非常有利可图的合法市场”和“同样有利可图的非法市场”,因此无论 vendor 如何 framing,这项活动都确实存在激励。u/batman_not_robin 观察到“这个 thread 中每个回复都是同几个想法,只是措辞不同。只有我是人类在读吗?”——这本身也是 agent-focused subreddit 讨论质量的信号(帖子)。
Anthropic Managed Agents 引发怀疑¶
Anthropic 的 managed agents 公告在 2026-04-10 产生了兴奋(得分 22),但到 2026-04-11,讨论转向安全担忧。u/WhichCardiologist800 提出了“猫看牛奶”问题,u/Rough-Leather-6820 说“Lois 有顾虑”。社区并不反对 managed agents,但正在尖锐追问独立验证和安全审计能力。
SKILL.md spec 获得跨 IDE 牵引力¶
u/geekeek123 报告称,SKILL.md frontmatter spec(agentskills.io)现在可跨 Claude Code、Cursor、VS Code、Goose 和 Codex 使用。实际结果——把 MCP server 限定在 skill 调用范围内,token 成本降低 144x——说明它可能成为 agent capability packaging 的事实标准。
7. 机会在哪里¶
[+++] 智能体安全中间件——3 篇独立帖子都把 tool-call layer 识别为主要攻击面,甚至高于 prompt injection。u/Healthy_Owl_7132 演示了无 guardrails 情况下完整外传 credentials。u/ismaelkaissy 构建了 MCP Harbour,u/WhichCardiologist800 要求 managed agents 的独立验证。需求强,现有方案处于 alpha,什么都不做的后果严重(PII leaks、privilege escalation)。任何能发布生产级 agent tool call inline security layer 的团队,都在解决实践者已经用 ad hoc 方案处理的需求。
[+++] 结构化 AI 自动化教育——有人被雇去做还交付不了的自动化工作,并引发 66 条评论;再加上 roadmap 请求和对可信资源的困惑,说明有大量未被服务的受众。u/DetectiveMindless652 组装了一个 24 模块指南,但还没有权威、持续维护的 curriculum。需求实际且紧急——人们正在基于自己尚未拥有的 AI 自动化技能做职业转向。
[++] Agent memory as a service——至少 5 篇帖子讨论了记忆持久化,构建者独立收敛到相似架构(dual-path retrieval、semantic dedup、topic-based filtering)。Mind 支持 8 个 IDE,但空间仍碎片化。一个标准化、跨平台 memory layer,能处理 dedup、decay 和 contradiction resolution,会在已经自建这类东西的构建者中找到即时用户。
[++] 面向非专家的简化智能体部署——41 条评论的 OpenClaw 替代品讨论和对框架复杂度的挫败表明:愿意用可配置性换可靠性的工具有机会。Ductor 的方法(包装官方 CLI,不代理 API)是一种模型。受众是想要结果的实践者,而不是享受配置基础设施的工程师。
[+] 面向领域专家的智能体评估工具——多位实践者提到 evals 难做,其中一位描述了领域专家评估的“Excel 地狱”。缺口在 ML engineer-grade eval framework 与业务领域专家真正能用的东西之间。信号早期,但反复出现。
[+] 已部署自动化的静默失败检测——u/Expert-Sink2302 描述了一个持续 19 天、让客户损失重大机会的静默失败。修复思路(基础告警 + 指定 owner)概念上简单,但还未标准化。一个专为自动化工作流设计、检查输出质量而不只是 uptime 的监控层,将填补每个 agency owner 最终都会遇到的缺口。
8. 要点总结¶
-
基于 outcome 的定价正在成为 AI 自动化实践者共识。 多位独立构建者报告称,从按小时计费转向 fixed-fee packages 和 retainers 后,收入和客户质量都提高了。一位客户明确要求自动化构建者停止使用 Cursor,因为更快交付意味着更少可计费小时。(来源)
-
智能体记忆架构正在收敛到 dual-path 模式。 至少 3 位独立构建者描述了把 conversation history(按时间)和 extracted knowledge(语义检索)拆开,并把 aggressive deduplication 作为关键质量因素。这种来自独立实践者的收敛说明该模式已经过实战检验,而不是纯理论。(来源)
-
tool-call layer,而不是 prompt injection,是生产智能体暴露最严重的位置。 一个 CrewAI agent 通过正确遵循指令,把 Jira 中的 SSN 和信用卡数据泄露到 Slack。另一个对抗测试显示,在 agent 与 API 之间没有任何东西时,可以完整外传 credentials。3 个独立项目(inline gateway、MCP Harbour、PIC-standard)正在分别构建解决方案。(来源)
-
无聊自动化论点正在获得支持,但仍面临怀疑。 报告真实收入的构建者做的是单步任务(email sorting、website reading、lead signals),不是多智能体编排。但评论者质疑,在当前过渡期中,任何现有 AI agent business model 是否可持续。(来源)
-
agent-to-agent communication 正从框架转向协议。 AMP(面向 agents 的 email-style messaging)和 Engram(语义互操作层)代表了一种转向:不再把编排埋进应用代码,而是走向独立通信标准。AMP 报告已有 5 个团队的 17 个 agents 在生产中运行。(来源)
-
把 MCP server 限定在 skill 范围,而不是全局加载,可让 token overhead 降低 100x 以上。 一位实践者测得,每条消息从约 44,000 token 降至约 780,同时安全检测结果完全一致。SKILL.md spec 可在 5 个主流 coding tools 中使用。(来源)
-
“影子跟班观察”比 discovery calls 更适合自动化 scoping。 一位 6 个月清掉 $20K 的 agency owner 把成功归因于花半天观察客户工作,而不是跑标准 intake。咖啡店案例——技术上正确的自动化因要求电话和纸笔为主的业务改用新 dashboard 而被放弃——说明观察胜过提问。(来源)