跳转至

Reddit AI Agent — 2026-04-11

1. 人们在讨论什么

1.1 AI自动化服务的商业模式与定价(🡕)

r/AI_Agents和r/AiAutomations上最主要的讨论围绕AI自动化服务的定价、销售和可持续经营展开。多位独立从业者得出了相同的结论:按小时计费是一个陷阱,基于成果的定价方式能吸引更优质的客户。

u/Warm-Reaction-456以每小时65美元的价格工作了九个月,才意识到廉价客户消耗了80%的精力,而固定费用客户反而产出更好的成果。有一位客户甚至要求停止使用Cursor,"因为它让你更快了,这样我花同样的钱得到的服务更少了。"转为固定费用套餐(最低2,500美元,生产级构建10,000美元,月度保留金3,000美元)后,三位客户流失了,但剩余两位客户的付费总额超过了流失的九位(Why I stopped charging hourly for automation work and started losing the cheap clients on purpose)。

u/stevekotev独立得出了相同的定价框架:量化客户问题的成本,然后将解决方案定价为该价值的20-30%。一次性构建报价在1,500-5,000美元之间,持续管理服务每月500-2,000美元。"500美元的客户会事无巨细地管你、质疑一切。3,000美元的客户信任你,让你放手做"(how to price AI automation services without underselling yourself or scaring clients away)。

u/Expert-Sink2302介绍了一位在六个月内收入超过20,000美元的自动化服务商。转折点在于从"我帮你搭建一个线索跟进系统,收费3,000美元"转变为"我确保你不会丢失任何一条线索,每月收费800美元。"经常性收入在六周内从0增长到每月4,200美元。帖子还引入了"影子观察"的概念——花半天时间观察客户的实际工作流程,而非通过需求调查电话了解情况——并将用户采纳视为一项独立的交付成果,而非事后补充(Chatting with an AI agency owner who has already cleared $20K+ in 6 months)。

u/Admirable-Station223发布了一份现实评估:前1-2个月通常零收入,第一个客户大约在第3个月出现,报价在1,000-2,000美元,真正的收入从第4-6个月开始。不少评论者持怀疑态度。u/Particular-Sea2005问"什么东西真的在卖",并指出大多数产品"看起来像是缺乏软件开发经验的人做的初级MVP"(making money with AI is real but it's nothing like what the youtube videos show you)。

讨论要点: u/Admirable-Station223与质疑者之间的讨论揭示了一种张力——一方认为"钱在无聊的单步AI任务里",另一方则怀疑当前任何AI智能体业务的可持续性。u/ContextLengthMatters认为行业正处于"一个过渡期,大家都在摸索","没人知道稳定的长期现金流从哪里来。"

与前日对比: 2026-04-10也有大量关于服务定价的讨论,同一篇u/Warm-Reaction-456的帖子已经出现,围绕自动化服务增长的类似话题也在进行。这一趋势明显在持续升温。

1.2 智能体记忆与持久状态(🡕)

记忆管理主导了技术讨论,至少有五篇帖子探索了赋予智能体持久记忆的不同方案。

u/Cold-Cranberry4280在运行一个常驻智能体十个月后分享了详细的技术分析。核心发现:将记忆分为两条独立的检索路径——对话历史按时间顺序加载以维持上下文连贯性,提取的知识则按语义相关性检索,不受记录时间影响。仅这一拆分就带来了"质量上最大的飞跃"。其他优化包括:一个轻量级预过滤器将记忆处理的LLM调用减少了80%;基于主题的检索成本低于每次0.0001美元;以及一个衰减系统,能区分永久性事实(电话号码、纪念日)和临时性数据(过期航班号)。对于矛盾信息("我住在纽约"后来变成"我搬到了伦敦"),旧记忆被标记为已取代而非删除,保留审计追踪(How I split agent memory into two separate retrieval paths)。

u/GabrielMartinMoran发布了Mind,一个跨Claude Code、OpenCode、Cursor、Gemini CLI、Windsurf、Codex、VSCode和Antigravity的持久记忆系统和会话管理器。它提供结构化MCP工具用于复杂查询、检查点系统用于状态快照,以及可视化神经图谱用于检查智能体记忆内容(Giving AI Agents long-term persistence across multiple platforms: Introducing Mind)。

在"你们在做什么?"讨论串中,u/ultrathink-art描述了一个双层存储系统——热数据使用markdown文件存放近期上下文,SQLite配合语义嵌入存放长期记忆——并强调"去重步骤比存储本身更重要",因为如果没有余弦相似度过滤,"智能体会存储几乎相同的条目,检索质量会急剧下降"(What are you guys building?)。

讨论要点: 多位构建者独立收敛到相同的架构:快速短期层加语义长期存储,辅以积极的去重策略。这种趋同表明该模式正在从实验阶段转向成熟的工程实践。

1.3 智能体安全与信任边界(🡒)

三个不同的安全关切浮出水面:工具调用载荷检查、托管智能体的不透明性,以及MCP访问控制。

u/Healthy_Owl_7132演示了一个CrewAI智能体在读取Jira工单时,将完整的客户记录——社保号、信用卡号、电子邮件——发布到了Slack。智能体严格遵循了指令,只是不知道哪些内容是敏感的。后续的对抗性测试表明,智能体可以从Drive窃取凭证、提升AWS IAM权限,并将数据外泄到外部域名,而智能体与API之间没有任何检查机制。解决方案是部署一个内联网关,扫描每个载荷中的PII和密钥信息,能够剥离敏感数据并转发清洁版本,而非直接阻断(Your agents have write access to production APIs. What's checking the payloads?)。

u/WhichCardiologist800提出了他所说的Anthropic托管智能体的"猫守牛奶"问题:模型和安全层捆绑在同一个黑箱中,无法独立验证运行中的工具调用。帖子引用了NVIDIA OpenShell和Node9作为潜在的独立安全层(Are we really okay with "Black Box" security for Managed Agents - Anthropic?)。

u/ismaelkaissy构建了MCP Harbour,一个开源代理,位于智能体和MCP服务器之间,用于实施每个智能体的安全策略。支持glob模式和正则表达式来过滤每个智能体可以使用的工具和参数值。该项目基于GPARS规范实现(MCP Harbour -- an open-source port authority for your MCP servers)。

讨论要点: u/prowesolution123指出,"大家都在关注提示词注入,但工具边界才是目前真正的爆炸半径所在。"u/Deep_Ad1959类比端到端测试:"你不会在不跑浏览器测试、不验证输出的情况下发布一个Web应用。"

1.4 从演示到生产的鸿沟(🡒)

多篇帖子探讨了为什么智能体在演示中表现良好、在生产环境中却频频失败,从业者分享了具体的故障模式。

u/EveningWhile6688询问智能体在生产中到底在哪里出问题,收到了详细的回复。u/Icy_Host_1975指出根本原因是"状态和控制平面漂移:认证过期、工具返回部分成功、后台任务超出用户上下文的生命周期,智能体失去了对已发生事件的追踪。演示之所以掩盖这些问题,是因为它们运行在短而干净的循环中。"u/RegularOk1820估计"意外的用户行为占了大概80%"(Where are your agents actually breaking in production?)。

u/Admirable-Station223认为"现在正在构建的AI智能体中90%永远不会赚到一分钱",因为开发者追逐炫酷的多智能体演示,而真正赚钱的是"无聊的单步AI任务",比如读取公司网站、分类邮件回复、从招聘信息中提取意图信号。"赚钱的智能体是那些为一种特定类型的企业解决一个特定问题的智能体"(90% of AI agents being built right now will never make a dollar)。

与前日对比: 2026-04-10,u/LumaCoree发帖称"我们从3个智能体增加到40个,四个月内。现在没人知道其中一半在干什么"(得分91),表明智能体泛滥正成为日益严重的问题。从演示到生产的鸿沟这一主题已持续多日。

1.5 智能体编排与智能体间通信(🡕)

多位构建者分享了协调多个智能体的新方法。

u/Negative-Border1439构建了Agent Mailer Protocol(AMP),让智能体通过类似电子邮件的异步消息进行通信:收件箱、发送、回复、转发、会话线程。使用Python/FastAPI构建,支持SQLite用于开发环境和PostgreSQL用于生产环境。据报告,17个智能体分布在5个团队中,每天处理数千条消息。PM智能体接收任务、拆解任务并分派给编码智能体,编码智能体发送给审查智能体,审查智能体再转发给DevOps进行部署——全程自主运行(We built a mail protocol for AI agents -- and it actually works)。

u/i_serghei发布了Sortie,一个单一的Go二进制文件,能够监控问题追踪器、启动编码智能体会话、将CI失败反馈回智能体循环,并将所有内容持久化到SQLite。它与供应商无关——可以用Copilot替换Claude,用Jira替换GitHub Issues——基于Apache 2.0开源(I'm building an orchestrator for coding agents)。

u/Unique_Champion4327发布了TigrimOS v1.2.1,一个自托管工作空间,能分析任务并自动生成智能体拓扑结构,支持可复用的集群模板,涵盖层级委派、对等协调和流水线工作流。本次发布新增了基于YAML的智能体配置以及带推理追踪的结构化单智能体日志(Built a self-hosted AI workspace with multi-agent orchestration)。

1.6 MCP服务器管理与token效率(🡒)

u/geekeek123发现,将MCP服务器捆绑在skill目录中而非全局加载,可以将token开销从每条消息约44,000个token降低到约780个。SKILL.md前置元数据规范(agentskills.io)适用于Claude Code、Cursor、VS Code、Goose和Codex。在安全审查测试中,skill范围内的方法检测到了与全局加载MCP相同的6个问题,但每次运行的token成本降低了144倍(Is anyone else bundling MCP servers inside skills instead of loading them globally?)。

这与MCP Harbour项目(第1.3节)呼应,共同构成了一个更广泛的趋势:更可控、更高效的MCP服务器使用方式。

1.7 软件产品的未来(🡒)

u/gravitonexplore发了两篇帖子,探讨当AI能够为每个用户创建定制自动化时,传统软件产品是否还具备防御性。核心场景是:一个智能体观察你工作一周,围绕你的行为模式构建定制工作流,按使用量收取积分。如果自动化变成了定制化和按需式的,"现有产品还剩下什么护城河?"讨论中识别出分发渠道、信任、集成生态、专有数据、合规性和迁移成本作为仍然存在的壁垒(what is the moat of software if ai starts building custom products for everyone?)。


2. 令人困扰的问题

技能差距:销售能力与交付能力的脱节

严重程度:高。u/Novel-Marionberry661在面试中声称熟悉Claude Code和n8n后被聘为行政助理(侧重AI自动化),之后才意识到自己声称的能力与实际交付之间的巨大差距。"我这个傻瓜以为那意味着更高效地使用ChatGPT。"这篇帖子收到66条评论(数据集中最高),社区积极提供实际建议,但这个案例揭示了一个普遍存在的差距。同样,u/ahmedhashimpk请求"一份成为AI智能体专家开发者的完整路线图",因为"YouTube上有成千上万的视频,有时候真的不知道该跟哪个"(I got hired to Automate workflows for the business and I don't know what to do)。

演示级智能体在生产环境中失败

严重程度:高。从业者一致反映,在受控评估中运行良好的智能体,一旦面对真实用户就会崩溃。u/Icy_Host_1975指出根本原因:"状态和控制平面漂移:认证过期、工具返回部分成功、后台任务超出用户上下文的生命周期。"u/AurumDaemonHD更加直白:"如果你的智能体没有自我感知能力,不会随时间演进,不对命中的数据进行微调/LoRA……你就需要一整个工程团队来永远看护这个应用。"目前的应对方式是人工监控和持续迭代,这本身就削弱了自动化的价值主张。

部署后的静默故障

严重程度:中。u/Expert-Sink2302描述了一个线索分配系统在CRM数据变乱后,将线索发送给了错误的人,持续了19天才被发现。"就这样运行了19天才有人发现。那时候客户已经损失了大量商机。"修复方案:为输出异常设置Slack或邮件基本告警,并为每个工作流指定一名负责人。

智能体框架的搭建复杂度

严重程度:中。u/Hereemideem1a发现"大多数演示看起来很流畅,但在实际使用中,我发现自己花在配置、API和修复工作流上的时间比实际获得结果的时间还多。"这篇帖子收到41条评论,揭示了智能体框架宣传与真实可用性之间的广泛不满。应对方法是退回到更简单的工具:u/HumzaDeKhan建议直接使用Claude或Codex,而不是OpenClaw或Hermes。

模型在拥有搜索工具时仍凭记忆作答

严重程度:低。u/JayPatel24_发现了一种微妙的失败模式:配备了搜索工具的模型在隐含需要实时信息的查询上仍然凭记忆回答。"你不会看到崩溃,不会看到工具错误,你只会得到一个自信满满的过时答案。"建议的修复方案是使用有监督的触发示例来教会模型何时以及为何需要进行检索。


3. 人们期望的功能

结构化的AI智能体学习路径

多人对碎片化的教育资源表示不满。u/ahmedhashimpk特别指出希望获得"人类的见解"而非AI生成的路线图。u/Novel-Marionberry661需要在90天的截止日期内学会n8n和Claude Code。u/DetectiveMindless652试图用一份涵盖从基础到生产部署的24模块指南来填补这个空白。这种需求是务实的而非理想化的——人们正在因为AI自动化技能而获得工作机会,需要切实交付。机会:直接。

可靠的智能体评估框架

u/sie7kf询问是否"有人也在为AI智能体搭建评估体系而苦恼",u/sipsgn描述了"困在Excel地狱里让领域专家评估智能体输出"的处境。差距不在评估理论上,而在非技术领域专家能实际使用的工具上。机会:直接。

独立的智能体安全层

三篇帖子共同指向了对一个独立于智能体和模型提供商的安全层的需求。u/Healthy_Owl_7132构建了用于载荷检查的内联网关,u/WhichCardiologist800呼吁独立的工具调用验证,u/ismaelkaissy构建了MCP Harbour用于按智能体策略执行。需求紧迫——一位从业者演示了在无安全护栏情况下的完整凭证外泄。这些早期工具部分解决了问题,但尚无广泛采用。机会:直接。

面向非专家的更简单智能体框架

关于OpenClaw替代方案的41条评论帖子表明,市场对优先保证执行可靠性而非配置灵活性的智能体框架有强烈需求。u/Hereemideem1a希望用更少的配置获得结果;评论者推荐了Ductor、直接使用Claude以及ai-flow.eu作为更轻量的替代方案。机会:竞争性。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
n8n 工作流自动化 (+) 可视化工作流构建器,适合非编程人员,可连接大多数API 有学习曲线,需手动搭建节点
Claude Code 编码智能体 (+) 强大的编码辅助,基于OAuth,推理能力强 生产使用需要编排层
OpenClaw 智能体框架 (+/-) 灵活,适合复杂智能体 搭建繁重,实际使用中配置和API的时间多于获得结果的时间
Hermes 智能体框架 (+) 适合编码、个人助理、营销任务 讨论度低于OpenClaw,社区反馈较少
Ductor 智能体CLI封装 (+) 通过Telegram/Matrix封装Claude Code/Codex/Gemini CLI,使用官方CLI 较新,采用数据有限
CrewAI 智能体框架 (+/-) 多智能体编排 无内置载荷检查,智能体可能泄露敏感数据
LangGraph 智能体框架 (+/-) 生产级,适合复杂流程 对简单用例来说比纯Python更重
Pydantic 验证/框架 (+) 快速API项目,类型安全 智能体专用性不如LangGraph
Gamma API 演示文稿生成 (+) 与Zapier集成自动生成宣讲PPT 不同生成之间的质量参差不齐
Pangea 安全/密钥管理 (+/-) 密钥保管和敏感数据清洗 清洗有时过于激进,破坏输出
MCP Harbour MCP安全代理 (+) 按智能体安全策略,支持glob/正则过滤 v0.1,早期阶段
OpenUI Lang UI生成语言 (+) 比JSON节省67%的token,流式优先 较新,采用有限

整体技术格局呈现出明显的分化。在智能体逻辑方面,从业者在完整框架(OpenClaw、Hermes、CrewAI、LangGraph)和更简单的方案(直接使用Claude/Codex、无代码方案n8n)之间做选择。一个迁移趋势清晰可见:多位从业者从复杂框架起步,逐步转向更简单的单一用途工具。安全工具层(Pangea、MCP Harbour、内联网关)还处于萌芽阶段,但正在因真实的生产事故而快速发展。


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
Agent Mailer Protocol (AMP) u/Negative-Border1439 AI智能体之间的电子邮件风格异步消息通信 复杂的DAG/RPC智能体通信 Python, FastAPI, PostgreSQL/SQLite Shipped GitHub
Sortie u/i_serghei 监控问题追踪器、管理编码智能体会话、将CI失败反馈回循环的编排器 手动看护终端智能体会话 Go, SQLite Beta brew install sortie-ai/tap/sortie
TigrimOS u/Unique_Champion4327 自托管AI工作空间,支持自动生成智能体拓扑 多智能体编排的复杂性和调试的不透明性 Python, YAML config, sandboxed Ubuntu Beta v1.2.1
Mind u/GabrielMartinMoran 智能体的持久记忆系统和会话管理器 跨会话和跨平台的智能体失忆问题 MCP, multi-IDE support Beta Link in comments
MCP Harbour u/ismaelkaissy 智能体与MCP服务器之间的安全代理 每个智能体对MCP服务器的不受控访问 GPARS spec implementation Alpha Link in comments
Engram u/Mobile_Discount6363 智能体工具连接的语义互操作层 脆弱的集成、schema漂移、协议碎片化 Python, OWL + ML, MCP/CLI/A2A/ACP Beta GitHub
OpenUI Lang u/Mr_BETADINE 面向LLM UI生成的行导向语言 JSON在UI生成中的冗余和流式延迟 Custom parser Shipped Video demo
工具调用安全网关 u/Healthy_Owl_7132 扫描智能体载荷中PII/密钥/威胁的内联网关 智能体通过API调用泄露敏感数据 CrewAI, inline proxy Alpha Demo available
Ductor u/BadRegEx(被提及) 封装Claude Code/Codex/Gemini CLI用于Telegram/Matrix 远程访问编码智能体 Python 3.11+ Shipped GitHub
Clawhub u/ananandreas 智能体共享经验和学习成果的平台 智能体重复解决已解决的问题 Web platform Shipped clawhub.ai

Agent Mailer Protocol以其概念的简洁性脱颖而出:它没有构建另一个DAG引擎或消息队列,而是将智能体通信映射到熟悉的电子邮件隐喻。团队报告该系统在生产中运行着17个智能体,分布于5个团队。问题在于电子邮件隐喻能否扩展到小团队之外,还是企业规模需要结构化的工作流引擎。

Sortie填补了使用编码智能体的开发者的一个具体空白:它自动化了问题分配、智能体会话管理和CI反馈的循环,无需绑定特定的LLM供应商或问题追踪器。单一Go二进制文件的方式使部署保持简单。

一个反复出现的模式是构建者在解决自己的痛点。u/Cold-Cranberry4280在苦苦挣扎数周后构建了分路径检索的记忆系统;u/Healthy_Owl_7132在看到智能体泄露PII后构建了载荷扫描器。获得关注的项目解决的是构建者在生产中亲身经历的问题,而非从阅读智能体相关文章中想象出来的问题。


6. 新动态与亮点

George Hotz质疑Anthropic的零日漏洞声明

得分最高的帖子(得分1080,144条评论)是George Hotz批评Anthropic关于AI智能体发现零日漏洞声明的截图。u/Hsoj707的最高赞评论(得分92)称其为"一场恐惧营销活动,而且似乎如预期般奏效了。"u/stealstea提出反驳,指出零日漏洞发现有"一个非常有利可图的合法市场"和"一个同样有利可图的非法市场",无论供应商如何包装,这种活动都有真实的经济激励。u/batman_not_robin观察到"这个帖子里的每条回复都是同样几个想法换了个说法。只有我一个真人在看吗?"——这本身就是关于智能体相关子版块讨论质量的一个信号(Hotz cooked Anthropic)。

Anthropic托管智能体引发质疑

Anthropic的托管智能体公告在2026-04-10引发了兴奋(得分22),但到2026-04-11,讨论已转向安全问题。u/WhichCardiologist800提出了"猫守牛奶"问题,u/Rough-Leather-6820指出"Lois有顾虑"。社区并不反对托管智能体,但在提出关于独立验证和安全审计能力的尖锐问题。

SKILL.md规范获得跨IDE支持

u/geekeek123报告称SKILL.md前置元数据规范(agentskills.io)现已支持Claude Code、Cursor、VS Code、Goose和Codex。实际效果——通过将MCP服务器范围限定在skill调用中,token成本降低了144倍——表明这可能成为智能体能力打包的事实标准。


7. 机会在哪里

[+++] 智能体安全中间件 ——三篇独立帖子将工具调用层确定为首要攻击面,优先级高于提示词注入。u/Healthy_Owl_7132演示了在无安全护栏情况下的完整凭证外泄。u/ismaelkaissy构建了MCP Harbour,u/WhichCardiologist800呼吁对托管智能体进行独立验证。需求强烈,现有方案处于Alpha阶段,而不作为的后果十分严重(PII泄露、权限提升)。任何一个推出生产级智能体工具调用内联安全层的团队,都将满足从业者已经在自行构建临时方案的需求。

[+++] 结构化的AI自动化教育 ——一位被聘用做自动化工作却还无法交付的人发起的66条评论帖子,加上路线图请求和对资源选择的困惑,反映出一个庞大的未被满足的受众群体。u/DetectiveMindless652编写了一份24模块指南,但目前没有权威的、持续维护的课程体系。需求是务实且紧迫的——人们正在基于尚未掌握的AI自动化技能做出职业转型。

[++] 智能体记忆即服务 ——至少五篇帖子涉及记忆持久化,构建者们独立收敛到相似的架构(双路径检索、语义去重、基于主题的过滤)。Mind支持八种IDE,但该领域仍然碎片化。一个标准化的、跨平台的记忆层,能够处理去重、衰减和矛盾解决,将立即吸引那些正在自行构建类似系统的开发者。

[++] 面向非专家的简化智能体部署 ——41条评论的OpenClaw替代方案帖子以及对框架复杂性的不满,暗示了一个机会:用可靠性换灵活性的工具。Ductor的方式(封装官方CLI,不做API代理)是一种模式。目标受众是想要结果的从业者,而非喜欢折腾配置的基础设施工程师。

[+] 面向领域专家的智能体评估工具 ——多位从业者提到在评估方面的困境,一位描述了用Excel进行领域专家评估的"地狱"。差距在于ML工程师级别的评估框架与业务领域专家实际能使用的工具之间。信号尚早,但被持续提及。

[+] 部署自动化的静默故障检测 ——u/Expert-Sink2302描述了一次持续19天的静默故障,给客户造成了严重的商机损失。修复方案(基本告警加指定负责人)概念上很简单但尚未标准化。一个专为自动化工作流打造的监控层——检查输出质量而非仅检查可用性——将填补每位服务商最终都会遇到的空白。


8. 要点总结

  1. 基于成果的定价正在成为AI自动化从业者的共识。 多位独立构建者报告称,从按小时计费转为固定费用套餐和月度保留金后,收入和客户质量都得到了提升。一位客户甚至明确要求自动化构建者停止使用Cursor,因为更快的交付意味着更少的计费时间。(Why I stopped charging hourly

  2. 智能体记忆架构正在收敛于双路径模式。 至少三位独立构建者描述了将对话历史(按时间顺序)与提取的知识(语义检索)分离的方案,积极去重是关键的质量因素。来自独立从业者的趋同表明这一模式是经过实战检验的,而非理论性的。(How I split agent memory into two separate retrieval paths

  3. 工具调用层而非提示词注入,才是生产智能体最大的暴露面。 一个CrewAI智能体在严格遵循指令的情况下,将社保号和信用卡数据从Jira泄露到了Slack。另一次对抗性测试显示,在智能体与API之间没有任何防护的情况下,可以完成完整的凭证外泄。三个独立项目(内联网关、MCP Harbour、PIC标准)正在分别构建解决方案。(Your agents have write access to production APIs

  4. "无聊自动化"论点正在获得认同,但也面临质疑。 报告有真实收入的构建者做的是单步任务(邮件分类、网站读取、线索信号提取),而非多智能体编排。但评论者质疑在当前过渡期内,是否有任何AI智能体商业模式具有可持续性。(90% of AI agents being built right now will never make a dollar

  5. 智能体间通信正在从框架转向协议。 AMP(智能体的电子邮件风格消息系统)和Engram(语义互操作层)代表了从在应用代码中构建编排逻辑向独立通信标准转变的趋势。AMP报告已在生产中运行17个智能体,分布于5个团队。(We built a mail protocol for AI agents

  6. 将MCP服务器范围限定在skill而非全局加载,可以将token开销降低100倍以上。 一位从业者测量到每条消息从约44,000个token降至约780个,且安全检测结果完全一致。SKILL.md规范适用于五种主要编码工具。(Is anyone else bundling MCP servers inside skills instead of loading them globally?

  7. "影子观察"比需求调查电话更有效地确定自动化范围。 一位在六个月内收入超过20,000美元的服务商将成功归因于花半天时间观察客户工作,而非走标准的需求收集流程。咖啡店案例——一个技术上正确的自动化方案因需要一个新仪表盘而被放弃,因为那是一个使用电话和纸质流程的运营方式——说明了为什么观察胜过提问。(Chatting with an AI agency owner who has already cleared $20K+