Twitter AI Coding - 2026-05-25¶
1. 人们在讨论什么¶
1.1 成本、配额和限流开始替人选择智能体 🡕¶
最强信号的讨论簇,讲的是支出上限,而不是基准测试炫耀。Microsoft 的许可证收缩、GitHub Copilot 的倍率截图,以及 Antigravity 的配额绕行方案,都把 AI 编码先塑造成预算问题,而后才是模型选择问题。就连 Antigravity 的正面发布消息,重点也放在更低的 token 消耗和配额重置上,而不是新能力。
@Pirat_Nation 表示,Microsoft 在 AI 账单失控后,正在缩减内部对 Claude Code 的使用,并把部分团队推向 GitHub Copilot(1,460 次点赞、122 条回复、79,463 次浏览、181 次收藏)。信息流里其他地方转引的报道,把细节说得更清楚:The Verge 称,Experiences + Devices 正在于 6 月 30 日前逐步取消大多数 Claude Code 许可证,但仍会通过 Copilot CLI 提供 Anthropic 模型;因此,这更像是成本控制和运行框架收敛,而不是放弃 AI。
@ardadev 直接总结了这条纠正信息,并附上拟议中的 Community Note,同时链接了同样的 Verge 和 Windows Central 报道(8 次点赞、727 次浏览)。

@testingcatalog 报道,Antigravity 新增了 Gemini 3.5 Flash (Low),并引用 Google 的说法称,它相比 Flash Medium 大约可减少 45% 的 token 消耗,同时突出付费计划的配额重置(356 次点赞、25 条回复、24,999 次浏览、30 次收藏)。@ai_for_success 又补充,这个新档位现在也已经出现在 CLI 里了(140 次点赞、8 条回复、7,039 次浏览、14 次收藏)。


@balakoteswar 贴出 了一张 GitHub Docs 截图,显示年付计划中的模型倍率大幅上调,其中 Claude Opus 4.5 从 3x 涨到 15x,Claude Sonnet 4.6 从 1x 涨到 9x(4 次点赞、378 次浏览)。

讨论要点: 回复区并没有不假思索地庆祝更便宜的档位。一条 Flash Low 帖子下面就有人问,这个变化是不是只多买到“5 分钟”的配额;而 Microsoft 那条讨论串则把读者引向 Community Note 更正和媒体报道链接,而不是病毒式的“AI 禁令”说法。
与前日对比: 5 月 24 日还主要把配额痛点当成 Antigravity 内部的产品摩擦。到了 5 月 25 日,同样的抱怨上升了一个层级:Microsoft 许可证、Copilot 倍率,以及模型限制重置,都让预算算术成了主导叙事。
1.2 模型之上的竞争,正在加厚成工作流文件、记忆和编排层 🡕¶
最强的工作流帖子,不是在说“这是一个更好的模型”,而是在说“我是怎么把多个智能体接起来的”“我是怎么教助手遵守我的约定的”“我是怎么让同一套工作流在工具切换后仍能延续的”。这让这一天看起来更像是一场控制平面之争,而不是某个最佳 UI 的单点竞争。
@Teknium 宣布,现在只要装一个技能,Hermes Agent 就能编排 OpenHands(58 次点赞、8 条回复、2,271 次浏览、47 次收藏)。随附信息图把这个集成讲得很具体:OpenHands 变成了 Hermes 的一个可选技能,背后由 LiteLLM 提供对 Anthropic、OpenAI、DeepSeek、Qwen、Ollama、vLLM 和 Nous 的支持,同时还带有明确的无头模式 flags。

@EXM7777 认为,真正厉害的用户在 Claude Code、Codex 和 OpenCode 上能拿到相近的质量,因为他们理解失效模式、指令结构、智能体系统、记忆架构,以及价格 / 质量之间的取舍(54 次点赞、19 条回复、2,097 次浏览、44 次收藏)。有条回复把这个想法又往前推了一步:真正的优势,在于把这些原则编码进能跟着每一次会话、每一个工具一起移动的文件里。
@code 推广 了一场 Microsoft Build 会议,主题是 GitHub Copilot 为什么会丢失上下文(59 次点赞、7 条回复、6,326 次浏览、17 次收藏);而 会议页面 写道,Copilot 可以借助共享规则、可复用提示词、技能和自定义智能体,学会团队约定,并能从 5 名工程师扩展到 500 名。
@PhilSeamark 写道,他把 VS Code 加 GitHub Copilot 当成一个“给知识工作者,不是给开发者”的个人生产力环境(54 次浏览);其链接的 设置指南 描述了晨间简报、转录导入、Power Automate 文件投递、可搜索聊天记录,以及同一工作区里的 subagents。
@dosco 表示,Ax/Aithy 的核心设计优势,在于把对话历史当成可供检查和提炼的结构化数据来处理(27 次点赞、3 条回复、878 次浏览、20 次收藏)。他附上的评审截图则把更难的要求说得很明白:缺的仍是一条一等公民的编程智能体工具通道,里面要有带边界的仓库搜索、事务性 patch、诊断、回滚和来源追踪。

讨论要点: Teknium 的回复区在要预设组合和更少的无关文件改动,而 EXM7777 的回复区则在问,怎样让那些来之不易的原则可迁移。真正的实际问题,是如何把工作流打包到能跨工具切换继续存活,而不是本周到底哪个界面赢了。
与前日对比: 5 月 24 日强调的是订阅路由和本地模型。5 月 25 日则在这层路由之上,又加厚了一层规则、技能、记忆和被委派的智能体。
1.3 构建者在既有智能体周围打包专用适配层,而不是正面取代它们 🡕¶
最清晰的项目分享帖,都是在一个流行运行框架上补一项缺失能力:语义代码智能、合规知识、提供商自由,或更快的远程接线能力。这是一种不同于“再发一个新助手”的构建模式,更像是给人们已经信任的智能体去补基础设施。
@pvergadia 重点提到 了 codegraph,把它列为本周 GitHub 增长最快的仓库之一(1 次点赞、185 次浏览、5 次收藏)。公开的 colbymchenry/codegraph 仓库 把它描述成一套面向 Claude Code、Codex CLI、Cursor、OpenCode 和 Hermes Agent 的 TypeScript 语义代码知识图谱;README 还声称,在 7 个代码库上的平均基准测试里,它能节省 35% 的成本,并减少 71% 的工具调用。
@VivekIntel 分享 了 mlunato47/claude-grc-plugin(3 次点赞、110 次浏览、3 次收藏);其 README 写道,它能为 Claude Code 和 OpenCode 提供 72 份以上的参考文件、15 套框架,以及 24 个面向 FedRAMP、NIST 800-53、CMMC、SOC 2、ISO 27001、HIPAA 等合规工作流的 slash commands。
@Liz_Binance 指向 了 ajsai47/backdoor(2 次点赞、2 条回复、806 次浏览),这个 Python proxy 的 README 写道,它能把 Claude Code 重路由到 DeepSeek、Groq、Ollama、OpenRouter 和 NVIDIA NIM 等 OpenAI 兼容提供商上。那条帖子真正有用的部分,不是那个未经证实的“copied” 指控,而是它展示了一层公开的路由层,专门用来保留 Claude Code 的运行框架,同时替换底层模型和价格点。
@tmsdnl 表示,一个 Codex 功能请求从 GitHub issue 到合并只花了 10 小时 41 分钟,并附上了新的 app-server WebSocket 流程和 /status 输出截图(2 次点赞、272 次浏览)。即便这只是个小功能,它也说明市场更奖励薄适配层和快速工作流修补,而不是重新发明全栈。
讨论要点: 这些构建者不断从一个强势的既有智能体出发,再补一块缺的能力:语义上下文、合规知识、提供商自由或委派执行。这个模式是叠加式的,不是替代式的。
与前日对比: 5 月 24 日已经出现了工作流专用技能包。5 月 25 日则把这个趋势扩展成更专门的基础设施层:知识图谱、合规插件、提供商代理,以及编排技能。
2. 令人困扰的问题¶
任务还没做完,配额就先耗尽了¶
严重程度:高。@air_codex 表示,自己只发了 6 个提示词,就先被封 2 小时,随后又因为反复出现“high traffic”失败而被封 4 天,尽管做的只是基础 CSS 和 TSX 工作(43 次浏览)。随附截图之所以重要,是因为它把一种模糊抱怨变成了具体失效模式:先是活干完后立刻弹出流量错误,然后是配额页面显示 Flash、Gemini 3.1、Claude 4.6 和 GPT-OSS 档位都只剩 0%。@testingcatalog 报道 Flash Low 是一种节省 45% token 的修补方案(356 次点赞、25 条回复、24,999 次浏览、30 次收藏),但回复区立刻追问,这是不是只多买来几分钟的可用工作时间。@balakoteswar 贴出 的 Copilot 倍率截图,又说明 GitHub 这一侧的高端模型成本压力也在上升(4 次点赞、378 次浏览)。可见的应对模式,是降级模型、等待重置,或改走更便宜的后端。这个方向值得做,因为失效点会直接打断任务,而不是只影响观感。


公开的 AI 编码讨论,在头条传播后仍需要纠偏¶
严重程度:中。@Pirat_Nation 把 Microsoft 的成本故事传播到了大范围用户面前(1,460 次点赞、122 条回复、79,463 次浏览、181 次收藏),但紧接着的一层讨论就是纠偏:@ardadev 转发 了 Community Note 和源报道,说明 Microsoft 取消的是 Claude Code 许可证,并把团队导向 Copilot CLI,而不是禁止 AI(8 次点赞、727 次浏览)。Google 那边也出现了更柔和的同类模式。@DuaFatimaAi 重复了 那套熟悉的 NotebookLM + Antigravity 组合宣传(45 次点赞、17 条回复、443 次浏览、9 次收藏),但帖子并没有提供超出搭建口号之外的新证据。当前的绕行机制,是读者自己把文章链接、截图和纠错信息带回讨论串。这件事值得做,因为验证如今正在变成产品发现的一部分。
编排工具仍在逼用户自己拼预设组合¶
严重程度:中。@Teknium 宣布 了一个有用的 Hermes + OpenHands 技能(58 次点赞、8 条回复、2,271 次浏览、47 次收藏),但马上就有回复说:“你们很快就需要预设组合了。”这样新用户才不用手动改每个设置。@dosco 则用更技术化的语言说了同一件事(27 次点赞、3 条回复、878 次浏览、20 次收藏):智能体架构仍然需要带边界的仓库搜索、事务性 patch、诊断、回滚和来源追踪,才会显得完整。@EXM7777 认为,现在的绕行方式就是个人基础设施:理解原则,把它们编码进可迁移文件,再在工具之间随身带着走(54 次点赞、19 条回复、2,097 次浏览、44 次收藏)。这个方向值得做,因为眼下的绕行方案仍然全靠手工自建。
3. 人们期望的功能¶
与智能体行为匹配的突发定价和配额仪表盘¶
最强的需求不是又一个抽象基准测试,而是一个能告诉你任务会花多少钱、哪些档位已经耗尽、什么时候刷新,以及更便宜的档位到底能不能把活干完的系统。@air_codex 从用户侧展示了 这种失效模式(43 次浏览),@balakoteswar 从套餐侧暴露了 倍率变化(4 次点赞、378 次浏览),而 Microsoft 的报道则给出了同一问题的企业版本。机会:直接。
能在工具切换后继续存活的可迁移工作流包¶
@EXM7777 认为,原则比界面更耐久(54 次点赞、19 条回复、2,097 次浏览、44 次收藏);而 Microsoft Build 会议页面 也明确把规则、提示词文件、技能和自定义智能体描述成向 Copilot 传授团队约定的方式。@PhilSeamark 又展示了 同一需求在非开发者场景里的样子(54 次浏览):真正的资产,是一套可复用工作流,能处理转录、日历、笔记和历史,而不是每次都从零开始。机会:直接且具竞争性。
面向受监管工作和非代码工作的领域专用智能体层¶
围绕 claude-grc-plugin 和 Phil Seamark 那套 Copilot 工作流的构建活动,都在暗示同一个缺口:通用智能体仍需要一层会说用户领域语言的外壳。前者意味着 FedRAMP、NIST 800-53 和文档审查命令,后者意味着客户笔记、差旅管理、产品反馈和日记式工作流。机会:直接。
用安全的多智能体预设替代白纸一张式编排¶
在 @Teknium 的 公告 下,回复区要的是预设组合(58 次点赞、8 条回复、2,271 次浏览、47 次收藏);@dosco 则把缺失的护栏正式列了出来(27 次点赞、3 条回复、878 次浏览、20 次收藏):带边界的仓库搜索、事务性编辑、诊断、回滚和来源追踪。人们真正想要的,看起来是一个值得信任的起点,而不是一袋旋钮。机会:具竞争性。
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| GitHub Copilot / Copilot CLI | 编程助手 / 运行框架 | (+/-) | 一方产品支持规则、提示词文件、技能和自定义智能体;同时出现在企业和知识工作流场景里 | 倍率变化和套餐算术正在收紧;部分采用来自成本和内部 dogfooding 决策推动 |
| Claude Code | 编程智能体 | (+/-) | 仍然足够受欢迎,以至于 Microsoft 需要主动缩减许可证;强运行框架催生了路由和代理项目 | 企业成本压力是真实存在的,设置蔓延也是反复出现的抱怨 |
| Google Antigravity | 智能体运行时 / IDE / CLI | (+/-) | 新增 Flash Low,覆盖多个表面,仍能吸引偏自动化的用户 | 高频失效、难用配额和反复出现的宣传帖持续削弱信任 |
| Gemini 3.5 Flash (Low) | 模型档位 | (+/-) | 主打比 Flash Medium 约省 45% token,并已进入 Antigravity 各端 | 用户仍在质疑,在配额触顶前它到底能多买来多少实际空间 |
| Hermes Agent | 编排运行框架 | (+) | 支持可安装技能,以及跨多个智能体后端的委派执行 | 回复区表明,用户想要更安全的预设、更明确的组合,以及更少的无关文件改动 |
| OpenHands | 自治编程智能体 | (+) | 现在能被 Hermes 联合多个 LiteLLM 提供商一起编排 | 复杂度仍然会通过 flags 和环境变量泄漏出来 |
| CodeGraph | 语义代码智能 | (+) | 预索引本地图谱有望减少工具调用、降低成本,并加快多种智能体的代码库探索 | 需要索引工作流,目前看起来仍偏早期基础设施软件 |
| GRC Knowledge Plugin | 领域插件 | (+) | 为 Claude Code 和 OpenCode 加入合规映射、文档审查和操作命令 | 除非你在受监管环境工作,否则仍偏小众 |
| Backdoor | 提供商代理 | (+) | 保留 Claude Code 的运行框架,同时切到更便宜、本地或其他提供商 | 早期设置负担较重,且受提供商兼容性约束 |
| VS Code + Copilot + Power Automate files | 工作流模式 | (+) | 能把编程环境变成全天候工作区,用来处理转录、日记、客户笔记和 subagents | 目前更像一套自定义栈,而不是默认产品体验 |
整体满意度最高的场景,是工具能提升可移植性,或把真实工作流知识打包起来的时候;最低的场景,则是用量上限或计费倍率打断工作的时候。实际迁移模式,并不是从工具 A 干净切换到工具 B,而是路由和叠层:保留人们喜欢的运行框架、替换提供商、加一个语义索引、加一个领域插件,或接入一个被委派的智能体。竞争焦点正在从单纯的模型质量,向上下文、编排和价格控制上移。
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| OpenHands skill for Hermes | @Teknium | 让 Hermes 以一个可安装技能来编排 OpenHands | 开发者希望用一个控制平面去委派另一个编程智能体,而不是把所有事都塞进同一闭环 | Hermes Agent, OpenHands CLI, LiteLLM, Anthropic/OpenAI/DeepSeek/Qwen/Ollama/vLLM/Nous | 已发布 | 推文 |
| CodeGraph | colbymchenry | 面向多个智能体客户端的预索引语义代码知识图谱 | 减少代码库探索时的 token 浪费和工具调用蔓延 | TypeScript, SQLite/FTS, MCP, Claude Code/Codex/Cursor/OpenCode/Hermes integrations | 已发布 | 仓库 |
| GRC Knowledge Plugin | mlunato47 | 为 Claude Code 和 OpenCode 增加合规框架、映射和审查命令 | 通用编程智能体并不了解受监管文档和审计工作流 | JavaScript plugin, 72+ reference files, 24 slash commands, Claude Code, OpenCode | 已发布 | 仓库 |
| Backdoor | ajsai47 | 让 Claude Code 通过任意 OpenAI 兼容或本地提供商运行 | 团队想保留 Claude Code 的运行框架,但不想接受 Anthropic 单一价格或锁定 | Python proxy, OpenAI-compatible APIs, DeepSeek, Groq, Ollama, OpenRouter, NVIDIA NIM | Beta | 仓库 |
| Codex app-server support | @tmsdnl | 新近合并的远程 / app-server 工作流扩展能力 | 用户想让 Codex 与本地或远程服务层对话,而不是被困在单一 shell 流里 | Codex, WebSockets, app-server status plumbing | Alpha | 推文 |
@Teknium 宣布 的 Hermes + OpenHands 技能,是一个真正可安装的工件,而不只是概念(58 次点赞、8 条回复、2,271 次浏览、47 次收藏)。附图展示了准确的安装命令、OpenHands 已支持的 flags,以及模型无关的后端列表,所以回复区才会立刻开始要求预设组合和更安全的默认值。
@pvergadia 重点提到 CodeGraph 在每周仓库榜单上的上升(1 次点赞、185 次浏览、5 次收藏);而仓库本身写得很直白:它要让 Claude Code、Codex CLI、Cursor、OpenCode 和 Hermes 更便宜、更轻,因为它给这些工具提供了一个预索引图谱,而不是逼它们反复读文件。@VivekIntel 分享 了 GRC Knowledge Plugin(3 次点赞、110 次浏览、3 次收藏);其 README 则把这种打包动作说得更明确:参考文件、slash commands 和框架映射,都被包在现有智能体外面。


@Liz_Binance 指向 了 Backdoor,其 README 写道,它能把 Claude Code 重路由到 DeepSeek、Groq、OpenRouter、Ollama 和 NVIDIA NIM 等提供商(2 次点赞、2 条回复、806 次浏览)。@tmsdnl 又给出 了一个更小但很有代表性的例子:一个 Codex 功能请求在 10 小时 41 分钟内上线,截图里新的 app-server 流程已经跑通(2 次点赞、272 次浏览)。

这 5 个例子背后反复出现的构建模式非常一致:如果你能让一个流行智能体更便宜、更懂领域、更容易路由,或更容易委派执行,就没有必要重新发明它。这也是为什么当天最强的项目,看起来像适配器、插件、图谱和编排技能,而不是新基础模型。
6. 新动态与亮点¶
搜索热度飙升的速度,可能快于广泛使用的扩散速度¶
@RealNickMugalli 认为,在 Opus 4.5 之后,Claude Code 的搜索热度一路垂直上升,而 Codex 则稍晚一步跟上;他附上了一张 Google US 的 AI 编程智能体搜索图表(2 次点赞、322 次浏览)。图表本身支持这个判断里较窄的部分:围绕 Claude Code 和 Codex 的关注度,在 2025 年末到 2026 年初明显加速。这件事之所以重要,是因为它与当天其他证据相吻合:虽然重度用户群仍然相对小,但规模已经大到足以把企业预算痛点暴露出来。

即便曝光不高的独立构建者,也开始晒出营收截图¶
@adensdk 声称,一个由 AI 构建的应用已经带来了超过 $13,000 的收入,并附上了一张 RevenueCat 截图,显示上一年收入为 $13,230(5 次点赞、3 条回复、284 次浏览、2 次收藏)。帖子没有披露技术栈,这个数字也是自报,因此应谨慎看待。但它仍然重要,因为它构成了一个反向信号:就在企业抱怨 token 预算的同一天,小体量构建者账号仍在晒出变现证明点。

7. 机会在哪里¶
[+++] 预算感知路由、配额预测和突发定价 — 第 1 节显示,Microsoft 和 GitHub 的决策都开始围绕支出上限转弯;第 2 节则展示了即便 Google 推出 Flash Low,Antigravity 用户仍会在任务中途被卡住。Backdoor 已经是构建者给出的回应,而这通常说明痛点既真实又紧迫。
[++] 可迁移的工作流包与记忆层 — 第 1.2 节和第 3 节都在说明:规则、提示词文件、技能、subagents 和持久工作区,正在变成高于任何单个模型之上的耐久资产。这个机会强度中等,因为一方产品已经交付了部分能力,但跨工具版本仍然是开放地带。
[++] 现有运行框架的专用插件 — 第 5 节里最强的构建者例子是 CodeGraph、GRC Knowledge Plugin 和 Backdoor。这 3 个项目的共同点,都是围绕既有智能体提供更窄但更有力的增益,而不是试图彻底替换它,因此这看起来更像一个可信的产品类别,而不是一次性 hack。
[+] AI 工具话语的验证与纠偏层 — 第 2 节展示了头条叙事和宣传式设置帖有多快就需要纠错。这个机会还在涌现,因为现在读者已经在靠 Community Notes、截图和源链接手工做这项工作。
8. 要点总结¶
- 企业支出正在开始主导工具选择。 Microsoft 的 Experiences + Devices 团队正在逐步取消大多数 Claude Code 许可证,并计划在 6 月底前把许多开发者导向 Copilot CLI,这让成本和组织内部杠杆都成了产品决策的一部分。(source)
- 更便宜的模型档位,并不能单独解决配额焦虑。 Flash Low 带着节省 45% token 的宣传上线,但用户仍在晒出只做了基础工作就触发高流量和 0 剩余额度的截图。(source)
- 更耐久的层,正在移动到模型之上。 Hermes + OpenHands 的编排、Microsoft Build 对规则和技能的强调,以及面向知识工作的 Copilot 设置,都把工作流文件、技能和记忆当成了真正的长期优势。(source)
- 构建者正在靠适配层赢。 CodeGraph、GRC Knowledge Plugin、Backdoor,以及 Codex 的 app-server 变更,都在既有智能体周围增加杠杆,而不是试图正面替代它们。(source)
- 注意力和收益仍然高度集中。 一张 Google 搜索趋势图显示,Claude Code 和 Codex 的关注度正在快速上升;与此同时,就在企业抱怨成本的同一天,小体量构建者账号仍在晒出自报营收截图。(source)