跳转至

Twitter AI Coding - 2026-05-25

1. 人们在讨论什么

1.1 成本、配额和限流开始替人选择智能体 🡕

最强信号的讨论簇,讲的是支出上限,而不是基准测试炫耀。Microsoft 的许可证收缩、GitHub Copilot 的倍率截图,以及 Antigravity 的配额绕行方案,都把 AI 编码先塑造成预算问题,而后才是模型选择问题。就连 Antigravity 的正面发布消息,重点也放在更低的 token 消耗和配额重置上,而不是新能力。

@Pirat_Nation 表示,Microsoft 在 AI 账单失控后,正在缩减内部对 Claude Code 的使用,并把部分团队推向 GitHub Copilot(1,460 次点赞、122 条回复、79,463 次浏览、181 次收藏)。信息流里其他地方转引的报道,把细节说得更清楚:The Verge 称,Experiences + Devices 正在于 6 月 30 日前逐步取消大多数 Claude Code 许可证,但仍会通过 Copilot CLI 提供 Anthropic 模型;因此,这更像是成本控制和运行框架收敛,而不是放弃 AI。

@ardadev 直接总结了这条纠正信息,并附上拟议中的 Community Note,同时链接了同样的 Verge 和 Windows Central 报道(8 次点赞、727 次浏览)。

拟议 Community Note 的截图,说明 Microsoft 因成本取消 Claude Code 许可证,并引导工程师转向 GitHub Copilot CLI,而不是禁止 AI

@testingcatalog 报道,Antigravity 新增了 Gemini 3.5 Flash (Low),并引用 Google 的说法称,它相比 Flash Medium 大约可减少 45% 的 token 消耗,同时突出付费计划的配额重置(356 次点赞、25 条回复、24,999 次浏览、30 次收藏)。@ai_for_success 又补充,这个新档位现在也已经出现在 CLI 里了(140 次点赞、8 条回复、7,039 次浏览、14 次收藏)。

Antigravity 模型选择器,展示 Gemini 3.5 Flash (Low) 以及付费计划的配额重置提示

Antigravity CLI 1.0.0 的模型切换器,展示 Gemini 3.5 Flash (Low) 已出现在可选档位里

@balakoteswar 贴出 了一张 GitHub Docs 截图,显示年付计划中的模型倍率大幅上调,其中 Claude Opus 4.5 从 3x 涨到 15x,Claude Sonnet 4.6 从 1x 涨到 9x(4 次点赞、378 次浏览)。

GitHub Copilot 计费截图,展示年付计划里更高的模型倍率,包括 Claude Opus 和 Claude Sonnet 档位的大幅跳涨

讨论要点: 回复区并没有不假思索地庆祝更便宜的档位。一条 Flash Low 帖子下面就有人问,这个变化是不是只多买到“5 分钟”的配额;而 Microsoft 那条讨论串则把读者引向 Community Note 更正和媒体报道链接,而不是病毒式的“AI 禁令”说法。

与前日对比: 5 月 24 日还主要把配额痛点当成 Antigravity 内部的产品摩擦。到了 5 月 25 日,同样的抱怨上升了一个层级:Microsoft 许可证、Copilot 倍率,以及模型限制重置,都让预算算术成了主导叙事。

1.2 模型之上的竞争,正在加厚成工作流文件、记忆和编排层 🡕

最强的工作流帖子,不是在说“这是一个更好的模型”,而是在说“我是怎么把多个智能体接起来的”“我是怎么教助手遵守我的约定的”“我是怎么让同一套工作流在工具切换后仍能延续的”。这让这一天看起来更像是一场控制平面之争,而不是某个最佳 UI 的单点竞争。

@Teknium 宣布,现在只要装一个技能,Hermes Agent 就能编排 OpenHands(58 次点赞、8 条回复、2,271 次浏览、47 次收藏)。随附信息图把这个集成讲得很具体:OpenHands 变成了 Hermes 的一个可选技能,背后由 LiteLLM 提供对 Anthropic、OpenAI、DeepSeek、Qwen、Ollama、vLLM 和 Nous 的支持,同时还带有明确的无头模式 flags。

Hermes Agent 信息图,说明如何把 OpenHands 作为一个可选技能安装和运行,并展示 LiteLLM 支持的模型以及无头模式 flags

@EXM7777 认为,真正厉害的用户在 Claude Code、Codex 和 OpenCode 上能拿到相近的质量,因为他们理解失效模式、指令结构、智能体系统、记忆架构,以及价格 / 质量之间的取舍(54 次点赞、19 条回复、2,097 次浏览、44 次收藏)。有条回复把这个想法又往前推了一步:真正的优势,在于把这些原则编码进能跟着每一次会话、每一个工具一起移动的文件里。

@code 推广 了一场 Microsoft Build 会议,主题是 GitHub Copilot 为什么会丢失上下文(59 次点赞、7 条回复、6,326 次浏览、17 次收藏);而 会议页面 写道,Copilot 可以借助共享规则、可复用提示词、技能和自定义智能体,学会团队约定,并能从 5 名工程师扩展到 500 名。

@PhilSeamark 写道,他把 VS Code 加 GitHub Copilot 当成一个“给知识工作者,不是给开发者”的个人生产力环境(54 次浏览);其链接的 设置指南 描述了晨间简报、转录导入、Power Automate 文件投递、可搜索聊天记录,以及同一工作区里的 subagents。

@dosco 表示,Ax/Aithy 的核心设计优势,在于把对话历史当成可供检查和提炼的结构化数据来处理(27 次点赞、3 条回复、878 次浏览、20 次收藏)。他附上的评审截图则把更难的要求说得很明白:缺的仍是一条一等公民的编程智能体工具通道,里面要有带边界的仓库搜索、事务性 patch、诊断、回滚和来源追踪。

评审截图,列出带边界的仓库搜索、事务性 patch、诊断、回滚和来源追踪等编程智能体需求

讨论要点: Teknium 的回复区在要预设组合和更少的无关文件改动,而 EXM7777 的回复区则在问,怎样让那些来之不易的原则可迁移。真正的实际问题,是如何把工作流打包到能跨工具切换继续存活,而不是本周到底哪个界面赢了。

与前日对比: 5 月 24 日强调的是订阅路由和本地模型。5 月 25 日则在这层路由之上,又加厚了一层规则、技能、记忆和被委派的智能体。

1.3 构建者在既有智能体周围打包专用适配层,而不是正面取代它们 🡕

最清晰的项目分享帖,都是在一个流行运行框架上补一项缺失能力:语义代码智能、合规知识、提供商自由,或更快的远程接线能力。这是一种不同于“再发一个新助手”的构建模式,更像是给人们已经信任的智能体去补基础设施。

@pvergadia 重点提到 了 codegraph,把它列为本周 GitHub 增长最快的仓库之一(1 次点赞、185 次浏览、5 次收藏)。公开的 colbymchenry/codegraph 仓库 把它描述成一套面向 Claude Code、Codex CLI、Cursor、OpenCode 和 Hermes Agent 的 TypeScript 语义代码知识图谱;README 还声称,在 7 个代码库上的平均基准测试里,它能节省 35% 的成本,并减少 71% 的工具调用。

@VivekIntel 分享mlunato47/claude-grc-plugin(3 次点赞、110 次浏览、3 次收藏);其 README 写道,它能为 Claude Code 和 OpenCode 提供 72 份以上的参考文件、15 套框架,以及 24 个面向 FedRAMP、NIST 800-53、CMMC、SOC 2、ISO 27001、HIPAA 等合规工作流的 slash commands。

@Liz_Binance 指向ajsai47/backdoor(2 次点赞、2 条回复、806 次浏览),这个 Python proxy 的 README 写道,它能把 Claude Code 重路由到 DeepSeek、Groq、Ollama、OpenRouter 和 NVIDIA NIM 等 OpenAI 兼容提供商上。那条帖子真正有用的部分,不是那个未经证实的“copied” 指控,而是它展示了一层公开的路由层,专门用来保留 Claude Code 的运行框架,同时替换底层模型和价格点。

@tmsdnl 表示,一个 Codex 功能请求从 GitHub issue 到合并只花了 10 小时 41 分钟,并附上了新的 app-server WebSocket 流程和 /status 输出截图(2 次点赞、272 次浏览)。即便这只是个小功能,它也说明市场更奖励薄适配层和快速工作流修补,而不是重新发明全栈。

讨论要点: 这些构建者不断从一个强势的既有智能体出发,再补一块缺的能力:语义上下文、合规知识、提供商自由或委派执行。这个模式是叠加式的,不是替代式的。

与前日对比: 5 月 24 日已经出现了工作流专用技能包。5 月 25 日则把这个趋势扩展成更专门的基础设施层:知识图谱、合规插件、提供商代理,以及编排技能。


2. 令人困扰的问题

任务还没做完,配额就先耗尽了

严重程度:高。@air_codex 表示,自己只发了 6 个提示词,就先被封 2 小时,随后又因为反复出现“high traffic”失败而被封 4 天,尽管做的只是基础 CSS 和 TSX 工作(43 次浏览)。随附截图之所以重要,是因为它把一种模糊抱怨变成了具体失效模式:先是活干完后立刻弹出流量错误,然后是配额页面显示 Flash、Gemini 3.1、Claude 4.6 和 GPT-OSS 档位都只剩 0%。@testingcatalog 报道 Flash Low 是一种节省 45% token 的修补方案(356 次点赞、25 条回复、24,999 次浏览、30 次收藏),但回复区立刻追问,这是不是只多买来几分钟的可用工作时间。@balakoteswar 贴出 的 Copilot 倍率截图,又说明 GitHub 这一侧的高端模型成本压力也在上升(4 次点赞、378 次浏览)。可见的应对模式,是降级模型、等待重置,或改走更便宜的后端。这个方向值得做,因为失效点会直接打断任务,而不是只影响观感。

Antigravity 截图,展示活干完后立刻出现的 high-traffic 失败

Antigravity 配额页面,展示 Flash、Gemini 3.1 Pro、Claude 4.6 和 GPT-OSS 档位都已耗尽,只能等未来时间刷新

公开的 AI 编码讨论,在头条传播后仍需要纠偏

严重程度:中。@Pirat_Nation 把 Microsoft 的成本故事传播到了大范围用户面前(1,460 次点赞、122 条回复、79,463 次浏览、181 次收藏),但紧接着的一层讨论就是纠偏:@ardadev 转发 了 Community Note 和源报道,说明 Microsoft 取消的是 Claude Code 许可证,并把团队导向 Copilot CLI,而不是禁止 AI(8 次点赞、727 次浏览)。Google 那边也出现了更柔和的同类模式。@DuaFatimaAi 重复了 那套熟悉的 NotebookLM + Antigravity 组合宣传(45 次点赞、17 条回复、443 次浏览、9 次收藏),但帖子并没有提供超出搭建口号之外的新证据。当前的绕行机制,是读者自己把文章链接、截图和纠错信息带回讨论串。这件事值得做,因为验证如今正在变成产品发现的一部分。

编排工具仍在逼用户自己拼预设组合

严重程度:中。@Teknium 宣布 了一个有用的 Hermes + OpenHands 技能(58 次点赞、8 条回复、2,271 次浏览、47 次收藏),但马上就有回复说:“你们很快就需要预设组合了。”这样新用户才不用手动改每个设置。@dosco 则用更技术化的语言说了同一件事(27 次点赞、3 条回复、878 次浏览、20 次收藏):智能体架构仍然需要带边界的仓库搜索、事务性 patch、诊断、回滚和来源追踪,才会显得完整。@EXM7777 认为,现在的绕行方式就是个人基础设施:理解原则,把它们编码进可迁移文件,再在工具之间随身带着走(54 次点赞、19 条回复、2,097 次浏览、44 次收藏)。这个方向值得做,因为眼下的绕行方案仍然全靠手工自建。


3. 人们期望的功能

与智能体行为匹配的突发定价和配额仪表盘

最强的需求不是又一个抽象基准测试,而是一个能告诉你任务会花多少钱、哪些档位已经耗尽、什么时候刷新,以及更便宜的档位到底能不能把活干完的系统。@air_codex 从用户侧展示了 这种失效模式(43 次浏览),@balakoteswar 从套餐侧暴露了 倍率变化(4 次点赞、378 次浏览),而 Microsoft 的报道则给出了同一问题的企业版本。机会:直接。

能在工具切换后继续存活的可迁移工作流包

@EXM7777 认为,原则比界面更耐久(54 次点赞、19 条回复、2,097 次浏览、44 次收藏);而 Microsoft Build 会议页面 也明确把规则、提示词文件、技能和自定义智能体描述成向 Copilot 传授团队约定的方式。@PhilSeamark 又展示了 同一需求在非开发者场景里的样子(54 次浏览):真正的资产,是一套可复用工作流,能处理转录、日历、笔记和历史,而不是每次都从零开始。机会:直接且具竞争性。

面向受监管工作和非代码工作的领域专用智能体层

围绕 claude-grc-plugin 和 Phil Seamark 那套 Copilot 工作流的构建活动,都在暗示同一个缺口:通用智能体仍需要一层会说用户领域语言的外壳。前者意味着 FedRAMP、NIST 800-53 和文档审查命令,后者意味着客户笔记、差旅管理、产品反馈和日记式工作流。机会:直接。

用安全的多智能体预设替代白纸一张式编排

@Teknium公告 下,回复区要的是预设组合(58 次点赞、8 条回复、2,271 次浏览、47 次收藏);@dosco 则把缺失的护栏正式列了出来(27 次点赞、3 条回复、878 次浏览、20 次收藏):带边界的仓库搜索、事务性编辑、诊断、回滚和来源追踪。人们真正想要的,看起来是一个值得信任的起点,而不是一袋旋钮。机会:具竞争性。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
GitHub Copilot / Copilot CLI 编程助手 / 运行框架 (+/-) 一方产品支持规则、提示词文件、技能和自定义智能体;同时出现在企业和知识工作流场景里 倍率变化和套餐算术正在收紧;部分采用来自成本和内部 dogfooding 决策推动
Claude Code 编程智能体 (+/-) 仍然足够受欢迎,以至于 Microsoft 需要主动缩减许可证;强运行框架催生了路由和代理项目 企业成本压力是真实存在的,设置蔓延也是反复出现的抱怨
Google Antigravity 智能体运行时 / IDE / CLI (+/-) 新增 Flash Low,覆盖多个表面,仍能吸引偏自动化的用户 高频失效、难用配额和反复出现的宣传帖持续削弱信任
Gemini 3.5 Flash (Low) 模型档位 (+/-) 主打比 Flash Medium 约省 45% token,并已进入 Antigravity 各端 用户仍在质疑,在配额触顶前它到底能多买来多少实际空间
Hermes Agent 编排运行框架 (+) 支持可安装技能,以及跨多个智能体后端的委派执行 回复区表明,用户想要更安全的预设、更明确的组合,以及更少的无关文件改动
OpenHands 自治编程智能体 (+) 现在能被 Hermes 联合多个 LiteLLM 提供商一起编排 复杂度仍然会通过 flags 和环境变量泄漏出来
CodeGraph 语义代码智能 (+) 预索引本地图谱有望减少工具调用、降低成本,并加快多种智能体的代码库探索 需要索引工作流,目前看起来仍偏早期基础设施软件
GRC Knowledge Plugin 领域插件 (+) 为 Claude Code 和 OpenCode 加入合规映射、文档审查和操作命令 除非你在受监管环境工作,否则仍偏小众
Backdoor 提供商代理 (+) 保留 Claude Code 的运行框架,同时切到更便宜、本地或其他提供商 早期设置负担较重,且受提供商兼容性约束
VS Code + Copilot + Power Automate files 工作流模式 (+) 能把编程环境变成全天候工作区,用来处理转录、日记、客户笔记和 subagents 目前更像一套自定义栈,而不是默认产品体验

整体满意度最高的场景,是工具能提升可移植性,或把真实工作流知识打包起来的时候;最低的场景,则是用量上限或计费倍率打断工作的时候。实际迁移模式,并不是从工具 A 干净切换到工具 B,而是路由和叠层:保留人们喜欢的运行框架、替换提供商、加一个语义索引、加一个领域插件,或接入一个被委派的智能体。竞争焦点正在从单纯的模型质量,向上下文、编排和价格控制上移。


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
OpenHands skill for Hermes @Teknium 让 Hermes 以一个可安装技能来编排 OpenHands 开发者希望用一个控制平面去委派另一个编程智能体,而不是把所有事都塞进同一闭环 Hermes Agent, OpenHands CLI, LiteLLM, Anthropic/OpenAI/DeepSeek/Qwen/Ollama/vLLM/Nous 已发布 推文
CodeGraph colbymchenry 面向多个智能体客户端的预索引语义代码知识图谱 减少代码库探索时的 token 浪费和工具调用蔓延 TypeScript, SQLite/FTS, MCP, Claude Code/Codex/Cursor/OpenCode/Hermes integrations 已发布 仓库
GRC Knowledge Plugin mlunato47 为 Claude Code 和 OpenCode 增加合规框架、映射和审查命令 通用编程智能体并不了解受监管文档和审计工作流 JavaScript plugin, 72+ reference files, 24 slash commands, Claude Code, OpenCode 已发布 仓库
Backdoor ajsai47 让 Claude Code 通过任意 OpenAI 兼容或本地提供商运行 团队想保留 Claude Code 的运行框架,但不想接受 Anthropic 单一价格或锁定 Python proxy, OpenAI-compatible APIs, DeepSeek, Groq, Ollama, OpenRouter, NVIDIA NIM Beta 仓库
Codex app-server support @tmsdnl 新近合并的远程 / app-server 工作流扩展能力 用户想让 Codex 与本地或远程服务层对话,而不是被困在单一 shell 流里 Codex, WebSockets, app-server status plumbing Alpha 推文

@Teknium 宣布 的 Hermes + OpenHands 技能,是一个真正可安装的工件,而不只是概念(58 次点赞、8 条回复、2,271 次浏览、47 次收藏)。附图展示了准确的安装命令、OpenHands 已支持的 flags,以及模型无关的后端列表,所以回复区才会立刻开始要求预设组合和更安全的默认值。

@pvergadia 重点提到 CodeGraph 在每周仓库榜单上的上升(1 次点赞、185 次浏览、5 次收藏);而仓库本身写得很直白:它要让 Claude Code、Codex CLI、Cursor、OpenCode 和 Hermes 更便宜、更轻,因为它给这些工具提供了一个预索引图谱,而不是逼它们反复读文件。@VivekIntel 分享 了 GRC Knowledge Plugin(3 次点赞、110 次浏览、3 次收藏);其 README 则把这种打包动作说得更明确:参考文件、slash commands 和框架映射,都被包在现有智能体外面。

榜单截图,显示 CodeGraph 位列本周 GitHub 增长最快仓库前列

GRC Knowledge Plugin 的 README 截图,列出面向 Claude Code 和 OpenCode 的合规框架、参考文件与命令

@Liz_Binance 指向 了 Backdoor,其 README 写道,它能把 Claude Code 重路由到 DeepSeek、Groq、OpenRouter、Ollama 和 NVIDIA NIM 等提供商(2 次点赞、2 条回复、806 次浏览)。@tmsdnl 又给出 了一个更小但很有代表性的例子:一个 Codex 功能请求在 10 小时 41 分钟内上线,截图里新的 app-server 流程已经跑通(2 次点赞、272 次浏览)。

Codex app-server 截图,展示快速从 issue 到合并后,本地 WebSocket 端点和状态输出已经可用

这 5 个例子背后反复出现的构建模式非常一致:如果你能让一个流行智能体更便宜、更懂领域、更容易路由,或更容易委派执行,就没有必要重新发明它。这也是为什么当天最强的项目,看起来像适配器、插件、图谱和编排技能,而不是新基础模型。


6. 新动态与亮点

搜索热度飙升的速度,可能快于广泛使用的扩散速度

@RealNickMugalli 认为,在 Opus 4.5 之后,Claude Code 的搜索热度一路垂直上升,而 Codex 则稍晚一步跟上;他附上了一张 Google US 的 AI 编程智能体搜索图表(2 次点赞、322 次浏览)。图表本身支持这个判断里较窄的部分:围绕 Claude Code 和 Codex 的关注度,在 2025 年末到 2026 年初明显加速。这件事之所以重要,是因为它与当天其他证据相吻合:虽然重度用户群仍然相对小,但规模已经大到足以把企业预算痛点暴露出来。

Google US 搜索趋势图,对比 2025 年 1 月至 2026 年 5 月间 Claude Code 与 OpenAI Codex 的热度

即便曝光不高的独立构建者,也开始晒出营收截图

@adensdk 声称,一个由 AI 构建的应用已经带来了超过 $13,000 的收入,并附上了一张 RevenueCat 截图,显示上一年收入为 $13,230(5 次点赞、3 条回复、284 次浏览、2 次收藏)。帖子没有披露技术栈,这个数字也是自报,因此应谨慎看待。但它仍然重要,因为它构成了一个反向信号:就在企业抱怨 token 预算的同一天,小体量构建者账号仍在晒出变现证明点。

RevenueCat 截图,展示一个自称由 AI 构建的应用在上一年取得了 $13,230 收入


7. 机会在哪里

[+++] 预算感知路由、配额预测和突发定价 — 第 1 节显示,Microsoft 和 GitHub 的决策都开始围绕支出上限转弯;第 2 节则展示了即便 Google 推出 Flash Low,Antigravity 用户仍会在任务中途被卡住。Backdoor 已经是构建者给出的回应,而这通常说明痛点既真实又紧迫。

[++] 可迁移的工作流包与记忆层 — 第 1.2 节和第 3 节都在说明:规则、提示词文件、技能、subagents 和持久工作区,正在变成高于任何单个模型之上的耐久资产。这个机会强度中等,因为一方产品已经交付了部分能力,但跨工具版本仍然是开放地带。

[++] 现有运行框架的专用插件 — 第 5 节里最强的构建者例子是 CodeGraph、GRC Knowledge Plugin 和 Backdoor。这 3 个项目的共同点,都是围绕既有智能体提供更窄但更有力的增益,而不是试图彻底替换它,因此这看起来更像一个可信的产品类别,而不是一次性 hack。

[+] AI 工具话语的验证与纠偏层 — 第 2 节展示了头条叙事和宣传式设置帖有多快就需要纠错。这个机会还在涌现,因为现在读者已经在靠 Community Notes、截图和源链接手工做这项工作。


8. 要点总结

  1. 企业支出正在开始主导工具选择。 Microsoft 的 Experiences + Devices 团队正在逐步取消大多数 Claude Code 许可证,并计划在 6 月底前把许多开发者导向 Copilot CLI,这让成本和组织内部杠杆都成了产品决策的一部分。(source)
  2. 更便宜的模型档位,并不能单独解决配额焦虑。 Flash Low 带着节省 45% token 的宣传上线,但用户仍在晒出只做了基础工作就触发高流量和 0 剩余额度的截图。(source)
  3. 更耐久的层,正在移动到模型之上。 Hermes + OpenHands 的编排、Microsoft Build 对规则和技能的强调,以及面向知识工作的 Copilot 设置,都把工作流文件、技能和记忆当成了真正的长期优势。(source)
  4. 构建者正在靠适配层赢。 CodeGraph、GRC Knowledge Plugin、Backdoor,以及 Codex 的 app-server 变更,都在既有智能体周围增加杠杆,而不是试图正面替代它们。(source)
  5. 注意力和收益仍然高度集中。 一张 Google 搜索趋势图显示,Claude Code 和 Codex 的关注度正在快速上升;与此同时,就在企业抱怨成本的同一天,小体量构建者账号仍在晒出自报营收截图。(source)