跳转至

Reddit AI 编程 - 2026-04-30

1. 人们在讨论什么

1.1 Copilot 出走加速:取消订阅、成本数据和目的地 stack(🡕)

从 GitHub Copilot 的迁移已经从规划进入执行。今天出现了多条取消订阅帖:u/VRRifter 发布 Thank You Github Copilot, Just cancelled(131 分,60 条评论),自称“Microsofty”,却“惊讶于用 Codex 和 Gemini 做实验竟然这么容易”。u/Banneder 发布 Cancelled my subscription - Moving on(53 分,57 条评论),称这是“AI inflation and enshittification”。u/chinmay06 在使用 1.2 年后取消订阅(16 分,23 条评论)。

具体成本分析也来了。u/PanAchy 更新了 copilot-arewecooked(63 分,50 条评论),这是一个本地工具,可估算 6 月 1 日计费影响。某用户报告显示,Pro 方案的 overage 达 4,186%——月配额 1,000 credits,却消耗 125,597 credits。u/jonnywhatshisface 拆解了新定价数学(77 分,83 条评论),u/YouExpress [score 101] 回应:“你基本上只是拿到不会滚存到下个月的 10$ 或 39$ API credits。一个 Claude opus 4.7 prompt 最少就会吃掉 6-10$ credits。”

copilot-arewecooked 报告显示 Pro 方案 4186% overage

u/vapalera 发布了完整的订阅排名(254 分,125 条评论),把 Codex Pro 5x($100/月)排第 1,MiniMax Starter($9/月)排第 2,Gemini Pro($19.99/月)排第 3。u/popiazaza 发了一张讽刺性的对比表(91 分),指出 Copilot “表里红色最多。所以你应该继续用 Github Copilot,给 Microsoft 带来好运”。

讨论要点: 社区已经就替代方案达成共识。u/Scarity [score 35] 给出坦诚告别:“为了测试,我切到 openrouter 做了几个任务,账单高出 20 到 30 倍。我之前根本没意识到我们有多舒服。”与此同时,u/ri90a [score 24] 指出 GHCP “已经封锁新注册一段时间了。所以我不认为‘失去客户’是他们主要担心的事。”

与前日对比: 昨天的迁移规划里,OpenCode Go 和 DeepSeek 刚成为目的地。今天这些目的地固化成主要推荐,取消订阅帖增多,并出现首批定量 overage 数据(Pro 上 4,186%)。


1.2 Claude 可靠性危机:故障、限制和 HERMES.md 计费 bug(🡕)

Claude 故障和限制耗尽今天在 r/ClaudeCode 上由重叠讨论主导。u/theisafos 发布 How not to run an ai company(575 分,120 条评论):“这已经像是本周第 5 次了,而且今天才周三。”配图状态页显示所有服务 Major Outage,90 天 uptime 在 98.69% 到 99.88% 之间。

Anthropic 状态页显示所有服务反复故障

u/MindCluster 发布 Claude Down for Anyone Else?(207 分,140 条评论)。u/Repulsive_Horse6865If Mythos is so powerful... why does Claude keep going down?(76 分,81 条评论),u/STANAGs [score 24] 回应:“他们为什么不把整架飞机都做成黑匣子?!”

限制耗尽进一步放大了问题。u/onepunchcode 发布 Ok, now what!?(148 分,231 条评论),u/1inAm1llion [score 20] 坦白:“我这个月花了 $1,420 的 API credits。救救我。”u/Pecolps 报告更快撞到 weekly limit(28 分,35 条评论),发现 Claude Code 2.1.119+ 会在 background agents 上消耗“远超应有数量”的 token。

Claude Max 20x 用量显示 weekly limit 100%,额外用量 $192.75

HERMES.md 计费 bug 成为当天最令人担忧的技术故事。u/AutomatonSwan 详细说明一个包含“HERMES.md”的 git commit message 如何静默扣掉 $200(205 分,73 条评论)。服务端内容过滤器匹配该字符串后,把 API 请求从方案配额重路由到单独的 extra billing pool。u/jimmytoan 发了后续分析(49 分,33 条评论):“Anthropic 之外没人知道还有哪些字符串会触发同样的路由行为。”u/tom_mathews [score 56]:“一家提供 state of the art model intelligence 的公司……竟然想不出比非常基础的 regex matching 更好的方案,这感觉很怪。”

讨论要点: u/ant3k [score 151] 给出反向观点:“这正是很多颠覆式科技公司早期多年运行的方式。古老的 go fast and break things。”但 HERMES.md bug——开发者 commit message 的内容会影响计费正确性——和容量问题在性质上完全不同。

与前日对比: 昨天可靠性还是背景抱怨。今天它升级了:三个同时出现的故障帖、一个新发现的 billing-via-regex bug,以及近期 Claude Code 版本会加速 background agents token 消耗的证据。


1.3 Opus 4.7 质量投诉推动 Codex 迁移(🡕)

对 Opus 4.7 的质量投诉加剧,并伴随明确迁移声明。u/MuttMundane 发布 Opus 4.7 Complete dogshit quality. I'm fucking out(93 分,98 条评论):“这个模型已经没有脑子了。它不会做 git 操作,甚至不承认用户 prompt。”u/NiceZerg 发布 Ok, that's it -- I'm switching to Codex(46 分,81 条评论):“感觉每天都在退化。”

u/Previous-Pride6335 [score 46] 给出当天最好的比喻:“opus 像一个出色工人,但慢慢开始上班喝酒。”u/rxmarcus [score 34] 确认迁移结果:“我只能说我搬到 codex 了,体验出乎意料更好……用 opus 时我 30 到 45 分钟就会撞到 [limits]。”

u/Danieboy 记录了每天使用 Opus 4.7(xHigh)(57 分,8 条评论),展示模型忽略指令,被纠正后说“你这么指出来是对的”,然后又忽略修正的模式。u/Fair-Average5139 报告 Opus 4.6 available again in Claude Code(102 分,29 条评论),u/m-in [score 7] 确认:“刚试了 4.6,daaaamm boy,它回来了!表现就像 2 个月前那样。”

讨论要点: u/sundevil21CS [score 22] 表示怀疑:“到这一步,我觉得 OpenAI 可能雇人在这个 sub 里 bash Claude code、吹 codex。”u/SomeOrdinaryKangaroo [score 7] 警告:“笑话在你身上,Codex 一两个月后也会变烂,等着吧。”

与前日对比: 昨天规则遵循是 Opus 4.7 的主导投诉。今天投诉扩展到基本能力(git 操作、承认 prompt),用户不只是抱怨,而是在主动取消。Codex 迁移路径现在有了具体证词。


1.4 AI 编程经济学:补贴、初级开发者和未来定价(NEW)

围绕 AI 辅助开发经济学的新主题出现。u/divBit0 发布 Codex is insanely subsidized: $528 of usage less than a week(134 分,76 条评论),分享 dashboard,显示 $200 方案产生了 $528 的“virtual spend”。u/philanthropologist2 [score 123] 反驳:“按 OpenAI 的说法是 $528 worth of usage。他们并不是真的在你身上亏 $328。他们把自己的 tool calls 标成 $528。”

Codex 用量 dashboard 显示 $200 方案上的 $528 virtual spend

u/Complete-Sea6655 发布 Did we just reinvent junior devs again(583 分,53 条评论),引用一条病毒式 tweet:“我们雇了一个初级开发者来写简单代码,这样就不用为那些基础/原始任务花一大堆 token 钱。”回复是:“太好了,所以我们现在靠重新发明员工来优化 LLM 成本。Full circle innovation。”u/goship-tech [score 78] 反驳:“初级和高级的差距主要是生产事故留下的伤疤。LLM 不会积累这种东西。”

关于雇初级开发者节省 token 成本的 tweet

u/LiminalRnyx 预测 2027 年会出现 $1000/$2000 AI 订阅(46 分,116 条评论)。u/miscfiles [score 6] 分享企业视角:“我老板说‘我们把 Copilot 当作 headcount,所以即使一年花 $25k,也可以说它创造的价值远超一个 $25k 新人。’”u/Fun_Squirrel5446 [score 67] 预测未来分裂:“花 $1,000 用美国模型,或者花 $100 获得中国模型 80% 的性能。”

讨论要点: “Full circle innovation”——公司雇人来省 AI 成本——标志着一个潜在拐点。token 成本已经高到公司开始做人力与 token 的成本比较,而且在某些任务类别上,人类赢了。

与前日对比: 昨天经济讨论聚焦迁移细节。今天它扩大到结构性问题:补贴可持续性、人类与 AI 成本交叉点,以及当前定价是否只是临时促销阶段。


1.5 DeepSeek V4 和中国模型:价格优势被确认(🡒)

中国模型的价格优势从传闻变成了文档化证据。u/cidara 发布 DeepSeek pricing is honestly insane(21 分,13 条评论),配有价格对比表,显示 DeepSeek V4 Flash 每 1M input/output tokens 为 $0.14/$0.28,而 Claude Opus 4.7 为 $5.00/$25.00——差距达到 35-90x。

模型定价对比显示 DeepSeek V4 Flash 只需 Claude/GPT 成本的一小部分

u/RagnarSkywalker 发布 OpenCode GO + Deepseek V4 Pro/flash and stop stressing out(233 分,27 条评论),总结情绪:“我们不是他们真正的客户,只是 beta testers。”u/RevolutionaryGrape50 [score 34] 直接给出模型排名:“Opus 4.5 不如 deepseek v4 pro,后者又不如 opus 4.6。Sonnet 4.5 不如 deepseek v4 flash,后者又不如 sonnet 4.6。”

u/Uditakhourii 报告本地 Gemma4+OpenClaude setup 达到约 70% 效率(82 分,95 条评论),但社区对指标表示怀疑——u/gordonnowak [score 58]:“‘70% 效率’到底他妈是什么意思?”

讨论要点: u/billwharton [score 73] 概括了张力:“每月 $100 用 ai 对我来说太离谱。中国模型只差一点点。”正在结晶的实际 stack 是:中国模型(DeepSeek V4、MiniMax、Kimi K2.6)用于大批量工作,西方前沿模型保留给架构决策。

与前日对比: 昨天中国模型有 $2/天成本数据,已经是活跃迁移目标。今天定价对比变得可视化且完整,DeepSeek V4 Flash 被确认每 token 比 Opus 4.7 便宜 35x。


1.6 Vibe Coding:已发布产品与墓地(🡒)

按分数最高的帖子是 u/Purple_Homework_2280The ultimate dilemma(1345 分,112 条评论)——一个关于是付 $24.99 买 app,还是花 $200/月 vibe code 一个的梗。u/yam-bam-13 [score 48] 点出经济学:“我很愿意为 app 付 $79,问题是大多数 app 要你余生每年都付 $79。我宁愿一次性 vibe code 那个 $200 的。SAAS 毁了很多东西。”

已发布项目提供了实质内容。u/Ieocoout 分享了一个水豚送餐游戏(191 分,40 条评论),完全用 Claude Code、ThreeJS、Suno、ElevenLabs 和 Tripo3D 为 VibeJam 构建。项目包含一个由 Claude 构建的自定义 cinematic editor。u/schiehll 花 3 周做了 Pawnfall,一款 chess roguelike(94 分,35 条评论)——“这是我做过的第一个从未看过一行代码的项目。”u/methionine048 小时内获得 130+ 下载(78 分,68 条评论)。u/New_Consequence3669 在 Steam 上发布了游戏(32 分,54 条评论),支持 7 种语言,全部由 Claude 本地化。

Claude Code 构建的水豚游戏 cinematic editor

反面力量是:u/Tight-Platform-8432 发布 The vibe coded graveyard is getting out of hand(45 分,49 条评论)。u/xRmg [score 25] 反驳:“当然 99.999% 都是没用的 slop,但想法背后至少有一个人,而不是公司。”u/papa_papa6-9 发布 Drop your vibe code app: I could be your first paying user(52 分,163 条评论),引出一串真实产品。

讨论要点: 昨天的 CSR 不可见问题仍在延续。u/Reasonable_Use_8915 继续推广 SSR/SSG 修复(52 分,46 条评论),u/InterestingFrame1982 [score 70] 指出:“兄弟们,你们大概晚了十年……这就是 NextJS 被创造出来的原因。”

与前日对比: 昨天梗文化主导(前 5 个帖子全是)。今天组合更丰富:最高分梗达到 1345 分,但具体已发布产品(VibeJam 游戏、Steam 发布、带下载量的 app)证明经验开发者群体还在持续拉开差距。


1.7 Token 优化:生态突然爆发(NEW)

一份庞大的 token 节省工具汇总,表明新的基础设施层开始成形。u/chimp73 发布 What are ways to save tokens?(34 分,19 条评论),列出 25+ 个开源工具,包括 RTK(60-90% token 消耗降低)、Context Mode(借助 SQLite sandboxing 把 context 消耗降低 98%)、code-review-graph(Tree-sitter knowledge graphs)、caveman(强制简短输出,减少 65-75% 输出)等等。

u/Deep_Structure2023 发布 Six layers that turned my Claude Code into a 24/7 dev team(72 分,22 条评论),详细介绍了一个 $20/月 Pro 上的生产配置:CLAUDE.md 约定、基于 Obsidian 的持久记忆、Trail of Bits 的安全 skills、角色分离 subagents(architect/coder/reviewer/tester/ops)、57 个带 hooks 的自定义 slash commands,以及用 claude-squad 做并行智能体编排。

讨论要点: token 优化生态已经从少数工具增长成一个完整类别。需求驱动很清楚:当 flat-rate 定价消失,每个浪费的 token 都有美元成本。最复杂的配置结合了上下文压缩、持久记忆和角色分离,才能待在不断缩小的配额内。

与前日对比: 昨天 token 优化还隐含在多模型策略中。今天它变成一个明确、文档化的基础设施层,拥有几十个专用工具。


1.8 快乐/倦怠分裂持续存在(🡒)

u/No-Difficulty733 的帖子 I don't have fun using AI writing code for me(33 分,54 条评论)继续引发共鸣。u/MariaCassandra [score 12]:“我是自闭症谱系,对我来说编程从来不是为了 shipping……我感觉自己像个沮丧的经理,而不是创造者……软件工程对我来说几乎已经死了。”u/goship-tech [score 4] 重申 spec-first 方法:“自己写测试和验收标准,让 AI 写代码。”

u/Exotic-Anteater-4417 发布了一个讽刺性工具切换公告(38 分,21 条评论):“我要从穿长裤改成穿短裤了”——模仿不断出现的迁移帖,还承诺 6 小时后给出“thermal comfort analysis”。mod note 承认了其中的元评论。

讨论要点: 倦怠模式和迁移疲劳彼此相连。开发者被夹在退化的工具、上涨的价格和剥夺手艺满足的工作方式之间。这个讽刺帖抓住了社区对持续变化的疲惫。

与前日对比: 这个主题昨天作为新的情绪维度出现。今天它以更深个人证词和关于迁移疲劳的元评论继续存在。


2. 令人困扰的问题

Claude 故障和状态页不诚实

最急迫的挫败是:Claude 在工作时间宕机,而状态页显示绿色。u/mystery_hobo [score 5]:“有意思的是他们链接到的状态页仍显示所有域名 operational。”u/illustrious_wang [score 7]:“我他妈受够这破服务了。它他妈天天都在宕机。” 状态页截图显示 90 天 uptime 为 98.69-99.88%,但日常中断让这些数字显得误导。严重程度:Critical -- 支付 $200/月的用户无法工作。(帖子 1帖子 2)

HERMES.md 静默计费重路由

包含“HERMES.md”的 git commit message 让所有 API 请求从方案配额转入额外计费池,未警告就扣掉 $200。Anthropic 最初拒绝退款。u/Tough-Difference3171 [score 3]:“本应确定性的系统部分,为什么要依赖任何 prompt、文件或内容?这是计费。别把 AI 放进去。”只有在 Hacker News 上爆火后问题才被解决。严重程度:Critical -- 计费正确性绝不该依赖用户内容。(帖子 1帖子 2)

token 消耗无解释加速

Max 20x 用户报告比以前更快撞到 weekly limits。u/Pecolps 发现 Claude Code 从 2.1.119+ 回滚到 2.1.116 后,过度 weekly usage 消耗停止。新版本似乎在 background agent 操作中消耗显著更多 token。u/Fickle-Exit1203 [score 3]:“我用了 $100 方案 2 个月,但最近没做什么严肃工作就用完了。”u/depresso-expressoo 发帖称用量烧得比以前快得多(12 分,23 条评论)。严重程度:High -- 用户无法信任自己的消耗数据。(帖子 1帖子 2)

跨平台 agent 破坏性行为

u/samandeg 报告 Cursor agent 陷入循环,两小时花掉 $2,000(38 分,26 条评论)。向 Cursor field engineer 求助时,“他直接跳过了我的问题。”Cursor 拒绝退款。u/Straight-Age29 记录 Composer 2 破坏性使用 git checkout(35 分,29 条评论)。u/gregory1111 报告 Antigravity 删除整个项目(31 分,32 条评论),原因是把“project”和“script”混淆。严重程度:High -- 覆盖 Claude、Cursor 和 Antigravity。(帖子 1帖子 2帖子 3)


3. 人们期望的功能

统一的跨提供商用量 dashboard

开发者现在同时跨 3-5 个订阅使用 Claude、Codex、OpenCode Go、DeepSeek 和 Gemini,但没有工具聚合实时花费。u/CheesecakeOk1301 为 Antigravity 构建了 AG Multi-Account Switchboard(28 分,35 条评论),u/PanAchy 为 Copilot 构建了 copilot-arewecooked,但没有跨平台方案。u/MurkyFlan567 做了一个开源 Copilot token cost tracker(21 分,14 条评论)。需求明确且正在增长。(帖子 1帖子 2)

Agent 循环保护和成本上限

u/samandeg 的 $2,000 Cursor 事件暴露了自动成本上限的缺位。没有主流 AI 编程工具提供可配置的每 session 或每小时花费限制来中止执行。AWS 曾为类似循环事件退款;Cursor 没有。用户想要能在成本失控前停止 agent 的“circuit breakers”。(帖子)

稳定、不回退的模型

这个需求延续自昨天。u/NiceZerg:“我之前用 4.5(以及部分 4.6)一路顺畅。然后 4.7 来了……事情一直变糟。”u/No-Replacement-2631 [score 22]:“benchmarks 会告诉你 4.7 略微好一点点。但真实日常编码里,4.6 更强。”用户想要带保证的版本固定:固定版本不会被静默修改。(帖子 1帖子 2)

发展中国家定价档位

u/Meraath 发布 Developing countries got priced out(9 分,31 条评论)。当前定价让高收入市场之外的 AI 编程变得不可及。没有主要提供商提供 PPP 调整方案。中国模型提供商通过较低绝对价格部分填补缺口,但订阅式工具仍按美国/欧盟市场定价。(帖子)


4. 使用中的工具与方法

工具 类别 评价 优势 局限
Claude Code (Opus 4.7) AI 编程智能体 强烈负面 Extended thinking;工作时 review 彻底 忽略规则;不会做 git ops;吃 token;频繁故障;HERMES.md 计费 bug
Claude Code (Opus 4.6) AI 编程智能体 正面(需求上升) 规则遵循更好;恢复到模型选择器;“像 2 个月前那样工作” 可能被量化;仍受故障和限制影响
Codex (GPT 5.5) AI 编程智能体 正面上升 指令遵循更好;更难撞限制;据 u/vapalera 称“one shots almost everything” 据 u/ipilotete 称外科手术式编辑较弱
OpenCode Go 替代平台 强烈正面 $10/月;GLM 5.1 + Kimi K2.6 + DeepSeek V4;干净 CLI 额度烧得快;UX 不够熟悉
DeepSeek V4 Flash 开放模型 强烈正面 $0.14/1M input tokens;“VERY CAPABLE”;用户称强于 Sonnet 4.5 75% 促销折扣将结束;创意/规划能力较弱
DeepSeek V4 Pro 开放模型 正面 用户报告接近 Opus 4.6 质量;$1.74/1M input 促销定价临时;有 100k 以上上下文不稳定报告
GitHub Copilot IDE 集成 强烈负面 无限 tab autocompletions;熟悉 UX Credits 每月过期;Pro 方案可能 4186% overage;已阻止新注册
Cursor (Composer 2) IDE 负面居多 熟悉 UX;subagent 架构 $2000 循环事件;破坏性 git checkout;无退款政策
Google Antigravity IDE 混合但改善 “最近几天明显更好”;Ultra 方案稳定性改善 项目删除风险;rate limiting;多账号工具可能有 ToS 问题
MiniMax M2.7 中国模型 正面 $9/月 starter;每 5 小时约 1500 次请求;工具调用扎实 不是最聪明的模型
GLM 5.1 中国模型 正面 接近 Claude/GPT 推理;很有价值的 OpenCode Go 选项 有 100k 以上上下文不稳定报告
Gemini 3.1 Pro Google 模型 谨慎正面 Antigravity 无 weekly cap;单独 CLI/Code Assist limits 未达 GPT 水平;有免费方案
copilot-arewecooked 成本估算 正面 本地分析 session logs;估算 6 月 1 日影响 VS Code input tokens 是估算;部分 session 覆盖有缺口
RTK (Rust Token Killer) token 优化 正面 终端输出减少 60-90% token;兼容多个 agents 新项目;自行承担风险

5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
Capybara Food Driver u/Ieocoout 带自定义 cinematic editor 的 3D 送餐游戏 VibeJam 2026 参赛作品 Claude Code, ThreeJS, Suno, ElevenLabs, Tripo3D Shipped Play
Pawnfall u/schiehll 带 bullet hell 机制的 chess roguelike VibeJam 提交;零代码阅读 Codex, Claude Code, Cursor, Tripo3D, Mixamo, Suno Shipped Play
SatoshiGuesser u/jmprog 浏览器版 Bitcoin private key guessing “slot machine” 教育性加密演示(概率 1 / 5.27x10^72) Vite, noble/secp256k1, Cloudflare Shipped GitHub
copilot-arewecooked u/PanAchy 从本地 session logs 估算 Copilot AI credit 成本 没有官方 6 月前成本估算 Local, reads VS Code/CLI logs Shipped, open source GitHub
AG Multi-Account Switchboard u/CheesecakeOk1301 Antigravity 的多账号切换、上下文窗口分析和用量跟踪 管理多个 Google 账号和 token 预算 VS Code extension, OAuth Shipped, open source GitHub
Spellmaxxing u/Luminaryg 竞技多人 spelling bee 游戏 有趣的多人文字游戏 Opus 4.6, Cursor, Cloudflare Workers, Supabase, ElevenLabs Shipped Play
Steam roguelite u/New_Consequence3669 2D bullet hell roguelite,支持 7 种语言 Solo dev 借助 AI 交付完整游戏 Claude Code (split planning/implementation) Shipped on Steam Steam
SafeSend u/FileEfficient6355 AI prompts 的本地 PII 清洗器;贡献者加入 Web Workers、virtual scrolling 敏感数据泄露到 AI prompts Browser-only, Web Workers Shipped, v1.1 Site
Six-layer Claude setup u/Deep_Structure2023 CLAUDE.md + Obsidian memory + skills + subagents + hooks + claude-squad 编排 把 $20/月 Pro 方案跑成 24/7 dev team Claude Code, Obsidian, claude-squad, tmux Production 帖子
Startup (unnamed) u/Happy_Macaron5197 “两个傻子”做出的盈利 startup 证明非技术创始人能 ship Cursor, Runable Profitable 帖子
Streaming site u/PhuduShaheer 带推荐引擎和进度同步的多页 streaming site 跨设备个人 streaming Vanilla HTML/CSS/JS, TMDB API, Firebase, Supabase Shipped 帖子
MGuide u/KhoslasBiggestOpp 大学校园地图 改善 U of Michigan 导航 Vibe coded Shipped, press coverage Site

6. 新动态与亮点

HERMES.md:计费依赖 commit message 内容

Anthropic 的服务端内容过滤器匹配了 git commit history 中的“HERMES.md”字符串(包含在 Claude Code system prompt 里),并静默把 API 计费从方案配额重路由到额外用量。这个 bug 在 Max 方案还有 86% 配额未用时扣掉 $200。Anthropic 最初拒绝退款;在 Hacker News 爆火后反转。大小写敏感匹配(hermes.md 和 AGENTS.md 都没问题)显示这可能是仓促写出的过滤器,也许用于防止 Hermes jailbreak 滥用。重要性:确定性计费绝不应该依赖 AI 解释的用户内容。(帖子GitHub issue)

公司雇初级开发者来节省 token

一条病毒式 tweet(497 retweets,11K likes,820K views)写道:“我们雇了一个初级开发者来写简单代码,这样就不用为那些基础/原始任务花一大堆 token 钱。”回应——“所以我们现在靠重新发明员工来优化 LLM 成本。Full circle innovation”——抓住了当前成本动态的荒诞。这是人类-AI 成本交叉的第一批具体证据:对简单重复任务来说,初级开发者比前沿模型 token 更便宜。(帖子)

Copilot code review 从 6 月 1 日开始消耗 Actions minutes

u/AmblemYagami 分享了 GitHub Changelog 公告(57 分,16 条评论):此前免费的 Copilot code review 将从 2026 年 6 月 1 日开始消耗 GitHub Actions minutes。这给计费转换增加第二个成本向量,对使用 Copilot 做自动 PR review 的团队来说,会叠加 credit-based 定价变化。(帖子)

Claude Code 2.1.119+ 静默增加 background token 消耗

u/Pecolps 发现,从 Claude Code 2.1.119+ 回滚到 2.1.116 后,过度 weekly usage 消耗停止。新版似乎在 background agent 操作中消耗明显更多 token。changelog 没有记录这个变化。更新后感觉 limit 更快耗尽的用户,现在有了一个具体缓解办法。(帖子)


7. 机会在哪里

[+++] 跨提供商成本聚合和告警 -- 开发者现在经常跨 3-5 个提供商。u/PanAchy 做了单平台估算,u/CheesecakeOk1301 做了单平台分析,u/MurkyFlan567 做了单平台跟踪。没人聚合所有平台。$2,000 Cursor 循环事件证明实时成本告警有必要。token 优化工具列表(25+ 项目)说明生态还处在 pre-revenue 且碎片化阶段。

[+++] Agent 成本上限和 circuit breakers -- u/samandeg 的 $2,000 循环、HERMES.md 的 $200 扣费、u/1inAm1llion 的 $1,420 月花费,都指向缺失的安全护栏。一个 middleware 层,能跨任何 AI 编程智能体强制每 session、每小时、每天花费限制,将解决一个紧急、痛苦且有记录的需求。

[++] 带护栏的中国模型预算 AI 编程平台 -- OpenCode Go 以 $10/月成为最常被提到的迁移路径,但缺少成本控制和 agent 安全。一个把中国模型访问(DeepSeek V4、MiniMax、Kimi K2.6、GLM 5.1)与花费限制、循环检测、用量分析结合的平台,可以接住 Copilot 出走潮。u/Fun_Squirrel5446 [score 67] 明确说出需求:“中国模型用 $100 提供 80% 性能。”

[++] Token 优化 middleware -- u/chimp73 列出的 25+ 工具体系碎片化且大多单一用途。一个统一上下文管理层,处理压缩、缓存、记忆持久化和工具输出过滤,可以整合 RTK、Context Mode、caveman 等工具的需求。

[+] 发展中国家 AI 编程访问 -- u/Meraath 发帖说自己被定价排除在外。PPP 调整方案或面向非美国市场、以中国模型优先的平台,可以服务一个巨大且未被充分服务的人群。MiniMax $9/月最接近,但缺少工具集成。


8. 要点总结

  1. Copilot 出走已经进入执行阶段,并有量化影响。 copilot-arewecooked 数据显示,一个 Pro 用户 overage 达 4,186%。今天出现多条取消订阅帖,并给出具体替代 stack。新注册被阻止,说明 GitHub 更关注容量管理而非留存。(帖子)

  2. Claude 可靠性有三种相互叠加的失败模式:故障、计费 bug 和静默消耗增加。 HERMES.md 计费重路由、2.1.119+ background token 消耗,以及所有服务反复“Major Outage”,共同造成了一个不能只用定价解释的信任赤字。(帖子 1帖子 2)

  3. Opus 4.7 投诉已经从挫败转向迁移。 用户不只是抱怨——他们在取消订阅,并发布 Codex 对比证词。4.6 恢复验证了回退,但没有解决问题。(帖子)

  4. 简单任务上的人类-AI 成本交叉已经出现。 公司正在雇初级开发者,以避免在基础/原始任务上支付 token 成本。Opus 4.7 每 1M tokens $5.00/$25.00,而 DeepSeek V4 Flash 只要 $0.14/$0.28,这种价格差强烈激励模型套利,甚至重新招聘。(帖子)

  5. Token 优化已经成为独立生态。 现在有 25+ 个开源工具用于上下文压缩、记忆持久化和消耗监控。最复杂的配置用六层架构跑在 $20/月方案上。随着 flat-rate 定价消失,这个类别会继续增长。(帖子)

  6. Vibe-coded 游戏是最强产品类别。 今天发布了三款 VibeJam 作品和一个 Steam release,社区反馈都很正面。游戏能利用 AI 在样板生成上的优势,同时把设计决策留给人。graveyard 担忧主要适用于 SaaS clone。(帖子 1帖子 2)

  7. Agent 安全失败横跨所有主要平台。 同一天出现了 $2,000 Cursor 循环、Composer 2 破坏性 git checkout、Antigravity 项目删除和 HERMES.md 计费扣费,分别发生在不同平台。没有平台为自主 agent 操作提供足够护栏。(帖子 1帖子 2)