Reddit AI 编程 - 2026-05-21¶

1. 人们在讨论什么¶

1.1 Antigravity 2.0 的配额经济学取代了上线话题，而 Google 用 3x 缓解回应，但没让所有人满意 (🡕)¶

5 月 21 日的主导话题已经不是 Antigravity 2.0 的新 UI 或缺失的 IDE——那场争论前一天基本已经告一段落。新的讨论重心变成了配额经济学：Gemini 3.5 Flash 烧 token 有多快、相较旧版 Gemini 3 Flash 每百万 token 的成本是多少，以及 Google 紧急给出的 3x 配额提升到底够不够。

根因被 u/tadanada 在《Here's why gemini 3.5 flash burn token so fast, it's actually more expensive than 3.1 pro》里量化地说明了 (168 分，60 条评论)。该帖引用了 Google 自己的 Gemini API 定价页，并在一张成本图上做了标注：Gemini 3.5 Flash 每次基准测试运行要 $1,552，而 Gemini 3 Flash 只要 $278——5.6x 的成本差解释了为什么付费套餐会在一个下午内耗尽。

Artificial Analysis 成本图，标注显示 Gemini 3.5 Flash 每次基准测试运行成本为 $1,552，而 Gemini 3 Flash 为 $278，箭头突出显示两者的成本差距

u/nomadtracker 在《Bring back Gemini 3 flash》中抓住了核心挫败感 (330 分，131 条评论)：一套以 Flash 3 作为无限低成本执行层搭起来的工作流，如今已经死了。u/Abelius75（得分 59）说，自己在 Flash 3.5 Medium 里只做了 8 次简单的 UI 调整提示，就烧掉每周配额的 60%，随后取消了订阅。u/CapitalPristine3971（得分 54）说，自己买的是年度 Pro 套餐，并要求把 Flash 3 带回来。

u/ackadamius 在《Antigravity Gemini 3.5 Flash is 6x more expensive than 3.1》中指出了这个缺口 (41 分，8 条评论)：Antigravity 自己的文档里仍把 Gemini 3 Flash 列为可用的推理模型，但真实产品里已经没有这个选项。

Antigravity 文档列出了包括 Gemini 3 Flash 在内的可用模型，但在 2.0 更新后的真实产品中这一选项已经消失

多位用户还用截图把配额耗尽这件事直观地记录了下来。u/PinkySwearNotABot 的《Gemini 3.5 Flash is amazing (speed, quality) with the new Antigravity CLI but...》 (231 分，106 条评论) 展示了短时间使用后的配额仪表盘：所有 Gemini 模型（Flash High、Flash Medium、3.1 Pro High、3.1 Pro Low）都只剩 20%，并出现了“已达到个人配额”警告；而 Claude Sonnet 4.6、Claude Opus 4.6 和 GPT-OSS 120B 仍都是 100%。

Antigravity CLI 配额面板显示所有 Gemini 模型都只剩 20%，并出现“已达到个人配额，4h23m 后重置”的警告；Claude 和 GPT-OSS 模型仍为 100%

u/Substantial_Rate_772 的《Either revert the 2.0 Update or let us choose 3.1 flash again》 (52 分，10 条评论) 展示了更进一步的后果：所有 Gemini 配额都要到 6 天 18 小时后才刷新，而 Claude 和 GPT-OSS 仍然可用。

Antigravity 模型配额面板中，所有 Gemini 模型都显示“6 天 18 小时后刷新”且进度条几乎见底，而 Claude Sonnet 4.6、Claude Opus 4.6 和 GPT-OSS 120B 显示“53 分钟后刷新”

Google 在 5 月 21 日做出了回应。u/aunchable 的《3x More Gemini for Antigravity Users》 (448 分，201 条评论) 宣布所有付费档位都会整包重置配额，并把额度统一提升 3x。u/Final_Initial 又在《3X usage for Gemini models for all AI Plus, Pro, and Ultra users. Forever.》 (407 分，108 条评论) 中贴出了 CEO Varun Mohan 的那条推文，其中还有一句后续说明：“如果还不够清楚的话，这个 3x 是永久的。”

Varun Mohan（@_mohansolo）于 2026 年 5 月 21 日发布的推文截图，确认 Gemini 配额提升 3x 并且重置将“永久”生效，获得 148 个赞和 15K 次浏览

应用内如何交付这次 3x 提升，也被 u/dtswk 在《I'm finding the new AG 2.0 and Flash 3.5 pretty good as a novice》中记录了下来 (47 分，28 条评论)：一条横幅写着“配额已提升——如果你使用付费套餐，本周的 Gemini 配额已重置，并在后续提升 3x。继续构建吧！”

Antigravity 应用内通知横幅写着“配额已提升——如果你使用付费套餐，本周的 Gemini 配额已重置，并在后续提升 3x。继续构建吧！”

社区的接受度依旧很怀疑。u/DocumentFun9077（得分 51）回复说：“哦，那这样一来，一整周也就只够 3 条 opus 提示了。”u/KeyboardPolitics_Man（得分 47）说：“3x，但还是比 5.17 少。”u/tadanada（得分 32）则认为，没有 Gemini 3 Flash 之后，Pro 套餐（$20）已经失去了相较其他提供商最核心的竞争优势。

一个部分权宜方案也浮现出来了：u/JhonDoe191ee 的《gemini-3-flash from the most hated to the most wanted》 (29 分，12 条评论) 显示，TAU v0.8.6 CLI 工具里仍然把 gemini-3-flash 列为可选的 Antigravity 模型，即便它已经从网页 UI 中被移除。

TAU v0.8.6 CLI 的 /models 输出列出了所有 Antigravity 模型，其中 gemini-3-flash 以可选项形式高亮显示，尽管它已从 Antigravity GUI 中移除

基准测试数据也证明了模型本身其实没问题。u/pebblepath 的《Major LLM benchmarks, including the new Gemini 3.5 Flash》 (12 分，8 条评论) 分享了 DeepMind 自己的评测表：Gemini 3.5 Flash 在 MCP Atlas（83.6%）、Finance Agent v2（57.9%）、CharXiv Reasoning（84.2%）和 MMMU-Pro（83.6%）上领先或并列领先，但在 ARC-AGI-2 上落后于 GPT-5.5，在 SWE-Bench Pro 上落后于 Opus 4.7。

DeepMind 基准测试表，对比了 Gemini 3.5 Flash、Gemini 3 Flash、Gemini 3.1 Pro、Claude Sonnet 4.6、Claude Opus 4.7 和 GPT-5.5 在编程、智能体、UI 控制、专家任务、多模态、长上下文和推理基准上的表现

讨论要点： 3x 提升落地时，用户已经把叙事固定成了“Google 毁掉了我的工作流”。因此，尽管配额提升在客观上确实有意义，社区整体反应仍然偏负面——这说明移除 Gemini 3 Flash 造成的信任损伤，可能不会因为配额缓解就自动消失。

与前日对比： 5 月 20 日的焦点是 Antigravity 2.0 上线冲击——IDE 消失、迁移失败、用户自己写恢复指南。到了 5 月 21 日，讨论从“我的 IDE 去哪了？”转成了“我的 token 怎么没了，为什么？”抱怨论坛从结构性问题变成了经济性问题。

1.2 高价 AI 编程工具的定价焦虑，从截图升级成了取消订阅 (🡕)¶

5 月 20 日以法律通知和账单截图形式出现的定价不信任，在 5 月 21 日进一步加深，演变成明确的取消订阅与工具迁移模式。

u/Michal37374 的《Copilot pricing went from $39 to around $387 for my usage. What should we use instead?》 (74 分，108 条评论) 描述了一家欧洲小型工作室：平时 30-40% 的常规用量，在新的按用量计费预览下，成本却上涨了 10x。u/Relevant_Pause_7593（得分 53）警告说：“去看看竞争对手高端模型的价格吧。你马上就会发现，他们都在涨价。”u/big-papito（得分 44）说得更直白：“补贴时代结束了。大家想趁现在继续 vibe，就抓紧吧——你们只剩 10 天了。”

u/Duckfine 的《More than 100 times more then before. The hell?》 (20 分，12 条评论) 贴出了那张把冲击量化出来的计费模拟图：当前计费为 $1.78（344.6 PRUs，每个 $0.04）；按用量计费则是 $220.54（22,053,674 AICs，每个 $0.01）——同样的使用量，涨了 124x。

GitHub Copilot 计费对比图显示，2026 年 5 月当前计费为 $1.78，而按用量计费为 $220.54；同样使用模式下多出 $218.75

Gemini 模型的可用性也进一步收窄了。u/juraj_m 的《All Gemini models have been removed from Copilot Chat on the web》 (83 分，40 条评论) 贴出了 GitHub 在 5 月 20 日的更新日志，确认了这次移除。Antigravity 的配额危机和 Copilot 移除 Gemini 这两件事叠在一起，让 5 月 21 日成了“到处都是 Gemini”变成“哪里都用不起 Gemini”的那一天。

迁移问题也成了热议焦点。u/DavidG117（得分 32）推荐使用带 Composer 2.5 的 Cursor，或者 OpenCode。u/hollandburke（得分 19）指出，GLM 5.1、Qwen 3.6 27B 和 DeepSeek V4 是最接近 Sonnet 的替代品。u/Stunning-Top-1076（得分 12）则推荐 OpenRouter，以更便宜的价格提供按 token 计费的访问方式。

讨论要点： 5 月 21 日的定价讨论，比 5 月 20 日更落实到具体行为——用户已经开始点名自己要迁往哪些工具，而不仅仅是在表达“太贵了”的震惊。

与前日对比： 5 月 20 日出现的是法律通知和 Copilot 按用量账单截图这类早期预警；到了 5 月 21 日，则多了明确的退订意向、直接的迁移建议，以及 Gemini 被移除的官方确认。

1.3 Cursor Composer 2.5 在多条讨论中确立为可行的日常默认选择 (🡒)¶

围绕 Cursor 的 Composer 2.5，几条讨论里都出现了正向共识；这些帖子放在一起看，更像一个完整信号，而不是零散好评。

u/West-Welcome8247 的《Composer 2.5 is my new default. It is fast, accurate, and actually cheap》 (130 分，52 条评论) 为这一主题定下了基调。u/No-Distribution9902 又在《Artificial Analysis independent benchmark just found composer 2.5 to be the third best model, beaten only by Opus 4.7 (Max) and GPT 5.5 (xHigh) at 10-60x cheaper》 (85 分，13 条评论) 中补上了独立基准的背景，引用了一条 Artificial Analysis 推文，称 Composer 2.5 在其智能指数里排第 3，而成本只占前两名的一小部分。

u/paltium 的《Thoughts on Composer 2.5?》 (48 分，32 条评论) 给出了最具体的成本数据：切到 Composer 2.5 后，日常使用成本从大约 $60 降到了 $10 以下。u/Crazyscientist1024 的《Composer 2.5 Real World Reviews?》 (30 分，28 条评论) 则收集了实战反馈：u/Voiston44（得分 12）仅靠 Composer 2.5，就把一个 120,000 行的 JavaScript 项目迁移到了 TypeScript/Vite/Svelte，没有碰 GPT-5.5 或 Opus；u/P2070（得分 17）觉得它在原生 Windows C#/.NET 8 + WinUI 3 + SQLite 的 UI 工作上，已经能和 Opus 相提并论。u/CoreDirt（得分 24）对它的定位最直接：“不如 gpt 5.5 或 opus，但在性价比和速度上绝对是最强的。”

u/NotSeacombe 的《Composer 2.5 so good I'm being nice to AI again》 (54 分，25 条评论) 给出了最生动的总结：“过去 24 小时里，我在 Cursor 里打出 ‘please’ 的次数，远远多过打出 ‘you useless donkey’ 的次数。”

讨论要点： 5 月 21 日的 Composer 2.5 信号之所以值得注意，是因为它没有依附于任何发布事件，而是在 5 条独立帖子里自然冒出来。基准数据、成本反馈和真实迁移案例，都在指向同一个结论。

与前日对比： 5 月 20 日，Composer 2.5 已经被拿来当作 Copilot 的替代方案。到了 5 月 21 日，这个信号又被独立基准和一个 120k 行迁移案例进一步放大了。

1.4 vibe 编程分裂成了身份认同之争与学习论题两条线 (🡒)¶

5 月 21 日，vibe 编程社区同时在跑两条平行讨论：一条围绕身份是否合法，另一条围绕学习速度。

身份这条线由 u/CRUSHx69_ 的《when they ask if i'm a full stack developer and i say yes with zero hesitation》带起来 (535 分，127 条评论)。帖子描述的是一位 vibe 编程者：他的“整套交付栈”就是 Cursor、Runable 和 Vercel——但他却听不懂一位资深开发者关于 Docker 容器和内存泄漏的对话。u/the_useful_comment（得分 120）嘲讽这种表述：“vibe 编程者自称工程师，就像玩《Call of Duty》的人自称战争英雄一样。”u/DismissedFetus（得分 38）觉得这种自我描述“怪得离谱”。但 u/Noledge0120（得分 21）给出了最有内容的辩护：真正的区别不在于现在用什么工具，而在于当情况需要时，愿不愿意继续往深处钻。

学习论题这一边得到的支持要细腻得多。u/itjustworks00 的《unpopular opinion but vibe coding has taught me more than any course ever did》 (137 分，98 条评论) 点明了它到底教会了什么：API、环境变量、限流、CORS 和部署流水线——这些不是靠被动听课学会的，而是在不断出错、不断修的压力下硬学会的。

u/Cetautomatix777 的《Published my first app! A compass that points to the nearest liquor store》 (1,044 分，72 条评论) 是当天得分最高的帖子，也是“边做边学”最清楚的例子。正文列出的教训都很具体：Google Maps API 是 $30/1,000 requests，而 Mapbox 大约便宜 100x；Cursor 在多步上下文理解上明显强于 Copilot；大多数 LLM 都很难做出一个真正能用的指南针。

PointMe 应用在户外使用：手机屏幕上的指南针 UI 指向 126 英尺外的一家酒吧，显示 heading 123 度、bearing 109 度

讨论要点： 这两条线放在一起，展示了 vibe 编程的双重人格——一边是喧闹的身份梗经济，另一边则是更安静、但更持久的学习经济。

与前日对比： 5 月 20 日，vibe 编程梗图仍然是互动最高的模式，学习型帖子只是次要信号。5 月 21 日延续了同样的比例，但当天的头号帖子（指南针应用）把两者合在了一起：文化上很好笑，技术上也确实有东西。

1.5 Claude Code 的技巧与专业使用模式一并浮现，同时也暴露了真实局限 (🡒)¶

5 月 21 日两条高互动的 Claude Code 讨论，把这款工具最强的一面和最弱的一面都照了出来。

u/holotherapper 的《what's your "nobody talks about this" tip for Claude Code?》 (81 分，112 条评论) 汇集了当天最密集的一批一线实践知识。u/tonyboi76（得分 60）介绍了 # 这个快捷方式：给消息加上 # 前缀，就会直接写进 CLAUDE.md，从而让用户不用离开终端界面，也能在会话内修正模型行为。u/KOM_Unchained（得分 40）提到，他们会把内部 Claude Code 市场做成带自动更新插件的 git 仓库。u/hihcadore（得分 34）指出，Mermaid 图在 VS Code 的 Markdown 预览里用 Ctrl+Shift+V 就能显示。u/mjsarfatti（得分 30）给出了最实用的架构建议：先用 Opus 在低到中等思考档位做规划，再把任务一个个交给 Claude Code 去做，而且每个任务都新开一个会话——在企业代码库里通常很少超过 100k tokens。u/Routine_Low_6202（得分 23）则把 spawn_task 点名为一个被低估的并行原语。

u/KindOfHardToSpell 的《A violent start to the workday》 (386 分，27 条评论) 则展示了它处理真实运行时冲突的一面。截图中，Claude Code（运行 Opus 4.7，上下文 119.1k，会话 30.0%）发现一个 parquet-inspect 进程和一个 sync-reset 任务同时在跑，而且可能互相阻塞。它给出了 3 个选项：两个都杀掉、只杀掉 parquet-inspect 让 sync-reset 跑完，或者先让用户自行检查。

Claude Code TUI 截图显示，Claude 检测到 parquet-inspect 与 sync-reset 之间的进程冲突，并提供了 3 种处理选项；模型为 Opus 4.7，上下文为 119.1k，自动模式已开启

局限也同样被记录下来了。u/Temporary_Most5517 的《Recent Claude Code performance degradation with Opus 4.7 / 1M context / xhigh》 (22 分，45 条评论) 描述了过去 6 天里明显变差的输出：做了用户没要求的动作、无关地到处探索 repo、文档写得空泛。u/piratehat（得分 14）证实“从周一开始就出现了明显退化”。u/Patriark（得分 10）则报告了相反体验：一天 4 到 8 个 PR，质量没有问题。u/tumes（得分 3）说，自己在 Codex 也遇到了类似的退化轨迹，而通过 OpenCode 使用 DeepSeek V4 则让人“像吸到一口新鲜空气”。

讨论要点： Claude Code 的技巧帖说明，这个工具已经冒出一种非正式的口耳相传知识传统——许多模式和快捷方式并不在官方文档里，却在重度用户之间不断流转。

与前日对比： 5 月 20 日几乎没什么 Claude Code 质量讨论。到了 5 月 21 日，一边是高质量技巧的集中沉淀，一边是性能退化报告——这说明社区已经成熟到会按周追踪模型质量了。

1.6 单体和微服务之争意外找到了共同地带 (🡒)¶

u/eivittunytsit 的《Microservices versus monoliths: Did everyone just lose their minds in the last 6 months?》 (241 分，281 条评论) 反驳了“AI 智能体更适合单仓单体架构”这种说法，称其为一种跟风式迷信。来自 u/apf6 的最高赞回复（得分 348）纠正了这个前提：单体架构的回潮在 AI 出现之前就已经开始，驱动力是微服务带来的真实运维开销。u/LittleLordFuckleroy1（得分 124）也认同，微服务狂热本身就是一轮泡沫。u/sixothree（得分 36）则提出了一条中间路线：模块化单体，可以作为逃离过度工程化微服务的出口。

讨论要点： 这条讨论里得票最高的回答，并没有把方向带向“AI 更喜欢单体”，而是带向“微服务本来就被卖得太过头了”。这一点很重要，因为它表明社区依然能把真正的软件工程演进，与 AI 时代的跟风教条区分开来。

与前日对比： 这是从 5 月 20 日延续下来的同一条讨论（得分从 204 涨到 241），但到 5 月 21 日时，最高赞评论已经积累了足够多的权重，基本把原帖作者最核心的焦虑彻底说清了。

2. 令人困扰的问题¶

Gemini 3 Flash 的移除摧毁了精心搭建的成本控制工作流¶

严重性：高。Pro 套餐用户搭建出了一套规划/执行分层工作流：用 Gemini 3.1 Pro 做架构，用 Gemini 3 Flash 做迭代编程和修 bug——而 Flash 近乎无限的预算，就是高频工作时的安全垫。2.0 更新之后，这个预算没了。u/Maahesvra 的《Flash 3 is gone and my workflow is dead》 (95 分，33 条评论) 描述了最具体的失败场景：只用 Flash 3.5 跑了两次阶段性开发会话，就耗光了整周的 token 池，用户剩下的整整一周都被卡住了。

Gemini 3.5 Flash 确实是更好的模型，但配额把它锁成了不可用状态¶

严重性：高。多条帖子都承认 Flash 3.5 的技术质量很强，同时又痛骂它的配额设置。u/chrissichris02（得分 85）写道：“Gemini 3.5 Flash 其实真的不错，这点让我很意外。它很快，输出质量也很稳……然后用量限制就砸下来了。我用的是 Pro 套餐，大概 1 小时 15 分钟之后……所有模型基本都被用光了。”u/SveXteZ 的《Google is focusing on the wrong thing. We don't want faster LLM models, we want more of them》 (62 分，31 条评论) 则抓住了那个反转点：用户想要的不是更快，而是更便宜。

Copilot 的按用量计费预览，带来了真实的财务规划焦虑¶

严重性：高。$1.78 → $220.54 的模拟图（u/Duckfine，20 分）和 $39 → $387 的估算（u/Michal37374，74 分）都发生在正常使用水平上，而不是边界情况。多位评论者都提到，对那些把 AI 编程当作核心基础设施的小型工作室来说，按用量计费可能会直接打穿预算。u/Relevant_Pause_7593（得分 53）提醒说，这不只是 Copilot 的问题：所有提供商都在涨价。

AI 生成的落地页会默认带上伪造的社会认同¶

严重性：中。u/No-Conclusion1329 的《PSA: Fake user counts and reviews are illegal》 (92 分，41 条评论) 指出，Claude Code 在生成演示站点时，会默认塞进像“受到 15,000 名用户信赖”这样的占位文案，而很多 vibe 编程者因为它“听起来很棒”就直接保留了下来。FTC 将伪造用户数量视为虚假广告，罚款最高可达 $50,000+。u/brightbilll（得分 38）又补了第二层风险：vibe 编程做出来的应用，经常把所有用户数据都存在 Firebase 且还开着默认开放规则，却在 App Store 列表里声称“未收集任何数据”——这已经是隐私违规。

Antigravity IDE 更新完后把自己删了¶

严重性：中。u/feardoom4 的《Antigravity IDE updated just now... And deleted itself!》 (35 分，12 条评论) 描述了第二代发布失败：用户前一天才重新安装好 IDE，好不容易从 2.0 迁移中缓过来，结果它自动更新后又把自己卸载了，连 Antigravity Agent 一起带走。一个软件工具在自动更新后把自己删掉，这是明显的可靠性回退，也直接削弱了前一天那套“迁移已经恢复”的叙事。

Cursor 在重上下文负载下会吃掉数百 GB 内存¶

严重性：中，普遍性尚不明确。u/InstaMatic80 的《I guess my prompt is too heavy》 (58 分，21 条评论) 展示了 macOS 的内存不足弹窗，其中 Cursor 显示占用 899.56 GB。另一位评论者也分享了类似崩溃，发生场景是“自动化软件工厂”。有一条回复（得分 8）指出，这个数字会把 Cursor 集成终端里运行的应用内存也一起算进去，因此这个异常值也许有解释空间。

3. 人们期望的功能¶

订阅制里真正便宜、可高频使用的工作马模型¶

5 月 21 日最明确的未满足需求，不是更强的前沿模型——而是像旧版 Gemini 3 Flash 那样的模型：足够快，能支持迭代式编程；每个 token 又足够便宜，便宜到几乎可以持续不断地跑，而不会撞上每周上限。u/tadanada（得分 32）解释了为什么 Pro 套餐（$20）在包含 Flash 3 时说得通：它相当于一个“无限量”的简单任务执行层。没有了它，Pro 这一档在同价位上就没有任何优势可言。用户想要的是一种分层模型组合：低成本档不是被拿来逼用户升级，而是被刻意保持充足。

能在出事前把账算清楚的按用量计费模拟¶

多条讨论其实都在间接要求同一件事：在用户真的改套餐之前，先给出一套现实的账单模拟，并且明确解释是什么触发了成本。u/Duckfine 的截图（$1.78 vs $220.54）展示了用户现在是怎么做的——先把模拟图截下来，再跑到 Reddit 问大家自己该不该慌。产品应该在恐慌出现前就把这件事做好，而不是等到恐慌之后。

能自动演进的 CLAUDE.md 管理工具¶

技巧帖暴露出一个事实：CLAUDE.md 是一个用户希望跨会话自然生长的活文档。# 这个快捷方式（u/tonyboi76，得分 60）其实就是在绕过工具缺口：真正完善的 CLAUDE.md 生命周期管理器，应该让用户不用离开会话、也不用手动改文件，就能审阅、批准并做版本管理。

跨公司的 Claude Code 插件市场¶

u/KOM_Unchained（得分 40）描述了他们如何从零搭起这一套：把一个 git 仓库标记成自动更新源，里面放 semver 版本化的 skills 和 agents，让组织里的开发者和非开发者都能使用、也都能贡献。构建这类东西的底层条件已经存在，但目前还没有一个打磨完善的现成产品。

诚实且具备风险意识的 vibe 编程入门层¶

伪造社会认同的 PSA、关于“代码会离开你网络”的讨论串，以及那篇“npm 蠕虫”安全帖，其实都指向同一个缺口。很多新的 vibe 编程者一边构建、一边上线，却并不知道 FTC 对虚假广告的规定，也不了解 Firebase 默认数据暴露、未锁定 npm 依赖，或代码发给 AI 提供商后会经过怎样的基础设施范围。只要加上一层覆盖法律、安全和隐私基础知识的结构化入门，就能用很低成本去减少这类真实伤害。

4. 使用中的工具与方法¶

工具	类别	评价	优势	局限
Gemini 3.5 Flash (Antigravity)	智能体模型	(+/-)	质量高、速度快，在 MCP Atlas / Finance / Reasoning 基准上领先	比 Gemini 3 Flash 贵 6x；Pro 套餐下每周配额几小时就会耗尽
Gemini 3 Flash (Antigravity, legacy)	智能体模型	(+) 事后回看	适合迭代编程的近乎无限预算；速度快；成本低	已从 Antigravity GUI 移除；但仍可通过 TAU CLI 访问
Antigravity 2.0 (Agent Manager + IDE + CLI)	智能体套件	(+/-)	Flash 3.5 的质量受到称赞；Agent Manager 可并行拉起子智能体；3x 配额缓解已落地	IDE 自动更新后会自删；积分额度被移除；信任严重受损
Claude Code / Opus 4.7	编程智能体	(+/-)	TUI 进程管理、可用 `#` 编辑 CLAUDE.md、支持市场插件与 spawn_task 并行	部分用户报告过去一周性能退化；代码会离开本地基础设施
Cursor Composer 2.5	IDE 模型	(+)	在 Artificial Analysis 指数上排第 3；日成本从 $60 降到 $10 以下；能处理 120k 行迁移	在最难的任务上仍不如 GPT-5.5 和 Opus 4.7
GitHub Copilot (new pricing)	模型接入层	(-)	模型组合广；BYOK 现在支持自定义 API 端点（VS Code 1.121）	按用量计费预览在正常使用下显示 124x 涨幅；网页端移除了 Gemini 模型
VS Code 1.121	编辑器 + 智能体宿主	(+)	可监控远程智能体、Markdown 预览支持 Mermaid、HTML 预览、BYOK 自定义端点、终端输出压缩	还很早期；BYOK 自定义端点初期仅限 Insiders
OpenCode / OpenCode Go	开源编程智能体	(+)	支持开放模型（DeepSeek V4、Qwen3.6）；被提作 Copilot 和 Cursor 的迁移路径	社区较小；打磨度不如商业产品
Runable	落地页 / 文档构建工具	(+)	可快速部署落地页和文档；常与 Cursor 搭配使用	没有负面信号；适用场景较窄
DeepSeek V4	开放权重模型	(+)	Claude Code 质量下滑时，用户把它称赞为替代方案；可通过 OpenRouter 使用	需要 BYOK 配置

这张表里最强的模式，是定价压力下的替代行为：Gemini Pro 套餐用户一撞上 token 墙，就会转向 Cursor Composer 2.5 或 OpenCode；Copilot 用户一看到那张计费模拟图，就会转向 Claude Code 或通过 OpenRouter 使用开放模型。评论区里这些替代选择并不是随机发生的——它们稳定地落在那些固定费率更可预测的工具上。

5. 人们在构建什么¶

项目	构建者	功能	解决的问题	技术栈	阶段	链接
PointMe（酒类商店指南针）	u/Cetautomatix777	指向最近酒吧或酒类商店的指南针	在不熟悉的区域寻找附近的酒吧	Mapbox API, iOS	已发布	App Store
Myst 风格作品集（mattebso.com）	u/AbilityAny4629	按 Myst 游戏房间风格设计、可探索的作品集网站	所有 AI 网站看起来都一样	Claude + Claude Design, ChatGPT image 2, Veo 3.1	已发布	网站, 帖子
YGGDRA（yggdra.garden）	u/FarClient2449	带树状心智图和聊天界面的人格智能工具	通过结构化人生领域做自我认知和个人建议	Web（技术栈未知）	测试版	网站, 帖子
MeowGPT（更新版）	u/Time-Ad-7720	带猫咪主题聊天机器人和动态吉祥物状态（neutral、typing、peek-a-boo、sparkle）	为千篇一律的 AI 聊天壳子提供更好笑的替代品	Claude Code（初版）、GPT Image 做 sprites、Photoshop 做 GIF 帧	已发布	帖子
Claude Code → Remotion 发布视频	u/Top_Commission_8567	以程序化方式用 Remotion 生成完整发布视频	不用手工剪视频也能做发布视频	Remotion, Claude Code	已发布	帖子
StoneGPT	u/znatgost	和一块石头聊天	荒诞主义创意实验	未知	已发布	帖子
AI 游戏引擎（早期阶段）	u/APASDEEA1	用 AI 生成完整游戏的游戏引擎	从提示词直接生成整款游戏	Antigravity 辅助，技术栈未说明	Alpha	帖子

PointMe 指南针应用之所以突出，在于它的技术学习日志极其具体。作者发现，Google Maps API 每 1,000 次请求要 $30，而 Mapbox 大约只要 $0.30（便宜 100x）；还记录了大多数 LLM 都没法原生做出一个可用的指南针，以及 Cursor 在多步上下文理解上明显强于 Copilot。这类关于 API 成本和工具比较的具体知识，正是 vibe 编程者通过动手构建才会获得、而课程里教不到的东西。

Myst 风格作品集的可贵之处，在于它是有意识地反着“AI 网站千篇一律”的审美去做的。构建者把 Claude 用于布局，把 ChatGPT Image 2 用于环境生成，把 Veo 3.1 用于动画运动——这是一个多模型创意栈，做出来的结果和标准落地页模板有清晰差异。

Myst 风格作品集落地页《The Arrival》，展示一个由 AI 生成、可供探索的写实地中海书房场景，包含书架、盘带录音机、笔记本电脑和黑板

YGGDRA 的人格心智图，展示了一种很有辨识度的界面模式——以 “YOU” 为中心的分叉树，围绕 Soul、Life、Psychology、Work 和 Childhood 等领域节点展开，说明 vibe 编程工具正在探索标准聊天框之外的知识图谱式界面。

YGGDRA 人格智能工具显示了一张深色背景的树状心智图，以“YOU”为中心，分出 Soul、Life、Psychology、Work、Childhood 和 Word Association 等彩色分支，底部带有聊天输入框

构建者帖子里反复出现一个模式：最容易爆火的项目往往没什么用，或者几乎没什么用（酒类商店指南针、猫咪聊天机器人、和石头聊天），而技术上更有野心的项目（游戏引擎、Remotion 视频）反而互动量较低。社区注意力奖励的是人格和幽默，而不是复杂度。

6. 新动态与亮点¶

Antigravity 2.0 触发了大规模取消订阅信号¶

来自 u/AlessandroLobo 的《Broken Trust》帖子（发了两次：得分分别为 42 和 41）把这个模式说得很明白：Google 先说服开发者从 Claude Code 转到 Antigravity 上构建，接着又移除了让这套商业模式成立的关键条件，然后还在更新日志里把这次降级包装成改进。评审集中涉及的多条讨论（包括那些已经用了 6 个月 Ultra 套餐的用户）都明确表示，他们正在取消订阅，或者不再续费年付计划。u/Madlonewolf 的《Anyone found a reason to still having pro plan?》 (24 分，26 条评论) 没收到任何对 Pro 套餐价值主张有说服力的辩护，评论里只有大家各自列出的退出路径。

GitHub Copilot 正式确认网页端移除 Gemini¶

GitHub 在 5 月 20 日的更新日志中写明了，Copilot Chat 网页端已移除 Gemini 模型。这个时间点——恰好和 Antigravity 的配额危机同时发生——让 Reddit 产生了一种“Gemini 正在被协同收紧可用性”的印象，尽管这两件事其实是各自独立推动的。

Claude Code 在连续 60 天补测试覆盖后，生成了一个包含 1,943 个文件、1,060 次提交的 PR¶

u/Counter-Business 的《Yall ever seen a PR like this?》 (108 分，76 条评论) 记录了 Claude Code 连续使用 60 天后，在提交层面会产出什么：一个刚刚合并的 PR，涉及 1,943 个变更文件、+377,696 行新增、-121 行删除，以及 1,060 次提交。

GitHub 移动端 PR 视图显示 1,943 个变更文件、+377,696 -121 行，以及刚刚创建的 1,060 次提交——这是 Claude Code 连续 60 天补测试覆盖的结果

来自 u/Ok-Tax2953 的最高赞回复（得分 100）是：“那不是 PR，那是一次孤注一掷。”u/anon377362（得分 39）还贴出了 Bun 自己那个 30,412 次提交的 PR，给大家作对照。

VS Code 1.121 扩展了 BYOK，并原生加入 Mermaid 渲染¶

u/bogganpierce 的《VS Code 1.121 is now live!》 (74 分，41 条评论) 覆盖了一次很有意义的发布：BYOK 现在支持一种自定义端点模式，可以接入任何兼容 OpenAI 聊天补全格式的 API；旧版 BYOK 一直有持续性问题，因此这次是从头重写。Mermaid 图现在能在 Markdown 预览里原生渲染。HTML 文件可以直接在集成浏览器里预览。终端输出现在会先压缩再发送给智能体，以减少 token 消耗。

7. 机会在哪里¶

[+++] 订阅制下充足且廉价的算力档位 — 5 月 21 日最清晰的缺口，就是 Google 刚刚移除的那类产品：一种按月或按年固定付费、但可用于迭代式编程工作的近乎无限低成本模型。需求并不是前沿模型；需求是一个不必数 token、也不用盯着每周进度条的工作马档位。任何能可信地提供这一点的提供商，都会吃下 Antigravity Pro 的退订潮。

[+++] 诚实的计费模拟与配额可观测性 — $1.78 vs $220.54 的 Copilot 对比，以及 Antigravity 那些“6 天 18 小时后刷新”的配额界面，本质上都是用户偶然才发现的信息。一个真正对计费敏感的 AI 编程订阅产品，如果能在用户撞墙之前就显示实时成本模拟、预测月度总额和配额轨迹，就能补上所有提供商共同存在的信任缺口。

[++] AI 编程平台的迁移工具 — 持续 2 天的 Antigravity 迁移危机和 Copilot 定价冲击引发的出走潮，实际上暴露的是同一种痛点：开发者没有一种干净的方法，把项目上下文、CLAUDE.md 等价物、扩展配置和会话历史，从一个 AI 编程环境迁到另一个。一个与平台无关的项目上下文导出器，会在这个领域的每一次换工具事件里派上用场。

[++] CLAUDE.md 生命周期管理 — # 快捷方式说明，CLAUDE.md 文件已经开始超出手工维护的范畴。一个真正完整的生命周期工具——带会话级 diff 审查、审批流、版本历史和团队共享——既能服务不断扩大的 Claude Code 重度用户群，也能服务技巧帖里提到的跨公司插件市场场景。

[+] vibe 编程者的法律与合规入门 — 那条伪造社会认同的 PSA（FTC $50,000+ 罚款）、Firebase 数据暴露警告，以及 npm 依赖审计建议，都指向一种真实伤害，而这个社区里的很多人其实并不知道它的存在。只要在流行的 vibe 编程模板里内置一页清单或一层轻量合规检查，就能同时服务于法律风险降低和社区信任提升。

[+] 面向差异化 UX 的多模型创意栈 — Myst 作品集（Claude + ChatGPT Image 2 + Veo 3.1）就是一个很具体的例子：多个模型组合起来，可以做出明显不同的终端结果。当前还没有任何工具，能让人轻松编排多个 AI 提供商去共同产出一个创意成品。面向前端和创意构建者的多模型流水线构建器，有机会规模化解决“每个 AI 网站看起来都一样”的挫败感。

8. 要点总结¶

Antigravity 的配额危机在战术层面得到缓解，但战略层面没有解决。 Google 的 3x 配额提升缓解了当下的不满，但既没有恢复 Gemini 3 Flash，也没有处理底层成本数学。用户算得很清楚：不够用的配额乘以 3x，仍然不够用，因此取消订阅意愿依旧很高。 (来源, 来源)
所有主流 AI 编程平台的定价，都在同一时间朝着同一个方向移动。 Antigravity 收紧配额、Copilot 推出按用量计费预览，以及 Copilot 网页端移除 Gemini，这三件事都发生在 24 小时内。Copilot 定价帖的评论区直接把它描述为整个行业补贴结束，而不是某一家厂商的单独决定。 (来源, 来源)
Cursor Composer 2.5 从多个方向承接了换工具需求。 它同时出现在 Copilot 迁移建议、Antigravity 退出讨论，以及同一天 5 条独立的正面评价里——而且每次被提及，核心原因都是成本效率。独立基准数据还把它排到了 Artificial Analysis 智能指数的第 3 名。 (来源, 来源)
vibe 编程的身份认同争论仍未解决，但“它确实能让人学到东西”这套论点正在获得更具体的证据。 PointMe 指南针应用——当天得分最高的帖子——展示了真实的 API 成本发现（$30/1k Google Maps vs $0.30/1k Mapbox）、工具对比（Cursor vs Copilot 在多步上下文上的表现），以及一个已经上线的 iOS 产品，这些都是学习过程的直接产物。 (来源)
Claude Code 已经出现一种口耳相传的知识传统。 那条技巧帖里整理出了多个已有文档记录的捷径（把 # 写入 CLAUDE.md、spawn_task、以及会话中途切换 /model），但这些仍不在官方文档里。这说明工具真实的能力表面，与新用户靠自己能发现的那部分之间，仍然存在明显落差。 (来源)
AI 生成的落地页正在悄悄上线虚假广告。 Claude Code 会生成“受到 15,000 名用户信赖”这样的占位文案，而创始人因为它看起来可信就直接保留。FTC 将其视为虚假广告，罚款最高可达 $50,000+。目前没有流行的 vibe 编程模板会默认提醒用户避开这个问题。 (来源)