Reddit AI 编程 - 2026-05-21¶
1. 人们在讨论什么¶
1.1 Antigravity 2.0 的配额经济学取代了上线话题,而 Google 用 3x 缓解回应,但没让所有人满意 (🡕)¶
5 月 21 日的主导话题已经不是 Antigravity 2.0 的新 UI 或缺失的 IDE——那场争论前一天基本已经告一段落。新的讨论重心变成了配额经济学:Gemini 3.5 Flash 烧 token 有多快、相较旧版 Gemini 3 Flash 每百万 token 的成本是多少,以及 Google 紧急给出的 3x 配额提升到底够不够。
根因被 u/tadanada 在 《Here's why gemini 3.5 flash burn token so fast, it's actually more expensive than 3.1 pro》 里量化地说明了 (168 分,60 条评论)。该帖引用了 Google 自己的 Gemini API 定价页,并在一张成本图上做了标注:Gemini 3.5 Flash 每次基准测试运行要 $1,552,而 Gemini 3 Flash 只要 $278——5.6x 的成本差解释了为什么付费套餐会在一个下午内耗尽。

u/nomadtracker 在 《Bring back Gemini 3 flash》 中抓住了核心挫败感 (330 分,131 条评论):一套以 Flash 3 作为无限低成本执行层搭起来的工作流,如今已经死了。u/Abelius75(得分 59)说,自己在 Flash 3.5 Medium 里只做了 8 次简单的 UI 调整提示,就烧掉每周配额的 60%,随后取消了订阅。u/CapitalPristine3971(得分 54)说,自己买的是年度 Pro 套餐,并要求把 Flash 3 带回来。
u/ackadamius 在 《Antigravity Gemini 3.5 Flash is 6x more expensive than 3.1》 中指出了这个缺口 (41 分,8 条评论):Antigravity 自己的文档里仍把 Gemini 3 Flash 列为可用的推理模型,但真实产品里已经没有这个选项。

多位用户还用截图把配额耗尽这件事直观地记录了下来。u/PinkySwearNotABot 的 《Gemini 3.5 Flash is amazing (speed, quality) with the new Antigravity CLI but...》 (231 分,106 条评论) 展示了短时间使用后的配额仪表盘:所有 Gemini 模型(Flash High、Flash Medium、3.1 Pro High、3.1 Pro Low)都只剩 20%,并出现了“已达到个人配额”警告;而 Claude Sonnet 4.6、Claude Opus 4.6 和 GPT-OSS 120B 仍都是 100%。

u/Substantial_Rate_772 的 《Either revert the 2.0 Update or let us choose 3.1 flash again》 (52 分,10 条评论) 展示了更进一步的后果:所有 Gemini 配额都要到 6 天 18 小时后才刷新,而 Claude 和 GPT-OSS 仍然可用。

Google 在 5 月 21 日做出了回应。u/aunchable 的 《3x More Gemini for Antigravity Users》 (448 分,201 条评论) 宣布所有付费档位都会整包重置配额,并把额度统一提升 3x。u/Final_Initial 又在 《3X usage for Gemini models for all AI Plus, Pro, and Ultra users. Forever.》 (407 分,108 条评论) 中贴出了 CEO Varun Mohan 的那条推文,其中还有一句后续说明:“如果还不够清楚的话,这个 3x 是永久的。”

应用内如何交付这次 3x 提升,也被 u/dtswk 在 《I'm finding the new AG 2.0 and Flash 3.5 pretty good as a novice》 中记录了下来 (47 分,28 条评论):一条横幅写着“配额已提升——如果你使用付费套餐,本周的 Gemini 配额已重置,并在后续提升 3x。继续构建吧!”

社区的接受度依旧很怀疑。u/DocumentFun9077(得分 51)回复说:“哦,那这样一来,一整周也就只够 3 条 opus 提示了。”u/KeyboardPolitics_Man(得分 47)说:“3x,但还是比 5.17 少。”u/tadanada(得分 32)则认为,没有 Gemini 3 Flash 之后,Pro 套餐($20)已经失去了相较其他提供商最核心的竞争优势。
一个部分权宜方案也浮现出来了:u/JhonDoe191ee 的 《gemini-3-flash from the most hated to the most wanted》 (29 分,12 条评论) 显示,TAU v0.8.6 CLI 工具里仍然把 gemini-3-flash 列为可选的 Antigravity 模型,即便它已经从网页 UI 中被移除。

基准测试数据也证明了模型本身其实没问题。u/pebblepath 的 《Major LLM benchmarks, including the new Gemini 3.5 Flash》 (12 分,8 条评论) 分享了 DeepMind 自己的评测表:Gemini 3.5 Flash 在 MCP Atlas(83.6%)、Finance Agent v2(57.9%)、CharXiv Reasoning(84.2%)和 MMMU-Pro(83.6%)上领先或并列领先,但在 ARC-AGI-2 上落后于 GPT-5.5,在 SWE-Bench Pro 上落后于 Opus 4.7。

讨论要点: 3x 提升落地时,用户已经把叙事固定成了“Google 毁掉了我的工作流”。因此,尽管配额提升在客观上确实有意义,社区整体反应仍然偏负面——这说明移除 Gemini 3 Flash 造成的信任损伤,可能不会因为配额缓解就自动消失。
与前日对比: 5 月 20 日的焦点是 Antigravity 2.0 上线冲击——IDE 消失、迁移失败、用户自己写恢复指南。到了 5 月 21 日,讨论从“我的 IDE 去哪了?”转成了“我的 token 怎么没了,为什么?”抱怨论坛从结构性问题变成了经济性问题。
1.2 高价 AI 编程工具的定价焦虑,从截图升级成了取消订阅 (🡕)¶
5 月 20 日以法律通知和账单截图形式出现的定价不信任,在 5 月 21 日进一步加深,演变成明确的取消订阅与工具迁移模式。
u/Michal37374 的 《Copilot pricing went from $39 to around $387 for my usage. What should we use instead?》 (74 分,108 条评论) 描述了一家欧洲小型工作室:平时 30-40% 的常规用量,在新的按用量计费预览下,成本却上涨了 10x。u/Relevant_Pause_7593(得分 53)警告说:“去看看竞争对手高端模型的价格吧。你马上就会发现,他们都在涨价。”u/big-papito(得分 44)说得更直白:“补贴时代结束了。大家想趁现在继续 vibe,就抓紧吧——你们只剩 10 天了。”
u/Duckfine 的 《More than 100 times more then before. The hell?》 (20 分,12 条评论) 贴出了那张把冲击量化出来的计费模拟图:当前计费为 $1.78(344.6 PRUs,每个 $0.04);按用量计费则是 $220.54(22,053,674 AICs,每个 $0.01)——同样的使用量,涨了 124x。

Gemini 模型的可用性也进一步收窄了。u/juraj_m 的 《All Gemini models have been removed from Copilot Chat on the web》 (83 分,40 条评论) 贴出了 GitHub 在 5 月 20 日的更新日志,确认了这次移除。Antigravity 的配额危机和 Copilot 移除 Gemini 这两件事叠在一起,让 5 月 21 日成了“到处都是 Gemini”变成“哪里都用不起 Gemini”的那一天。
迁移问题也成了热议焦点。u/DavidG117(得分 32)推荐使用带 Composer 2.5 的 Cursor,或者 OpenCode。u/hollandburke(得分 19)指出,GLM 5.1、Qwen 3.6 27B 和 DeepSeek V4 是最接近 Sonnet 的替代品。u/Stunning-Top-1076(得分 12)则推荐 OpenRouter,以更便宜的价格提供按 token 计费的访问方式。
讨论要点: 5 月 21 日的定价讨论,比 5 月 20 日更落实到具体行为——用户已经开始点名自己要迁往哪些工具,而不仅仅是在表达“太贵了”的震惊。
与前日对比: 5 月 20 日出现的是法律通知和 Copilot 按用量账单截图这类早期预警;到了 5 月 21 日,则多了明确的退订意向、直接的迁移建议,以及 Gemini 被移除的官方确认。
1.3 Cursor Composer 2.5 在多条讨论中确立为可行的日常默认选择 (🡒)¶
围绕 Cursor 的 Composer 2.5,几条讨论里都出现了正向共识;这些帖子放在一起看,更像一个完整信号,而不是零散好评。
u/West-Welcome8247 的 《Composer 2.5 is my new default. It is fast, accurate, and actually cheap》 (130 分,52 条评论) 为这一主题定下了基调。u/No-Distribution9902 又在 《Artificial Analysis independent benchmark just found composer 2.5 to be the third best model, beaten only by Opus 4.7 (Max) and GPT 5.5 (xHigh) at 10-60x cheaper》 (85 分,13 条评论) 中补上了独立基准的背景,引用了一条 Artificial Analysis 推文,称 Composer 2.5 在其智能指数里排第 3,而成本只占前两名的一小部分。
u/paltium 的 《Thoughts on Composer 2.5?》 (48 分,32 条评论) 给出了最具体的成本数据:切到 Composer 2.5 后,日常使用成本从大约 $60 降到了 $10 以下。u/Crazyscientist1024 的 《Composer 2.5 Real World Reviews?》 (30 分,28 条评论) 则收集了实战反馈:u/Voiston44(得分 12)仅靠 Composer 2.5,就把一个 120,000 行的 JavaScript 项目迁移到了 TypeScript/Vite/Svelte,没有碰 GPT-5.5 或 Opus;u/P2070(得分 17)觉得它在原生 Windows C#/.NET 8 + WinUI 3 + SQLite 的 UI 工作上,已经能和 Opus 相提并论。u/CoreDirt(得分 24)对它的定位最直接:“不如 gpt 5.5 或 opus,但在性价比和速度上绝对是最强的。”
u/NotSeacombe 的 《Composer 2.5 so good I'm being nice to AI again》 (54 分,25 条评论) 给出了最生动的总结:“过去 24 小时里,我在 Cursor 里打出 ‘please’ 的次数,远远多过打出 ‘you useless donkey’ 的次数。”
讨论要点: 5 月 21 日的 Composer 2.5 信号之所以值得注意,是因为它没有依附于任何发布事件,而是在 5 条独立帖子里自然冒出来。基准数据、成本反馈和真实迁移案例,都在指向同一个结论。
与前日对比: 5 月 20 日,Composer 2.5 已经被拿来当作 Copilot 的替代方案。到了 5 月 21 日,这个信号又被独立基准和一个 120k 行迁移案例进一步放大了。
1.4 vibe 编程分裂成了身份认同之争与学习论题两条线 (🡒)¶
5 月 21 日,vibe 编程社区同时在跑两条平行讨论:一条围绕身份是否合法,另一条围绕学习速度。
身份这条线由 u/CRUSHx69_ 的 《when they ask if i'm a full stack developer and i say yes with zero hesitation》 带起来 (535 分,127 条评论)。帖子描述的是一位 vibe 编程者:他的“整套交付栈”就是 Cursor、Runable 和 Vercel——但他却听不懂一位资深开发者关于 Docker 容器和内存泄漏的对话。u/the_useful_comment(得分 120)嘲讽这种表述:“vibe 编程者自称工程师,就像玩《Call of Duty》的人自称战争英雄一样。”u/DismissedFetus(得分 38)觉得这种自我描述“怪得离谱”。但 u/Noledge0120(得分 21)给出了最有内容的辩护:真正的区别不在于现在用什么工具,而在于当情况需要时,愿不愿意继续往深处钻。
学习论题这一边得到的支持要细腻得多。u/itjustworks00 的 《unpopular opinion but vibe coding has taught me more than any course ever did》 (137 分,98 条评论) 点明了它到底教会了什么:API、环境变量、限流、CORS 和部署流水线——这些不是靠被动听课学会的,而是在不断出错、不断修的压力下硬学会的。
u/Cetautomatix777 的 《Published my first app! A compass that points to the nearest liquor store》 (1,044 分,72 条评论) 是当天得分最高的帖子,也是“边做边学”最清楚的例子。正文列出的教训都很具体:Google Maps API 是 $30/1,000 requests,而 Mapbox 大约便宜 100x;Cursor 在多步上下文理解上明显强于 Copilot;大多数 LLM 都很难做出一个真正能用的指南针。

讨论要点: 这两条线放在一起,展示了 vibe 编程的双重人格——一边是喧闹的身份梗经济,另一边则是更安静、但更持久的学习经济。
与前日对比: 5 月 20 日,vibe 编程梗图仍然是互动最高的模式,学习型帖子只是次要信号。5 月 21 日延续了同样的比例,但当天的头号帖子(指南针应用)把两者合在了一起:文化上很好笑,技术上也确实有东西。
1.5 Claude Code 的技巧与专业使用模式一并浮现,同时也暴露了真实局限 (🡒)¶
5 月 21 日两条高互动的 Claude Code 讨论,把这款工具最强的一面和最弱的一面都照了出来。
u/holotherapper 的 《what's your "nobody talks about this" tip for Claude Code?》 (81 分,112 条评论) 汇集了当天最密集的一批一线实践知识。u/tonyboi76(得分 60)介绍了 # 这个快捷方式:给消息加上 # 前缀,就会直接写进 CLAUDE.md,从而让用户不用离开终端界面,也能在会话内修正模型行为。u/KOM_Unchained(得分 40)提到,他们会把内部 Claude Code 市场做成带自动更新插件的 git 仓库。u/hihcadore(得分 34)指出,Mermaid 图在 VS Code 的 Markdown 预览里用 Ctrl+Shift+V 就能显示。u/mjsarfatti(得分 30)给出了最实用的架构建议:先用 Opus 在低到中等思考档位做规划,再把任务一个个交给 Claude Code 去做,而且每个任务都新开一个会话——在企业代码库里通常很少超过 100k tokens。u/Routine_Low_6202(得分 23)则把 spawn_task 点名为一个被低估的并行原语。
u/KindOfHardToSpell 的 《A violent start to the workday》 (386 分,27 条评论) 则展示了它处理真实运行时冲突的一面。截图中,Claude Code(运行 Opus 4.7,上下文 119.1k,会话 30.0%)发现一个 parquet-inspect 进程和一个 sync-reset 任务同时在跑,而且可能互相阻塞。它给出了 3 个选项:两个都杀掉、只杀掉 parquet-inspect 让 sync-reset 跑完,或者先让用户自行检查。

局限也同样被记录下来了。u/Temporary_Most5517 的 《Recent Claude Code performance degradation with Opus 4.7 / 1M context / xhigh》 (22 分,45 条评论) 描述了过去 6 天里明显变差的输出:做了用户没要求的动作、无关地到处探索 repo、文档写得空泛。u/piratehat(得分 14)证实“从周一开始就出现了明显退化”。u/Patriark(得分 10)则报告了相反体验:一天 4 到 8 个 PR,质量没有问题。u/tumes(得分 3)说,自己在 Codex 也遇到了类似的退化轨迹,而通过 OpenCode 使用 DeepSeek V4 则让人“像吸到一口新鲜空气”。
讨论要点: Claude Code 的技巧帖说明,这个工具已经冒出一种非正式的口耳相传知识传统——许多模式和快捷方式并不在官方文档里,却在重度用户之间不断流转。
与前日对比: 5 月 20 日几乎没什么 Claude Code 质量讨论。到了 5 月 21 日,一边是高质量技巧的集中沉淀,一边是性能退化报告——这说明社区已经成熟到会按周追踪模型质量了。
1.6 单体和微服务之争意外找到了共同地带 (🡒)¶
u/eivittunytsit 的 《Microservices versus monoliths: Did everyone just lose their minds in the last 6 months?》 (241 分,281 条评论) 反驳了“AI 智能体更适合单仓单体架构”这种说法,称其为一种跟风式迷信。来自 u/apf6 的最高赞回复(得分 348)纠正了这个前提:单体架构的回潮在 AI 出现之前就已经开始,驱动力是微服务带来的真实运维开销。u/LittleLordFuckleroy1(得分 124)也认同,微服务狂热本身就是一轮泡沫。u/sixothree(得分 36)则提出了一条中间路线:模块化单体,可以作为逃离过度工程化微服务的出口。
讨论要点: 这条讨论里得票最高的回答,并没有把方向带向“AI 更喜欢单体”,而是带向“微服务本来就被卖得太过头了”。这一点很重要,因为它表明社区依然能把真正的软件工程演进,与 AI 时代的跟风教条区分开来。
与前日对比: 这是从 5 月 20 日延续下来的同一条讨论(得分从 204 涨到 241),但到 5 月 21 日时,最高赞评论已经积累了足够多的权重,基本把原帖作者最核心的焦虑彻底说清了。
2. 令人困扰的问题¶
Gemini 3 Flash 的移除摧毁了精心搭建的成本控制工作流¶
严重性:高。Pro 套餐用户搭建出了一套规划/执行分层工作流:用 Gemini 3.1 Pro 做架构,用 Gemini 3 Flash 做迭代编程和修 bug——而 Flash 近乎无限的预算,就是高频工作时的安全垫。2.0 更新之后,这个预算没了。u/Maahesvra 的 《Flash 3 is gone and my workflow is dead》 (95 分,33 条评论) 描述了最具体的失败场景:只用 Flash 3.5 跑了两次阶段性开发会话,就耗光了整周的 token 池,用户剩下的整整一周都被卡住了。
Gemini 3.5 Flash 确实是更好的模型,但配额把它锁成了不可用状态¶
严重性:高。多条帖子都承认 Flash 3.5 的技术质量很强,同时又痛骂它的配额设置。u/chrissichris02(得分 85)写道:“Gemini 3.5 Flash 其实真的不错,这点让我很意外。它很快,输出质量也很稳……然后用量限制就砸下来了。我用的是 Pro 套餐,大概 1 小时 15 分钟之后……所有模型基本都被用光了。”u/SveXteZ 的 《Google is focusing on the wrong thing. We don't want faster LLM models, we want more of them》 (62 分,31 条评论) 则抓住了那个反转点:用户想要的不是更快,而是更便宜。
Copilot 的按用量计费预览,带来了真实的财务规划焦虑¶
严重性:高。$1.78 → $220.54 的模拟图(u/Duckfine,20 分)和 $39 → $387 的估算(u/Michal37374,74 分)都发生在正常使用水平上,而不是边界情况。多位评论者都提到,对那些把 AI 编程当作核心基础设施的小型工作室来说,按用量计费可能会直接打穿预算。u/Relevant_Pause_7593(得分 53)提醒说,这不只是 Copilot 的问题:所有提供商都在涨价。
AI 生成的落地页会默认带上伪造的社会认同¶
严重性:中。u/No-Conclusion1329 的 《PSA: Fake user counts and reviews are illegal》 (92 分,41 条评论) 指出,Claude Code 在生成演示站点时,会默认塞进像“受到 15,000 名用户信赖”这样的占位文案,而很多 vibe 编程者因为它“听起来很棒”就直接保留了下来。FTC 将伪造用户数量视为虚假广告,罚款最高可达 $50,000+。u/brightbilll(得分 38)又补了第二层风险:vibe 编程做出来的应用,经常把所有用户数据都存在 Firebase 且还开着默认开放规则,却在 App Store 列表里声称“未收集任何数据”——这已经是隐私违规。
Antigravity IDE 更新完后把自己删了¶
严重性:中。u/feardoom4 的 《Antigravity IDE updated just now... And deleted itself!》 (35 分,12 条评论) 描述了第二代发布失败:用户前一天才重新安装好 IDE,好不容易从 2.0 迁移中缓过来,结果它自动更新后又把自己卸载了,连 Antigravity Agent 一起带走。一个软件工具在自动更新后把自己删掉,这是明显的可靠性回退,也直接削弱了前一天那套“迁移已经恢复”的叙事。
Cursor 在重上下文负载下会吃掉数百 GB 内存¶
严重性:中,普遍性尚不明确。u/InstaMatic80 的 《I guess my prompt is too heavy》 (58 分,21 条评论) 展示了 macOS 的内存不足弹窗,其中 Cursor 显示占用 899.56 GB。另一位评论者也分享了类似崩溃,发生场景是“自动化软件工厂”。有一条回复(得分 8)指出,这个数字会把 Cursor 集成终端里运行的应用内存也一起算进去,因此这个异常值也许有解释空间。
3. 人们期望的功能¶
订阅制里真正便宜、可高频使用的工作马模型¶
5 月 21 日最明确的未满足需求,不是更强的前沿模型——而是像旧版 Gemini 3 Flash 那样的模型:足够快,能支持迭代式编程;每个 token 又足够便宜,便宜到几乎可以持续不断地跑,而不会撞上每周上限。u/tadanada(得分 32)解释了为什么 Pro 套餐($20)在包含 Flash 3 时说得通:它相当于一个“无限量”的简单任务执行层。没有了它,Pro 这一档在同价位上就没有任何优势可言。用户想要的是一种分层模型组合:低成本档不是被拿来逼用户升级,而是被刻意保持充足。
能在出事前把账算清楚的按用量计费模拟¶
多条讨论其实都在间接要求同一件事:在用户真的改套餐之前,先给出一套现实的账单模拟,并且明确解释是什么触发了成本。u/Duckfine 的截图($1.78 vs $220.54)展示了用户现在是怎么做的——先把模拟图截下来,再跑到 Reddit 问大家自己该不该慌。产品应该在恐慌出现前就把这件事做好,而不是等到恐慌之后。
能自动演进的 CLAUDE.md 管理工具¶
技巧帖暴露出一个事实:CLAUDE.md 是一个用户希望跨会话自然生长的活文档。# 这个快捷方式(u/tonyboi76,得分 60)其实就是在绕过工具缺口:真正完善的 CLAUDE.md 生命周期管理器,应该让用户不用离开会话、也不用手动改文件,就能审阅、批准并做版本管理。
跨公司的 Claude Code 插件市场¶
u/KOM_Unchained(得分 40)描述了他们如何从零搭起这一套:把一个 git 仓库标记成自动更新源,里面放 semver 版本化的 skills 和 agents,让组织里的开发者和非开发者都能使用、也都能贡献。构建这类东西的底层条件已经存在,但目前还没有一个打磨完善的现成产品。
诚实且具备风险意识的 vibe 编程入门层¶
伪造社会认同的 PSA、关于“代码会离开你网络”的讨论串,以及那篇“npm 蠕虫”安全帖,其实都指向同一个缺口。很多新的 vibe 编程者一边构建、一边上线,却并不知道 FTC 对虚假广告的规定,也不了解 Firebase 默认数据暴露、未锁定 npm 依赖,或代码发给 AI 提供商后会经过怎样的基础设施范围。只要加上一层覆盖法律、安全和隐私基础知识的结构化入门,就能用很低成本去减少这类真实伤害。
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| Gemini 3.5 Flash (Antigravity) | 智能体模型 | (+/-) | 质量高、速度快,在 MCP Atlas / Finance / Reasoning 基准上领先 | 比 Gemini 3 Flash 贵 6x;Pro 套餐下每周配额几小时就会耗尽 |
| Gemini 3 Flash (Antigravity, legacy) | 智能体模型 | (+) 事后回看 | 适合迭代编程的近乎无限预算;速度快;成本低 | 已从 Antigravity GUI 移除;但仍可通过 TAU CLI 访问 |
| Antigravity 2.0 (Agent Manager + IDE + CLI) | 智能体套件 | (+/-) | Flash 3.5 的质量受到称赞;Agent Manager 可并行拉起子智能体;3x 配额缓解已落地 | IDE 自动更新后会自删;积分额度被移除;信任严重受损 |
| Claude Code / Opus 4.7 | 编程智能体 | (+/-) | TUI 进程管理、可用 # 编辑 CLAUDE.md、支持市场插件与 spawn_task 并行 |
部分用户报告过去一周性能退化;代码会离开本地基础设施 |
| Cursor Composer 2.5 | IDE 模型 | (+) | 在 Artificial Analysis 指数上排第 3;日成本从 $60 降到 $10 以下;能处理 120k 行迁移 | 在最难的任务上仍不如 GPT-5.5 和 Opus 4.7 |
| GitHub Copilot (new pricing) | 模型接入层 | (-) | 模型组合广;BYOK 现在支持自定义 API 端点(VS Code 1.121) | 按用量计费预览在正常使用下显示 124x 涨幅;网页端移除了 Gemini 模型 |
| VS Code 1.121 | 编辑器 + 智能体宿主 | (+) | 可监控远程智能体、Markdown 预览支持 Mermaid、HTML 预览、BYOK 自定义端点、终端输出压缩 | 还很早期;BYOK 自定义端点初期仅限 Insiders |
| OpenCode / OpenCode Go | 开源编程智能体 | (+) | 支持开放模型(DeepSeek V4、Qwen3.6);被提作 Copilot 和 Cursor 的迁移路径 | 社区较小;打磨度不如商业产品 |
| Runable | 落地页 / 文档构建工具 | (+) | 可快速部署落地页和文档;常与 Cursor 搭配使用 | 没有负面信号;适用场景较窄 |
| DeepSeek V4 | 开放权重模型 | (+) | Claude Code 质量下滑时,用户把它称赞为替代方案;可通过 OpenRouter 使用 | 需要 BYOK 配置 |
这张表里最强的模式,是定价压力下的替代行为:Gemini Pro 套餐用户一撞上 token 墙,就会转向 Cursor Composer 2.5 或 OpenCode;Copilot 用户一看到那张计费模拟图,就会转向 Claude Code 或通过 OpenRouter 使用开放模型。评论区里这些替代选择并不是随机发生的——它们稳定地落在那些固定费率更可预测的工具上。
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| PointMe(酒类商店指南针) | u/Cetautomatix777 | 指向最近酒吧或酒类商店的指南针 | 在不熟悉的区域寻找附近的酒吧 | Mapbox API, iOS | 已发布 | App Store |
| Myst 风格作品集(mattebso.com) | u/AbilityAny4629 | 按 Myst 游戏房间风格设计、可探索的作品集网站 | 所有 AI 网站看起来都一样 | Claude + Claude Design, ChatGPT image 2, Veo 3.1 | 已发布 | 网站, 帖子 |
| YGGDRA(yggdra.garden) | u/FarClient2449 | 带树状心智图和聊天界面的人格智能工具 | 通过结构化人生领域做自我认知和个人建议 | Web(技术栈未知) | 测试版 | 网站, 帖子 |
| MeowGPT(更新版) | u/Time-Ad-7720 | 带猫咪主题聊天机器人和动态吉祥物状态(neutral、typing、peek-a-boo、sparkle) | 为千篇一律的 AI 聊天壳子提供更好笑的替代品 | Claude Code(初版)、GPT Image 做 sprites、Photoshop 做 GIF 帧 | 已发布 | 帖子 |
| Claude Code → Remotion 发布视频 | u/Top_Commission_8567 | 以程序化方式用 Remotion 生成完整发布视频 | 不用手工剪视频也能做发布视频 | Remotion, Claude Code | 已发布 | 帖子 |
| StoneGPT | u/znatgost | 和一块石头聊天 | 荒诞主义创意实验 | 未知 | 已发布 | 帖子 |
| AI 游戏引擎(早期阶段) | u/APASDEEA1 | 用 AI 生成完整游戏的游戏引擎 | 从提示词直接生成整款游戏 | Antigravity 辅助,技术栈未说明 | Alpha | 帖子 |
PointMe 指南针应用之所以突出,在于它的技术学习日志极其具体。作者发现,Google Maps API 每 1,000 次请求要 $30,而 Mapbox 大约只要 $0.30(便宜 100x);还记录了大多数 LLM 都没法原生做出一个可用的指南针,以及 Cursor 在多步上下文理解上明显强于 Copilot。这类关于 API 成本和工具比较的具体知识,正是 vibe 编程者通过动手构建才会获得、而课程里教不到的东西。
Myst 风格作品集的可贵之处,在于它是有意识地反着“AI 网站千篇一律”的审美去做的。构建者把 Claude 用于布局,把 ChatGPT Image 2 用于环境生成,把 Veo 3.1 用于动画运动——这是一个多模型创意栈,做出来的结果和标准落地页模板有清晰差异。

YGGDRA 的人格心智图,展示了一种很有辨识度的界面模式——以 “YOU” 为中心的分叉树,围绕 Soul、Life、Psychology、Work 和 Childhood 等领域节点展开,说明 vibe 编程工具正在探索标准聊天框之外的知识图谱式界面。

构建者帖子里反复出现一个模式:最容易爆火的项目往往没什么用,或者几乎没什么用(酒类商店指南针、猫咪聊天机器人、和石头聊天),而技术上更有野心的项目(游戏引擎、Remotion 视频)反而互动量较低。社区注意力奖励的是人格和幽默,而不是复杂度。
6. 新动态与亮点¶
Antigravity 2.0 触发了大规模取消订阅信号¶
来自 u/AlessandroLobo 的《Broken Trust》帖子(发了两次:得分分别为 42 和 41)把这个模式说得很明白:Google 先说服开发者从 Claude Code 转到 Antigravity 上构建,接着又移除了让这套商业模式成立的关键条件,然后还在更新日志里把这次降级包装成改进。评审集中涉及的多条讨论(包括那些已经用了 6 个月 Ultra 套餐的用户)都明确表示,他们正在取消订阅,或者不再续费年付计划。u/Madlonewolf 的 《Anyone found a reason to still having pro plan?》 (24 分,26 条评论) 没收到任何对 Pro 套餐价值主张有说服力的辩护,评论里只有大家各自列出的退出路径。
GitHub Copilot 正式确认网页端移除 Gemini¶
GitHub 在 5 月 20 日的更新日志 中写明了,Copilot Chat 网页端已移除 Gemini 模型。这个时间点——恰好和 Antigravity 的配额危机同时发生——让 Reddit 产生了一种“Gemini 正在被协同收紧可用性”的印象,尽管这两件事其实是各自独立推动的。
Claude Code 在连续 60 天补测试覆盖后,生成了一个包含 1,943 个文件、1,060 次提交的 PR¶
u/Counter-Business 的 《Yall ever seen a PR like this?》 (108 分,76 条评论) 记录了 Claude Code 连续使用 60 天后,在提交层面会产出什么:一个刚刚合并的 PR,涉及 1,943 个变更文件、+377,696 行新增、-121 行删除,以及 1,060 次提交。

来自 u/Ok-Tax2953 的最高赞回复(得分 100)是:“那不是 PR,那是一次孤注一掷。”u/anon377362(得分 39)还贴出了 Bun 自己那个 30,412 次提交的 PR,给大家作对照。
VS Code 1.121 扩展了 BYOK,并原生加入 Mermaid 渲染¶
u/bogganpierce 的 《VS Code 1.121 is now live!》 (74 分,41 条评论) 覆盖了一次很有意义的发布:BYOK 现在支持一种自定义端点模式,可以接入任何兼容 OpenAI 聊天补全格式的 API;旧版 BYOK 一直有持续性问题,因此这次是从头重写。Mermaid 图现在能在 Markdown 预览里原生渲染。HTML 文件可以直接在集成浏览器里预览。终端输出现在会先压缩再发送给智能体,以减少 token 消耗。
7. 机会在哪里¶
[+++] 订阅制下充足且廉价的算力档位 — 5 月 21 日最清晰的缺口,就是 Google 刚刚移除的那类产品:一种按月或按年固定付费、但可用于迭代式编程工作的近乎无限低成本模型。需求并不是前沿模型;需求是一个不必数 token、也不用盯着每周进度条的工作马档位。任何能可信地提供这一点的提供商,都会吃下 Antigravity Pro 的退订潮。
[+++] 诚实的计费模拟与配额可观测性 — $1.78 vs $220.54 的 Copilot 对比,以及 Antigravity 那些“6 天 18 小时后刷新”的配额界面,本质上都是用户偶然才发现的信息。一个真正对计费敏感的 AI 编程订阅产品,如果能在用户撞墙之前就显示实时成本模拟、预测月度总额和配额轨迹,就能补上所有提供商共同存在的信任缺口。
[++] AI 编程平台的迁移工具 — 持续 2 天的 Antigravity 迁移危机和 Copilot 定价冲击引发的出走潮,实际上暴露的是同一种痛点:开发者没有一种干净的方法,把项目上下文、CLAUDE.md 等价物、扩展配置和会话历史,从一个 AI 编程环境迁到另一个。一个与平台无关的项目上下文导出器,会在这个领域的每一次换工具事件里派上用场。
[++] CLAUDE.md 生命周期管理 — # 快捷方式说明,CLAUDE.md 文件已经开始超出手工维护的范畴。一个真正完整的生命周期工具——带会话级 diff 审查、审批流、版本历史和团队共享——既能服务不断扩大的 Claude Code 重度用户群,也能服务技巧帖里提到的跨公司插件市场场景。
[+] vibe 编程者的法律与合规入门 — 那条伪造社会认同的 PSA(FTC $50,000+ 罚款)、Firebase 数据暴露警告,以及 npm 依赖审计建议,都指向一种真实伤害,而这个社区里的很多人其实并不知道它的存在。只要在流行的 vibe 编程模板里内置一页清单或一层轻量合规检查,就能同时服务于法律风险降低和社区信任提升。
[+] 面向差异化 UX 的多模型创意栈 — Myst 作品集(Claude + ChatGPT Image 2 + Veo 3.1)就是一个很具体的例子:多个模型组合起来,可以做出明显不同的终端结果。当前还没有任何工具,能让人轻松编排多个 AI 提供商去共同产出一个创意成品。面向前端和创意构建者的多模型流水线构建器,有机会规模化解决“每个 AI 网站看起来都一样”的挫败感。
8. 要点总结¶
- Antigravity 的配额危机在战术层面得到缓解,但战略层面没有解决。 Google 的 3x 配额提升缓解了当下的不满,但既没有恢复 Gemini 3 Flash,也没有处理底层成本数学。用户算得很清楚:不够用的配额乘以 3x,仍然不够用,因此取消订阅意愿依旧很高。 (来源, 来源)
- 所有主流 AI 编程平台的定价,都在同一时间朝着同一个方向移动。 Antigravity 收紧配额、Copilot 推出按用量计费预览,以及 Copilot 网页端移除 Gemini,这三件事都发生在 24 小时内。Copilot 定价帖的评论区直接把它描述为整个行业补贴结束,而不是某一家厂商的单独决定。 (来源, 来源)
- Cursor Composer 2.5 从多个方向承接了换工具需求。 它同时出现在 Copilot 迁移建议、Antigravity 退出讨论,以及同一天 5 条独立的正面评价里——而且每次被提及,核心原因都是成本效率。独立基准数据还把它排到了 Artificial Analysis 智能指数的第 3 名。 (来源, 来源)
- vibe 编程的身份认同争论仍未解决,但“它确实能让人学到东西”这套论点正在获得更具体的证据。 PointMe 指南针应用——当天得分最高的帖子——展示了真实的 API 成本发现($30/1k Google Maps vs $0.30/1k Mapbox)、工具对比(Cursor vs Copilot 在多步上下文上的表现),以及一个已经上线的 iOS 产品,这些都是学习过程的直接产物。 (来源)
- Claude Code 已经出现一种口耳相传的知识传统。 那条技巧帖里整理出了多个已有文档记录的捷径(把
#写入 CLAUDE.md、spawn_task、以及会话中途切换/model),但这些仍不在官方文档里。这说明工具真实的能力表面,与新用户靠自己能发现的那部分之间,仍然存在明显落差。 (来源) - AI 生成的落地页正在悄悄上线虚假广告。 Claude Code 会生成“受到 15,000 名用户信赖”这样的占位文案,而创始人因为它看起来可信就直接保留。FTC 将其视为虚假广告,罚款最高可达 $50,000+。目前没有流行的 vibe 编程模板会默认提醒用户避开这个问题。 (来源)