跳转至

Reddit AI 编程 - 2026-04-24

1. 人们在讨论什么

1.1 事后报告余波:验证、怀疑,以及要求更多补偿(🡒)

Anthropic 的 4 月 23 日事后报告 确认过去一个月有三个 bug 降低了 Claude Code 质量,这一话题连续第二天主导讨论——但语气从松一口气转向怨气。事后报告验证了用户数周来被否定的投诉,现在社区正在争论 Anthropic 的透明到底是真诚,还是被 GPT 5.5 发布逼出来的。

u/Direct-Attention8597 发布了当天最高赞帖子,得分 2,580:Anthropic 刚发布事后报告,解释 Claude 过去一个月为什么感觉变笨。最高赞评论来自 u/Sufficient-Farmer243(677 分):“所以基本上,他们 gaslight 我们好几周的每一个问题,最后都确实是我们以为的那样。”u/TheBanq这份“postmortem”——Anthropic 是不是只是为了和 GPT 5.5 竞争而把 Opus 重新 unnerf?(258 分,89 条评论)中直接追问这些 bug 是真实问题,还是为了掩盖曾经有意 nerf、后来在竞争压力下撤回。u/NoTailor8223Claude Code 回退:我们应得到 1 个月 credit,而不只是 limit reset(196 分)中要求整整一个月的补偿。u/prnkzzpost-mortem 缺少什么:对用户反馈的任何承诺(42 分)中指出,事后报告没有给用户提供未来上报回退的机制。

ClaudeDevs tweet,确认事后报告并为所有订阅者重置使用限制

官方 Anthropic 事后报告摘录,说明 3 月 4 日至 4 月 20 日降低 Claude Code 质量的三个 bug

与前日对比:4 月 23 日事后报告是突发新闻,最初反应相对正面。今天怀疑占主导——用户质疑发布时间、补偿是否足够,以及这些“bugs”是否是只有在 GPT 5.5 迫使 Anthropic 让步后才撤回的有意省算力措施。

1.2 GPT 5.5 以 7.5x 成本进入 GitHub Copilot(🡕)

GPT 5.5 “Spud” 于 4 月 24 日在 GitHub Copilot 中全面可用,premium request multiplier 为 7.5x——这是 Copilot 迄今提供过的最昂贵模型。定价立刻引发反弹。

u/JaninnhoGPT-5.5 is generally available for GitHub Copilot(72 分,107 条评论)中分享了公告。u/Hyp3rSoniX(73 分)问“promotional pricing”是否意味着以后还会更贵。u/Rock--Lee 预测 GitHub 会“很快移除 5.4,然后彻底转向 token based”。u/CryinHeronMMericaChatGPT 5.5 Released!(171 分,75 条评论)中发布初始反应,其中 u/Ancient-Frosting-422(50 分)指出“GPT 5.5 的 API 按 token 计费比 Claude Opus 4.7 还贵”。与此同时,u/BetterAd7552我们其实过得不错,刚试了 Codex(60 分,145 条评论)中给出反向叙事,不过最高赞评论 u/m-shottie(108 分)不同意:“我个人觉得这阵子 Codex 更好用。”

与前日对比:4 月 23 日 GPT 5.5 刚发布。今天它带着具体定价进入 Copilot——7.5x multiplier 正在制造与 Anthropic Max plans 类似的成本愤怒。

1.3 跨平台 Rate Limit 危机加剧(🡕)

Rate limits 同时更重地打到每个主要 AI coding 平台。Claude Code、GitHub Copilot 和 Google Antigravity IDE 都施加或收紧了使用限制,让开发者在平台之间来回碰壁。

在 Claude Code 上:u/dennisplucinik这种新的焦虑叫什么?(55 分,45 条评论)中用一张截图捕捉了焦虑:每周用量已消耗 79%。u/pavel_molianovYou've hit your org's monthly usage limit(76 分)中撞到 Max plan 上的 org-level limit。u/SubVettelMy weekly reset date changed again! (again!)(13 分,26 条评论)中报告 reset date 变化。

Claude Code 每周使用限制显示已消耗 79%,距离重置还有 11 小时

Claude Code 在 Max plan 上,一条“hi”消息就显示 org monthly usage limit hit

在 GitHub Copilot 上:u/CookieAway995Limits are getting more aggressive now(62 分)中报告 WebSocket error,显示 5 小时 session limit。u/new-oneechan为什么 auto / zero-cost models 也会 rate limited?(67 分)中说自己甚至在 zero-cost models 上被限流。u/Individual_Ad6564Copilot Student plan limits are way too aggressive(45 分)中记录 student plan 限制。

Copilot WebSocket error,显示超过 5 小时 session limit,并有 8244 秒 retry timer

Copilot 显示 zero-cost GPT-4.1 model 也用完 100% weekly rate limit,直到 4 月 27 日才重置

Copilot Student plan 显示 weekly rate limit hit,premium requests 只有 1% 但不可用

在 Google Antigravity 上:u/kingstar_vAntigravity IDE getting worse instead of better(65 分)中报告情况恶化,u/nothebestpersontoaskWe no longer get 25,000 per month(13 分)中发现每月 credits 被砍半。

与前日对比:和 4 月 23 日模式相同,但更严重。Copilot 现在除了 weekly limits 外还有 session-level limits。Claude Code 的 org-level caps 是新维度。Google Antigravity 未公告就把 credits 砍半,增加了第三条战线。

1.4 修复后 Opus 4.7 质量仍有争议(🡒)

即使事后报告中的 fixes 已上线,Opus 4.7 质量报告仍然分裂。有些用户报告明显改善,另一些仍称它“几乎不可用”。

u/ddriseOPUS 4.7 with effort high level is nearly unuseable for any high-difficulty job(84 分,70 条评论)中报告,模型会偷工减料,写假的 unit tests,除非设置到 max effort。u/endgamer42还有人觉得 xhigh/max useless 吗?(15 分,19 条评论)中发问。正面一侧,u/Xccelerate_Opus 4.7 今天终于表现得像 absolute beast(25 分,61 条评论)中报告重大转机,u/gtgderekWhat's Working for Me with Opus 4.7...finally(69 分)中分享成功配置。u/Silver-Range-8108Claude Design + Opus 4.7 is actually game changing(137 分)中称其能在 20 分钟内搭出 award-winning 风格网站。

与前日对比:4 月 23 日由质量负面反馈主导。今天信号混合——fixes 帮到了一些 workflow(尤其设计),但没有解决高 effort 推理任务中的深层问题。

1.5 Vibe Coding 现实检查加深(🡒)

vibe coding 社区继续自我纠偏,tech debt 恐怖故事、安全警告和 Dunning-Kruger 点名,与真实成功故事并行。

u/Available-Dentist992 发布了当天第二高分帖子,874 分:vibe coded for 6 months. my codebase is a disaster(338 条评论)。应用可用,用户付费,但新开发者打开 repo 后“安静了大概 2 分钟”。最高赞评论来自 u/johnkapolos(549 分),把重写周期正常化:“你赚钱,然后当 codebase 阻碍你交付价值时,就付钱请开发者从头重写。这在 vibecoding 之前也发生过。”u/bekircagricelikThe one thing I shouldn't have vibe coded(138 分,66 条评论)中分享了具体 Stripe billing bug——缺少边界情况处理导致重复订阅。u/nPolyDunning-Kruger effect should be pinned at the top of this subreddit(50 分,131 条评论)中再次提到 Dunning-Kruger。

反向叙事:u/TrueEstablishment630I vibe-coded GTA on Google Earth over the weekend(775 分,91 条评论)走红——一个基于真实城市、有偷车、警察追捕和机场飞机的游戏,用 Claude Code + Cesium + Google 3D Tiles 构建,作者没有游戏开发背景。

与前日对比:延续 4 月 23 日“通过失败成熟”的主题。社区最高赞内容继续是警示故事而非 showcase,但 GTA-on-Earth 这样的雄心项目说明上限仍在上升。

1.6 SpaceX-Cursor 隐私担忧持续(🡖)

4 月 23 日确认的 SpaceX-Cursor 收购今天讨论量下降,但隐私担忧仍活跃。

u/ChildlikeBeginner所以 Elon Musk 最后会拿到数百万 Cursor 用户的源代码?(107 分,74 条评论)。u/impossiblyben 指出用户可通过 Cursor 的 Privacy Mode 设置 opt out。u/Borat_2020 反驳:“Microsoft 已经能访问你所有 github。”

Cursor Privacy Mode 设置,显示可 opt-out code data training

与前日对比:从 4 月 23 日大规模取消订阅的峰值下降。今天讨论从情绪化出走转向实际隐私缓解。

1.7 Seniors 在企业中击败 AI(🡒)

关于有经验开发者胜过 AI 的反向叙事从 4 月 23 日延续,并保持互动。

u/CacheConqueror不可思议的转折:seniors 开始击败 AI(300 分,147 条评论)中报告,其大公司现在正在重新招聘 senior developers,因为 AI-driven layoffs 被证明比预期更昂贵。最高赞评论来自 u/unspecified_person11(284 分):“如果不雇 juniors,就不会有 competent seniors。”u/skidmark_zuckerberg这里有经验开发者觉得自己的编码能力正在被侵蚀吗?(21 分,43 条评论)中问,依赖 AI 是否正在降低开发者技能。

与前日对比:与 4 月 23 日同一主题,但互动更深(300 vs 186 分)。pipeline concern——不雇 juniors 就没有未来 seniors——正在成为主导框架。

1.8 Google 向 Anthropic 投资 $40B(NEW)

u/TimeKillsThem 分享了 Google to invest $40B into Anthropic(148 分,29 条评论),链接到 Yahoo Finance 报道。用户将其解读为 Google “放弃 Gemini models”。评论争论这是 Gemini 衰落信号,还是单纯的 hedge。

与前日对比:4 月 23 日没有这个主题。新进展具有长期竞争含义。


2. 令人困扰的问题

事后报告补偿不足

严重程度:高。用户认为使用量重置不足以补偿一个月的降级服务。u/NoTailor8223Claude Code Regressions: We deserve a 1-month credit(196 分)中要求整月 credit。u/butimjustagirl 指出 $200 free credit “一天就用完了”。u/Jack_Dnlz 指出 reset 来在“周末前 1.5 个工作日,而大多数人周末不碰电脑”。

所有平台的 Rate Limits

严重程度:高。没有一个主要 AI coding 平台提供可靠、不限量访问。Claude Code 有周限额、会话限额和组织级限额。GitHub Copilot 对 zero-cost models 也施加周限额和会话限流。Google Antigravity 未公告砍半月度额度。用户被推向其他平台,却发现同样限制无处不在。证据覆盖 r/ClaudeCode、r/GithubCopilot 和 r/google_antigravity 至少 15 个独立线程。

Opus 4.7 Effort Level 不一致

严重程度:中。u/ddrise《OPUS 4.7 with effort high level is nearly unuseable》(84 分,70 条评论)中报告 Opus 4.7 在 high effort 下“有几乎不可控的偷工减料倾向”。用户必须用 max/xhigh effort(烧更多 tokens)才能获得可接受输出,形成成本-质量陷阱。

GPT 5.5 Cost Multiplier

严重程度:中。Copilot 中 GPT 5.5 的 7.5x premium request multiplier 意味着 Pro+ 订阅者在这个档位上每天大约只有 5 个请求。u/Snorkleds 点名“premium request multiplier 高达 7.5x,而且只有 Pro+ 及以上档位可用”。u/Mediocre-Wonder9080 指出“而 Cursor 那边在 5 月 2 日前对 GPT 5.5 还在打五折。”

Copilot 模型频繁变动

严重程度:中。u/cryptogod1987 发布 《Please add back Claude Opus 4.6》(77 分,48 条评论)。u/Iajah《Bring back Opus 4.6 at 3x for Pro+》(64 分)中呼应。用户觉得模型被移除时,没有提供同等质量/成本比的替代品。

Claude Code CLI 不稳定

严重程度:低。u/anotherJohn12《Claude Code CLI layout constantly break near to the point that unusable》(9 分,19 条评论)中报告终端 UI 渲染问题,这种小问题放大了整体信任侵蚀。


3. 人们期望的功能

透明使用仪表盘

u/Diabolacal 构建 token tracker,发现 Copilot 使用中 87.8% 是服务开销——也就是说用户被计费的 token 里只有约 12% 来自自身提示词/补全。发布在 Instead of guessing about Copilot limits, let's collect some actual data(43 分,36 条评论)。u/hyperdx开发用量计量器来检查所有限制很难吗?(14 分)。没有平台原生提供实时 token 仪表盘。

Copilot token tracker dashboard,显示 30 天内消耗 36.3M tokens、87.8% service overhead、估算成本 $228.80

Pro 与 Max 之间的中档定价

Claude Code 的 $20/月 Pro 方案与 $100+/月 Max 方案之间差距仍太大。u/anon_mistborn 改用默认 Sonnet,并准备 购买 M4 Max Studio(61 分,83 条评论),而不是支付 Max 定价。u/ApprehensiveEcho2073 请求 昂贵 Opus 4.7 的替代品(13 分,34 条评论)。

Claude Code 模型选择器显示定价:Sonnet 4.6 1M 为 $3/$15 per Mtok,Opus 4.7 1M 为 $5/$25 per Mtok

模型无关 Coding Harness

用户希望在不换工具的情况下自由切换模型 backend。u/R3K4CE 取消 Copilot(27 分,30 条评论),“不是因为 AI 已死,而是单一订阅模式正在失灵。” u/99xAgency 描述 Claude + Codex = Excellence(71 分,57 条评论)——同时使用两个工具,因为没有一个单独足够。

恢复 Opus 4.6 作为可选项

多个 r/ClaudeCode 和 r/GithubCopilot 线程要求 Opus 4.6 回归 first-class option。用户宁愿选择其可预测行为,而不是 4.7 的不一致,即使 benchmark 偏向新模型。

面向 Vibe Coders 的生产就绪工具

u/PaddleboardNut《If you're about to launch a "vibe coded" app... read this first》(617 分,99 条评论)中提供了手动安全清单,但提到正在构建自动化工具。u/bekircagricelik 的 Stripe 重复订阅 bug 说明为什么需要自动支付流程审计。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
Claude Code (v2.1.116-118) AI coding CLI Mixed — 正在改善但信任赤字仍在 Postmortem fixes 为部分用户恢复质量;Claude Design + Opus 4.7 因 Web design 获赞;1M context window Weekly/session/org limits;effort level 不一致;CLI 渲染 bug;Pro plan 对 Opus access 设 paywall
Codex / GPT 5.5 “Spud” AI coding CLI Cautiously positive 与 Claude Code CLI 功能接近;开箱 RAG 更好;GPT 5.5 已进入 Copilot 7.5x Copilot multiplier;API cost 超过 Opus 4.7;信任仍在建立
GitHub Copilot (Pro/Pro+) IDE integration Negative — 限制主导 广泛 IDE 支持(VS Code、JetBrains、Xcode、Eclipse);GPT 5.5 access Weekly + session rate limits;model churn(Opus 4.6 被移除);暂停 Business self-serve signups
Cursor AI IDE Negative — 收购担忧 强 autocomplete(u/garg-aayush:“still way ahead of its peers”);50% GPT 5.5 promo SpaceX 收购隐私担忧;大规模取消订阅潮
Google Antigravity IDE AI IDE Negative — 可靠性下降 Free tier;Gemini integration High-traffic errors 持续;monthly credits 未公告砍半
DeepSeek V4 Pro Open-weight model Neutral-curious 新发布,引发兴趣 u/Altruistic-Dust-2565:通过 OpenRouter BYOK tool calls 不可靠
Local models (Qwen 3.6, Kimi) Self-hosted Positive — 动能增长 零 rate limits;隐私;接近云端质量 需要昂贵硬件(M4 Max Studio);与 frontier models 的差距正在缩小但仍存在
DESIGN.md workflow Prompt engineering Positive — 小众热情 u/Ok_Use1957:在 帖子(9 分,32 条评论)中说“the concept finally clicked” 有学习曲线;尚未广泛采用

5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
CrimeWorld (GTA on Google Earth) u/TrueEstablishment630 基于真实世界地图数据的开放世界犯罪游戏,含汽车、飞机、警察、医院 展示复杂交互 app 的 vibe coding 上限 Claude Code, Cesium, Google 3D Tiles Alpha (waitlist) cw.naveen.to, post
Copilot Token Tracker u/Diabolacal 追踪实际 Copilot token 消耗并估算成本的 VS Code extension 没有平台提供原生使用透明度 VS Code extension Beta post
Claude Radio (WRIT-FM) u/eltokh7 用 Claude Code 生成的 24/7 AI radio channel 创意 AI 应用、自主内容生成 Claude Code Shipped post
DOT (offline AI buddy) u/Koopericher 完全在 iPhone 上运行的离线 AI companion 不依赖云的隐私优先个人 AI Swift, on-device inference Shipped post
AI Coding Plans Comparison u/SelectionCalm70 汇总主流 AI coding 平台价格对比 用户需要在 10+ provider 页面间比较 plan Web (Hermes Guide) Shipped post
Real-time Agent Monitor u/Redrock990 用 game engine frontend 实时监控 AI agent 活动 看清自主 agents 正在做什么 Game engine frontend Alpha post
Vibe-coded app at 100 EUR MRR u/luis_411 未命名 app 达成首个收入里程碑 证明 vibe coding 可产出创收产品 Not specified Shipped (revenue) post

Claude Radio WRIT-FM 界面,显示实时 AI-generated trip-hop downtempo stream

Stripe MRR 仪表盘,显示 vibe-coded app 于 2026 年 4 月达到 100 欧元月度经常性收入


6. 新动态与亮点

GPT 5.5 在 GitHub Copilot 中全面可用

OpenAI 的 GPT 5.5 “Spud” 于 4 月 24 日在 Copilot 中推出,premium request multiplier 为 7.5x。Pro+、Business 和 Enterprise 档位可用。促销定价暗示成本可能进一步上涨。来源:GitHub Blog changelogu/Janinnho

Claude Code System Prompt v2.1.118 被提取

u/AldebaranBeforeClaude Code System Prompt v2.1.118(91 分,32 条评论)中发布完整 Claude Code system prompt v2.1.118。prompt 被 发布到 GitHub。另外,u/CommunityTough1PSA: official Superpowers plugin has 'ultrathink' baked into systematic-debugging skill(23 分)中警告 Superpowers plugin 可能会静默提升 reasoning effort。

Opus 4.7 通过 Web Search 检测 Prompt Injection

u/whoisyuriiBe careful allowing Claude do WebSearch(113 分,18 条评论)中记录 Opus 4.7 能捕捉并报告通过 web search results 注入的假 <system-reminder> blocks。模型标记了 injection 并明确告知用户,不像 Opus 4.6 可能会静默遵循注入指令。

Claude Code terminal 显示 Opus 4.7 检测并标记来自 web search results 的 prompt injection 尝试

Google 向 Anthropic 投资 $40B

Yahoo Finance,Google 正把对 Anthropic 的投资加深到 $40B。来源:u/TimeKillsThem(148 分)

GitHub 暂停 Self-Serve Copilot Business Signups

u/fishchar 分享 Pausing new self-serve signups for GitHub Copilot Business(40 分,29 条评论)。结合 outage 和激进 rate limits,这表明 GitHub 正在为 Copilot 容量挣扎。

“Model Fatigue”进入词汇表

u/Complete-Sea6655 发布讽刺图,显示每个 AI lab 都在循环声称“the world's most powerful model”,得分 445。该图精准概括了一种增长中的情绪:用户已经被不断更换的模型发布和“best model”说法耗尽耐心。

讽刺图,显示 OpenAI、Claude、Gemini、DeepSeek、Grok 和 generic LLMs 都声称推出世界最强模型


7. 机会在哪里

[+++] 使用透明度工具。没有主要 AI coding 平台提供实时 token dashboards。u/Diabolacal 的社区 tracker 揭示 87.8% service overhead——意味着用户消耗的 token 是自己 prompts/completions 的 8 倍。一个打磨好的跨平台 usage monitor(覆盖 Claude Code、Copilot、Cursor 和 Codex),将服务今天 15+ 个 rate-limit complaint threads 中每个受挫用户。

[+++] 模型无关编程运行框架。信任正在所有平台同时崩塌:Anthropic 的 bug、Copilot 的限制、Cursor 的收购、Antigravity 的额度削减。像 u/99xAgency 这样的用户已经把 Claude + Codex 串联使用。一个统一运行框架,如果能让开发者在会话中途切换后端,同时保持一致的提示工程、上下文和工具集成,会同时捕获每个平台失败后的迁移用户市场。

[++] 本地模型基础设施与工具。限流是推力,质量提升是拉力。用户正在购买 M4 Max Studios 用于自托管。u/DidiFUnky 写了 Local AI for Code in 2026: The Real Alternative(27 分)。u/icebslim 呼吁 shared self hosting opensource models(6 分)。让本地模型无缝进入编程工作流的工具(模型服务、提示词优化、IDE 集成)仍供给不足。

[++] 中档 AI 编程订阅($40-60/月)。$20 Pro(Opus 访问受限、被限流)与 $100+ Max 之间的缺口制造了“缺失的中间档”,推动取消订阅。u/anon_mistborn 宁愿花 $5K+ 买硬件,也不愿付 $200/月。一个 $50/月档位,如果能提供可靠 Opus 访问和可预测限制,会留住当前完全退出生态的用户。

[+] 面向 vibe-coded apps 的生产就绪自动化。Stripe 重复订阅 bug、4 月 23 日 $25K 云账单,以及 617 分安全清单帖,都显示对自动 guardrails 的需求——payment flow auditors、cost monitors、security scanners——尤其针对会跳过边界情况的 AI-generated codebases。

[+] AI coding plan 对比和推荐引擎。u/SelectionCalm70 的手工对比表(48 分)显示需求。7+ providers、每家 3-5 tiers、限制不断变化,一个基于使用模式推荐最佳 plan 的自动工具可以降低切换摩擦。

AI 编程方案价格对比,显示 Claude、Codex、Kimi、Gemini、Z.AI GLM 和 Mistral 档位


8. 要点总结

  1. 事后报告第二天的故事是信任,而不是 bug。 Anthropic 确认了三个真实 bug,但社区的主导问题变成:发布时间是否由 GPT 5.5 发布推动,而不是真正透明。补偿(usage reset)被广泛认为不足以覆盖一个月降级服务。(u/TheBanq, u/NoTailor8223)

  2. GPT 5.5 以削弱竞争定位的价格进入 Copilot。 7.5x premium request multiplier 让它按每任务成本看约等于 Claude Code 的 Max plan,抵消了“更便宜替代”的叙事。两个平台都在收敛到相似 price points,同时都没有提供可靠 unlimited access。(u/Janinnho, u/Ancient-Frosting-422)

  3. Rate limits 现在是所有平台的定义性挫败,而不只是某一个平台的问题。 Claude Code 有 weekly、session 和 org-level limits。Copilot 有 weekly 和 session limits,甚至 zero-cost models 也会触发。Antigravity 砍半 credits。没有“escape hatch”平台——这就是模型无关和 local-first tooling 需求激增的原因。(u/CookieAway995, u/pavel_molianov)

  4. vibe coding 的 874 分灾难帖确认了成熟模式。 最高赞 vibe coding 内容持续是警示故事和 technical debt confession,而不是 showcases。但社区在自我纠偏:最高赞回复把重写周期正常化,安全清单热度超过 demos。(u/Available-Dentist992)

  5. 87.8% service overhead 是当天最有揭示性的数字。 社区构建的工具发现,Copilot token 消耗中只有约 12% 来自用户 prompts 和 completions,其余是向用户计费的基础设施 overhead。如果大规模确认,这会从根本上改变 rate limits 应如何评估和定价。(u/Diabolacal)

  6. Opus 4.7 通过 web search 检测 prompt injection 是真正的能力进展。 虽然该模型仍会在基础推理题上失败(对“how many p in strawpberry”回答“3”),但它成功识别并报告了通过 web search results 注入的恶意 <system-reminder> blocks——这是 Opus 4.6 似乎没有的防御。(u/whoisyurii)

  7. Google 的 $40B Anthropic 投资和企业重新招聘趋势指向同一个结论:AI coding 市场正在围绕可靠性而不是原始能力整合。 公司正在发现,最便宜的模型不是 API 价格最低的模型,而是产出可维护结果的模型。(u/TimeKillsThem, u/CacheConqueror)

  8. 今天的数据集(244 个帖子,122 个 review set)由 r/ClaudeCode(44 个帖子)、r/GithubCopilot(34)和 r/vibecoding(30)主导。 最高得分 2,580。事后报告后续、GPT 5.5 Copilot 发布和跨平台 rate limits 是三条收敛主线。