Reddit AI 编程 - 2026-04-16¶
1. 人们在讨论什么¶
1.1 Opus 4.7 发布后立即遭遇嘲讽和推理失败 (🡕)¶
Claude Opus 4.7 于 4 月 16 日发布,迅速占据全部 7 个监测中的 subreddit,至少出现 15 个专门讨论串。u/ClaudeOfficial 发布了官方公告(968 分,379 条评论):复杂编程能力更强,视觉分辨率提升 3 倍,API 价格仍为每百万 token $5/$25,并加入 Project Glasswing 的网络安全防护(Claude Opus 4.7 发布:迄今最强大的 Opus 模型)。社区最高赞回应来自 u/Ok-Actuary7793(619 个赞同):“系好安全带吧兄弟们,我们又能用上 3 天下一代模型,然后再次脑叶切除。”
当天最高分帖子(1746 分,275 条评论)是 u/Dramatic_Method_9554 截图展示 Opus 4.7 在“洗车测试”中失败——被问到去 50 米外的洗车店该走路还是开车时,它回答:“走路……开一辆你正要去洗的车毫无意义”(Opus 4.7)。多名用户复现了这个推理失败。u/Kaelthas98(139 个赞同)发布截图显示 Haiku 4.5 回答正确:“原来 Haiku 4.5 一直才是真 AGI。”

官方公告发布前,u/No-Macaron9305 发现模型提前出现——一张截图显示 Opus 4.6 选择器返回的模型 slug 是 claude-opus-4-7(1015 分,137 条评论)。u/Healthy_Razzmatazz38(319 个赞同):“突然之间,我所有同事马上都要聪明几个百分点了”(开始了)。

这种嘲讽情绪在 u/anthsoul 的帖子中定型。该帖(505 分,29 条评论)分享了 @hetmehtaa 的一条推文:“给大家 Opus 4.6 > 大家很喜欢 > 你把 Opus 4.6 劣化 2 个月 > 你把正常版 Opus 4.6 还回来,并叫它 Opus 4.7 > 大家很喜欢。这就是商业模式”(做 Anthropic)。u/workphone6969 说得更直接:“Opus 4.7 = 没被削弱的 Opus 4.6”(107 分)(Opus 4.7 = 没被削弱的 Opus 4.6)。

数小时内,u/Harvard_Med_USMLE267 发帖问“Opus 4.7 被削弱了?”(134 分,39 条评论):“99% 确信 Anthropic 已经开始跑 2-bit 量化来省钱……订阅已取消”(Opus 4.7 被削弱了?)。u/BeautifulLullaby2:“Claude Max x5 的额度大概 20 分钟就烧完了,对我当前项目完全变蠢、迷路了,回去用 Opus 4.6”(44 分)(Opus 4.7 无法使用)。
讨论要点: 先削弱再换牌的叙事,已经成了社区评估每一次 Anthropic 模型发布时的默认视角。即便早期评价是正面的,社区也会把它看作暂时现象——“趁它 2 个月后劣化前,赶紧把苦活做完”(u/TriggerHydrant,101 个赞同)。相比 Anthropic 的官方基准,社区更看重“洗车测试”这个 meme;它已经成了事实上的社区评测。
与前日对比: 4 月 15 日的报告基于泄露代号(Capybara、Tengu)判断 Opus 4.7 即将发布。4 月 16 日则迎来实际发布、社区即时反弹,以及数小时内第一批“已经被削弱”的报告——把从 hype 到失望的完整周期压缩到了一天之内。
1.2 GitHub Copilot 上的 Opus 4.7 定价冲击 (🡕)¶
GitHub 宣布 Copilot 可用 Opus 4.7,但高级请求倍率高达 7.5x——同时 Opus 4.5 和 4.6 正在逐步下线。u/baeleeef 分享了更新日志(139 分,210 条评论)。u/nvez(160 个赞同):“为什么会是 7.5x(而且还是促销期……所以之后还会更贵?),还要替换 4.5 和 4.6?这看起来像大幅涨价……尤其 Anthropic 那边的定价根本没变”(Claude Opus 4.7 已在 Copilot 中上线,高级请求倍率为 7.5x)。
u/Devile(79 个赞同):“先是限流,然后是每周限流,现在又把最常用的模型(x3)弃用,换成 x7.5 的后继版本。我很火大。”u/Famous__Draw(57 个赞同):“尽管要 7.5x,还是卡在 200k 上下文窗口。”u/DillyMing 补充说,Copilot 把该模型限制在 160K 上下文,并锁定中等思考预算(64 分)(Copilot Claude Opus 4.7 为 7.5x)。
在 Cursor 上,u/AdAutomatic1446 报告 Opus 4.7 首发 5 折,但强制进入 Max 模式(59 分,31 条评论)。u/FallopianInvestor(8 个赞同):“只问了一个问题,就用了差不多 40 个 token,甚至没写代码。强制 Max 模式”(Opus 4.7 刚在 Cursor 上线)。
讨论要点: Opus 4.6 被强制弃用,再叠加倍率从 3x 提到 7.5x(上涨 2.5 倍),社区把它解读为披着升级外衣的实际涨价。过去依赖 Opus 4.6、接受 3x 成本的用户,现在要么面对 7.5x,要么彻底换用其他模型。
与前日对比: 4 月 15 日追踪的是限流这个行业状态。4 月 16 日又在 Copilot 上加入了结构性定价变化,进一步放大限流带来的挫败感——即使用户还没撞到限额,每次 Opus 请求也会以 2.5 倍速度烧掉配额。
1.3 所有平台上的限流和故障仍在持续 (🡒)¶
API 500 错误在 4 月 16 日继续出现,至少有 5 个不同讨论串。u/barack17 确认早上出现 500,而状态页仍显示“正常运行”(95 分,100 条评论)(Claude Code 挂了吗?)。u/dennisplucinik 记录到官方在不到 5 分钟内承认问题,服务到 EST 上午 11:03 恢复(90 分,73 条评论)(今天早上又出现“API Error: 500”错误)。u/marciuz777 发布 Anthropic 状态页截图,显示面向消费者的服务处于“Degraded Performance”:claude.ai 为 97.95%,Claude Code 为 98.41%,Claude API 为 98.65%——而 Claude for Government 仍保持 99.96%(258 分,70 条评论)(发现什么了吗)。

Boris Cherny 在 Twitter 宣布,为补偿 Opus 4.7 更高的思考 token 用量,所有订阅者的限额都已提高(220 分,67 条评论)。u/anthsoul(155 个赞同):“他们先打断你的腿,然后让你感谢他们给了拐杖。”u/rJohn420 在 Max x5 上测试后发现,只多了约 10% 容量(提高限额)。

在 Copilot 上,u/Maverobot 记录自己使用 Pro+,即使冷却了一整晚,也在单个提示词后就被限流(54 分,64 条评论)。u/KayBay80(26 个赞同):“我们整个团队都在撞这些限制……目前想出的唯一办法是开多个账号,让其他账号冷却”(Copilot Pro+ 是个笑话)。u/flipperj_3000 在用了 8 个月后取消 Pro+:“一个简单的 2000 行代码审查我都会被限流”(34 分,50 条评论)(每周限额让我退订)。

Google Antigravity 的故障仍在继续,u/Black_Star_1 发帖问“Google 是不是要放弃 Antigravity 了?”(71 分,63 条评论)(Google 要放弃 Antigravity 了吗?)。u/LawfulnessLocal4934 报告“Ultra 套餐用户遭遇大规模无声故障”(29 分,36 条评论)(大规模无声故障)。
与前日对比: 4 月 15 日记录了两波故障。4 月 16 日显示消费者服务可用率仍低于 98.5%,并出现新动态:Opus 4.7 发布同时放大了服务器负载和 token 消耗,让故障和限流在使用体验上几乎无法区分。
1.4 身份验证反弹升级 (🡕)¶
Anthropic 要求用户借助 Persona Identities 提交政府身份证件和人脸扫描,引发当天评论数最高的讨论。u/Wa1ker1 发起主讨论串(178 分,200 条评论)(Anthropic 将要求用户提交政府身份证件和人脸扫描)。u/BroadEstate9711(178 个赞同):“真等不及有能力足够强、离线可用、运行成本又不离谱的 LLM 了。”u/Red0Adrenaline(104 个赞同):“这就是我的底线。这个一旦成真我就取消。”
u/Direct-Attention8597 发布了详细分析(177 分,95 条评论),指出 Persona 在 2025 年底有过记录在案的数据泄露,暴露了约 70,000 张 Discord 用户的政府身份证件图片,而且 Persona 可能与多达 17 家子处理方共享数据。u/ProperArticle5003(113 个赞同):“Persona 不是可信第三方。”u/orphenshadow(78 个赞同):“这是我划下的底线”(Anthropic 刚悄悄为 Claude 推出 ID 验证)。
u/nobodyhere3369 专门指出与 Peter Thiel 的关联(135 分,33 条评论)。u/Wanky_Danky_Pae(65 个赞同)做出最尖锐的对比:“Anthropic 2026 年 2 月:‘我们不希望自己的东西被用来监视美国人。’Anthropic 2026 年 4 月:‘我们很高兴与一家会泄露数据的公司合作,监视美国人。’”
讨论要点: 身份验证反弹不同于限流和故障投诉——这是价值层面的反对。能忍受服务退化的用户,在生物识别数据收集面前划下了硬线,尤其考虑到 Persona 的泄露历史,以及 Anthropic 过去把自己定位为“负责任”的 AI 公司。
与前日对比: 4 月 15 日已经浮现身份验证要求,但互动量中等。4 月 16 日出现 3 个独立的高互动讨论串(200、95、33 条评论)和明确的取消订阅威胁——问题正在加速发酵。
1.5 输出 token 膨胀已有可复现证据 (🡕)¶
u/bitdamaged 发布了当天最严谨的技术调查:在 Claude Code 2.1.96 到 2.1.107 之间做受控 A/B 测试,显示每条助手消息的输出 token 从 791(2.1.96)跃升到 1,622(2.1.98,+105%),再到 2,221(2.1.101,+181%)——同一提示词、同一模型、同一台机器(44 分,29 条评论)。完整复现材料已作为 GitHub issue #48808 提交,附带会话 JSONL 和分析脚本(从 2.1.101 开始,输出 token 增加到 3 倍)。
另外,u/Dyrect_ 发布了一组并排对比:Opus 4.6 消耗约 270K token 跑完 19 个任务中的 6 个,而 Opus 4.5 用 140K token 跑完了复杂度相当的整个计划(42 分,38 条评论)。“我的老编程搭子回来了”(试试 Opus 4.5)。

u/dinkinflika0 又补充了另一个角度:“Claude Code v2.1.100 每次请求都会注入约 20K 个不可见 token,你的代理日志可以证明”(36 分)(Claude Code v2.1.100 正在注入约 20K 个不可见 token)。
与前日对比: 4 月 15 日定性记录了 cache TTL 修复和 token 消耗担忧。4 月 16 日则提供了第一份可复现、绑定版本号的量化证据,证明 Claude Code 各版本之间输出 token 增加了 2–3 倍。
1.6 CLAUDE.md 与 AGENTS.md 配置之争 (🡒)¶
u/onil_gova 发布了一张 CLAUDE.md 文件截图,里面只有一行——“read AGENTS.md”——该帖成为当天互动最高的讨论之一(636 分,84 条评论)(如何正确处理 CLAUDE.md 文件)。

社区出现了 3 种做法:u/andreagrandi(128 个赞同):“直接建个 symlink!ln -s AGENTS.md CLAUDE.md。”u/spinnakerflying(26 个赞同)更偏好 @AGENTS.md include 指令,理由是更便于团队移植:“我认为这是程序化 include,所以不会把 token 浪费在重定向上。”u/ThePantsThief(16 个赞同):“他们为什么到现在还不能让 Claude 自动识别 AGENTS.md?”
与前日对比: 4 月 15 日讨论的是 CLAUDE.md 的结构化方法(保持在 40 行以内,使用 scoped rules)。4 月 16 日转向互操作问题:当多个智能体(Claude、Copilot、Codex)各自期待自己的配置文件时,如何维护单一事实来源。
2. 令人困扰的问题¶
Opus 4.7 的 token 消耗和质量不确定性 -- High Severity¶
根据 Anthropic 自己的文档,Opus 4.7 每次输入会多消耗 1.0–1.35 倍 token,而用户在实践中报告的比例甚至更高。u/Logichris(200 个赞同):“我们的会话限额会从 4 个提示词缩到 3 个提示词就用完。”u/BeautifulLullaby2 在 20 分钟内烧完了 Max x5 限额。u/Frankkul 记录了每天质量摇摆:“昨天老 Opus 回来了整整一天……今天又变回村里傻子了”(45 分,35 条评论)(Opus 质量每天都在变)。Boris Cherny 宣布的“提高限额”由 u/rJohn420 测试后发现,在 Max x5 上只多了约 10%(提高限额)。
Copilot 的 Opus 4.7 multiplier 等同于实际涨价 -- High Severity¶
Copilot 上 7.5x 的高级请求倍率——再加上 Opus 4.5 和 4.6 正在逐步下线——剥夺了用户选择更便宜模型的能力。u/shminglefarm22(62 个赞同):“真他妈是骗局。至少把 4.6 留着。”u/Kaljuuntuva_Teppo(30 个赞同):“看来我还是继续用 GPT-5.4 xhigh。”API 定价没有变化($5/$25),这让 Copilot 的 7.5x 倍率看起来更像 Microsoft 的利润率决策,而不是成本反映(Claude Opus 4.7 已在 Copilot 上线)。
身份验证造成信任破裂 -- High Severity¶
3 个讨论串合计 328 条评论,显示 Persona Identities 要求正在引发明确的取消订阅威胁。Persona 在 2025 年发生数据泄露、可能与 17 家子处理方共享数据、与 Peter Thiel 有关联,再叠加 Anthropic 过去的隐私立场,让这件事成为价值层面的反对;调整限流无法解决这个问题(Anthropic 将要求政府 ID)。
API 500 错误持续出现,状态页又有误导性 -- Medium Severity¶
4 月 16 日早上的故障延续了 4 月 15 日的模式。u/AustinLeungCK(6 个赞同):“昨天就已经发生过了……anthropic 该修好这破事,而不是推他们的 PR 团队出来。”消费者服务和政府服务之间的状态页可靠性差距(97.95% 对 99.96%)仍未解决(Claude Code 挂了吗?)。
Cursor 账号封禁和平台不确定性 -- Medium Severity¶
u/Agreeable_Idea5985 付了 $60 两天后就被 Cursor 封禁,且没有退款(53 分,81 条评论)(被 Cursor 封禁)。u/captainnigmubba 发帖问“2026 年 Cursor 还值得用吗?”,获得 71 个赞同和 84 条评论后被版主移除,随后又发帖控诉审查(198 分,91 条评论)(版主移除了我的帖子)。
3. 人们期望的功能¶
保留 Opus 4.5 或支持模型版本固定¶
u/Dyrect_ 展示了 Opus 4.5 能用 Opus 4.6 一半的 token 跑完复杂度相当的工作。在 Opus 4.7 的讨论串中,多名用户明确要求能够继续停留在旧模型版本。随着 Copilot 逐步下线 4.5 和 4.6,对版本固定的需求进一步增强。关于移除 4.5 访问权,用户的反应是“求你别这么干,anthropic”(使用 Opus 4.5)。
机会评级:直接。需求已有量化确认;在 4 月 15 日的模型版本选择器请求基础上,又叠加了 Copilot 7.5x multiplier 带来的新定价压力。
跨供应商智能体配置标准¶
CLAUDE.md 与 AGENTS.md 讨论串(636 分)暴露出一个碎片化问题:Claude 读取 CLAUDE.md,Copilot 读取不同文件,Codex 又有自己的约定。维护多工具工作流的开发者需要一种所有智能体都尊重的统一配置格式;至少也需要一套工具链,能从单一来源生成各智能体各自的配置(如何正确处理 CLAUDE.md 文件)。
机会评级:竞争型。symlink/include 权宜方案已经存在,但很脆弱;真正的标准需要行业协调。
独立 token 消耗审计¶
u/bitdamaged 的 A/B 测试方法(固定 Claude Code 版本、运行相同提示词、比较输出 token)正是应该产品化的工具形态。一个持续基准测试服务,如果能跨版本、模型和提供商监测 token 消耗,并发现无声膨胀,就能同时服务个人开发者和企业采购(GitHub issue #48808)。
机会评级:直接。方法已经验证;产品化路径很直接。
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| Claude Code (Opus 4.7) | AI 编程智能体 | (+/-) | 按基准测试看,困难任务更强;视觉分辨率 3 倍;API 定价不变 | 洗车推理失败;1.0–1.35x token 倍率;20 分钟烧完 Max x5 限额;上线数小时内出现“被削弱”报告 |
| Claude Code (Opus 4.5) | AI 编程智能体 | (+) | 并排测试中比 4.6 省 2 倍 token;行为可预测 | 200K 上下文窗口(4.6/4.7 为 1M);有被弃用风险 |
| Claude Code (Opus 4.6) | AI 编程智能体 | (-) | 正在被 4.7 替换 | 自 v2.1.101 起有记录显示输出 token 膨胀 3 倍;报告称每次请求约有 20K 个不可见 token |
| GitHub Copilot (Opus 4.7) | IDE 智能体 | (-) | 可在所有 IDE 和 CLI 中使用 | 7.5x 高级倍率;160K 上下文上限;锁定中等思考;Opus 4.5/4.6 正在逐步下线 |
| Cursor (Opus 4.7) | IDE 智能体 | (+/-) | 首发 5 折 | 强制 Max 模式;单次查询 token 成本高;有账号封禁投诉 |
| Google Antigravity | AI 编程智能体 | (-) | Gemini 3.1 Pro 可用于智能体化任务 | 持续故障;Ultra plan 用户遭遇无声失败;thin-client 架构扩展问题 |
| OpenAI Codex | AI 编程智能体 | (+) | 稳定;能抓到 Claude 漏掉的问题 | 4 月 16 日社区讨论有限;被 Opus 4.7 发布盖过风头 |
u/Vast-Moose1393 提供了一个反向观点(42 分,162 条评论):作为一名 15 年以上经验的资深工程师,“这东西对我几乎每个任务仍然都是工作倍增器”。u/puppymaster123(8 个赞同)指出,管理 12 人团队、每人配 2 个 Max 账号的 SWE,过去 2 个月没有报告“削弱”抱怨——这暗示质量方差可能对结构化程度较低的工作流影响更大(大家为什么都在讨厌 Claude?)。
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| 67speed.com | u/East-Scale-1956 | 由主播社区重新带火的打字速度游戏 | 娱乐;3 天内增长到 400 万玩家、X 上 3 亿浏览 | 氛围编程做成(细节未说明) | Shipped,病毒式传播 | 帖子 |
| Cross-Platform App Pipeline | u/Only-Season-2146 | 完整的 Android + iOS 应用开发和发布工作流 | 尽量减少跨移动平台的手工劳动 | Gemini, React, Stitch, Claude Code, Vite, Capacitor, Firebase, RevenueCat, PlayFab, Suno, AntiGravity, Android Studio, CodeMagic | Shipped 到两个应用商店 | 帖子 |
| 3D Periodic Table | u/NoSquirrel4840 | 带 3D 原子可视化的交互式元素周期表 | 给侄子做化学教育 | React 19, Three.js, React Three Fiber, Zustand, Vite | Shipped | 帖子 |
| Boring Cursor App | u/NotMeThenWhoSnaps | 未公开细节、已突破 500+ 用户的应用 | 未说明 | Cursor | Shipped(500+ 用户) | 帖子 |
| Year-Guessing Daily Game | u/Fun_Associate_4203 | 玩家根据真实报纸标题猜年份的每日游戏 | 娱乐 / 教育 | React, Claude API | Shipped | 帖子 |
| SaaS ($1K MRR) | u/funfunfunzig | 未公开细节的 SaaS:第 1 个月 $1K 收入、50 名付费客户、2,000 个注册 | 未说明 | 氛围编程做成 | Shipped(付费客户) | 帖子 |
| J.A.R.V.I.S. Coder Agent | u/True-Profile6435 | 声称质量可媲美 Opus 的免费编程智能体 | 付费智能体的零成本替代品 | 未说明 | Shipped | 帖子 |
| Retro Pixel Art React Library | u/Classic-Clothes3439 | 29 个可直接使用的区块 + 5 套复古像素风完整页面布局 | 可复制粘贴的 React UI 组件 | React | Shipped(模板已增加) | 帖子 |
u/East-Scale-1956 的 67speed.com 是最突出的项目:一个最初在 11 月构建的打字速度游戏,被主播社区重新带火,3 天内在 X 上达到 3 亿浏览。增长技巧:“花 $100 让真实用户开始创作有机内容,比任何广告投放都便宜得多”(u/InteractionSmall6778,5 个赞同)。u/Only-Season-2146 的 14 工具栈,是数据集中最详细的氛围编程工作流文档,覆盖从 Gemini 原型,到 Claude Code 开发,再到 App Store 提交的完整路径。
6. 新动态与亮点¶
Claude Opus 4.7 发布,并加入网络安全防护¶
Anthropic 的官方博客文章将 Opus 4.7 定位为首个部署 Project Glasswing 防护措施的模型,可自动检测并阻止被禁止的网络安全用途。面向合法安全研究人员的新 Cyber Verification Program 也同步推出。早期测试者报告称,相比 Opus 4.6,它在一个 93 任务编程基准上提升 13%,其中包括 4 个 Opus 4.6 和 Sonnet 4.6 都无法解决的任务。Adaptive reasoning(自适应推理)取代了可配置的推理强度——现在不再有推理强度参数。
Grok Build Beta 已宣布¶
Elon Musk 发推称“Grok Build 应用和终端的 beta 版下周发布”(2026 年 4 月 16 日)。u/mauriciorubio 分享了截图(58 分,136 条评论)。u/Grouchy-Stranger-306(108 个赞同):“啥也没有的公告。”u/Powerful_Froyo8423(62 个赞同):“大概是用泄露出来的 Claude Code 代码氛围编程做了个东西”(Grok Build 下周发布)。

Claude Code v2.1.101+ 输出 token 回归问题已有记录¶
u/bitdamaged 提交了 GitHub issue #48808,其中包含可复现的 A/B 测试框架,证明在相同提示词下,每条助手消息的输出 token 在 v2.1.98 翻倍,并在 v2.1.101 变为 3 倍。附件包含会话 JSONL。报告者还链接到 caveman,作为潜在缓解工具(从 2.1.101 开始,输出 token 增加到 3 倍)。
Claude 使用强度数据点¶
u/Inside_Source_6544 分享了 Claude Code 使用统计:920 个会话、105,937 条消息、35.5M token,在 30 个活跃日内消耗,连续使用 31 天,高峰时段为晚上 9 点(106 分,24 条评论)。“比《了不起的盖茨比》多 573 倍 token”(比社交媒体应用还上瘾)。

7. 机会在哪里¶
[+++] 模型版本保留和降级工具 — 既然 Opus 4.5 已证明比 4.6 省 2 倍 token,而 Copilot 又在逐步下线 4.5 和 4.6,转而推 7.5x 成本的 4.7,用户就需要固定到旧模型版本的能力。任何提供版本固定的供应商,都能接住逃离强制升级的用户。证据:u/Dyrect_ 的并排数据、210 条评论中对 7.5x 倍率的愤怒,以及明确的“请别移除 4.5”请求。
[+++] 跨提供商 token 消耗审计 — u/bitdamaged 的 A/B 测试方法(固定版本、相同提示词、JSONL 对比)证明,无声 token 膨胀是真实且可测量的。一个持续监测服务如果能追踪跨版本、跨提供商的每任务 token 消耗,并在消耗变化时发出告警,将服务所有付费 AI 编程用户。证据:GitHub issue #48808 包含完整复现材料,记录了 3 倍输出 token 增加。
[++] 保护隐私的 AI 编程访问 — Persona Identities 反弹(合计 328 条评论、多次取消订阅威胁)制造了对 AI 编程工具的需求:明确不要求身份验证或生物识别数据。本地 LLM 兴趣在这些讨论串中激增。一个有强隐私承诺的托管服务——或者让本地模型在编程上具备竞争力的工具——可以抓住那些划下“底线”的用户。证据:3 个身份验证讨论串中都有明确迁移到本地 LLM 的意图。
[++] 智能体配置互操作层 — CLAUDE.md 与 AGENTS.md 之争(636 分)反映了更深的问题:每个 AI 编程工具都期待自己的配置格式。一个维护单一事实来源,并生成各智能体配置(CLAUDE.md、.copilot-instructions.md、.cursorrules 等)的工具,会服务不断增长的多工具开发者群体。证据:symlink 和 include 权宜方案说明需求存在;目前还没有真正的解决方案。
[+] 独立 AI 服务可靠性仪表盘 — Claude、Copilot 和 Antigravity 都出现过活跃故障时状态页仍显示“Operational”的情况,信任已经受损。一个独立、众包式的监控服务,如果能追踪所有主要提供商的真实错误率、响应时间和模型质量,将服务个人开发者和企业买家。证据:仅 4 月 16 日就有 5+ 个讨论串记录了状态页差异。
8. 要点总结¶
-
Opus 4.7 发布后立刻在社区自建推理基准——“洗车测试”——中失败,产生当天最高分帖子,分数达 1746。 帖子中的最高赞评论(619 个赞同)预测它会在几天内被“脑叶切除”。无论 Anthropic 的基准提升如何,社区都在用可复现的常识测试评估模型,而 Opus 4.7 在发布当天就失败了。(Opus 4.7)
-
GitHub Copilot 对 Opus 4.7 设置 7.5x 高级请求倍率,同时逐步下线 Opus 4.5 和 4.6,社区正在将其解读为强制涨价。 API 定价没有变化,因此 Copilot 倍率看起来像利润率决策。过去以 3x 成本依赖 Opus 4.6 的用户,现在要么每次请求承担 7.5x,要么彻底换用其他模型。(Claude Opus 4.7 已在 Copilot 上线)
-
可复现 A/B 测试显示,在相同提示词下,Claude Code 的输出 token 在 2.1.96 到 2.1.101 之间增长到 3 倍。 这是迄今关于无声 token 膨胀最强的量化证据——而且它与 Anthropic 宣布 Opus 4.7 会使用更多 thinking token 发生在同一天。运行旧版 Claude Code 的用户在成本效率上有可测量优势。(GitHub issue #48808)
-
Persona Identities 验证要求带来当天最高评论数(200)和长期订阅用户的明确取消威胁。 Persona 的 2025 年数据泄露、Peter Thiel 关联,以及 Anthropic 过去的隐私定位叠在一起,让这件事成为价值层面的反对,服务改进无法解决。(Anthropic 将要求政府 ID)
-
社区主导叙事现在是“先削弱再换牌”:劣化一个模型,再用新版本号发布原本的质量,并宣称有所提升。 不管这种说法是否准确,这都会成为未来评估每次 Anthropic 发布的视角。u/anthsoul(155 个赞同):“他们先打断你的腿,然后让你感谢他们给了拐杖。”(做 Anthropic)
-
Opus 4.5 正在成为注重成本的开发者的务实选择。 并排测试显示,它能用 Opus 4.6 一半的 token 跑完复杂度相当的工作,行为也更可预测。风险在于,随着提供商集中转向 4.7,它可能很快被弃用。(使用 Opus 4.5)
-
Grok Build 宣布下周进入 beta,社区立刻不买账。 最高赞评论(108 个赞同)称它是“啥也没有的公告”。不过,xAI 进入 AI 编程工具市场,意味着除 Claude Code、Copilot、Cursor、Codex 和 Antigravity 之外,又多了第 6 个主要竞争者。(Grok Build 下周发布)
-
最突出的构建项目是 67speed.com——一个氛围编程做出的打字游戏,被主播重新带火后 3 天内在 X 上达到 3 亿浏览,说明病毒式分发仍然是更难的问题。 “15 分钟建出来、400 万玩家,这就是任何人都能拿出的最强氛围编程宣传语。”(我做了传播最病毒式的氛围编程网站)