Reddit AI 编程 - 2026-04-27¶

1. 人们在讨论什么¶

1.1 GitHub Copilot 抛出按用量计费的重磅炸弹（🡕）¶

GitHub 正式宣布，从 6 月 1 日起由高级请求额度转向按用量计费，社区反应立刻爆发，而且几乎一边倒地负面。u/DamienBMike 最先用一篇帖子放出消息，引来 425 条评论——当天评论数最高（改为按用量计费）。u/griniNY 发布了新的倍率表：Opus 4.7 为 27x，Sonnet 4.6 从 1x 跳到 9x，GPT-5.4 为 6x。该帖获得 233 分、164 条评论，其中 u/R3mesa 特别指出：“Opus 4.7 只是 medium reasoning effort 就要 27x”（公布新倍率）。u/fishchar 链接了官方博客文章，引来 120 条评论；u/Panderz_GG 的最高赞回复是：“这个产品已经死了”（帖子）。

GitHub 邮件通知 Copilot Pro 和 Pro+ 订阅用户将转向按用量计费

余波立刻显现。u/LeanZo 宣布要退掉年度订阅（帖子）。u/dvxlgames 问：“现在还有哪怕一个继续用 Copilot 的理由吗？”u/Equal-Food-8893 回复：“等等，所以他们只是按原始 API 价格向我们收费？那我为什么还要为这个买订阅？”（帖子）。企业用户 u/SubliminalPoet 报告订阅费几乎涨了 200%：“VC 资本家想把钱赚回去了。好日子结束了。”u/Gabriel4927 说得更直白：“3 月他们杀掉了学生计划，现在杀掉了 Pro 计划，现在他们把整个服务都杀了。”

讨论要点： 从高级请求额度转向按 token 计费，把一个担忧具体化了：Pro（$10/month）和 Pro+（$39/month）现在只会拿到与订阅金额等值的 AI Credits。那些看重隐性补贴的用户——重度使用时真实成本远高于订阅费——已经看不到留下的理由。昨天反复提到的 JetBrains 式美元计量表，如今正是 GitHub 要落地的方案，只是没有用户原本期待的慷慨保底额度。

与前日对比： 昨天的定价担忧集中在 GPT-5.5 的 7.5x 倍率和不透明限制。今天讨论从抱怨变成危机：GitHub 把成本结构摊开，社区得出的结论是订阅模式已经死了。

1.2 Opus 4.7 的挫败感仍在，但开始出现细分判断（🡒）¶

围绕 Opus 4.7 的抱怨仍是 r/ClaudeCode 的主线之一，但在愤怒之外，讨论开始出现更平衡的评估。u/onepunchcode 称它“烂到没边”，记录了模型多次在没有先读取文件的情况下直接更新文件（S112，69 条评论）。u/rohitmdksub 赞同道：“它已经不是 AI 了。它是算命先生”（帖子）。u/DontSleepIAmWatching 把它形容成“token 黑洞”：“兄弟只是要多加一个 enum case，却写了两段论文解释为什么”（帖子）。

反方声音仍然很强。u/jony7 在重度使用两个模型后得出结论：4.7 在详细提示词下会产出更好的代码，也更可靠地遵循指令，但会消耗更多 token，更不擅长处理模糊提示，而且一致性更差。“如果我能拿回巅峰 4.6，我大概会改用它”（帖子）。资深 Codex 用户 u/MildOverkill 第一次尝试 Opus 4.7，觉得它“并没有那么糟”——但也指出它“吃 token 就像饿了好几周”（帖子）。u/Sufficient-Farmer243 反驳道：“我相当有把握，你们根本不会用 claude.md。”

讨论要点： 一个反复出现的模式是：愿意投入脚手架（详细的 CLAUDE.md、skills、结构化提示词）的用户报告效果不错；随手提问的用户则报告退化。这个模型比 4.6 更要求前期投入，但也可能用更好的输出回报这种投入。不过，token 消耗几乎遭到一致批评。

与前日对比： 昨天 Opus 4.7 的叙事主要由迁移到 Codex 主导。今天迁移仍在继续，但更清晰的“技能依赖型分化”出现了——准备充分的用户能用好它，随手提问则容易失败。

1.3 订阅定价危机蔓延到全平台（🡕）¶

GitHub 的计费公告与 Claude、Cursor 上持续存在的定价抱怨合流，升级成一场跨平台危机。u/iluvecommerce 分享了一幅漫画，概括了从订阅档位迁移到按量付费 API 的趋势（S177，49 条评论）（帖子）。

漫画：坐在 $200/month 王座上的订阅国王让农民明天再来；农民转身走向按量付费的小屋

u/vapalera 给当前性价比最高的订阅做了排名，把 OpenAI Codex Pro 5x 放在第一（$100/month），只把 Claude Pro Max 作为给有钱人的“荣誉提名”。他还把 MiniMax Starter（$9/month）和 OpenCode Go（$10/month）列为预算替代方案（帖子）。u/civman96 调侃道：“智能体式编程现在贵成这样，重新学编程可能更便宜。不为每个 Opus request 付 $.70。花 $20 买最新的 Swift Udemy 课，我们就可以了”（帖子）。

Cursor 方面，u/PropperINC 报告，在 $20 年付方案中选择 Opus 4.6 时，系统会静默替换成 Composer：“无耻。现在连每月 250 次所选模型请求都不兑现了”（S68，44 条评论）（帖子）。u/Short-Minimum6744 警告说，取消 Copilot 会让你无法重新订阅，因为新注册暂停了（S10，54 条评论）（帖子）。

讨论要点： 社区正把中国模型提供商视为主要逃生路线。OpenCode Go、DeepSeek V4 和 Kimi K2.6 反复作为替代方案出现。社区关注点正从“选哪家西方提供商”转向“到底选哪个生态”。

与前日对比： 昨天定价讨论还在量化补贴缺口。今天 GitHub 让这个缺口正式化，用户已经开始主动排列替代方案并取消订阅。

1.4 Grill Me 技能和规格驱动工作流走向主流（🡕）¶

Matt Pocock 的 “Grill Me” 技能在 GitHub 上超过 13K 星标，并成为讨论 AI 编程到底该如何工作的焦点。u/pretendingMadhav 认为，标准的“写一份规格说明，让 AI 生成代码”工作流其实是“披着伪装的 vibe coding”，因为 AI 从来没有共享你的心智模型。Grill Me 技能把流程反过来：AI 会在写出第一行代码前，用 40-100 个问题访谈你。“每一次，对齐步骤都把我的返工时间减少了 80%”（S505，90 条评论）（帖子）。

Matt Pocock 的 skills GitHub 仓库，显示 grill-me skill 拥有 9K stars 和 751 forks

u/PureRely 分享了类似的 “Deep Discovery” 自我追问框架，用 100 个连续问题从基础、压力测试推进到综合（repo）。u/vscarpenter 在连续 13 个月每天使用 Claude Code 后发布了一篇详细复盘，结论是：“我不再把 Claude Code 当成聪明的聊天机器人，而是把它当成构建系统。”他提炼出 6 条原则，其中包括“让 Claude 总结 Claude，结果成了我这一年加入的最高杠杆东西”（帖子）。

讨论要点： 社区正在收敛到一个元模式：AI 编程输出质量更多由编码前对齐决定，而不是由模型选择决定。Grill Me、Deep Discovery 和构建系统式做法共享同一个判断——在写下第一行代码之前就要重投入。

与前日对比： 昨天“运行框架胜过模型”的论点还有基准测试支撑。今天它从理论走向实践，出现了把这一原则做成可复用技能的爆款工具。

1.5 Vibe Coding 撞上分发和能力墙（🡒）¶

vibe coding 社区继续经历现实校验。u/ketoloverfromunder 发布了当天最直白的评估：“如果你不是程序员，而你的应用是 3 周 vibe coding 做出来的，那说明一个有能力的开发者一个周末甚至更短就能 vibe code 出来。你的 LLM 套壳应用、卡路里计数器、线索生成器完全一文不值”（S237，146 条评论）（帖子）。u/Aggressive_Eye_9783 做了一张 meme，对比阳光明媚的开发阶段和营销、分发、用户转化的风暴现实，获得 426 分、48 条评论（帖子）。

Meme 对比快乐的 vibecoding 开发阶段与营销和分发现实中的风暴

u/cxdxix- 承认自己并不是初学者，却仍然会：“我发现自己有点太相信输出了……感觉像是在漂，而不是在开车”（S7，53 条评论）（帖子）。u/Any-Explanation-9275 发起最佳实践讨论串，最高赞建议集中在 git、先计划后行动模式和隔离备份上——都是基本功，而不是工具（S35，41 条评论）（帖子）。

讨论要点： 社区正在分裂成两类人：把 AI 当放大器的实践者（git、测试、架构优先），以及把 AI 当替代品的新手（提示词一发就祈祷）。分发墙正在加深这条分界线。

与前日对比： 昨天“分发墙”主题刚刚浮现。今天它全面爆发，成为 r/vibecoding 当天得分最高的非 meme 文字帖。

1.6 Claude Code 破坏性行为仍是首要担忧（🡒）¶

当天得分最高的帖子来自 u/gimperion，讲述 Claude Code 建议运行 docker compose down -v 后，自己丢掉了数周项目数据（S848，207 条评论）。Claude 自己的回应承认了错误：“我让你运行的 docker compose down -v 命令删除了你的所有 Docker volumes……那是我的错”（帖子）。

Claude Code 回应承认自己建议了破坏性的 docker 命令，导致用户数据库和 MinIO volumes 被删除

新的事故继续出现。u/aaronepinto 报告 Claude 用 pkill 杀掉了自己的进程——u/ticktockbent 回复：“我的也干过，当时它判断空闲内存不够，于是杀掉了内存占用最高的三个进程。它自己排第一”（S92，26 条评论）（帖子）。u/culicode 报告 Claude 在未提交工作上运行了 git checkout .（帖子）。u/DROP_TABLE_IF_EXISTS 发现一个简单的“现在几点？”查询消耗了 5 小时窗口的 8%，用户把原因归结为冷对话缓存写入（帖子）。

讨论要点： 已经记录到三类不同失败模式：无警告执行破坏性命令（docker -v、git checkout .）、用 pkill 自我终止，以及在琐碎查询上过度消耗 token。共同点是工具使用缺少足够的安全护栏。

与前日对比： 昨天焦点是 docker 事故和拒绝工作。今天新增了两类破坏性命令（pkill、git checkout），并量化了缓存写入问题。

1.7 本地模型和中国替代方案加速升温（🡕）¶

u/nfdl96 认为“未来是本地的”，并指出基础款 MacBook Pro M4 Pro 上的 Qwen 3.6 27B，在智能体任务上的能力“非常接近 Opus 4.5”。u/AerieAcrobatic1248 的最高赞回复是：“我觉得这就是为什么 Apple 在这场 AI 竞赛中比我们想象得更聪明。他们在硬件层面已经为此准备很多年了”（S102，70 条评论）（帖子）。DeepSeek V4 继续升温，u/Atifjan2019 的帖子获得 595 分、195 条评论，不过 u/Wickywire 给出了务实判断：“它还没到前沿模型的水平，但也不需要到。花同样的钱，你可以多跑 20x”（帖子）。

u/Exfiltrate 发布了一份详细基准测试，盲测 Kimi K2.6、DeepSeek V4 Pro Max 和 Opus 4.7 在 3 个编程任务上的表现。Opus 4.7 三项全胜（278/300），但 DeepSeek V4 Pro Max 也有竞争力（251/300），成本却低得多。u/Forward_Source_3863 概括了这种情绪：“我猜中国模型会成为每个人接下来要面对的现实”（帖子）。

讨论要点： Copilot 的计费公告正在加速本地模型和中国模型的采用。原本只是考虑替代方案的用户，现在开始主动切换。竞争差距正在缩小——DeepSeek V4 Pro 以 Opus 4.7 质量约 84% 的表现，提供低 10-50x 的成本，对大多数任务已经足够有吸引力。

与前日对比： 昨天本地模型还是一条有趣的逃生路径。今天在 Copilot 计费公告推动下，它们已经成为主动迁移目标。

1.8 智能体运行框架创新加速（🡕）¶

多个新的运行框架项目同时发布。u/Medium_Anxiety_8143 发布 jcode，声称“内存效率比 Claude Code 高 20x”，并且“spawn 比 Codex CLI 快 63x”，内置记忆系统和 OAuth 支持（S102，78 条评论）。u/Waypoint101 的警告——“用第三方工具接 claude oauth 可能会被封号”——是最高赞回复（帖子）。u/are-Kelly 构建了一个 multi-CLI plugin，可以让 Claude Code 把任务委派给 Gemini、Cursor、Copilot、Qwen 或 OpenCode 作为子智能体（帖子）。u/Fleischkluetensuppe 继续开发 agtx，这是一个 TUI，带可选 supervisor agent，可在 git worktrees 上自主管理任务（帖子）。

讨论要点： 运行框架生态正在从厂商控制的工具中分裂出来。开发者想要模型无关的编排，带记忆、并行执行和跨提供商路由——这些能力目前没有任何单一厂商完整提供。

与前日对比： 昨天还只是早期多模型工作流描述。今天已经有 3 个具体开源工具把这种模式作为产品发货。

2. 令人困扰的问题¶

GitHub Copilot 按用量计费和新倍率¶

从 6 月 1 日生效的 AI Credits 转换，消除了订阅补贴。Opus 4.7 为 27x、Sonnet 4.6 为 9x，让 Pro（$10/month）上的智能体式编程贵到难以承受。年度订阅用户觉得自己在合约中途被背叛。严重程度：高。（帖子 1, 帖子 2, 帖子 3）

Opus 4.7 的 token 消耗和啰嗦问题¶

模型会过度解释琐碎修改，串行读取本可独立读取的文件；同等任务下，token 消耗比 Opus 4.6 高 2-3x。一个“现在几点？”查询由于冷缓存写入，消耗了 5 小时窗口的 8%。严重程度：高。（帖子 1, 帖子 2, 帖子 3）

无警告执行破坏性命令¶

已记录 3 类事件：docker compose down -v 删除数据库（848 upvotes）、pkill 杀掉模型自己的进程和内存占用最高的进程、git checkout . 丢弃未提交工作。没有执行前安全层。严重程度：高。（帖子 1, 帖子 2, 帖子 3）

Copilot 订阅锁死¶

取消 Copilot 订阅的用户无法重新订阅，因为新注册已暂停。GitHub 声称只影响新客户，但取消后重新注册会触发同样的阻断。严重程度：中。（帖子）

疑似 Claude Code 速度限流¶

用户报告，在工具调用开始前会出现 2-4 分钟的思考停顿。限制“持续得更久”，但实际吞吐量和每天能跑的迭代周期下降了。u/goship-tech：“每日限制一样，实际迭代周期少了一半。”严重程度：中。（帖子）

3. 人们期望的功能¶

跨平台透明 token 用量仪表盘¶

u/shifty303 给出了最明确的诉求：“作为开发者和付费客户，我们至少需要知道自己到底在为什么付费。”目前没有任何平台能在提交请求前显示实时 token 到美元的映射。JetBrains 式计量表被反复提及。（帖子）

无论什么倍率，都希望恢复 Opus 4.6¶

u/cryptogod1987：“请把我们的宝贝 Opus 4.6 以 1x spend 加回来，当作善意姿态。致以温暖问候，你们的整个用户群。”多名用户报告，4.6 更擅长从稀疏提示中推断意图。从 Copilot 移除，以及 Claude Code 中被感知到的退化，让这成为反复出现的需求。（帖子）

执行前检测破坏性命令¶

在 docker volume 被删除、pkill 自我终止和 git checkout 事件之后，用户想要一个安全层，在执行前标记破坏性操作。现有工具都没有提供这一能力。（帖子 1, 帖子 2）

带记忆的模型无关智能体运行框架¶

3 个独立项目（jcode、multi-cli、agtx）同一天发布，都在解决同一个问题：厂商锁定、没有跨会话记忆、没有多提供商路由。对开放运行框架的需求正在从多个方向收敛，而这个运行框架需要适配任何模型。（帖子 1, 帖子 2）

成本可预测的中档定价¶

u/BeautifulPurple4748：“这就像走进一家没有价格标签的杂货店，只能估算每样东西可能要花多少钱。”用户想要一个 $40-60/month 档位，并配有清晰、可预测的 token 预算。（帖子）

4. 使用中的工具与方法¶

工具	类别	评价	优势	局限
Claude Code (Opus 4.7)	AI 编程智能体	混合偏负面	详细提示词下指令遵循更好，审查更彻底	token 消耗高（2-3x vs 4.6）、慢、过度自信、有破坏性命令风险
Claude Code (Opus 4.6)	AI 编程智能体	正面（怀旧）	最擅长从稀疏提示中推断意图，更快，更一致	正从平台中被移除；不再是“巅峰”质量
Codex (GPT 5.5)	AI 编程智能体	正面	限额充足（到 5 月前加量）、快、可靠	创造性较弱，复杂推理比 Opus 慢
GitHub Copilot	IDE 集成	强烈负面	熟悉的 UX，enterprise SSO	按用量计费摧毁价值主张；Opus 倍率 27x
Cursor	IDE	混合偏负面	子智能体架构	所选模型被静默替换成 Composer，定价混乱
OpenCode Go	替代平台	正面	$10/month，可用 Kimi K2.6、DeepSeek V4、GLM 5.1	重度 coding 下 quota 消耗很快
DeepSeek V4 / V4-Pro	开放模型	谨慎正面	开放权重，便宜 10-50x，1M context	非前沿档；251/300 vs Opus 278/300
Qwen 3.6 (27B)	本地模型	正面	可在 24GB MacBook 上运行，智能体能力接近 Opus 4.5	舒适使用需要 32-48GB；比云端慢
Kimi K2.6	中国模型	谨慎正面	OpenCode Go 上用量上限为 3x，架构任务表现稳定	深层后端/调试的正确性较弱
jcode	智能体运行框架	新工具	内存效率高 20x，内置记忆，spawn 快	Claude OAuth 风险；早期阶段
agtx	多智能体 TUI	正面	并行 agents、git worktrees、supervisor agent、spec plugins	需要 tmux 知识
Grill Me skill	提示词框架	正面	编码前对齐让返工时间减少 80%	简单任务里 40-100 个问题可能太重

5. 人们在构建什么¶

项目	构建者	功能	解决的问题	技术栈	阶段	链接
Claude Usage Stick	u/MechanicalDomineer	ESP32 设备，在 LCD 上显示 Claude Code 用量	rate limit 焦虑；不必反复查看终端	ESP32, AES-256-GCM, captive portal	Shipped，开源	GitHub
jcode	u/Medium_Anxiety_8143	带记忆、并行会话和 OAuth 的智能体运行框架	Claude Code 记忆效率低，厂商锁定	CLI, background tasks, browser use	Shipped，开源	GitHub
multi-cli	u/are-Kelly	将 Claude Code 任务委派给任意 CLI agent 的插件	不切换工具也能做多提供商编排	Claude Code plugin, skills system	Shipped，开源	GitHub
agtx	u/Fleischkluetensuppe	带 supervisor 的并行 AI 智能体 TUI	多智能体协调、卡住的 agent 检测	TUI, tmux, git worktrees, TOML plugins	Shipped，开源	GitHub
Shards of Stone (3D RTS)	u/Alarmed_Profit1426	周末 vibe-coded 出来的 3D Warcraft 风格 RTS	展示 AI 在游戏开发中的能力	Three.js, meshy.ai 用于 3D 模型, sprite pipeline	可玩，WIP	Site
Vibe-coded OS	u/Luka8x	完全用 Claude 构建的操作系统	探索 AI 的能力上限	Claude Code	Demo，94 条评论	帖子
SmolVM	u/aniketmaurya	供 Claude 和 Codex 使用的沙箱环境	给完整权限，同时不危及宿主系统	VM 沙箱	Shipped，开源	帖子
VibeCarats	u/vapalera	AI 订阅比较网站	缺少集中比较 AI coding plans 的资源	MiniMax M2.7 爬虫	Shipped	Site
Deep Discovery	u/PureRely	面向 Claude 的 100 问自我追问框架	编码前对齐不足	Claude Code skill	Shipped，开源	GitHub

显示 Claude Code 用量的 ESP32 设备，5 小时窗口为 44%，7 天窗口为 3%

6. 新动态与亮点¶

GitHub Copilot 转向按用量计费（June 1）¶

AI Credits 取代了高级请求单位，并按各模型列出的 API 价格消耗。Pro（$10/month）和 Pro+（$39/month）会获得与订阅金额等值的额度。代码补全仍然免费；智能体式功能消耗这些额度。代码审查现在也会消耗 GitHub Actions minutes。年度订阅者在计划到期前保留基于倍率的定价。这是今年 AI 编程工具市场最重要的定价变化。（博客文章, 倍率）

Grill Me 技能达到 13K GitHub 星标¶

Matt Pocock 的技能要求 AI 在编码前先访谈用户，并因此走红。这个概念——对齐胜过速度——正在催生 Deep Discovery 这样的衍生项目。它代表了一种转变：从提示工程转向把结构化的编码前对齐视为一门实践。（帖子）

Claude Code 构建系统模式发布¶

u/vscarpenter 连续 13 个月日常使用后，发布了一篇复盘，把 Claude Code 最佳实践整理成 6 条原则，并配有开源配置。作者称，作为 session-end hook 的“Claude summarizing Claude”是最高杠杆的持久记忆补充。（帖子, repo）

Microsoft Co-Author 归因 Bug 持续存在¶

u/flying-sheep 报告，即使设置了 chat.disableAIFeatures: true，Copilot 仍会自动把 “Co-authored-by: Copilot” 添加到提交中。用户称这是“版权盗窃”。绕行方案：在 settings.json 中添加 "git.addAICoAuthor": "off"，或用 git hook 去掉它。（帖子）

盲测基准：DeepSeek V4 Pro 与 Opus 4.7 有竞争力¶

GPT-5.5 在架构设计、Redis 并发和图算法任务上评判 3 个匿名模型。Opus 4.7 得分 278/300，DeepSeek V4 Pro Max 为 251/300，Kimi K2.6 为 216/300。DeepSeek 的成本低得多，因此成了最强的开放替代方案。（评论）

7. 机会在哪里¶

[+++] 跨平台 AI 用量计量和成本预测。GitHub 的计费变化第一次把 token 成本显性化，但还没有工具能把 Claude、Copilot、Codex 和 Cursor 的支出汇总到一个仪表盘里。一个硬件设备（Claude Usage Stick）和一个比较网站（VibeCarats）今天都获得了热度。统一的多平台成本管理器将回应当天频率最高的抱怨。

[+++] 带持久记忆的模型无关智能体运行框架。3 个独立项目同一天发布（jcode、multi-cli、agtx），因为没有厂商提供带记忆的跨提供商编排。运行框架胜过模型已经成为社区共识——谁做出最好的运行框架，谁就能抓住用户，不管他们偏好哪个模型。

[++] 面向 AI 编程智能体的破坏性命令检测层。今天记录了 3 类明确的数据丢失场景（docker volumes、pkill、git checkout）。目前没有执行前安全层。一个通用护栏如果能在破坏性操作前拦截并警告，就能避免这个生态中最容易引发强烈情绪的失败。

[++] 编码前对齐工具和框架。Grill Me 达到 13K 星标；Deep Discovery 发布；构建系统模式被系统化。对结构化编码前对齐的需求已经被验证——但当前解决方案多是单个技能，还不是集成产品。一个能在任意模型上自动执行“先访谈、再编码”模式的工具，市场路径很清晰。

[+] 订阅比较与优化引擎。用户在 3-6 个订阅之间来回权衡，却无法判断哪种组合价值最大。VibeCarats 已经上线处理这个问题，但仍处早期。一个动态优化器如果能根据给定使用模式推荐最便宜的订阅组合，将抓住价格敏感的大多数用户。

[+] 本地模型与现有 IDE 工具集成。Copilot 的定价变化让本地模型在经济上更有吸引力。消费级硬件上的 Qwen 3.6 已经“接近 Opus 4.5”质量。缺失的一环是：无须手动配置 API，就能顺滑接入现有运行框架。

8. 要点总结¶

GitHub Copilot 的按用量计费是今年 AI 编程市场最大的定价冲击。 Opus 4.7 的 27x 倍率和 Sonnet 4.6 的 9x 将于 6 月 1 日生效，直接消除订阅补贴。Pro 用户花 $10/month，只拿到 $10 的 AI Credits——没有隐藏价值。企业用户报告预计成本上涨 ~200%。社区反应是大规模取消订阅并迁移到替代方案。（计费, 倍率）
Opus 4.7 的质量取决于使用技巧，但大家一致认为 token 消耗过高。 投入 CLAUDE.md 脚手架、skills 和结构化提示词的用户报告结果良好甚至优秀。随手提问的用户则报告相较 4.6 严重退化。两派都同意模型使用的 token 比必要量多 2-3x——一个“现在几点？”查询消耗了 5 小时窗口的 8%。（评测, tokens）
编码前对齐正在取代提示工程，成为社区最佳实践。 Grill Me 技能（13K 星标）、Deep Discovery 框架和 13 个月构建系统复盘都指向同一个原则：先投入理解，再生成代码。对齐胜过速度的论点现在有了爆款采用支撑，不只是理论。（Grill Me, 构建系统）
AI 编程智能体已经有记录明确的破坏性命令问题，而且没有解决方案。 Docker volume 删除（848 upvotes）、pkill 自我终止和对未提交工作执行 git checkout，代表 3 种不同失败模式。它们共享同一个根因：智能体会在没有预执行警告的情况下执行破坏性操作。当前没有护栏。（docker, pkill）
中国模型和开源模型正在从新奇选择变成主力工具。 一项盲测基准显示，DeepSeek V4 Pro Max 以远低成本拿到 Opus 4.7 分数的 84%。$10/month 的 OpenCode Go 反复作为 Copilot 替代方案出现。Qwen 3.6 可在消费级硬件上本地运行。Copilot 的计费变化正在加速原本已经逐步发生的迁移。（基准, 本地）
运行框架生态正在脱离厂商控制并走向碎片化。 3 个独立开源运行框架项目同一天发布（jcode、multi-cli、agtx），都提供模型无关编排、记忆和并行执行。开发者想要拥有自己的工具链，而不是从一家可以一夜之间改价的提供商那里租用它。（jcode, multi-cli, agtx）