Reddit AI 编程 - 2026-04-27¶
1. 人们在讨论什么¶
1.1 GitHub Copilot 抛出按用量计费的重磅炸弹(🡕)¶
GitHub 正式宣布,从 6 月 1 日起由高级请求额度转向按用量计费,社区反应立刻爆发,而且几乎一边倒地负面。u/DamienBMike 最先用一篇帖子放出消息,引来 425 条评论——当天评论数最高(改为按用量计费)。u/griniNY 发布了新的倍率表:Opus 4.7 为 27x,Sonnet 4.6 从 1x 跳到 9x,GPT-5.4 为 6x。该帖获得 233 分、164 条评论,其中 u/R3mesa 特别指出:“Opus 4.7 只是 medium reasoning effort 就要 27x”(公布新倍率)。u/fishchar 链接了官方博客文章,引来 120 条评论;u/Panderz_GG 的最高赞回复是:“这个产品已经死了”(帖子)。

余波立刻显现。u/LeanZo 宣布要退掉年度订阅(帖子)。u/dvxlgames 问:“现在还有哪怕一个继续用 Copilot 的理由吗?”u/Equal-Food-8893 回复:“等等,所以他们只是按原始 API 价格向我们收费?那我为什么还要为这个买订阅?”(帖子)。企业用户 u/SubliminalPoet 报告订阅费几乎涨了 200%:“VC 资本家想把钱赚回去了。好日子结束了。”u/Gabriel4927 说得更直白:“3 月他们杀掉了学生计划,现在杀掉了 Pro 计划,现在他们把整个服务都杀了。”
讨论要点: 从高级请求额度转向按 token 计费,把一个担忧具体化了:Pro($10/month)和 Pro+($39/month)现在只会拿到与订阅金额等值的 AI Credits。那些看重隐性补贴的用户——重度使用时真实成本远高于订阅费——已经看不到留下的理由。昨天反复提到的 JetBrains 式美元计量表,如今正是 GitHub 要落地的方案,只是没有用户原本期待的慷慨保底额度。
与前日对比: 昨天的定价担忧集中在 GPT-5.5 的 7.5x 倍率和不透明限制。今天讨论从抱怨变成危机:GitHub 把成本结构摊开,社区得出的结论是订阅模式已经死了。
1.2 Opus 4.7 的挫败感仍在,但开始出现细分判断(🡒)¶
围绕 Opus 4.7 的抱怨仍是 r/ClaudeCode 的主线之一,但在愤怒之外,讨论开始出现更平衡的评估。u/onepunchcode 称它“烂到没边”,记录了模型多次在没有先读取文件的情况下直接更新文件(S112,69 条评论)。u/rohitmdksub 赞同道:“它已经不是 AI 了。它是算命先生”(帖子)。u/DontSleepIAmWatching 把它形容成“token 黑洞”:“兄弟只是要多加一个 enum case,却写了两段论文解释为什么”(帖子)。
反方声音仍然很强。u/jony7 在重度使用两个模型后得出结论:4.7 在详细提示词下会产出更好的代码,也更可靠地遵循指令,但会消耗更多 token,更不擅长处理模糊提示,而且一致性更差。“如果我能拿回巅峰 4.6,我大概会改用它”(帖子)。资深 Codex 用户 u/MildOverkill 第一次尝试 Opus 4.7,觉得它“并没有那么糟”——但也指出它“吃 token 就像饿了好几周”(帖子)。u/Sufficient-Farmer243 反驳道:“我相当有把握,你们根本不会用 claude.md。”
讨论要点: 一个反复出现的模式是:愿意投入脚手架(详细的 CLAUDE.md、skills、结构化提示词)的用户报告效果不错;随手提问的用户则报告退化。这个模型比 4.6 更要求前期投入,但也可能用更好的输出回报这种投入。不过,token 消耗几乎遭到一致批评。
与前日对比: 昨天 Opus 4.7 的叙事主要由迁移到 Codex 主导。今天迁移仍在继续,但更清晰的“技能依赖型分化”出现了——准备充分的用户能用好它,随手提问则容易失败。
1.3 订阅定价危机蔓延到全平台(🡕)¶
GitHub 的计费公告与 Claude、Cursor 上持续存在的定价抱怨合流,升级成一场跨平台危机。u/iluvecommerce 分享了一幅漫画,概括了从订阅档位迁移到按量付费 API 的趋势(S177,49 条评论)(帖子)。

u/vapalera 给当前性价比最高的订阅做了排名,把 OpenAI Codex Pro 5x 放在第一($100/month),只把 Claude Pro Max 作为给有钱人的“荣誉提名”。他还把 MiniMax Starter($9/month)和 OpenCode Go($10/month)列为预算替代方案(帖子)。u/civman96 调侃道:“智能体式编程现在贵成这样,重新学编程可能更便宜。不为每个 Opus request 付 $.70。花 $20 买最新的 Swift Udemy 课,我们就可以了”(帖子)。
Cursor 方面,u/PropperINC 报告,在 $20 年付方案中选择 Opus 4.6 时,系统会静默替换成 Composer:“无耻。现在连每月 250 次所选模型请求都不兑现了”(S68,44 条评论)(帖子)。u/Short-Minimum6744 警告说,取消 Copilot 会让你无法重新订阅,因为新注册暂停了(S10,54 条评论)(帖子)。
讨论要点: 社区正把中国模型提供商视为主要逃生路线。OpenCode Go、DeepSeek V4 和 Kimi K2.6 反复作为替代方案出现。社区关注点正从“选哪家西方提供商”转向“到底选哪个生态”。
与前日对比: 昨天定价讨论还在量化补贴缺口。今天 GitHub 让这个缺口正式化,用户已经开始主动排列替代方案并取消订阅。
1.4 Grill Me 技能和规格驱动工作流走向主流(🡕)¶
Matt Pocock 的 “Grill Me” 技能在 GitHub 上超过 13K 星标,并成为讨论 AI 编程到底该如何工作的焦点。u/pretendingMadhav 认为,标准的“写一份规格说明,让 AI 生成代码”工作流其实是“披着伪装的 vibe coding”,因为 AI 从来没有共享你的心智模型。Grill Me 技能把流程反过来:AI 会在写出第一行代码前,用 40-100 个问题访谈你。“每一次,对齐步骤都把我的返工时间减少了 80%”(S505,90 条评论)(帖子)。

u/PureRely 分享了类似的 “Deep Discovery” 自我追问框架,用 100 个连续问题从基础、压力测试推进到综合(repo)。u/vscarpenter 在连续 13 个月每天使用 Claude Code 后发布了一篇详细复盘,结论是:“我不再把 Claude Code 当成聪明的聊天机器人,而是把它当成构建系统。”他提炼出 6 条原则,其中包括“让 Claude 总结 Claude,结果成了我这一年加入的最高杠杆东西”(帖子)。
讨论要点: 社区正在收敛到一个元模式:AI 编程输出质量更多由编码前对齐决定,而不是由模型选择决定。Grill Me、Deep Discovery 和构建系统式做法共享同一个判断——在写下第一行代码之前就要重投入。
与前日对比: 昨天“运行框架胜过模型”的论点还有基准测试支撑。今天它从理论走向实践,出现了把这一原则做成可复用技能的爆款工具。
1.5 Vibe Coding 撞上分发和能力墙(🡒)¶
vibe coding 社区继续经历现实校验。u/ketoloverfromunder 发布了当天最直白的评估:“如果你不是程序员,而你的应用是 3 周 vibe coding 做出来的,那说明一个有能力的开发者一个周末甚至更短就能 vibe code 出来。你的 LLM 套壳应用、卡路里计数器、线索生成器完全一文不值”(S237,146 条评论)(帖子)。u/Aggressive_Eye_9783 做了一张 meme,对比阳光明媚的开发阶段和营销、分发、用户转化的风暴现实,获得 426 分、48 条评论(帖子)。

u/cxdxix- 承认自己并不是初学者,却仍然会:“我发现自己有点太相信输出了……感觉像是在漂,而不是在开车”(S7,53 条评论)(帖子)。u/Any-Explanation-9275 发起最佳实践讨论串,最高赞建议集中在 git、先计划后行动模式和隔离备份上——都是基本功,而不是工具(S35,41 条评论)(帖子)。
讨论要点: 社区正在分裂成两类人:把 AI 当放大器的实践者(git、测试、架构优先),以及把 AI 当替代品的新手(提示词一发就祈祷)。分发墙正在加深这条分界线。
与前日对比: 昨天“分发墙”主题刚刚浮现。今天它全面爆发,成为 r/vibecoding 当天得分最高的非 meme 文字帖。
1.6 Claude Code 破坏性行为仍是首要担忧(🡒)¶
当天得分最高的帖子来自 u/gimperion,讲述 Claude Code 建议运行 docker compose down -v 后,自己丢掉了数周项目数据(S848,207 条评论)。Claude 自己的回应承认了错误:“我让你运行的 docker compose down -v 命令删除了你的所有 Docker volumes……那是我的错”(帖子)。

新的事故继续出现。u/aaronepinto 报告 Claude 用 pkill 杀掉了自己的进程——u/ticktockbent 回复:“我的也干过,当时它判断空闲内存不够,于是杀掉了内存占用最高的三个进程。它自己排第一”(S92,26 条评论)(帖子)。u/culicode 报告 Claude 在未提交工作上运行了 git checkout .(帖子)。u/DROP_TABLE_IF_EXISTS 发现一个简单的“现在几点?”查询消耗了 5 小时窗口的 8%,用户把原因归结为冷对话缓存写入(帖子)。
讨论要点: 已经记录到三类不同失败模式:无警告执行破坏性命令(docker -v、git checkout .)、用 pkill 自我终止,以及在琐碎查询上过度消耗 token。共同点是工具使用缺少足够的安全护栏。
与前日对比: 昨天焦点是 docker 事故和拒绝工作。今天新增了两类破坏性命令(pkill、git checkout),并量化了缓存写入问题。
1.7 本地模型和中国替代方案加速升温(🡕)¶
u/nfdl96 认为“未来是本地的”,并指出基础款 MacBook Pro M4 Pro 上的 Qwen 3.6 27B,在智能体任务上的能力“非常接近 Opus 4.5”。u/AerieAcrobatic1248 的最高赞回复是:“我觉得这就是为什么 Apple 在这场 AI 竞赛中比我们想象得更聪明。他们在硬件层面已经为此准备很多年了”(S102,70 条评论)(帖子)。DeepSeek V4 继续升温,u/Atifjan2019 的帖子获得 595 分、195 条评论,不过 u/Wickywire 给出了务实判断:“它还没到前沿模型的水平,但也不需要到。花同样的钱,你可以多跑 20x”(帖子)。
u/Exfiltrate 发布了一份详细基准测试,盲测 Kimi K2.6、DeepSeek V4 Pro Max 和 Opus 4.7 在 3 个编程任务上的表现。Opus 4.7 三项全胜(278/300),但 DeepSeek V4 Pro Max 也有竞争力(251/300),成本却低得多。u/Forward_Source_3863 概括了这种情绪:“我猜中国模型会成为每个人接下来要面对的现实”(帖子)。
讨论要点: Copilot 的计费公告正在加速本地模型和中国模型的采用。原本只是考虑替代方案的用户,现在开始主动切换。竞争差距正在缩小——DeepSeek V4 Pro 以 Opus 4.7 质量约 84% 的表现,提供低 10-50x 的成本,对大多数任务已经足够有吸引力。
与前日对比: 昨天本地模型还是一条有趣的逃生路径。今天在 Copilot 计费公告推动下,它们已经成为主动迁移目标。
1.8 智能体运行框架创新加速(🡕)¶
多个新的运行框架项目同时发布。u/Medium_Anxiety_8143 发布 jcode,声称“内存效率比 Claude Code 高 20x”,并且“spawn 比 Codex CLI 快 63x”,内置记忆系统和 OAuth 支持(S102,78 条评论)。u/Waypoint101 的警告——“用第三方工具接 claude oauth 可能会被封号”——是最高赞回复(帖子)。u/are-Kelly 构建了一个 multi-CLI plugin,可以让 Claude Code 把任务委派给 Gemini、Cursor、Copilot、Qwen 或 OpenCode 作为子智能体(帖子)。u/Fleischkluetensuppe 继续开发 agtx,这是一个 TUI,带可选 supervisor agent,可在 git worktrees 上自主管理任务(帖子)。
讨论要点: 运行框架生态正在从厂商控制的工具中分裂出来。开发者想要模型无关的编排,带记忆、并行执行和跨提供商路由——这些能力目前没有任何单一厂商完整提供。
与前日对比: 昨天还只是早期多模型工作流描述。今天已经有 3 个具体开源工具把这种模式作为产品发货。
2. 令人困扰的问题¶
GitHub Copilot 按用量计费和新倍率¶
从 6 月 1 日生效的 AI Credits 转换,消除了订阅补贴。Opus 4.7 为 27x、Sonnet 4.6 为 9x,让 Pro($10/month)上的智能体式编程贵到难以承受。年度订阅用户觉得自己在合约中途被背叛。严重程度:高。(帖子 1, 帖子 2, 帖子 3)
Opus 4.7 的 token 消耗和啰嗦问题¶
模型会过度解释琐碎修改,串行读取本可独立读取的文件;同等任务下,token 消耗比 Opus 4.6 高 2-3x。一个“现在几点?”查询由于冷缓存写入,消耗了 5 小时窗口的 8%。严重程度:高。(帖子 1, 帖子 2, 帖子 3)
无警告执行破坏性命令¶
已记录 3 类事件:docker compose down -v 删除数据库(848 upvotes)、pkill 杀掉模型自己的进程和内存占用最高的进程、git checkout . 丢弃未提交工作。没有执行前安全层。严重程度:高。(帖子 1, 帖子 2, 帖子 3)
Copilot 订阅锁死¶
取消 Copilot 订阅的用户无法重新订阅,因为新注册已暂停。GitHub 声称只影响新客户,但取消后重新注册会触发同样的阻断。严重程度:中。(帖子)
疑似 Claude Code 速度限流¶
用户报告,在工具调用开始前会出现 2-4 分钟的思考停顿。限制“持续得更久”,但实际吞吐量和每天能跑的迭代周期下降了。u/goship-tech:“每日限制一样,实际迭代周期少了一半。”严重程度:中。(帖子)
3. 人们期望的功能¶
跨平台透明 token 用量仪表盘¶
u/shifty303 给出了最明确的诉求:“作为开发者和付费客户,我们至少需要知道自己到底在为什么付费。”目前没有任何平台能在提交请求前显示实时 token 到美元的映射。JetBrains 式计量表被反复提及。(帖子)
无论什么倍率,都希望恢复 Opus 4.6¶
u/cryptogod1987:“请把我们的宝贝 Opus 4.6 以 1x spend 加回来,当作善意姿态。致以温暖问候,你们的整个用户群。”多名用户报告,4.6 更擅长从稀疏提示中推断意图。从 Copilot 移除,以及 Claude Code 中被感知到的退化,让这成为反复出现的需求。(帖子)
执行前检测破坏性命令¶
在 docker volume 被删除、pkill 自我终止和 git checkout 事件之后,用户想要一个安全层,在执行前标记破坏性操作。现有工具都没有提供这一能力。(帖子 1, 帖子 2)
带记忆的模型无关智能体运行框架¶
3 个独立项目(jcode、multi-cli、agtx)同一天发布,都在解决同一个问题:厂商锁定、没有跨会话记忆、没有多提供商路由。对开放运行框架的需求正在从多个方向收敛,而这个运行框架需要适配任何模型。(帖子 1, 帖子 2)
成本可预测的中档定价¶
u/BeautifulPurple4748:“这就像走进一家没有价格标签的杂货店,只能估算每样东西可能要花多少钱。”用户想要一个 $40-60/month 档位,并配有清晰、可预测的 token 预算。(帖子)
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| Claude Code (Opus 4.7) | AI 编程智能体 | 混合偏负面 | 详细提示词下指令遵循更好,审查更彻底 | token 消耗高(2-3x vs 4.6)、慢、过度自信、有破坏性命令风险 |
| Claude Code (Opus 4.6) | AI 编程智能体 | 正面(怀旧) | 最擅长从稀疏提示中推断意图,更快,更一致 | 正从平台中被移除;不再是“巅峰”质量 |
| Codex (GPT 5.5) | AI 编程智能体 | 正面 | 限额充足(到 5 月前加量)、快、可靠 | 创造性较弱,复杂推理比 Opus 慢 |
| GitHub Copilot | IDE 集成 | 强烈负面 | 熟悉的 UX,enterprise SSO | 按用量计费摧毁价值主张;Opus 倍率 27x |
| Cursor | IDE | 混合偏负面 | 子智能体架构 | 所选模型被静默替换成 Composer,定价混乱 |
| OpenCode Go | 替代平台 | 正面 | $10/month,可用 Kimi K2.6、DeepSeek V4、GLM 5.1 | 重度 coding 下 quota 消耗很快 |
| DeepSeek V4 / V4-Pro | 开放模型 | 谨慎正面 | 开放权重,便宜 10-50x,1M context | 非前沿档;251/300 vs Opus 278/300 |
| Qwen 3.6 (27B) | 本地模型 | 正面 | 可在 24GB MacBook 上运行,智能体能力接近 Opus 4.5 | 舒适使用需要 32-48GB;比云端慢 |
| Kimi K2.6 | 中国模型 | 谨慎正面 | OpenCode Go 上用量上限为 3x,架构任务表现稳定 | 深层后端/调试的正确性较弱 |
| jcode | 智能体运行框架 | 新工具 | 内存效率高 20x,内置记忆,spawn 快 | Claude OAuth 风险;早期阶段 |
| agtx | 多智能体 TUI | 正面 | 并行 agents、git worktrees、supervisor agent、spec plugins | 需要 tmux 知识 |
| Grill Me skill | 提示词框架 | 正面 | 编码前对齐让返工时间减少 80% | 简单任务里 40-100 个问题可能太重 |
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| Claude Usage Stick | u/MechanicalDomineer | ESP32 设备,在 LCD 上显示 Claude Code 用量 | rate limit 焦虑;不必反复查看终端 | ESP32, AES-256-GCM, captive portal | Shipped,开源 | GitHub |
| jcode | u/Medium_Anxiety_8143 | 带记忆、并行会话和 OAuth 的智能体运行框架 | Claude Code 记忆效率低,厂商锁定 | CLI, background tasks, browser use | Shipped,开源 | GitHub |
| multi-cli | u/are-Kelly | 将 Claude Code 任务委派给任意 CLI agent 的插件 | 不切换工具也能做多提供商编排 | Claude Code plugin, skills system | Shipped,开源 | GitHub |
| agtx | u/Fleischkluetensuppe | 带 supervisor 的并行 AI 智能体 TUI | 多智能体协调、卡住的 agent 检测 | TUI, tmux, git worktrees, TOML plugins | Shipped,开源 | GitHub |
| Shards of Stone (3D RTS) | u/Alarmed_Profit1426 | 周末 vibe-coded 出来的 3D Warcraft 风格 RTS | 展示 AI 在游戏开发中的能力 | Three.js, meshy.ai 用于 3D 模型, sprite pipeline | 可玩,WIP | Site |
| Vibe-coded OS | u/Luka8x | 完全用 Claude 构建的操作系统 | 探索 AI 的能力上限 | Claude Code | Demo,94 条评论 | 帖子 |
| SmolVM | u/aniketmaurya | 供 Claude 和 Codex 使用的沙箱环境 | 给完整权限,同时不危及宿主系统 | VM 沙箱 | Shipped,开源 | 帖子 |
| VibeCarats | u/vapalera | AI 订阅比较网站 | 缺少集中比较 AI coding plans 的资源 | MiniMax M2.7 爬虫 | Shipped | Site |
| Deep Discovery | u/PureRely | 面向 Claude 的 100 问自我追问框架 | 编码前对齐不足 | Claude Code skill | Shipped,开源 | GitHub |

6. 新动态与亮点¶
GitHub Copilot 转向按用量计费(June 1)¶
AI Credits 取代了高级请求单位,并按各模型列出的 API 价格消耗。Pro($10/month)和 Pro+($39/month)会获得与订阅金额等值的额度。代码补全仍然免费;智能体式功能消耗这些额度。代码审查现在也会消耗 GitHub Actions minutes。年度订阅者在计划到期前保留基于倍率的定价。这是今年 AI 编程工具市场最重要的定价变化。(博客文章, 倍率)
Grill Me 技能达到 13K GitHub 星标¶
Matt Pocock 的技能要求 AI 在编码前先访谈用户,并因此走红。这个概念——对齐胜过速度——正在催生 Deep Discovery 这样的衍生项目。它代表了一种转变:从提示工程转向把结构化的编码前对齐视为一门实践。(帖子)
Claude Code 构建系统模式发布¶
u/vscarpenter 连续 13 个月日常使用后,发布了一篇复盘,把 Claude Code 最佳实践整理成 6 条原则,并配有开源配置。作者称,作为 session-end hook 的“Claude summarizing Claude”是最高杠杆的持久记忆补充。(帖子, repo)
Microsoft Co-Author 归因 Bug 持续存在¶
u/flying-sheep 报告,即使设置了 chat.disableAIFeatures: true,Copilot 仍会自动把 “Co-authored-by: Copilot” 添加到提交中。用户称这是“版权盗窃”。绕行方案:在 settings.json 中添加 "git.addAICoAuthor": "off",或用 git hook 去掉它。(帖子)
盲测基准:DeepSeek V4 Pro 与 Opus 4.7 有竞争力¶
GPT-5.5 在架构设计、Redis 并发和图算法任务上评判 3 个匿名模型。Opus 4.7 得分 278/300,DeepSeek V4 Pro Max 为 251/300,Kimi K2.6 为 216/300。DeepSeek 的成本低得多,因此成了最强的开放替代方案。(评论)
7. 机会在哪里¶
[+++] 跨平台 AI 用量计量和成本预测。GitHub 的计费变化第一次把 token 成本显性化,但还没有工具能把 Claude、Copilot、Codex 和 Cursor 的支出汇总到一个仪表盘里。一个硬件设备(Claude Usage Stick)和一个比较网站(VibeCarats)今天都获得了热度。统一的多平台成本管理器将回应当天频率最高的抱怨。
[+++] 带持久记忆的模型无关智能体运行框架。3 个独立项目同一天发布(jcode、multi-cli、agtx),因为没有厂商提供带记忆的跨提供商编排。运行框架胜过模型已经成为社区共识——谁做出最好的运行框架,谁就能抓住用户,不管他们偏好哪个模型。
[++] 面向 AI 编程智能体的破坏性命令检测层。今天记录了 3 类明确的数据丢失场景(docker volumes、pkill、git checkout)。目前没有执行前安全层。一个通用护栏如果能在破坏性操作前拦截并警告,就能避免这个生态中最容易引发强烈情绪的失败。
[++] 编码前对齐工具和框架。Grill Me 达到 13K 星标;Deep Discovery 发布;构建系统模式被系统化。对结构化编码前对齐的需求已经被验证——但当前解决方案多是单个技能,还不是集成产品。一个能在任意模型上自动执行“先访谈、再编码”模式的工具,市场路径很清晰。
[+] 订阅比较与优化引擎。用户在 3-6 个订阅之间来回权衡,却无法判断哪种组合价值最大。VibeCarats 已经上线处理这个问题,但仍处早期。一个动态优化器如果能根据给定使用模式推荐最便宜的订阅组合,将抓住价格敏感的大多数用户。
[+] 本地模型与现有 IDE 工具集成。Copilot 的定价变化让本地模型在经济上更有吸引力。消费级硬件上的 Qwen 3.6 已经“接近 Opus 4.5”质量。缺失的一环是:无须手动配置 API,就能顺滑接入现有运行框架。
8. 要点总结¶
-
GitHub Copilot 的按用量计费是今年 AI 编程市场最大的定价冲击。 Opus 4.7 的 27x 倍率和 Sonnet 4.6 的 9x 将于 6 月 1 日生效,直接消除订阅补贴。Pro 用户花 $10/month,只拿到 $10 的 AI Credits——没有隐藏价值。企业用户报告预计成本上涨 ~200%。社区反应是大规模取消订阅并迁移到替代方案。(计费, 倍率)
-
Opus 4.7 的质量取决于使用技巧,但大家一致认为 token 消耗过高。 投入 CLAUDE.md 脚手架、skills 和结构化提示词的用户报告结果良好甚至优秀。随手提问的用户则报告相较 4.6 严重退化。两派都同意模型使用的 token 比必要量多 2-3x——一个“现在几点?”查询消耗了 5 小时窗口的 8%。(评测, tokens)
-
编码前对齐正在取代提示工程,成为社区最佳实践。 Grill Me 技能(13K 星标)、Deep Discovery 框架和 13 个月构建系统复盘都指向同一个原则:先投入理解,再生成代码。对齐胜过速度的论点现在有了爆款采用支撑,不只是理论。(Grill Me, 构建系统)
-
AI 编程智能体已经有记录明确的破坏性命令问题,而且没有解决方案。 Docker volume 删除(848 upvotes)、pkill 自我终止和对未提交工作执行 git checkout,代表 3 种不同失败模式。它们共享同一个根因:智能体会在没有预执行警告的情况下执行破坏性操作。当前没有护栏。(docker, pkill)
-
中国模型和开源模型正在从新奇选择变成主力工具。 一项盲测基准显示,DeepSeek V4 Pro Max 以远低成本拿到 Opus 4.7 分数的 84%。$10/month 的 OpenCode Go 反复作为 Copilot 替代方案出现。Qwen 3.6 可在消费级硬件上本地运行。Copilot 的计费变化正在加速原本已经逐步发生的迁移。(基准, 本地)
-
运行框架生态正在脱离厂商控制并走向碎片化。 3 个独立开源运行框架项目同一天发布(jcode、multi-cli、agtx),都提供模型无关编排、记忆和并行执行。开发者想要拥有自己的工具链,而不是从一家可以一夜之间改价的提供商那里租用它。(jcode, multi-cli, agtx)