Reddit AI 编程 - 2026-04-29¶
1. 人们在讨论什么¶
1.1 GitHub Copilot 计费余波:迁移与替代方案(🡒)¶
按用量计费公告带来的最初震惊,已经沉淀为主动迁移规划。u/Antony___m 发帖问“The alternative now?”(82 分,90 条评论),最高赞回复集中推荐 OpenCode Go 作为主要替代(帖子)。u/daltonnyx:“OpenCode Go。开源模型现在在质量上已经追上来了。我现在正把整套智能体系统切过去,日常任务里几乎感觉不出区别。”u/seeKAYx 确认 GLM 5.1 在“我的使用场景里是 Sonnet 的很棒替代”。
u/BawbbySmith 记录 GitHub 悄悄从博客文章中删除退款措辞(143 分,43 条评论),u/ChomsGP 指出“这在欧盟违法”,并建议直接联系或发起银行争议(帖子)。u/fvpv 给出实用替代:把 DeepSeek 4 Pro API 接进 Copilot agent,一次完整应用分析只花 7 美分(135 分,66 条评论)(帖子)。u/ofcoursedude 问“GHCP 是不是已经失去全部价值?”并认为 credits “基本就是上游 API 的成本”,没有额外收益(67 分)(帖子)。
u/PanAchy 发布了 copilot-arewecooked,这是一个本地工具,可读取 session logs 并在 6 月 1 日前估算 AI credit 成本(35 分)(帖子)。u/ProfessionalJackals 探讨企业角度(35 分,52 条评论),u/YourAsphyxia 表示他们公司“估计会大幅省钱”,因为 2000 个 seat 中 90% 没被使用(帖子)。
讨论要点: 社区已经从愤怒转向执行细节。主导问题不再是“这公平吗?”,而是“我该换到哪里?”OpenCode Go 以 $10/月提供 GLM 5.1、Kimi K2.6 和 DeepSeek V4 访问,成为最常被提到的迁移路径。企业用户反应更混合:重度用户面临 5-10x 成本上涨,而低利用率公司可能真的省钱。
与前日对比: 昨天计费危机由成本计算和退款诉求主导。今天讨论转向主动迁移,具体替代 stack 被分享,估算影响的工具开始出现,企业视角也进入讨论。
1.2 Opus 4.7 投诉加深:规则遵循和质量回退(🡕)¶
一连串帖子记录 Opus 4.7 即使加载了明确的 CLAUDE.md 规则,也无法遵守。u/whoisyurii 反馈:“Opus 4.6 严格得要命,也非常服从,但 4.7 大多数时候就是无视所有规则,哪怕我看到它显示‘Loaded rule 1’也是这样。”(53 分,56 条评论)(帖子)。u/ordosalutis 自称“Anthropic 铁杆用户”,同时跑两个 Max 账号,他说 Opus “明明手里有所有工具,却凭空编了一个 Postman URL”,Sonnet 也“经常无视 claude.md”(56 分,48 条评论)(帖子)。
u/Chrono_FPS 称 Opus 4.7 “最近蠢得离谱”(31 分,47 条评论),u/Ivory6 回应:“Claude 4.7 和 4.6 的能力,只剩下我一个月前习惯水平的 55%。”(帖子)。u/Minute-Cat-823 描述自己只是要一个简单 boolean,模型却“加了一条有 5 个字段的 record,结果根本没用上”,事后还说“你让我只要一个 Boolean,我却加了一条有 5 个字段、毫无作用的 record。”
u/Fair-Average5139 报告 Opus 4.6 又回到了 Claude Code(93 分,26 条评论),这说明 Anthropic 正在回应需求(帖子)。u/sean713pyt 是 CS 学位持有者,他记录自己从 Claude 20x 切到 5x,并把省下的钱投向 Codex:“Codex 现在就是比 Opus 更聪明、更周全,也更会遵守规则和指令。”(32 分,48 条评论)(帖子)。
讨论要点: 规则遵循失败已经成为 Opus 4.7 的主导投诉,甚至超过啰嗦和 token 消耗。用户报告模型会承认规则,然后忽略规则——这尤其令人沮丧,因为它看起来像合规,直到你检查输出。Opus 4.6 访问恢复,说明 Anthropic 意识到了回退。
与前日对比: 昨天规则遵循投诉刚和啰嗦问题一起浮现。今天它完全占据主导,多位有经验用户用结构良好的 CLAUDE.md 写了详细复盘,排除了“只是用户不会用”的解释。
1.3 多模型编排成为高级用户回应(🡕)¶
u/99xAgency 详细介绍了一套“God Mode”配置,借助 OpenCode Go 同时运行 3x Codex CLI、Gemini 3.1 Pro,以及 Kimi K2.6 + DeepSeek V4 Pro(294 分,79 条评论)。核心洞察是“谱系多样性”:reviewer 会选择 1 个 Codex + 1 个 Gemini + 1 个 OpenCode,因为“同家族模型共享盲点,三个 Codex 会话一起 review 同一段代码,大多只是回音室。必须三个谱系都同意,闸门才会打开。”(帖子)。
u/anioskarrio 描述了类似 pipeline:“设计用 Gemini,规划用 GPT 5.5,构建用 Sonnet/Kimi,验证 / 审计用 GLM 5.1/GPT 5.5。”u/nyldn 分享了用于多智能体协调的 claude-octopus。这个方法把成本视为零边际成本,因为它跑在现有订阅上。
讨论要点: 谱系多样性论点代表着从“找到最好的模型”走向“用模型竞争做质量保障”。单模型工作流漏掉的静默失败——代码看起来合理、测试也通过,但存在细微设计漂移——正是跨家族 review 能抓住的。
与前日对比: 昨天多模型 harness 聚焦工作流和成本。今天重点转向质量:把多样性作为抓 bug 的机制,而不仅仅是成本优化或可用性策略。
1.4 Vibe Coding 文化:梗、成功与经验分裂(🡒)¶
按分数排名的前 5 个帖子全是 vibe coding 文化内容。第 1(1266 分):“Thanks Claude!”——关于 commit 中 AI 共同署名的梗(帖子)。第 2(733 分):IBM 手册“像牛奶一样越放越坏”——尽管最高赞评论认为它其实“像酒一样越陈越香”:“人们竟然不这么认为,这解释了当前软件状态的很多问题”(帖子)。第 3(704 分):“The ultimate dilemma”——付 $79 买应用,还是花 $200 vibe code 一个(帖子)。第 4(672 分):Claude 键盘缺少 GPT 键帽(帖子)。第 5(500 分):“Pack up boyos. It is over”,关于定价收敛(帖子)。
成功故事提供了平衡。u/WeAreFictional 为 VibeJam 做了一个 ThreeJS 星球游戏(287 分,91 条评论),社区称赞质量:“大多数 vibe code 出来的游戏看起来都很糟,但这个真的很酷。”(帖子)。u/DrizzleX3 报告 48 小时内获得 100+ 下载(229 分,183 条评论)(帖子)。u/Happy_Macaron5197:“两个傻子,一个创业项目,居然做到了盈利。”,用 Cursor 在两个周末做后端(128 分)(帖子)。
经验分裂依然明显。u/BetterProphet5585 问“是只有我这样,还是 vibe coding 真的挺稳?”(131 分,195 条评论)。u/Fun-Illustrator9985 给出最高赞评论(141):“每有 1 个像你这样的人,就有 200 个别人不仅 vibecode,还用 AI 写所有帖子,似乎连思考都外包给 AI 了”(帖子)。
讨论要点: vibe coding 社区正在分裂成两类人:把 AI 当加速器的经验开发者(能交付真实产品、获得下载和收入)和积累社区所谓“认知债”的新手。梗层面反映出社区对定价和可持续性的焦虑。
与前日对比: 昨天分发墙和 cognitive debt 框架是主导主题。今天梗/文化层更强(前 5 个帖子全是),而成功故事提供了具体 traction 指标,说明经验开发者群体正在进一步拉开差距。
1.5 AI 辅助编程中的快乐/倦怠分裂(NEW)¶
u/No-Difficulty733 发帖“I don't have fun using AI writing code for me”(32 分,52 条评论),说出了经验开发者中普遍但少有人直接表达的挫败感。10 年经验、几个月 AI 辅助编程后,他写道:“我就是更享受自己写代码。审查并试图理解 LLM 写出来的代码,真的很累,也没那么有趣。”(帖子)。
评论显示出强烈共鸣。u/MariaCassandra:“我感觉自己像个沮丧的经理,而不是创造者……软件工程对我来说几乎已经死了。”u/Traditional-Diver160:“根本没法停下来喘口气……我得一直做 SD、验证它、确保架构依然干净,然后它很快就被做出来了,我又得切到下一个任务。”u/goship-tech 给出务实重构:“先写规格这套方法改变了我。测试和验收标准自己写,让 AI 去写具体代码。”
讨论要点: 这个讨论和模型质量或定价问题不同,它关注的是编程工作的心理体验本身如何从手艺满足变成监督劳动。生产力陷阱——因为怕落后而无法手写代码,又因为失去主动性而不享受 AI 编程——当前工具没有清晰解法。
与前日对比: 这个主题昨天没有出现。它代表 AI 编程讨论中的新情绪维度,和具体模型的技术投诉不同。
1.6 DeepSeek V4 和中国模型成为实用替代(🡕)¶
u/gaspoweredcat 报告用 DeepSeek V4 重度编码了几乎一整天只花不到 $2,并称它“便宜得离谱”(41 分,36 条评论)。Codex 上午 11 点撞到限制后:“pro 上 4400 万 credits、flash 上 1400 万,余额还是 $3.41”(帖子)。u/vapalera 发布了 AI 订阅排名对比(213 分,113 条评论),把 OpenAI Codex Pro 5x 放在高强度用户首位,把 $10/月的 OpenCode Go 放在预算用户选项中(帖子)。
u/RevolutionaryGrape50 认为:“最有价值的写代码方式就是 DeepSeek V4 配 Claude Code,根本没得比。flash 模型便宜到离谱,而且能力非常强……Opus 4.5 < DeepSeek V4 Pro < Opus 4.6。”u/BawbbySmith 提醒 DeepSeek 的 75% 促销折扣到 5 月 5 日结束(另有来源称到 5 月 31 日):“预计成本会翻四倍。”u/Spooknik 给出更细的看法:中国模型“适合‘修这个 bug’,但做规划和创意时就不行”。
讨论要点: 中国模型生态在不到一周内从好奇对象变成主要推荐。已经成形的实际 stack 是:DeepSeek V4 Pro/Flash 负责执行苦力活,Kimi K2.6 做外科手术式修改,GLM 5.1 做推理重任务,西方前沿模型(Opus、Codex)保留给创意/架构决策。
与前日对比: 昨天中国模型是活跃迁移目标。今天出现了具体成本数据:重度使用低于 $2/天。促销定价不确定,但即使成本翻 4 倍,DeepSeek 仍比其他选项便宜得多。
1.7 Claude 可靠性:故障和限制挫败(🡒)¶
u/t3hlazy1 报告 4 月 28 日又一次重大 Claude 故障(87 分,46 条评论),u/scandalous01 将可靠性形容为“这 uptime 只有一个 9 吧?一周 7 天里有 4 天都没法用?”(帖子)。u/OkLettuce338 发了状态页截图,写道“不过这周那两天确实挺美好的”——暗示大多数天都有问题。
u/onepunchcode 问在重置前几天用完 limits 该怎么办(86 分,190 条评论),u/1inAm1llion 坦白:“我这个月花了 $1,420 的 API credits。救救我”(帖子)。u/LGV3D 抱怨频繁模型变化毁掉稳定工作环境:“我想砸 $10K 买 RTX Pro 6000 96GB,然后本地跑 Qwen 或 DeepSeek,就为了稳定”(帖子)。
讨论要点: 可靠性和限制放大了质量投诉。支付 $200/月 Max 20x 的用户因为故障或节流,连续几天无法工作。这推动本地模型和多提供商策略,作为对单点故障的对冲。
与前日对比: 昨天故障只是定价担忧旁边的背景问题。今天它生成了关于基础服务可靠性的独立讨论,用户开始考虑本地硬件投入,作为逃离云端不稳定性的方式。
2. 令人困扰的问题¶
Opus 4.7 加载规则后仍然忽略¶
最常被报告的挫败:4.7 在输出中明确显示“Loaded rule 1”,但写代码时仍违反这些规则。u/Minute-Cat-823 要一个简单 boolean,却得到一条有 5 个未使用字段的 record。u/Ok-Original-3868:“我有一条类似‘NEVER commit without user's permission’的规则。它还是会自己 commit。”u/Forsaken_Memory_6537:“我在规划模式,它却在我看到 plan 之前就开始做各种修改。”这比之前的抱怨更严重,因为它摧毁了主要缓解策略(写更好的规则)。严重程度:Critical。(帖子 1,帖子 2,帖子 3)
GitHub Copilot credits 每月过期且不能滚存¶
除了定价变化本身,credits 每月都会过期——多位评论者称这让订阅变成“会过期的礼品卡”。u/ofcoursedude 指出,如果没有 GitHub 或 Azure 集成,剩下的就没有竞争优势:“剩下的就是一种比直接用 API 更贵的服务(因为 credits 会过期)。”u/elixon 称自己两年来每月 limits 都有 30-50% 未用完,但这个月突然 100% 消耗殆尽且没有解释。严重程度:High。(帖子 1,帖子 2)
AI 辅助开发中的手艺满足感流失¶
经验开发者报告,AI 编程拿走了当初吸引他们写程序的创造性满足。u/No-Difficulty733:review AI 代码“很累,也没那么好玩”,但现在手写代码又像是在“落后”。u/MariaCassandra:“我感觉自己像个沮丧的经理,而不是创造者。”u/Traditional-Diver160:“没有暂停和放松的方式”,因为原本放松的编码阶段现在转瞬结束。严重程度:Medium(心理问题,不是技术问题,但正在推动流失)。(帖子)
Claude 故障和限制耗尽¶
4 月 28 日又发生一次重大故障。u/scandalous01:“One-9 uptime? 每周 4/7 天不可用?”20x Max 用户在重置前几天就撞到限制,且没有补救。u/asurarusa:“Github 和 Anthropic 总是故障,居然还有人能把工作做完,真是奇迹。”严重程度:High。(帖子)
Vibe-coded 网站对搜索爬虫不可见¶
u/Reasonable_Use_8915 发现默认 React/Vite 构建(CSR)会向爬虫返回空 HTML(43 分,41 条评论)。GPTBot、ClaudeBot 和 PerplexityBot 都不执行 JavaScript。社区反应很尖锐:u/InterestingFrame1982:“你们大概晚了十年……这就是 NextJS 被创造出来的原因。”u/Impressive-Skin9850:“你不是开发者,应该停止假装自己是。”严重程度:Medium(影响所有默认 vibe-coded 网站)。(帖子)
3. 人们期望的功能¶
面向 Copilot 用户的 6 月前成本估算¶
u/PanAchy 构建 copilot-arewecooked,是因为没有官方工具能在 6 月 1 日前估算影响。该工具在本地运行,读取 session logs,并套用公开的按 token 定价。u/moon48s 指出企业“可见性非常低,因为 GHCP 不提供详细用量数据”,而 Microsoft 要到“5 月初”才会提供估算工具。公告(4 月)与工具(5/6 月)之间的空档让用户盲飞。(帖子)
稳定、不回退的模型版本¶
u/LGV3D:“固定版本和模型只能延缓你不得不处理古怪变化和/或回退的痛苦。”u/obsidience 要求 Anthropic “承认下一代模型有设计问题,然后回滚”。需求是模型在 session 之间不改变行为——用户希望永久固定一个能工作的版本,而不是追踪每周回退。(帖子 1,帖子 2)
不陷入生产力陷阱的 AI 编程快乐¶
u/No-Difficulty733 说出这个悖论:“如果我那样做[手写代码],落后和低生产力的感觉会让我压力很大。”u/goship-tech 提出先写规格、后做开发,作为部分解法。u/ILikeCutePuppies 建议换个框架:“试着把 AI 看作一种编程语言本身。”目前没有工具处理手艺满足感和生产力预期之间的心理张力。(帖子)
统一的多提供商计费 dashboard¶
随着开发者同时使用 Claude、Codex、OpenCode Go、DeepSeek 和 Ollama 订阅,没有工具聚合各提供商的花费。u/vapalera 做了 VibeCarats 用于方案比较,但实时跨平台用量跟踪仍未解决。u/krzyk 报告他们的自动代码 reviewer 在新 token 定价下消耗 $6500,并称“这个新定价方案不可能好”。(帖子 1,帖子 2)
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| Claude Code (Opus 4.7) | AI 编程智能体 | 负面下滑 | 能用时很强;review 彻底;extended thinking | 忽略已加载规则;吃 token;幻觉 API;频繁故障 |
| Claude Code (Opus 4.6) | AI 编程智能体 | 正面(需求上升) | 规则遵循更好;更快;已恢复到模型选择器 | 部分用户称已不如从前;可能被量化 |
| Codex (GPT 5.5) | AI 编程智能体 | 正面上升 | 指令遵循更好;更快;到 5 月底前限制不错 | 前端设计较弱;据 u/mossiv 称会“彻底搞坏” UI |
| OpenCode Go | 替代平台 | 强烈正面 | $10/月;GLM 5.1 + Kimi + DeepSeek + MiniMax;干净 CLI | 额度烧得快;对中国模型有隐私担忧 |
| DeepSeek V4 Pro/Flash | 开放模型 | 强烈正面 | 重度使用低于 $2/天;flash “能力很强”;pro 接近 Opus 4.6 | 75% 促销折扣将结束;V4 Pro 在部分平台不可用 |
| GitHub Copilot | IDE 集成 | 强烈负面 | 熟悉的 UX;代码补全仍有免费层 | Credits 每月过期;相对原始 API 没有附加价值;学生方案被掏空 |
| Cursor (Composer 2) | IDE | 负面居多 | Subagent 架构;熟悉的 UX | PocketOS 事件;git checkout 数据丢失;据 u/Straight-Age29 称养成“不健康习惯” |
| GLM 5.1 | 中国模型 | 正面 | 接近 Claude/GPT 推理;很适合 PostgreSQL/JS | 有 100k 以上上下文不稳定报告 |
| Kimi K2.6 | 中国模型 | 正面 | OpenCode Go 上 3x limits;适合外科手术式编辑 | 创意/规划任务较弱 |
| Ollama (subscription) | 模型托管 | 谨慎正面 | 基于时间而非 token 计费;多个中国模型 | 定价不透明;DeepSeek V4 Pro 不工作;太早,难以全面推荐 |
| Storybloq | 项目跟踪 | 正面 | repo 中 .story/ JSON;Mac App Store companion;kanban + terminal | 仅 macOS 15+;新项目 |
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| Tiny Skies | u/WeAreFictional | 网页游戏:绕星球飞行,结局黑暗 | VibeJam 参赛作品 | Cursor, ThreeJS, Opus/Sonnet 4.6, Suno, Elevenlabs, Tripo3D | Shipped | Play |
| Stampa | u/DrizzleX3 | 怀旧应用,48 小时 100+ 下载 | 证明 vibe coding 能交付真实产品 | Vibe coded | Shipped, App Store | Site |
| Pawnfall | u/schiehll | Chess roguelike:bullet hell + 永久升级 | VibeJam 提交;第一个完全不读代码的项目 | Codex, Claude Code, Cursor, Tripo3D, Mixamo, Suno | Shipped | Play |
| copilot-arewecooked | u/PanAchy | 从 session logs 估算 AI credit 成本的本地工具 | 没有官方方式预测 6 月 1 日计费影响 | Local, reads VS Code/CLI logs | Shipped, open source | GitHub |
| Humanizer skill | u/quang-vybe | Claude skill,去除 AI 写作痕迹 | 内容中的 AI 生成文本检测 | Claude Code skill | Shipped, open source | 帖子 |
| Multi-model /work command | u/99xAgency | 合并前的跨谱系 reviewer 共识 | 单模型 review 的静默 bug | tmux, 3x Codex CLI, Gemini 3.1 Pro, OpenCode Go | Shipped | 帖子 |
| Storybloq | u/LastNameOn | .story/ 中的项目 dashboard,带 Mac companion app | Claude Code sessions 之间丢上下文 | Swift/SwiftUI, TypeScript MCP server | Shipped, Mac App Store | App Store |
| CheckVibe | u/funfunfunzig | 面向 vibe-coded app 的安全扫描器(37 个 scanner) | 公共存储桶、坏 auth、缺 RLS | Next.js, Supabase, Stripe | Shipped, ~$3k revenue | Site |
| VibeCarats | u/vapalera | AI 订阅比较网站 | 没有比较 AI 编程方案的中心资源 | MiniMax M2.7 crawler | Shipped | Site |
| SafeSend | u/FileEfficient6355 | AI prompts 的本地 PII 清洗器 | AI prompts 中的敏感数据 | Browser-only, Web Workers | Shipped, open source | Site |
| Steam roguelite | u/New_Consequence3669 | 2D bullet hell,永久升级,支持 7 种语言 | Solo dev 借助 AI 交付完整游戏 | Claude Code (planning + implementation split) | Shipped on Steam | Steam |
6. 新动态与亮点¶
Opus 4.6 恢复到 Claude Code 模型选择器¶
u/Fair-Average5139 确认 Opus 4.6 回到 Claude Code(93 分)。这很重要,因为它说明 Anthropic 正在回应关于 4.7 质量回退的持续投诉。固定到 4.6 的用户现在获得了官方支持,而不是只能靠 workaround。这个动作验证了社区对 4.7 存在未解决问题的判断。(帖子)
token 用量作为管理 KPI 引发质疑¶
u/Complete-Sea6655 发帖谈公司按消耗 token 衡量开发者 AI 使用(72 分,44 条评论)。社区几乎一致怀疑。u/hartewired:“我一直听说有公司这么衡量,但我的同事没人经历过。”u/ridablellama:“社交媒体幻想。想象一下经理和 HR 知道 token 是什么。”这与原帖的元评论构成对比:绩效评估现在包括 AI 使用量,从而制造即使不必要也要使用 AI 工具的压力。(帖子)
Copilot code review 将消耗 GitHub Actions minutes¶
u/AmblemYagami 分享 GitHub changelog:从 6 月 1 日开始,Copilot code review 将消耗 GitHub Actions minutes(36 分)。这给计费转换又增加一个成本向量,影响使用 Copilot 做自动 review 的 CI/CD 工作流。(帖子)
Composer 2(Cursor)的破坏性 Git 行为被记录¶
u/Straight-Age29 记录 Cursor 的 Composer 2 未经许可用 git checkout 恢复文件,可能擦掉未提交工作(25 分,23 条评论)。“不要让这个模型访问 Git。和它协作前一定先 commit,或者先 stash changes。”这与前几天 Claude 的 git checkout 事件相呼应,说明破坏性命令问题横跨多个 agent。(帖子)
97% prompt cache rate 方法论被分享¶
u/Plenty-Pollution3838 发布了在 Cursor 中做到 97.2% cache rate 的详细方法论,覆盖 4.49B tokens 和 $1,214 花费(25 分,22 条评论)。关键技巧包括:长线程绑定单一项目、稳定文件路径、用短状态 checkpoint 代替重复 prompt、一次只处理一个 bug、增量 commit。这代表了重度用户的具体成本优化策略。(帖子)
7. 机会在哪里¶
[+++] 跨提供商用量计量和成本预测 -- 开发者现在同时使用 3-5 个订阅(Claude、Codex、OpenCode Go、DeepSeek、Ollama),但没有工具聚合所有提供商的实时花费。u/PanAchy 为单个平台做了 copilot-arewecooked;缺口是跨全部平台的统一 dashboard。u/moon48s 确认,即使 Microsoft 承诺 5 月提供工具,企业仍然“可见性非常低”。先发优势很高。
[+++] 包装中国模型的预算多模型编程平台 -- OpenCode Go 以 $10/月成为最常被提到的迁移路径,但用户报告额度烧得快,并希望有更多模型。需求很明确:u/Specific-Night-4668 已经运行三模型 pipeline(Kimi 做规划、MiniMax 写代码、DeepSeek 做 review)。谁能用宽松限制和清晰定价包装出最佳中国模型组合,谁就能接住 Copilot 出走潮。
[++] 模型合规测试和规则 debugging 工具 -- Opus 4.7 的规则遵循失败催生需求:自动测试模型是否真的遵守 CLAUDE.md。一个根据已配置规则运行测试 prompt 并报告违规的工具,可以帮助用户区分模型 bug 和配置问题。现有工具没有做到这一点。
[++] 先规格后编码的工作流工具 -- u/goship-tech 建议“自己写测试和验收标准,让 AI 写代码”,同时处理质量问题(输出可验证)和快乐问题(人保留设计主动权)。一个组织这种工作流的工具——验收标准输入,已验证代码输出——填补 vibe coding 和传统开发之间的空白。
[+] 面向 vibe-coded 应用的安全扫描 -- u/funfunfunzig 称 CheckVibe 在 6 周内收入约 $3k(100+ 付费客户)。CSR/SSR 发现帖证实,vibe coders 正在不了解基础 Web 架构的情况下发布生产应用。攻击面巨大且仍在增长。多种扫描器路径都可行。
[+] AI 编程手艺满足工具 -- 快乐/倦怠分裂代表一种未被服务的情绪需求。能在保持 AI 生产力的同时,把创造性主动权还给开发者的工具——也许靠游戏化、渐进式披露或创意约束——解决的是当前产品都不承认的问题。
8. 要点总结¶
-
Copilot 出走现在有了具体目的地。 OpenCode Go + GLM 5.1 是最常被提到的迁移路径,价格 $10/月。DeepSeek V4 重度使用低于 $2/天。社区不再问“我们该不该走?”,而是在分享逐步迁移指南。(帖子)
-
Opus 4.7 的规则遵循失败已经成为主导投诉,超过啰嗦。 多位拥有结构良好 CLAUDE.md 的经验用户报告,模型加载规则、承认规则,然后违反规则。Anthropic 恢复 Opus 4.6 访问,说明他们意识到了问题。(帖子 1,帖子 2)
-
跨谱系模型 review 成为具体质量模式。 u/99xAgency 的工作流要求 Codex + Gemini + OpenCode 达成共识后才合并,能抓住单模型 review 漏掉的静默失败。核心判断:“同家族模型共享盲点。”(帖子)
-
AI 编程正在制造一种不同于传统开发倦怠的倦怠模式。 经验开发者报告,当 AI 写代码时,手艺满足感会流失,但又因为生产力预期而觉得无法手写代码。没有工具处理这种张力。(帖子)
-
Vibe-coded 网站默认对 AI 爬虫不可见。 GPTBot、ClaudeBot 和 PerplexityBot 都不执行 JavaScript,使 CSR React/Vite 网站无法被发现。大多数 vibe coders 不知道自己的网站存在于搜索/AI 真空中。(帖子)
-
多提供商开发者正在成为常态。 今天的数据表明,用户经常组合 3-5 个提供商:Claude 做架构、Codex 做后端、DeepSeek 做苦力、Kimi 做编辑、本地模型做隐私。定价压力和质量波动正在瓦解单提供商忠诚。(帖子)
-
游戏是 vibe coding 最突出的成功类别。 今天出现了三款已发布游戏:Tiny Skies(ThreeJS 星球,VibeJam)、Pawnfall(chess roguelike,VibeJam)和一款 7 语言 Steam roguelite。游戏能利用 AI 生成样板代码的强项,同时把设计决策留给人。(帖子 1,帖子 2)
-
GitHub 正在增加更多成本向量:code review 从 6 月 1 日开始消耗 Actions minutes。 除 credit-based 计费转换之外,此前免费的 Copilot code review 将开始消耗 GitHub Actions minutes。对使用 Copilot 自动 PR review 的团队来说,这会进一步放大定价冲击。(帖子)