跳转至

Reddit AI 编程 - 2026-05-25

1. 人们在讨论什么

1.1 围绕编程智能体的工作流层正在成为一个产品类别 🡕

最有信号的 Claude Code 讨论帖,已经不再追问底座模型能否更聪明,而是在讨论怎样用更清晰的心智模型、更好的可见性,以及把终端、文档、浏览器和分支放到一起的工作空间,让智能体工作流既看得懂,也能落实约束。

u/eaiarthur_ 想要有人用大白话解释 hooks、skills、plugins、SKILL.mdCLAUDE.mdagents.md 到底有什么区别,而最高赞回复逐渐收敛出一个稳定心智模型:策略写进 CLAUDE.md,操作手册放进 skills,约束落在 hooks,打包交给 plugins(帖子)(595 分,93 条评论)。来自 u/caldazar24 的最高赞回复(得分 397)把 hooks 描述成一个分界点:用户从此不再相信那种“随缘式”的提示词,而是改用确定性的命令。

u/EthanWng97 把可观测性做成了一个产品:ascii-agents 是一个终端像素风办公室,会把每个 Claude Code 会话可视化成坐在工位前的员工(帖子)(211 分,42 条评论)。链接里的 GitHub 仓库还写明了对 hooks 安全的集成方式、按工具记录的遥测,以及同时支持 Claude Code 和 Antigravity,这让它不只是一个新奇 demo。

u/nimbis 又把同样的想法推进到终端交互层面,做了 yet-another-statusline,在 ~/.claude 里把已加载的 plugins、skills、上下文和子智能体信息都显示出来(帖子)(182 分,50 条评论)。u/Ill_Particular_3385 则把这套思路扩展到更大的栈上,做了 Cate——一个开源画布式 IDE,把 Claude Code、编辑器、浏览器和终端放进同一个持久化工作空间(帖子)(132 分,33 条评论)。

讨论要点: 最有价值的回复,已经不再争论智能体式编程有没有用,而是在讨论怎样把状态、规则和可见性外化出来,让用户能够稳定地监督它。

与前日对比: 2026-05-24 最强的 Claude Code 信号还是围绕信任和定价的抱怨。到了 2026-05-25,讨论上移了一层,转向解释、可视化和约束智能体行为的工具。

1.2 低价编程通道和额度可见性正在成为核心产品功能 🡕

最大的跨平台产品信号,是用户强烈想要更便宜、可预测的“主力干活型”模型通道。Antigravity 用 Gemini 3.5 Flash (Low) 作出回应,而 Copilot 用户和直连模型用户则继续公开比较不同提供商的经济账。

u/aunchable 宣布 Antigravity 新增 Gemini 3.5 Flash (Low),把它定位成一种省 token 模式:据称相比 Flash (Medium) 少生成约 45% 的 token,同时在 SWE 任务上又优于 Gemini 3 Flash (High)(帖子)(354 分,106 条评论)。最高赞回复立刻追问是否会有独立额度池和可靠刷新机制;u/VENTURIexe(得分 41)直接问,这条新通道能不能不要和现有 Gemini 池共用额度。

Antigravity 模型选择器,显示新增的 Gemini 3.5 Flash Low 选项

u/TheTentacleOpera 给出了一个正面反例:他们说,调整工作流之后,Flash 3.5 Medium 已经能扛住反复的编程任务,而截图里额度剩余仍显示 100%(帖子)(100 分,18 条评论)。这场“便宜通道”争论也并非一边倒:u/Kaskote 说 Cursor Composer 2.5 Fast “快得离谱”,但在一个 5k-LOC 的金融代码改动集上依然引入了回归(帖子)(102 分,61 条评论)。

u/Immediate-Jicama-462 说,Copilot 的定价把他们逼去用 Cline + DeepSeek V4 Pro(帖子)(37 分,56 条评论);而 u/_porn93com 给出了最清晰的基准:他们通过 Copilot 插件跑 DeepSeek Flash API,一共发起 3,936 次请求、消耗 665M+ token,总成本约 $4(帖子)(33 分,20 条评论)。

DeepSeek Flash API 控制台,显示 3,936 次请求、665M+ token,以及总成本约 $4

讨论要点: 反复出现的分野已经很清楚:高价模型依旧被当作升级处理的工具,但日常开发工作正被推向更便宜、更快、也更容易做预算的通道。

与前日对比: 5 月 24 日主要还是 Copilot 的“账单吓一跳”。到 5 月 25 日,已经多了一个供应商的现场回应(Flash Low),以及更多用户迁移到直连 API 栈的具体证据。

1.3 信任与可靠性问题正在从烦恼升级为运营风险 🡕

Claude Code 和 Antigravity 里最棘手的讨论,已经不是模型“口味”之争,而是产品能不能被信任:它是否会按可预测方式运行、是否会说明自己在做什么,以及在真实硬件上能不能稳定。

u/matheusmoreira 报告称,Claude Code v2.1.150 引入了一种会从网络拉取内容并注入系统提示词的机制,来源包括一个 bootstrap 端点和一个 GrowthBook flag;他还贴出了一个 GitHub 问题单,里面包含复现步骤和退出环境变量(帖子)(420 分,56 条评论)。评论里的业务风险视角也很明显:u/cannontd(得分 162)说,隐藏的环境变量和不透明的发布行为,让企业很难放心把这个产品用在智能体式 GitHub Actions 工作流里。

u/lawnguyen123 又提出了另一类信任抱怨:用户在会话中途可能会不小心把便宜的缓存命中变成昂贵得多的缓存写入,而产品本身又没有把这种风险提示出来(帖子)(286 分,42 条评论)。最有力的回复虽然对部分细节做了纠正,但这反而进一步说明同一个问题:在工具内部,用户太难看清哪些行为会触发关键的成本变化。

u/AwayOpposite487u/Party-Amphibian-8394 分别贴出了 M4 Mac 截图,显示 Antigravity 在冻结前分别吃掉约 89.18 GB 和 40.14 GB 内存(帖子)(9 分,6 条评论);(帖子)(24 分,12 条评论)。

macOS 强制退出对话框显示:Antigravity IDE 在冻结前占用 89.18 GB 内存

讨论要点: 在这两个产品上,用户已经不只是问“这个模型好不好”,而是在问:隐藏的提示词变更、隐藏的成本倍率、隐藏的资源尖峰,会不会让整个工作流变得不值得信赖。

与前日对比: 5 月 24 日已经有长上下文和计费上的混乱;5 月 25 日又把完整性问题推得更尖锐:供应商是否正在以用户难以审计的方式改动智能体行为或资源占用。

1.4 vibe-coded 产品还在持续上线,但增长正在变成瓶颈 🡒

构建者热情依旧很高,但这一天最扎实的案例,都同时传递了两层信息:既有具体的产品证据,也有第二层现实——把东西做出来,比赢得注意力或信任更容易。

u/No_Reindeer_6824 做了 LinkChart.art——一个协作式调查面板,用来连接人物、车辆、地点和事件,技术栈包括 React、React Flow、Tailwind、WebSockets 和 SVG 导出(帖子)(104 分,41 条评论)。它的在线网站把定位明确放在调查、欺诈、保险和 OSINT 场景上,而不是一个泛泛的画布演示。

LinkChart 调查面板,显示关联实体、事件卡片和实时侧边栏

u/john200ok 则给出了另一类证据:OptimistPal 是一款离线 iPhone 应用,会用 Screen Time 打断 doomscrolling,并通过重构式提示引导用户重新表述;它在 3 天内拿到了 575 次首次下载(帖子)(81 分,38 条评论)。App Store 页面印证了它“隐私优先”的定位,截图也展示了真实下载曲线。

App Store Connect 分析图,显示 3 天内获得 575 次首次下载

u/nosirjonov 更直白地点出了下一个瓶颈:《Marketing is 100x harder than coding》(帖子)(34 分,93 条评论)。最高赞回复并不否认这个痛点;他们争论的是,这个产品页面依然没说清楚,为什么有人要选它,而不是 Lovable、Replit、Cursor、Codex 或 Claude Code。

讨论要点: 构建者社区已经不再卡在“我能不能发出去”上。更难的问题变成了分发:当代码已经能跑之后,如何做差异化、信息传达和信任建设。

与前日对比: 5 月 24 日的展示型热度更广。5 月 25 日依然有“发出去”的信号,但更偏向产品范围更窄、牵引力更清晰的项目,同时也更明确地暴露出对市场推广的焦虑。


2. 令人困扰的问题

配额、倍率和锁定机制都不透明

严重程度:高。Antigravity 和 Copilot 用户反复提到,最难受的已经不只是花更多钱,而是根本不知道自己什么时候会撞墙。u/aunchable 的 Flash Low 公告一发,评论区马上就出现了关于 3-4 天刷新墙和共享额度池的抱怨(帖子)(354 分,106 条评论);而 u/Mildly_Aware 则要求 Antigravity 公开每周上限,因为被锁一整周以后,他们“现在都不敢像之前那样用了”(帖子)(48 分,7 条评论)。

为 Antigravity 设计的模型额度界面 mockup,包含每周上限、按模型划分的刷新计时器和配额节奏控制

Copilot 用户从另一个角度提出了同样的烦恼。u/Little-Cricket-1051 展示了 GitHub 文档里现在把 GPT-5.4 和 GPT-5.4 mini 都标成年度套餐 6x 倍率,尽管二者的单 token 价格差距很大(帖子)(24 分,7 条评论);而 u/Key-Media-3520 则说 GitHub Education 已经不再提供他们原以为会有的、用于理解项目的 AI 访问能力(帖子)(35 分,51 条评论)。用户的应对方式,要么是切到 Cline + DeepSeek 这类直连模型栈,要么就是手动节省高价模型用量。这个痛点值得投入构建,因为它横跨了产品、套餐和预算层级。

会在会话中途改变成本或信任的隐藏行为

严重程度:高。u/matheusmoreira 指出,Claude Code v2.1.150 可能会把网络拉取的字符串注入系统提示词,并贴出了一个附带复现步骤和退出环境变量的 GitHub 问题单(帖子)(420 分,56 条评论)。最有分量的企业侧回复来自 u/cannontd(得分 162):隐藏的环境变量和不透明的发布行为,让企业很难放心把这个工具用在智能体式 GitHub Actions 里。

u/lawnguyen123 在计费侧揭开了另一个信任缺口:用户一旦改动会话状态,就可能在毫无提示的情况下把便宜的缓存命中变成更昂贵的缓存写入,但 UI 并不会解释这里面的经济学(帖子)(286 分,42 条评论)。回复里有人质疑部分技术细节,但这只会进一步坐实同样的挫败感:用户缺乏第一方视角,看不到到底哪些操作会触发昂贵行为。

付费 AI 编程工作流里的可靠性故障

严重程度:高。两位 Antigravity 用户分别贴出 M4 Mac 截图,显示在冻结或失稳前,内存占用达到约 89.18 GB 和 40.14 GB(帖子)(9 分,6 条评论);(帖子)(24 分,12 条评论)。在每周支持帖里,u/ChemistryMoney5596(得分 5)又补充了一种故障模式:反复出现“servers are experiencing high traffic”错误,而且据称每次重试都会消耗配额(讨论串)。

用户现在的应对方式包括不断重试、切换模型,或者干脆离开这个 IDE,改用更轻的栈。如果解决方案是运维可观测性或更安全的回退机制,这个方向值得做;但如果非得替换底层模型不可,那就不是。

分发比上线更难

严重程度:中。u/nosirjonov 在做出产品、又开始寻找增长帮助后,说出了“营销比写代码难 100 倍”(帖子)(34 分,93 条评论)。最高赞的反驳并不偏哲学,而是非常实操:u/whitew0lf(得分 17)说,网站说清了它是什么,却没说清为什么重要;u/Murky-Refrigerator30(得分 16)则问,为什么用户要选它,而不是 Lovable、Replit、Cursor、Codex 或 Claude Code。

这里的挫败感不是“我做不出来”,而是“我说不清、定位不准,也发不出去我做出来的东西”。这跟核心编程工具已经是另一类问题。


3. 人们期望的功能

透明的配额与成本可观测性

直接机会。用户想要的并不是模糊的“更好定价”,而是可见的每周上限、按模型划分的刷新计时器,以及更清楚的用量记账。u/Mildly_Aware 已经给 Antigravity 画出了那样的界面 mockup(帖子)(48 分,7 条评论);而 u/Key-Media-3520 则想要一种能负担得起、又不会突然跳出升级门槛的 AI 代码理解能力(帖子)(35 分,51 条评论)。这不是一种愿景型诉求,而是现实中的刚需。

更好的多智能体监督界面

直接机会。ascii-agents、状态栏工具和 Cate 这几条帖子都指向同一个缺口:用户想知道智能体在做什么、加载了哪些上下文,以及工作空间是如何组织的,而不是去啃长日志。u/EthanWng97 的 ascii-agents(帖子)(211 分,42 条评论)和 u/nimbis 的状态栏工具(帖子)(182 分,50 条评论)都只是部分答案,而 u/Ill_Particular_3385 则把 Cate 明确定位为对 Claude Code 周边工作空间蔓延的一种回应(帖子)(132 分,33 条评论)。这类需求对重度用户来说既实用又紧迫,但市场也正在变得拥挤。

关于 hooks、skills、plugins 和 memory 的更清晰心智模型

竞争性机会。u/eaiarthur_ 并不是在要一个新模型功能;他们想要的是一个“真正能让人一下明白”的解释(帖子)(595 分,93 条评论)。最高赞回复确实给出了这种解释,但这条帖子的体量说明,现有文档和入门流程仍让很多用户搞不清 hooks、skills 和 CLAUDE.md 各该怎么用。这里依然有空间做成产品或教程,把零散的经验传说整理成有引导的配置流程。

为新上线的 AI 产品提供市场推广支持

新兴机会。u/nosirjonov 说,构建这一步已经结束,难的是增长(帖子)(34 分,93 条评论)。与此同时,u/john200ok 又说,OptimistPal 只靠 ASO 和社交发布就拿到了牵引力(帖子)(81 分,38 条评论),这说明分发是可学习的,但仍远未被解决。这里的需求,一部分是实操手册,一部分是情绪上的托底。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
Claude Code 智能体式编程 CLI (+/-) hooks、skills、plugins 和社区扩展生态很强;好用到让用户开始围绕它搭可观测性和工作空间层 远程提示词实验、缓存成本不透明,以及内部行为不清晰带来的信任问题
Antigravity + Gemini 3.5 Flash IDE + 模型通道 (+/-) 新 Flash Low 通道瞄准更便宜的日常工作;有用户称 Flash 3.5 Medium 在重复编程任务里仍然耐用 共享额度池引发混乱、整周锁定焦虑、内存尖峰,以及大量依赖重试的可靠性抱怨
Cursor Composer 2.5 IDE 模型/运行框架 (+/-) 做小范围、可监控的改动或规划时,又快又便宜 用户报告在更大的多文件编辑里会出现回归,而且上下文很容易退化
DeepSeek V4 Pro / Flash API 直连模型/API (+) 成本效率高;用户报告经 Cline、Claude Code 或 Copilot 插件接入时表现不错 需要更明确的指令;更常被当成高价运行框架默认模型的替代,而不是单独成完整产品
GitHub Copilot IDE 运行框架 (-) 环境熟悉;付费用户能接入广泛的模型 年度套餐倍率让人困惑、升级门槛明显,以及教育/免费访问缩水带来的挫败感
ascii-agents 智能体可观测性工具 (+) 用会话和工具遥测把并行智能体活动变得可见 仍很早期;有评论者怀疑大多数用户是否真的需要这么强的并行智能体可见性
yet-another-statusline Claude 定制工具 (+) 直接在终端显示 plugins、skills、子智能体和上下文信息 这类终端定制比较小众,对轻度用户来说可能有些过度
Cate 空间式桌面工作空间 (+) 持久化画布把终端、编辑器、浏览器和 worktree 放在一起 仍属早期工作空间方案;对很多人来说是又加了一层 app,而不是简化整套栈

整体满意度正在按工作类型分化。需要更强推理或更高自治时,用户依然会求助高价运行框架;但日常开发工作正被分流到 Flash、DeepSeek 这类更便宜的通道。最常见的权宜组合是混搭:高价模型负责规划或审查,便宜模型负责执行,再叠加社区扩展来补足可见性和控制。如今最大的竞争变量,已经不再是“哪个前沿模型最好”,而是“哪一套栈最能让成本、上下文和监督这三件事更容易管理?”


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
ascii-agents u/EthanWng97 把终端里的编程智能体会话可视化成共享办公室里的动态同事 让多智能体 Claude Code 工作更容易监督 Rust、终端 UI、Claude Code/Antigravity hooks Beta 帖子 · 仓库
yet-another-statusline u/nimbis 给 Claude 终端加一条状态栏,显示 plugin、skill、上下文和子智能体信息 降低 Claude Code 会话里的隐藏状态混乱 Shell/Claude 配置工具 Beta 帖子 · 仓库
Cate u/Ill_Particular_3385 用画布式 IDE 把编辑器、终端、浏览器和 git/worktree 摆进同一个工作空间 减少围绕 Claude Code 工作流的标签页/窗口切换 Electron、Monaco、xterm.js、browser panels、git/worktrees Beta 帖子 · 仓库
LinkChart.art u/No_Reindeer_6824 面向人物、车辆、地点和事件的协作式调查面板 给调查人员和研究者一块实时的关系分析画布,而不是静态图示 React、React Flow、Tailwind、WebSockets、SVG 导出 Alpha 帖子 · 网站
OptimistPal u/john200ok 只有当用户把负面想法重新表述后,才允许打开所选 app 的 iPhone 应用 用离线介入打断 doomscrolling 和消极刷手机循环 使用 Apple Screen Time 的 iOS 应用 已发布 帖子 · App Store

最强的构建者模式并不是“又一个通用 AI 套壳”。而是外围基础设施:一个工具负责看见智能体,一个负责暴露隐藏的会话状态,一个负责把整个工作空间拢在一起。这个集群说明,智能体式编程已经成熟到让人开始围绕运行框架本身做工具,而不只是堆在模型上层。

第二种模式则是更窄的垂直产品。LinkChart.art 值得注意,是因为它已经明确对准了特定调查用户;OptimistPal 值得注意,是因为它把清晰的问题定义、已上线的分发和可量化的早期下载曲线放在了一起。把它和那条“营销比写代码难 100 倍”的讨论对照起来看,会很有帮助:产品上线越来越真实,但 build 完之后,牵引力仍取决于定位和分发。


6. 新动态与亮点

服务端提示词实验成了主流信任议题

那条关于远程系统提示词注入的帖子,之所以从小众逆向工程圈子走进主流 Claude Code 讨论,是因为它同时具备公开的 Reddit 写作、链接出去的 GitHub 问题单、可复现步骤,以及 Anthropic 对“提示词实验放在服务端跑”的回应(帖子)。这组组合让它不再只是一条抱怨,而成了一个具体的治理与企业信任信号。

低价模型基准第一次变得异常具体

DeepSeek Flash API 那张截图值得注意,因为它给出了这类帖子里少见的公开基准:3,936 次请求、665M+ token、总花费约 $4(帖子)。这么具体的成本数据,很能解释为什么用户愿意离开 Copilot 默认栈或高价运行框架,转去直连 API 路由。


7. 机会在哪里

[+++] 面向 AI 编程的成本与配额可观测性 —— 证据遍布第 1-4 节:Antigravity 用户想要每周上限和刷新计时器,Copilot 用户搞不清倍率逻辑和升级门槛,Claude Code 用户则在逆向缓存行为,只为看懂账单。这个信号很强,因为同样的痛点同时出现在不同供应商、套餐和用户分层里。

[++] 智能体监督与工作流可见性 —— ascii-agents、yet-another-statusline 和 Cate 之所以存在,是因为用户想看见会话状态、已加载的上下文,以及周边工作空间结构。这个需求真实而且眼下就存在,但随着社区工具和运行框架供应商一起补位,竞争也在加剧。

[+] 面向 AI 产品的市场推广工具 —— LinkChart.art 和 OptimistPal 证明“发出去”是真的,而《Marketing is 100x harder than coding》那条讨论又说明分发仍未被解决。这个机会正在浮现,因为构建瓶颈下降的速度,比上线和定位瓶颈下降得更快。


8. 要点总结

  1. AI 编程讨论继续从模型层往外移,转向工作流层。 Claude Code 这天最强的胜出案例,是解释 hooks、skills、plugins 的帖子,以及 ascii-agents、状态栏工具、Cate 这类可见性工具的发布。 (来源)
  2. 便宜、可预测的开发通道,比高端模型光环更重要。 Antigravity 为回应 token 抱怨新增了 Flash Low;与此同时,Copilot 用户也在公开成本截图的推动下,迁移到基于 DeepSeek 的栈。 (来源)
  3. 信任问题已经变成产品问题。 远程提示词实验、隐藏的缓存经济学、以及内存尖峰,都指向同一个需求:产品要把自己在做什么明明白白展示出来,而不是让用户自己去猜。 (来源)
  4. vibe-coded 产品确实能上线,但增长仍是下一道硬墙。 LinkChart.art 和 OptimistPal 展示了可信的产品与牵引力,而构建者帖子里最有信号的反驳也越来越聚焦于定位和分发,而不是开发本身。 (来源)