Twitter AI 编程 - 2026-05-05¶
1. 人们在讨论什么¶
1.1 GitHub Copilot 定价余波持续;品牌受损叙事出现 🡕¶
@theo 发布(1,096 点赞,68 回复,4 引用,150 收藏数,102,373 浏览量)一张后续截图,显示“15 条消息 - 价值 $221 的 token - 用掉了我 $40 套餐的 1.6%”,并总结:“很明显,GitHub 不可能继续用这种模式给 Copilot 计费。”这条帖子引用了他自己此前发现单条 6000 万 token 消息消耗 $30 推理成本的经历。在回复中,@bytecrafter_1 解释:“一次智能体循环就会吃掉过去相当于 100 次自动补全的推理量,一旦智能体式工作流上线,1500 条消息的固定上限根本撑不住。”

@GergelyOrosz 宣称(97 点赞,9 回复,13 收藏数,9,389 浏览量):“Copilot 就是一个如何用 AI 垃圾内容毁掉品牌的典型案例。GitHub Copilot 原本是个好产品,也一直是。其他那些 Copilot 都仓促上线、质量很差,把 Copilot 这个品牌搞成了大多数人都讨厌的东西。”这条帖子引用 Xbox CEO Asha Sharma 宣布他们正在“逐步收缩移动端 Copilot”并停止游戏主机开发。回复中,@diullei 认同:“GitHub Copilot 确实解决了一个真实问题,但后来的大多数 Copilot 都像是先有功能、再硬找使用场景。”
@iBhanuDahiya 报告(7 点赞,4 回复,185 浏览量):“‘每月 $19 无限量 AI’ 的时代这周结束了。GitHub Copilot 推出了按量计费。Sonnet 从 1x 涨到 9x,Opus 从 3x 涨到 27x。以前只算一次高级请求的长时间智能体会话,现在最高要贵 27 倍。”
@MSiekmoeller 预测(16 点赞,10 回复,503 浏览量):“到今年年底,氛围编程者的数量会腰斩:GitHub Copilot 将在 2026 年 6 月 1 日开始按量计费。其他家已经涨过了,剩下的也会跟进。”
讨论要点: GergelyOrosz 讨论串揭示了一种分裂:一边认为 GitHub Copilot 本身是根基良好的产品,却被 Microsoft 的品牌扩展策略拖累;另一边(如 @noah_vandal)质疑“就连 GitHub Copilot 本身,做法是否正确都很可疑。”定价讨论串中,@JulieLovesTech 提出不同视角:“这不是定价问题,而是商业模式问题。GitHub 给 Copilot 定价时,假设它是编程助手,不是让人拿来跑完整研究工作流的。”
与前日对比: 5 月 4 日,theo 的定价截图是头条,焦点是原始经济学(15 条消息 $221)。今天讨论演化:GergelyOrosz 从定价升级到品牌损害,MSiekmoeller 预测行业级后果,Xbox 的 Copilot 关闭提供了具体数据点。叙事从“它花多少钱”转向“Copilot 品牌已经受损到难以修复”。
1.2 OpenAI 将 Codex 额度提高 10 倍,引发社区忠诚度激增 🡕¶
@DeryaTR_ 庆祝(63 点赞,6 回复,1 引用,2 收藏数,2,606 浏览量):“OpenAI 刚刚把所有申请参加 OpenAI 派对的人,Codex 限额都提高了 10 倍,而且持续一个月!这举动也太贴心了!”引用 Sam Altman 承诺会为“所有申请了 GPT-5.5 派对的人”做点好事。
@RileyRalmuto 确认(22 点赞,6 回复,2 收藏数,1,231 浏览量):“各位技术宅,如果你申请了但没拿到 OpenAI 那场聚会的邀请,去看看邮箱。Codex 额度一个月 10 倍!”

@tonysimons_ 反应(12 点赞,4 回复,1 引用,1,007 浏览量):“我靠!接下来一个月 Codex 直接 10 倍?!谢谢 @sama @thsottiaux @OpenAI”
@argofowl 给出(39 点赞,9 回复,1,060 浏览量)喜剧式反方:“我都崩溃了,当时居然没去申请 OpenAI 那场活动派对。现在只能像个失败者一样坐在这儿,没有 10 倍额度。这样还有意义吗?一切还有意义吗?”
@morganlinton 立即利用(7 点赞,4 回复,359 浏览量)这些额度:“OpenAI 把我的额度提高了 10 倍之后,我都开始造一整个操作系统了,只是在开会间隙看看 Codex。内核已经搞定。”
讨论要点: @PaulGugAI 看穿了这份善意:“这招很聪明!对那些去不了的人来说,是个很大的安慰。他们的 PR 团队显然不是吃素的!”与此同时,@Parental_OnX 标记了排除问题:“这确实是个很棒的举动,但对我这种如果能去就一定会申请、却为了让别人能参加而主动没申请的人来说,还是会有点难受。”
与前日对比: 5 月 4 日,Codex 叙事聚焦功能扩展(Symphony、/goal、Pets)。今天 OpenAI 转向社区建设策略,用算力额度作为忠诚度工具。10 倍额度投放是一种分发打法:让重度用户在一个月内深度嵌入 Codex 工作流,在额度过期前制造切换成本。
1.3 Codex vs Claude Code:算力战加剧 🡕¶
@VraserX 认为(36 点赞,12 回复,2 收藏数,2,046 浏览量):“GPT-5.5 之后,OpenAI 把 Codex 限额提高 10 倍,Dario Amodei 看着这事恐怕睡觉都得哭。Anthropic 不是因为 Claude 不行才失手,而是因为现在比拼的就是算力。”回复中,@hAirJordan01 反驳:“他们在 ARR 和增长率上都甩开了 OAI。你这话根本站不住脚。”VraserX 回应:“现在 Codex 的下载量已经超过 Claude Code,而且 OpenAI 能服务的用户多得多。”
@Legendaryy 验证(12 点赞,5 回复,744 浏览量):“我用的是 $200 的 Codex 套餐,但根本打不到上限。$20 的档位对大多数开发者来说都够用了。Claude Code 的蜜月期已经过去了,OpenAI 正在把开发者买回来,而且这笔账算得过来。”
@aiedge_ 总结(7 点赞,9 回复,1 引用,626 浏览量)Anthropic 的处境:“Anthropic 现在想留在赛道上只剩两步:1. 发布 Mythos;2. 提高用量上限。OpenAI/Codex 团队这阵子确实很能打。”
@WesRoth 报道(25 点赞,6 回复,3 收藏数,833 浏览量):“OpenAI 的 Codex Mac 应用已经开始主导开发者市场。Codex 负责人刚刚确认,原生编辑器、iOS 应用、完整浏览器能力以及 OpenClaw 集成都已经正式在路上了。”回复中,@dahulilang 提供细腻观点:“Claude Code 在原始能力上更强,但 Codex 在生态上更占优。”

@Layton_Gott 分享(8 点赞,7 回复,1 引用,4 收藏数,89 浏览量)一个绕行方案:“Claude Code 的限额太狠了……不过如果你这么做,可以省下 50-75% 的 token。”回复中,@jeromeq2004 诊断结构性问题:“Anthropic 就是靠这些限额来交付利润率。Sonnet 当初给得大方是为了拉你上船,Opus 才是那道围栏。”
@vadymsyliava 直接比较(2 点赞,1 回复,1 收藏数,49 浏览量):“Claude Code @AnthropicAI 的 $200 Max Plan 对上 Codex @OpenAI 的 $100 Plan,差距一眼就能看出来。”

讨论要点: 争论揭示两大阵营:按原始模型质量评估的人(Claude 在能力上胜出),与按每美元可用算力评估的人(Codex 在用量上限上胜出)。@dahulilang 的表述——“原始能力更强 vs 生态更强”——可能是最准确综合。
与前日对比: 5 月 4 日,Codex-vs-Claude 叙事聚焦 NPM 下载数据(Codex 于 4 月 30 日超过 Claude Code)。今天它从市场份额指标转向经济基本面:OpenAI 的算力优势意味着他们可以把 10 倍额度当营销用,而 Anthropic 难以匹配。论点从“谁有更多用户”转向“谁能更久地补贴使用”。
1.4 Google Antigravity:教程饱和与生产怀疑 🡒¶
@JulianGoldieSEO 发布了三条 Antigravity 课程帖子:一门 4 小时课程(59 点赞,15 转发,60 收藏数,2,580 浏览量)、一门 2 小时课程(18 点赞,5 转发,12 收藏数,528 浏览量),以及 另一门 2 小时课程(14 点赞,5 转发,6 收藏数,421 浏览量)。
@boredabdel 推广(15 点赞,2 转发,10 收藏数,618 浏览量):“用 Google Antigravity 和 Firebase 做一款电子游戏!这门实战课程会先带你安装并上手 Antigravity,然后用 Firebase 为你构建的应用启用服务。最后,你会在 Antigravity 中提示多个智能体并行工作,做出一款叫 Voyager 的电子游戏。”

@thefox 发布(492 点赞,45 转发,36 回复,10 引用,226 收藏数,59,581 浏览量)一个真正的生产功能:“刚刚在 Google Finance 上线了 AI 驱动的关键时刻,让你能看懂股票图表中的重大价格波动,并跳转到公司财报电话会里的关键时刻。这个功能由一个小团队借助 @Antigravity 从零快速做出来。”
@MetacriticCap 批评(50 点赞,5 回复,2 引用,4 收藏数,8,504 浏览量):“Gemini 所谓的 SOTA,更像是大家都觉得如果把它放进 Cursor、Antigravity 或 Opencode 里会很棒。但实际上,根本没人真的在这些工具里用 Gemini。”回复中,@PmQuant 反驳:“你这说法太外行了。它依然是最好的多模态模型。Gemini 在编程上当然落后,但在很多方面仍然是 SOTA。”
@igboonaija3 抱怨(5 点赞,1 转发,1 引用,3 收藏数,825 浏览量):“LLM 还是很笨。我都为 Antigravity 付费了,但这家伙还是不如一个初级开发者。Google 真的得把 Gemini 修好。”
讨论要点: thefox 的 Google Finance 功能(492 点赞,59K 浏览量)是整个数据集中互动量第二高的帖子,但它也是唯一的 Antigravity 生产用例。海量教程供给(JulianGoldieSEO、boredabdel)与实际生产使用之间的差距,说明 Antigravity 仍处于“学习工具”阶段,而不是“交付工具”阶段。
与前日对比: 5 月 4 日,Antigravity 通过 JulianGoldieSEO 四帖饱和主导教程声量,同时仍“缺席于生产工具选型讨论”。今天 thefox 的 Google Finance 上线打破这个模式——这是来自 Google 内部的具体生产用例——但更广泛社区仍把 Antigravity 视为学习平台。MetacriticCap 的“根本没人真的在这些工具里用 Gemini”观点增加了昨天没有出现的模型质量角度。
1.5 AI 工具选择瘫痪与多工具现实 🡒¶
@isha_singh06 询问(42 点赞,40 回复,1 收藏数,887 浏览量):“大家说说我该选哪个?Claude、Codex、Cursor、Antigravity,还是 GitHub Copilot?”这条 40 回复讨论串变成实时工具投票,但没有共识。
@ghumare64 认为(1 点赞,2 收藏数,24 浏览量):“‘Cursor vs Claude Code vs Codex vs Copilot’ 这个争论方向就错了。开发者不是在四选一,他们是在搭自己的工具栈。JetBrains 2026 年的调查说,90% 的开发者现在都会固定使用至少 2 个 AI 编程工具。”
@old_sound 给出(2 点赞,2 回复,1 收藏数,284 浏览量)犬儒观点:“用了 3 个月 GitHub Copilot、Codex 和 Claude Code 之后,我的结论是:最好用的 AI 就是你没在用的那个。我在 Codex 上花了 200 多美元想优化一些推理内核,结果两天 /goal 模式跑下来什么也没得到,结果波动大得离谱。”
@verycracked 切换(7 点赞,3 回复,60 浏览量):“@aaronmahlke 把我说服了。@opencode 现在成了我的日常主力,跑在 Ghostty 里。”

@PopCatalin 请求(13 点赞,3 回复,3 引用,451 浏览量):“@elonmusk 请和 @github、@Microsoft 合作,把 Grok 4.3 接进 Github Copilot CLI。”用户希望在自己偏好的运行框架中获得最大模型多样性。
与前日对比: 5 月 4 日,资深用户发布多工具栈(LottoLabs、WiFiMoneyGuy、TechCyberCoder)。今天讨论向上游扩散到初学者:isha_singh06 的“我该选哪个”(40 回复,无共识)说明复杂性已经触达主流开发者。ghumare64 引用 JetBrains 调查数据,验证多工具已经是标准实践,而非资深用户专属行为。
1.6 氛围编程:从热潮到收入现实 🡖¶
@jsaunders_ 总结(9 点赞,9 转发,2 收藏数,398 浏览量)Naval Ravikant 的新播客:“他讲了这些内容:为什么纯软件如今已经‘不值得投资’,为什么 Apple 正在犯下‘这个十年里最大的错误’,以及那套能把 9 个工程师压缩成 1 个人的工作流。”
@sierracatalina 宣称(12 点赞,3 回复,246 浏览量):“氛围编程已经死了。我现在是在床上烂码。”
@zuess05 讽刺(4 点赞,6 回复,117 浏览量):“你去问 Claude:‘我的 SaaS 点子好吗?’它回给你一篇 4 段长文,大谈你的‘巨大 TAM’和‘颠覆性潜力’。然后你用氛围编程在 48 小时内把整个产品做完,最后盯着一个 $0 仪表盘发呆,不知道到底哪里出了问题。”
@wenyanhh 建议(2 点赞,1 收藏数,22 浏览量):“创始人该停下氛围编程了。现在最容易做的就是氛围编程,但它看起来像进展,其实不是。你更该做的是:把落地页一遍遍改到真的能转化,去参加线下活动。”
@MLStreetTalk 强力反驳(4 点赞,1 回复,1 收藏数,67 浏览量):“我不买账。作为一个从 2023 年起就在严肃项目上不停氛围编程的人,我可以很明确地说,它顶多只是制造了更多工作,也给软件工程师创造了更多饭碗。”
@orangie 宣布(44 点赞,18 回复,3 收藏数,5,404 浏览量):“第一个 $500 获胜者已经选出来了。我会在同一个 Discord 里再办一场 $500 的氛围编程比赛。”氛围编程比赛模式继续从加密货币周边社区获得互动。

与前日对比: 5 月 4 日,氛围编程讨论围绕“分发缺口”——构建容易,营销很难。今天怀疑更深:MLStreetTalk 直称它适得其反,sierracatalina 宣称它已经死亡,wenyanhh 把它框定为逃避行为。与此同时,orangie 的比赛显示氛围编程仍作为社区娱乐而活跃。“把氛围编程当严肃工程实践”和“把氛围编程当社区运动”之间的差距扩大。
1.7 OpenCode 与终端智能体生态增长 🡕¶
@kmdrfx 展示(118 点赞,9 转发,6 回复,1 引用,28 收藏数,9,685 浏览量):“我在探索给 OpenCode 做一个类似 which-key 的插件,同时把新的 OpenTUI keymap 整合成唯一的按键/命令处理引擎。OpenTUI keymap 对插件扩展性极强,也会支持一个真正带 motions 的 vim 插件。”
@bentlegen 指出(21 点赞,1 回复,3 收藏数,671 浏览量)一个里程碑:“像 @jayair(@opencode)和 @Sirupsen(@turbopuffer)这样的本地开发工具创始人能登上 Toronto Tech Week 的《Homecoming》舞台,这感觉就是一个重要里程碑。”
@teortaxesTex 解释(20 点赞,2 回复,2 收藏数,1,973 浏览量)成本优化:“构建能最大化缓存命中的智能体非常重要。这才是 V4 降本的主轴。在 OpenCode 这里,我的缓存命中率是 91.6%;如果能达到常见的 96%,成本还能再低 30%。”

@OpenCodeLog 宣布(4 点赞,1 收藏数,154 浏览量)v1.14.38:“桌面版现已信任系统 CA;UI CSP 现在允许外部连接;Node/Nix 打包已刷新;Zed 构建产物已更新。”
@prathamkode 推荐(3 点赞,2 回复,43 浏览量)预算路径:“如果你想开始氛围编程,但预算不多,那就直接从 opencode 开始。”
讨论要点: kmdrfx 的 which-key 插件帖子(118 点赞,9,685 浏览量)是数据集中互动量第五高,说明终端智能体中对 Vim 风格、键盘驱动工作流有强需求。@Beethoven779 的评论——“我正从 CLI 切到他们的桌面应用,连最简单的上下方向键都不能用”——突出说明,尽管爱好者兴趣强,CLI 体验对一些用户仍是障碍。
与前日对比: 5 月 4 日,OpenCode 主要作为预算路由工具($10/月档位)出现。今天它通过 kmdrfx 的高互动插件工作、Toronto Tech Week 登台亮相和 teortaxesTex 的成熟成本分析获得生态认可。OpenCode 正从“便宜替代品”转向“严肃平台”。
2. 令人困扰的问题¶
Copilot token 经济性与品牌侵蚀 -- 高¶
@theo 展示(1,096 点赞,102,373 浏览量)15 条消息消耗了价值 $221 的 token。@GergelyOrosz 把批评升级(97 点赞,9,389 浏览量)到品牌层面:“把 Copilot 这个品牌变成了大多数人都讨厌的东西。”@JamesFredley 报告(1 点赞,2 回复,19 浏览量):“我刚刚在 @opencode 里把 GitHub Copilot 关掉了。每月 300 次请求已经用了 19 次,超额也打开了,结果任务做到一半还是会失败。”
@dan_note 指出(3 点赞,1 收藏数,278 浏览量)另一个问题:“我到底要怎么给整个组织关掉 @github Copilot 审查?我不想要这东西。它会在 PR 里塞进一堆敷衍评论,还会分散贡献者注意力。”
应对策略:预算任务切换到 OpenCode(prathamkode)。完全禁用 Copilot(JamesFredley)。把预算拆分到多个工具。
Claude Code 限流作为利润机制 -- 中¶
@Layton_Gott 分享 节省 token 的技巧,但 @jeromeq2004 诊断根因:“Anthropic 就是靠这些限额来交付利润率。Sonnet 当初给得大方是为了拉你上船,Opus 才是那道围栏。这些省 token 的技巧当然不错,但那只是跟限流斗法,不是解决方案。”@vadymsyliava 展示 $200 Claude Max 套餐提供的可用算力少于 $100 Codex 套餐。
应对策略:采用降低 token 消耗的工作流(Layton_Gott 声称可节省 50-75%)。大流量任务切到 Codex。接受限流节奏。
Gemini 在编程任务中的模型质量落后 -- 中¶
@igboonaija3 表示(5 点赞,3 收藏数,825 浏览量):“我都为 Antigravity 付费了,但这家伙还是不如一个初级开发者。Google 真的得把 Gemini 修好。”@MetacriticCap 观察(50 点赞,8,504 浏览量):“根本没人真的在这些工具里用 Gemini。”
应对策略:只把 Gemini 用于多模态任务。可行时把 Antigravity 与 Claude 或 Codex 模型配对。
FOMO 与排他式准入模式 -- 低¶
@argofowl 哀叹(39 点赞,1,060 浏览量):“我后悔死了,当时没申请 OpenAI 那场活动派对。现在我只能像个失败者一样坐在这儿,没有 10 倍额度。”@Parental_OnX 提出公平问题:那些为了给别人留名额而主动不申请的人什么也没拿到。
3. 人们期望的功能¶
Codex 原生编辑器和移动应用¶
@WesRoth 报道(25 点赞,833 浏览量)Codex 团队确认“原生编辑器、iOS 应用、完整浏览器能力和 OpenClaw 集成都已经正式在路上。”@gonlenidefi 强调需求:“真正对我重要的是原生编辑器。iOS 应用只会让我在咖啡馆写代码上瘾得更厉害。”
紧迫性:高。已确认在路上,但尚未发布。用户已经通过 /goal 构建 10 小时会话,需要移动端监控。
Grok 接入 GitHub Copilot CLI¶
@PopCatalin 请求(13 点赞,3 引用,451 浏览量):“@elonmusk 请和 @github、@Microsoft 合作,把 Grok 4.3 接进 Github Copilot CLI(别跟 Windows Copilot 搞混了)。”用户希望在不切换工具的情况下,在自己偏好的运行框架中获得模型多样性。
紧迫性:中。反映了更广泛的模型无关编程运行框架需求。
编程模型中更有温度的 AI 个性¶
@Youssofal_ 请求(9 点赞,6 回复,1 收藏数,1,016 浏览量):“@OpenAI,能不能更温暖一点?如果跟 Codex 一样,那这里根本谈不上温度。你们应该单独做一条模型线,少一点对智能的强调,多一点对个性的强调。”回复中,@idontev63124802 反驳:“你到底是想写代码,还是想别人一个劲儿吹捧你的代码?”
紧迫性:低。小众偏好,但说明纯粹优化能力会忽视开发者体验。
没有 AI 垃圾内容的自动代码审查¶
@code 推广(39 点赞,4 回复,17 收藏数,4,653 浏览量)把团队最佳实践转成自动化 Copilot 工作流。但 @dan_note 抱怨:“它会用一堆敷衍评论污染 PR,还会让贡献者分心。”缺口在于:自动代码审查应该匹配团队质量标准,而不是生成泛泛建议。
紧迫性:高。需求存在(VS Code 简报,17 收藏数),但当前做法让用户沮丧。
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| OpenAI Codex | 智能体平台 | (+) | 10 倍额度促销;$20 档位覆盖大多数开发者(Legendaryy);原生编辑器/iOS 应用在路上(WesRoth);/goal 支持构建操作系统式会话(morganlinton) | “没有温度”(Youssofal_);在推理内核上花 $200 无结果(old_sound) |
| Claude Code | 终端智能体 | (+/-) | 数据集中 18 次提及;节省 token 的技巧(Layton_Gott 50-75%);5 个项目教程(RelentlessNik);“原始能力更强”(dahulilang) | 限额是“Anthropic 交付利润率的方式”(jeromeq2004);$200 Max 提供的可用量少于 $100 Codex(vadymsyliava) |
| Google Antigravity | IDE 智能体 | (+/-) | Google Finance 生产发布(thefox,492 点赞);Firebase 游戏课程(boredabdel);教程饱和(JulianGoldieSEO 3 帖) | “还不如一个初级开发者”(igboonaija3);“根本没人会在这些编程工具里用 Gemini”(MetacriticCap) |
| GitHub Copilot | IDE 补全 | (-) | Star Wars 爬字幕演示(github,124 点赞);自动化代码审查工作流(code,17 收藏);面向所有工作区的 Semantic Indexing(kkaminsk) | $221/15 条消息(theo);品牌“被非 GitHub 系 Copilot 搞砸了”(GergelyOrosz);PR 审查污染(dan_note) |
| OpenCode | 终端智能体 | (+) | which-key 插件(kmdrfx,118 点赞);91.6% 缓存命中率(teortaxesTex);v1.14.38 已发布;Toronto Tech Week 登台 | 桌面应用用户在基本导航上遇到困难(Beethoven779) |
| Hermes Agent | 智能体运行框架 | (+) | 20 分钟设好,对比 Copilot 需要 24 小时(Afkd3vil);自我改进循环(Legendaryy);通过 ViralBuilder 做营销 | 文档少于竞争对手 |
总结: 工具格局结晶为分层:Codex 领先于算力慷慨度和生态扩展,Claude Code 保留工程实践深度,OpenCode 作为可扩展的终端智能体增长,Antigravity 主导教程但在生产采用上挣扎。GitHub Copilot 面临的是与其技术能力不同的品牌危机。
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| Google Finance 的 AI 驱动关键时刻 | @thefox | 解释股票图表中的价格波动;跳转到财报电话会中的关键时刻 | 帮助投资者理解市场事件 | Antigravity, Google Finance | 已上线 | 帖子 |
| OpenCode 的 OpenTUI which-key 插件 | @kmdrfx | 面向终端编程智能体的 Vim 风格按键发现和可扩展键位映射引擎 | CLI 可发现性;键盘驱动工作流 | OpenCode, OpenTUI | 开发中 | 帖子 |
| Codex-in-Claude-Code 插件 | @Oluwaphilemon1 | Claude Code 内的 /codex:review、/codex:adversarial-review、/codex:rescue 命令 | 跨工具审查,无需切换上下文 | Claude Code, Codex 插件系统 | 已宣布 | 帖子 |
| 通过 Codex /goal 构建完整 OS | @morganlinton | 利用 10 倍额度,在会议间隙使用 Codex 构建完整操作系统 | 无需盯守的长时间自主编程 | Codex, /goal | 构建中 | 帖子 |
| OpenAI Codex Pet NFT | @0rdlibrary | 第一个 Codex Pet,在 Solana 上铸造成 Metaplex Core Asset | 连接 AI 编程文化与 web3 收藏品 | Codex Pets, Metaplex, Solana | 已上线 | 帖子 |
| 面向 Shopify 的 Claude Code 多智能体 | @browomo(报道者) | Claude Code 中 13 个智能体,服务 200 名 dropshippers,每位 $800/月 | 单人运营者扩展电商服务 | Claude Code, Shopify | 运行中 | 帖子 |
| 地质学 RAG 方案 | @_vmlops(报道者) | 60 岁教授用 AI 查询矿物文档 | 让领域专家访问自己的知识库 | Claude, Git | 已上线 | 帖子 |
| Agent Action Gate | @mnbowerresearch | 带审批工作流的 AI 智能体动作开源预执行门 | 智能体在写操作前需要人工审批 | 开源,v0.5.0 | 已上线 | 帖子 |
| 巴黎 Codex 大使活动 | @borvibe | 与 Mollie Payments 在巴黎组织 Codex 社区活动 | 围绕 Codex 建设开发者社区 | Codex, 社区 | 组织中 | 帖子 |
6. 新动态与亮点¶
Google Finance 将 Antigravity 构建的功能发布到生产¶
@thefox 宣布(492 点赞,226 收藏数,59,581 浏览量)Google Finance 中的 AI 驱动关键时刻,由“小团队借助 @Antigravity 从零快速构建”而成。这是第一个高可见度生产功能明确归因于 Antigravity 的智能体优先工作流,打破 Antigravity 只出现在教程中的模式。226 收藏数说明开发者很关心 Antigravity 是否能在生产场景中交付。
OpenClaw 创始人将重心转向 Codex¶
@SHL0MS 翻译(21 点赞,1,762 浏览量)steipete 的公告:“我很懂这种 PR 套话,让我翻译一下:他正在逐步从 OpenClaw 抽身去做 Codex,而 OpenAI 正通过一个‘基金会’围绕它组建团队。”这说明 OpenAI 正把独立工具创建者整合进其生态——一种类似 Microsoft 历史打法的人才吸纳策略。
Codex Copilot CLI 作为自动代码审查器¶
@ThePracticalDev 重点介绍(9 点赞,3 收藏数,1,262 浏览量)一份开发者体验报告:“GitHub Copilot 处理了一个 Electron 重构,修掉了一个拖了很久的 OpenBSD bug,写了 shell Tab 补全脚本,还在没人要求的情况下把测试覆盖率推到了 100%。这位开发者原本很怀疑,后来却印象非常、非常深刻。” “没被要求就做到了 100% 测试覆盖率”这一说法说明智能体式编程工具开始超出基本任务交付。
Semantic Indexing 扩展到 GitHub/ADO 之外的仓库¶
@kkaminsk 指出(1 点赞,2 回复,27 浏览量):“以前只支持 GitHub/ADO 仓库——现在本地仓库和非 GitHub 仓库也能用了。企业如果用的是本地部署的 Git 基础设施?Copilot 现在照样能理解你的代码库。”这为使用 GitLab、Bitbucket 或自托管 Git 的企业移除了一个有意义的采用障碍。
涉及 OAuth token 和 WebMCP 的安全漏洞¶
@DrGhattasMD 报告(1 点赞,3 回复,1 收藏数,116 浏览量)一起漏洞,涉及“攻击者利用被攻破的 OAuth/Opal token 未授权访问、18789 端口上的 WebMCP 后门、verifier.ts 被阉割,以及一份 62MB 的 journal.md 转储被外传”。这是 AI 编程基础设施开始成为攻击面的早期信号。
7. 机会在哪里¶
[+++] 后固定费率时代的成本感知模型路由 -- theo 的 $221 帖子(1,096 点赞,102K 浏览量)在第二天仍是主导信号。MSiekmoeller 预测随着按量计费扩散,“到今年年底,氛围编程者的数量会腰斩”。vadymsyliava 的并排比较和 Legendaryy 的“这笔账算得过来”观察确认开发者正在手动计算成本。一个能自动把任务路由到最便宜且足够胜任模型的工具——teortaxesTex 的缓存命中优化(91.6% 可降低成本 30%)显示了技术路径——会服务每个面对 token 账单的开发者。
[+++] 带审查闸门的跨工具智能体编排 -- Oluwaphilemon1 的 Codex-in-Claude-Code 插件、mnbowerresearch 的 Agent Action Gate,以及 isha_singh06 讨论串(40 回复,对单一工具没有共识)都指向同一缺口:开发者需要彼此协同而非相互竞争的工具。一个内置人工审批闸门的生产级编排层,会把 3-5 个工具组成的栈整合成可管理工作流。
[++] Vim/键盘优先的终端智能体用户体验 -- kmdrfx 的 which-key 插件(118 点赞,9,685 浏览量,数据集中第 5 高)和 Beethoven779 关于基本方向键导航的抱怨,显示对键盘驱动的智能体交互有强需求。“终端智能体”承诺和实际键盘体验之间的差距,为插件和替代界面创造机会。
[++] 氛围编程式产品分发流水线 -- zuess05 的“$0 仪表盘”讽刺、wenyanhh 的“创始人该停下氛围编程了”和 Naval Ravikant 的“纯软件已经不值得投资”都从新角度指向同一个缺口:如果构建被商品化,价值会完全转移到分发。一个接收已发布产品并生成营销素材、落地页和发布序列的工具,会补全单人开发者工作流。
[+] AI 编程安全和审计基础设施 -- DrGhattasMD 的漏洞报告(OAuth token、WebMCP 后门、journal.md 外传)和 mnbowerresearch 的 Agent Action Gate 都表明,大家逐渐意识到智能体式编程创造了新的攻击面。随着智能体获得对生产系统的写入权限,智能体会话的审计工具——访问了什么、写了什么、外传了什么——会成为新需求。
8. 要点总结¶
-
OpenAI 的 10 倍额度投放是一场“算力即营销”,而 Anthropic 难以匹配。 多条帖子(DeryaTR_ 63 点赞、RileyRalmuto 22 点赞、tonysimons_ 12 点赞)确认额度已到账。VraserX 说得很直白:“现在拼的就是算力。”10 倍促销把用户锁进 Codex 工作流一个月,在过期前创造切换成本。(来源)
-
Copilot 品牌损害从定价扩展到公司战略。 GergelyOrosz(97 点赞,9,389 浏览量)把 Xbox Copilot 关闭与更广泛的“AI 垃圾内容”品牌稀释联系起来。GitHub Copilot 技术上仍然可靠,但被失败的非编程 Copilot 产品关联拖累。(来源)
-
Antigravity 获得来自 Google 内部的首次生产验证。 thefox 的 Google Finance 上线(492 点赞,59,581 浏览量)是数据集中互动量第二高的帖子,也打破了 Antigravity 的教程限定模式。不过 MetacriticCap(50 点赞)和 igboonaija3 表明,更广泛社区仍怀疑 Gemini 的编程能力。(来源)
-
Claude Code 的竞争护城河是工程深度,而不是算力慷慨度。 Codex 赢在用量上限(Legendaryy 称 $20 覆盖大多数开发者),但 Claude Code 在数据集中仍有 18 次提及,并有关于 token 优化(Layton_Gott)、Shopify 多智能体配置(browomo)和项目教程(RelentlessNik)的帖子。dahulilang 的综合仍成立:“原始能力更强 vs 生态更强。”(来源)
-
终端智能体用户体验是新战场。 kmdrfx 为 OpenCode 构建的 which-key 插件(118 点赞)表明 CLI 编程智能体市场正从原始能力走向界面设计。用户想要 Vim 移动命令、键盘可发现性和可扩展键位映射——也就是让 Neovim 在资深用户中占主导的同类用户体验投入。(来源)
-
氛围编程反弹成熟为“分发才是真问题”。 Naval Ravikant 称纯软件“不值得投资”,MLStreetTalk 称氛围编程适得其反,zuess05 的“$0 仪表盘”讽刺,都收敛到同一洞察:AI 消除了构建瓶颈,却创造了当前没有工具填补的分发真空。(来源)