Twitter AI 编程 - 2026-05-16¶
1. 人们在讨论什么¶
1.1 GitHub 一边把智能体工作流界面讲得更清楚,一边也带来了更刺眼的定价故事 🡒¶
5 月 16 日围绕 GitHub 的讨论,已经不只是模型访问。5 个条目共同支撑了一个更紧的主题:用户截图让 Copilot 的定价变得更直观,而 GitHub 自己的产品表面,也在继续朝会话、隔离和智能体协作的方向推进。
@edzitron 发帖称,Microsoft 对 Copilot 的真实做法,一直是在大幅补贴 token;而他附上的账单截图显示,预估费用从 451 美元直接跳到了 11,432.22 美元(188 次点赞、3 条回复、12,090 次浏览)。这张图之所以重要,是因为它把“AI 经济账被藏起来了”这种模糊抱怨,变成了一个读者可以对照真实套餐去理解的数字。

@JohnDoritosKane 写道,他自己 4 月的 Copilot premium requests,如果按旧的按请求计费方式算是 16.85 美元,而到了 6 月的按使用量计费模型里,大约会变成 95.12 美元;他表示,这 5 倍变化已经足以让他重新评估替代方案(1 次点赞、1 条回复、46 次浏览)。

@NickZhu9 宣布,GitHub Copilot CLI 将进入 JetBrains,并带来统一的会话视图(24 次点赞、1,621 次浏览)。其链接的 GitHub 更新日志 说明,IDE 现在可以把任务委托给本地运行的 CLI 智能体,支持工作树或工作区隔离、实时工具调用进度,以及 Ask question 工具。互动较低、但同样具体的跟进证据,还来自 @JamesMontemagno 提到的体验:他连续 15 天依赖 GitHub Copilot CLI 与 GitHub Copilot Cloud Agent 的自动模型选择,几乎没有被迫手动挑模型(32 次点赞、5 条回复、2,390 次浏览);以及 @aiandcloud 喜欢 Copilot App 里活跃 / 归档会话加存储用量的界面(1 次点赞、1 条回复、185 次浏览)。
讨论要点: GitHub 这一天最强的信号,并不是 Copilot 能接上某个特定模型,而是成本敏感度在上升,同时大家对会话状态、隔离和自动模型路由的关注也在上升。
与前日对比: 5 月 15 日,围绕 GitHub 的故事还主要围绕内部许可证迁移传闻和 token 消耗截图。到 5 月 16 日,同样的成本主题还在,但它被更多个人账单证据,以及 JetBrains 与 Copilot App 这些 GitHub 自有工作流细节支撑了起来。
1.2 Codex 的恢复之所以重要,是因为手机和语音控制面还在继续扩张 🡕¶
5 个条目共同支撑了第二个主题:信息流把一次运营恢复,与越来越多“Codex 正在逃离桌面”的证据放在了一起。关键不只是一次可靠性故障被修好,而是人们已经把 Codex 当成一种离开主机之后也要继续监控、批准,甚至开口对话的东西。
@yuki_eliot 表示,OpenAI 已经修复了过去 2 天里影响 Codex 的 GPT-5.5 性能退化问题,并重置了付费使用上限(39 次点赞、11 条回复、596 次浏览)。附图里,@thsottiaux 解释说,这次性能退化来自大约 48 小时内出现的 2 个问题,因此这条帖子的意义,不只是泛泛的一句“已经修好”。

@nicdunz 感谢 Codex 团队快速修复问题(25 次点赞、5 条回复、1,058 次浏览),但回复并没有显得信任已经完全恢复:有人说额度重置其实早就发生了,也有人指责团队在重置和 fast mode 说明上前后不一致。与此同时,@DeryaTR_ 引用转发了一份移动端预览路线图,里面承诺会加入推送通知、/fork、更好的重连、设备控制修复、更好的 git diff 和整文件视图,以及更少的移动端线程错误(57 次点赞、3 条回复、4,359 次浏览)。
@bawan269 认为,ChatGPT 移动端里的 Codex,应该被理解成管理长时程智能体工作的控制面,而不是“在手机上写代码”(3 次点赞、4 条回复、54 次浏览)。其中一条回复进一步把需求说具体了:移动端审批必须看到 patch、请求执行的命令、测试状态,以及回滚路径。同样的控制面思路,也出现在 @DevAdventur3s 声称 OpenAI 正在把实时语音模式接进 Codex 的帖子里(30 次点赞、8 条回复、1,767 次浏览、5 次引用):一张图展示了带旁白的智能体 UX,另一张则露出了 realtime_conversation.rs、WebRTC 引用,以及背后大约 1,536 行 Rust 代码。


讨论要点: 有意思的变化在于,当天已经没有人在争论“远程监督是不是一个真实用例”。回复默认它有价值,真正争论的是重置、重连、审批上下文,以及 OpenAI 能不能把这层控制面做得值得信任。
与前日对比: 5 月 15 日围绕控制面的故事,主要还是移动端预览带来的兴奋感,以及对不稳定的抱怨。到 5 月 16 日,信息里又多了明确的修复 / 重置声明、一份公开的移动端改进清单,以及来自源码层的语音界面证据。
1.3 Antigravity 在截图里看起来还活着,但路线图信任却在持续流失 🡖¶
4 个条目支撑了第三个主题:Google 仍有公开材料在引导开发者使用 Antigravity,用户也还在分享当前的 UI 画面;但最强的讨论,还是不断回到陈旧的发布证据和缺失的沟通节奏上。
@FlutterDev 宣传了一场 Google I/O 会议;其 schedule page 上写着“凭感觉编程是 2026 年开发者的一项重要技能”,并承诺会展示 Google 团队如何借助 Google Antigravity 加速开发(78 次点赞、1 条回复、3,511 次浏览)。这页内容之所以重要,是因为在同一天里,它是对“Antigravity 要被关掉了”这种传闻最清晰的反向证据。
@LexnLin 发帖展示了一张截图,里面有 Antigravity 的 Plan mode、模型选择器和本地工作区,并猜测 I/O 上可能会开放云端智能体访问(87 次点赞、10 条回复、4,543 次浏览)。@Surendar__05 表示,他原本以为 Google 正在关闭 Antigravity,但他附上的截图里,仍然能看到实时编辑器和模型选择器,而不是一个已经消失的产品(54 次点赞、28 条回复、2,250 次浏览)。


更扎实的证据则是负面的。@haider1 写道,Antigravity 已经超过一个月没有可见更新,仍会丢失最近的项目上下文、忘掉 checkpoints,而且在他手里比 Codex 或 Claude Code 都更差(4 次点赞、2 条回复、185 次浏览)。截图给得很具体:release notes 还停留在 2026 年 4 月 16 日的 v1.23.2。

讨论要点: 这种矛盾现在已经稳定下来。公开截图仍在展示一个人们还能用的界面,而关闭传闻却一轮轮重来,因为可见的发布与沟通节奏,怎么看都不像一个正在积极运营的旗舰产品。
与前日对比: 5 月 15 日的焦点还是陈旧的 changelog 加 Google I/O 宣传。到 5 月 16 日,又多了更新鲜的 UI 证据,比如 Plan mode 和另一张实时模型选择器截图;但最强的新抱怨,已经从“没有声音”变成了“上下文丢失、checkpoint 会忘”,也就是更直接的可用性问题。
2. 令人困扰的问题¶
定价正在从后台补贴,变成摆在台前的工作流风险¶
当天最尖锐的挫败感,是 AI 编程账单往往要等用户已经深陷使用习惯之后,才真正变得清晰。@edzitron 发帖展示了一张 Copilot 账单预览,费用从 451 美元跳到 11,432.22 美元(188 次点赞、3 条回复、12,090 次浏览);而 @JohnDoritosKane 给出了自己的例子:4 月使用量在 6 月定价模型下,会从 16.85 美元变成 95.12 美元(1 次点赞、1 条回复、46 次浏览)。更务实的应对模式,来自 @pseudokid 分享的一整个月 OpenCode Go 使用记录:还剩 3 小时时,他的额度已经跑到 98%,而他是通过 Pi agent 调度工作,并尽量依赖 DeepSeek V4 Flash、DeepSeek V4 Pro、免费版 Qwen 3.6、Qwen 3.6 Plus、Mimo V2.5 Pro、Kimi K2.6,以及 GLM 5 / 5.1 来把账压住(21 次点赞、3 条回复、1,674 次浏览、10 次收藏)。这些截图之所以关键,是因为它们把“优化你的栈”这种建议,变成了真实的额度和模型配比证据。严重程度:高。值得为此构建:是,因为现在缺的已经不只是更便宜的 token,而是可观测性加上安全护栏。


Antigravity 用户正在被沉默、不稳定和上下文丢失反复消耗¶
围绕 Antigravity 的抱怨,如今已经不再是“它还活不活”的问题,而是更具体的运行问题。@haider1 写道,这个工具仍会丢失最近的项目上下文、忘掉检查点,而且用起来比 Codex 或 Claude Code 更差(4 次点赞、2 条回复、185 次浏览);而 @Surendar__05 发问,到底还有没有人在维护它(54 次点赞、28 条回复、2,250 次浏览)。甚至连更乐观的 @LexnLin 帖子(87 次点赞、10 条回复、4,543 次浏览)下面,也有人在追问 Plan mode 为什么居然还在,这又把配置不一致本身变成了一层摩擦。最奇怪的是,@FlutterDev 竟然在同一天宣传了一场关于 Antigravity 的 Google I/O 会议(78 次点赞、1 条回复、3,511 次浏览),于是用户开始把会议页面当成路线图沟通渠道。严重程度:高。值得为此构建:是。
凭感觉做出来的 MVP,一旦碰到真实用户还是会散架¶
关于生产环境加固的抱怨依然很具体。@Mr1_Nobody1 表示,一个凭感觉做出来的 MVP 看上去很完美,可一旦真的部署,就暴露出认证泄漏、缺少限额和安全失效;而附图则把缺失层写得很清楚:API、数据库、认证、云、安全、限流、缓存和 CDN(4 次点赞、2 条回复、124 次浏览)。一个更具体的应对模式,出现在 @dangtony98 分享的 Agent Vault 凭据代理图里:所有出站请求都先通过代理,因此智能体根本看不到真实凭据(2 次点赞、14 次浏览)。严重程度:高。值得为此构建:是,尤其适合围绕认证、额度控制和 AI 应用里的安全凭据处理来做产品。

3. 人们期望的功能¶
带真实审批上下文的移动端智能体监督¶
这个需求是按运营语言被说出来的,不是炒作。@DeryaTR_ 引用转发了一份路线图,里面承诺给 Codex mobile 加入推送通知、/fork、更好的重连,以及更好的 diff / 整文件视图(57 次点赞、3 条回复、4,359 次浏览);而 @bawan269 认为,手机应该是长时程工作的控制面,而不是实际执行工作的地方(3 次点赞、4 条回复、54 次浏览)。最具体的第三方尝试,来自 @0xPaulius 发布的一套 iPhone 配对与聊天 UI,可连接 Codex 和 Claude Code(2 次点赞、1 条回复、147 次浏览)。这是个非常现实的需求,已经有部分答案,但还没有明显赢家。机会:直接。

一个能看见成本、上下文、缓存和会话状态的本地控制平面¶
这里的需求同样非常务实:人们想在预算烧完、或者会话开始跑偏之前,就看到智能体到底在做什么。@aiandcloud 喜欢 GitHub Copilot App 能展示活跃 / 归档会话和存储用量(1 次点赞、1 条回复、185 次浏览);而 @AbdMuizAdeyemo 表示,构建者依然看不清成本、上下文、缓存、失败点和工作流质量,所以他才做了 Talocode(1 次点赞、2 条回复、67 次浏览)。抓取到的 Talocode 仓库 也用产品语言说了同一件事:本地守护进程、控制面板、手机控制、上下文缓存、浏览器运行时,以及面向工作树的会话。机会:直接。


能跨越会话边界和工具切换的记忆与连续性¶
人们想要的,并不是为了聊天记录本身去追求无限历史,而是希望智能体记住足够多的东西,能让长时间运行的工作保持连贯。@haider1 抱怨,Antigravity 仍然会丢失最近项目上下文、忘掉检查点(4 次点赞、2 条回复、185 次浏览);而 @goyalshaliniuk 表示,agentmemory 会记录每次会话、做压缩,并把后续需要的上下文注入下一次会话(7 次点赞、3 条回复、44 次浏览)。抓取到的 agentmemory 仓库 目前写明,它能通过 hooks、MCP 和 REST,为 Claude Code、Codex CLI、Cursor、Gemini CLI、Hermes 和 OpenCode 提供支持,所以部分答案其实已经存在。机会:竞争型。
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| GitHub Copilot CLI | CLI 编程智能体 | (+/-) | JetBrains 预览带来了工作树 / 工作区隔离、统一会话、实时工具调用,以及 Ask question 支持 | 6 月开始的按使用量计费,正在改变用户评估这款产品的方式 |
| GitHub Copilot App | 智能体工作区 | (+) | 通过 active / archived 视图和 storage usage,让会话状态变得可见 | 今天的证据更多是功能层面的称赞,而不是大规模采用证明 |
| Codex | 编程智能体 | (+/-) | 在 GPT-5.5 退化后很快重置了额度;移动端路线图和可能的语音模式扩大了监督表面 | 最近的退化与重置沟通混乱,削弱了信任 |
| Google Antigravity | 智能体优先 IDE | (+/-) | Plan mode、本地工作区、模型选择器,以及明确的 Google I/O 背书,仍让它留在讨论中心 | 可见更新已经陈旧,且用户持续报告上下文丢失、检查点遗忘和不稳定 |
| OpenCode Go / Pi agent | 多模型运行框架 | (+) | 通过细致路由 DeepSeek、Qwen、Mimo、Kimi 和 GLM,能把低成本套餐尽量拉长 | 需要主动优化,并且要对不同模型的预算非常敏感 |
| Claude Code | CLI 编程智能体 | (+) | 仍然好用到足以让构建者把它当作编排层,而且面向新手的培训内容还在增加 | 记忆、移动端控制和凭据处理这些问题,仍需要围绕它继续补层 |
| agentmemory | 记忆层 | (+) | 通过 hooks、MCP 和 REST,为许多编程智能体提供跨会话持久记忆 | 今天的信号主要来自仓库 / 文档和推广,而不是大规模实战反馈 |
| Agent Vault | 安全代理 | (+) | 通过虚拟凭据代理和出口控制,降低凭据外泄风险 | 需要单独部署代理 / 服务,并保持较强的配置纪律 |
| Talocode | 本地控制平面 | (+) | 把会话、手机控制、上下文缓存、浏览器运行时和工作树工作流放进同一套本地栈里 | 仍处于 MVP 阶段,公开采用也还早 |
| Pi App Studio | AI 应用构建器 | (+/-) | 在常见 IDE 竞争之外,展示了一种按类别驱动的 AI 应用创建界面 | 今天的公开证据只确认了 UI 表面,并没有证实更大的分发说法 |
整体满意度,已经更多按编排层来分,而不是按模型品牌来分。在正面一端,@JamesMontemagno 表示,GitHub Copilot CLI 和 GitHub Copilot Cloud Agent 的自动模型选择,大多数时候都能工作,不需要手动切换(32 次点赞、5 条回复、2,390 次浏览);而 @aiandcloud 喜欢 Copilot App 直接把会话状态和存储用量摆了出来(1 次点赞、1 条回复、185 次浏览)。在更看重预算的一端,@pseudokid 分享了一套模型配比打法:用 DeepSeek V4 Flash 做廉价压缩和局部手术式编辑,再按精度或图像任务轮换其他模型(21 次点赞、3 条回复、1,674 次浏览、10 次收藏)。最常见的权宜方案,已经不再是“选一个赢家”,而是“把模型、控制面,以及能补足短板的记忆层或安全层组合起来”。
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| Antigravity Editor for UE5 | Vahab Ahmadvand | 一个 Unreal Engine 插件,可从 Unreal Editor 直接在 Antigravity 里打开文件与行号 | 让 Unreal 开发者继续把 Antigravity 当主力代码编辑器,而不必退回 VS 或 VS Code 工具链 | C++、Unreal ISourceCodeAccessor、基于 VSCode 的 Antigravity 桥接层 |
Alpha | 推文, 仓库 |
| agentmemory | rohitg00 | 面向编程智能体的持久记忆服务器,会记录会话,并在后续注入所需上下文 | 减少反复重讲和智能体会话之间的连续性断裂 | TypeScript、npm package、hooks、MCP、REST、iii engine | 已发布 | 推文, 仓库 |
| Agent Vault | Infisical | 一套凭据代理和代理层,让智能体调用 API 时不直接持有真实凭据 | 去掉智能体工作流里的凭据外泄风险 | Go binary、TLS proxy、CLI、Web UI | 已发布 | 推文, 仓库 |
| Talocode | Talocode | 一个本地优先控制平面,可从桌面或手机运行并监督编程智能体 | 让构建者在一个地方看到成本、上下文、会话、工作树和审批 | 本地守护进程、控制面板、CLI、手机控制、上下文缓存、浏览器运行时、工作树 | Alpha | 推文, 仓库 |
| TachiDUBB Studio + MCP 服务器 | @smolekoma | 一个本地优先的 AI 配音应用,现已能由 Claude Code 通过 MCP 服务器驱动 | 用于替代昂贵的云配音流程和多语言视频本地化里的手工 UI 操作 | Claude Code、MCP 服务器、Whisper、speaker detection、Ollama、VoxCPM2、FFmpeg、SQLite queue | Alpha | 推文, 讨论串 |
构建者大多是在给现有智能体补工作流缺口,而不是再做一个通用助手。@VahabAhmadvand 分享了一个 UE5 插件;其抓取到的 README 说明,它能把代码导航从 Unreal 直接跳进 Antigravity(4 次点赞、1 条回复、213 次浏览)。@goyalshaliniuk 表示,agentmemory 基本上让 Claude Code、Codex 和 Hermes 拥有了持久记忆;抓取到的仓库目前已有 10,405 颗星(7 次点赞、3 条回复、44 次浏览)。@dangtony98 分享了 Agent Vault 的凭据代理模式(2 次点赞、14 次浏览);抓取到的仓库也把这个安全模式写得很清楚:智能体手里拿的是虚拟值,而代理会在网络层注入真实凭据。

@AbdMuizAdeyemo 表示,Talocode 存在的原因,是构建者仍然看不清成本、上下文、缓存、失败点和工作流质量(1 次点赞、2 条回复、67 次浏览);而 @smolekoma 更新说,TachiDUBB Studio 现在已经有了一个 MCP 服务器,因此 Claude Code 可以在不碰 UI 的前提下,直接驱动本地配音流水线(5 次点赞、1 条回复、49 次浏览、6 次收藏)。反复出现的构建模式,不是再训练一个底座模型,而是围绕开发者已经在用的智能体,再包上一层记忆、安全、编排或领域执行能力。
6. 新动态与亮点¶
Codex 语音模式的证据,已经从传闻走到了源码级产物¶
@DevAdventur3s 声称,OpenAI 正在把实时语音模式接进 Codex(30 次点赞、8 条回复、1,767 次浏览、5 次引用)。值得注意的,并不只是那张带旁白的 mockup;第二张截图直接指向了 realtime_conversation.rs、WebRTC 引用,以及大约 1,536 行 Rust,这让这个功能更像一条真实的落地路径,而不只是泛泛的产品预告。
Claude Code 培训,正在被打包给真正的新手¶
@Tech_p001 提到了一个 freeCodeCamp 的 Claude Code 入门课程(9 次点赞、2 条回复、201 次浏览、3 次收藏);其缩略图显示时长为 4:27:48。之所以重要,是因为现在出现的入门信号,已经不再只是高手的讨论串和 workshop 片段,而是面向新手、长时长、默认 Claude Code 值得从零学起的培训内容。
Pi App Studio 说明,AI 应用构建正在从常见 IDE 市场之外冒出来¶
@skadbsgml93 声称,Pi Network 的 App Studio 可以借助 Codex、Claude 和 Replit 的提示词,把“凭感觉写代码的人”变成真正的构建者(7 次点赞、3 条回复、122 次浏览)。推文里更大的覆盖面说法没有独立证据支持,但截图至少确认了一点:Pi App Studio 的确提供了一个按类别驱动的创建界面,入口分别面向 AI、代码、应用和实时体验。这个信号的价值在于,它说明 AI 辅助构建正在出现在以分发为先的生态里,而不只是 IDE 和终端工具里。

7. 机会在哪里¶
[+++] 成本感知型控制平面 —— 这里的证据很扎实:@edzitron 展示了 Copilot 账单预览飙到 11,432.22 美元(188 次点赞、3 条回复、12,090 次浏览);@JohnDoritosKane 给出了个人费用涨了 5 倍的例子(1 次点赞、1 条回复、46 次浏览);@aiandcloud 喜欢可见的会话与存储状态(1 次点赞、1 条回复、185 次浏览);而 @AbdMuizAdeyemo 之所以开始做 Talocode,就是因为构建者还看不清成本、上下文、缓存和失败点(1 次点赞、2 条回复、67 次浏览)。这个机会很强,因为痛点同时出现在厂商定价变化和独立构建者的反应里。
[++] 跨设备审批界面 —— @DeryaTR_ 引用转发了一份围绕重连、diff 和控制的移动端路线图(57 次点赞、3 条回复、4,359 次浏览),@bawan269 认为手机应该负责判断点,而不是执行(3 次点赞、4 条回复、54 次浏览),而 @0xPaulius 发布了一个适配 Codex 和 Claude Code 的手机配对 UI(2 次点赞、1 条回复、147 次浏览)。需求很明显,但这层产品表面看起来仍然碎片化,而且还停留在预览阶段。
[+] 面向 AI 构建应用的生产环境加固层 —— @Mr1_Nobody1 表示,凭感觉做出来的 MVP 一旦开始面对认证、限额和安全要求就会出问题(4 次点赞、2 条回复、124 次浏览);而 @dangtony98 分享了 Agent Vault 这种具体的凭据代理模式(2 次点赞、14 次浏览)。这个机会还在早期,但它直接贴着真实部署痛点,而不是抽象焦虑。
8. 要点总结¶
- Copilot 的价值讨论,如今已经离不开看得见的账单。 @edzitron 展示了一张飙到 11,432.22 美元的账单预览(188 次点赞、3 条回复、12,090 次浏览);而 @JohnDoritosKane 给出的个人预估月费,也从 16.85 美元涨到了 95.12 美元(1 次点赞、1 条回复、46 次浏览)。
- Codex 的下一场战斗,是监督 UX,而不只是模型质量。 @yuki_eliot 表示,最近的退化问题已经修好,额度也已重置(39 次点赞、11 条回复、596 次浏览);但 @DeryaTR_ 引用转发的路线图还在谈重连和 diff 视图(57 次点赞、3 条回复、4,359 次浏览),而 @bawan269 强调,移动端控制只有在判断上下文可见时才真正成立(3 次点赞、4 条回复、54 次浏览)。
- Antigravity 的证据集,现在已经是真正的互相矛盾。 @FlutterDev 宣传了一场关于 Antigravity 的 Google I/O 会议(78 次点赞、1 条回复、3,511 次浏览),@LexnLin 贴出了一张实时 Plan-mode 截图(87 次点赞、10 条回复、4,543 次浏览),而 @haider1 写道,这个产品仍然会丢上下文,而且已经超过一个月没有可见更新(4 次点赞、2 条回复、185 次浏览)。
- 最强的构建者能量,正在流向围绕智能体补脚手架,而不是再做一个通用智能体壳。 @goyalshaliniuk 表示,agentmemory 能持久化跨会话上下文(7 次点赞、3 条回复、44 次浏览);@dangtony98 分享了 Agent Vault 的凭据代理模式(2 次点赞、14 次浏览);@AbdMuizAdeyemo 开始做 Talocode,是为了让工作流变得可观察(1 次点赞、2 条回复、67 次浏览);@VahabAhmadvand 分享了一个 Antigravity-Unreal 桥接层(4 次点赞、1 条回复、213 次浏览);而 @smolekoma 更新说,TachiDUBB Studio 新增了一个 MCP 服务器(5 次点赞、1 条回复、49 次浏览、6 次收藏)。