Twitter AI 编程 - 2026-04-15¶

1. 人们在讨论什么¶

1.1 OpenAI Agents SDK 发布生产级原语 🡕¶

OpenAI 发布了 Agents SDK 的重大更新，目标是面向生产中的持久、长运行智能体。@snsf 宣布了这次发布（424 点赞、310 收藏、30,339 浏览），详细介绍了新的原语：文件和计算机使用、技能、带压缩的记忆，以及运行框架与计算执行的分离。运行框架是开源的，计算执行可以委托给沙箱合作伙伴，包括 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 和 Vercel。其定位很明确：“你现在可以构建自己的 Codex 风格智能体。”

@rohanvarma 报告了 OpenAI 内部采用情况（302 点赞，9,762 浏览）：“在 OpenAI 走一圈，有一件事你每 2-3 分钟一定会听到：‘我正在问 Codex。’” @MatiBuildsWith 回复：“一旦人们说‘我问 Codex’的方式像说‘我 Google 一下’一样，界面战争基本就结束了。” @JDoeg53617 的另一条回复请求推出 5.3 之外的新 Codex 模型，并指出即使用了 continual learning skills 和 CLI hooks，当前模型仍有局限。

讨论洞察： Agents SDK 更新把 OpenAI 的开发者叙事从“使用 Codex”改写为“构建你自己的 Codex”。运行框架与计算执行的分离在架构上很重要——智能体逻辑和执行环境因此都可以独立替换。@stefanjrice 把可观测性识别为“下一个重大解锁”：团队需要看到智能体为什么采取某个动作，而不只是它是否跑完。

与前一天对比： 昨天的报告追踪了 Codex 演进为桌面 Super App。今天，OpenAI 向上游移动——开源运行框架，让开发者自己构建生产级智能体基础设施。这是平台化布局，而不是产品更新。

1.2 限流成为跨平台主导痛点 🡕¶

今天限流挫败感横跨三大平台，而且互动量异常高。

@rsuyoy 点名 OpenAI，称其在没有公开沟通的情况下“幅度巨大”地静默削减 Codex 限制（161 点赞、39 回复、17,833 浏览——这是今日数据集中最高回复数）。作者系统性排除了其他解释：不是 fast mode，不是 high reasoning models，不是过度使用 skill，不是 x2 后调整。“现在的限制已经和 Claude code 相当，如果不是更严格的话。” @Jacoob_shi 回复：“静默降限最糟糕。你某天醒来，一切都变慢了，却没人说过任何事。”

@TheRegister 报道了更广泛的 Copilot 反弹：“GitHub Copilot ‘修复’ rate limits 后，客户反抗。” @mandraketech 报告，自己第一次在 Copilot Pro+ 订阅上触发限流，尽管平时大约每天 60 次请求、跨 3-4 个并行会话——“而且没有关于确切性质或时间线的细节。”

在 Anthropic 这边，@ChrisHayduk 提出可靠性担忧（46 点赞、11,588 浏览）：“Claude API 和 Claude Code（他们主要的企业营收驱动因素）只有两个 9 的可用性，简直不可接受。尤其是 Codex 和 OpenAI API 都有四个 9。”

讨论洞察： 限流挫败感已经不再是某个工具独有——现在横跨 OpenAI（Codex）、GitHub（Copilot）和 Anthropic（Claude Code 可用性）。共同线索是不透明：用户看不到自己的限制，无法预测何时触达限制，也不会在限制变化时收到正式沟通。

与前一天对比： 昨天的报告记录了 Claude Code 成本不透明（每天 $200 且没有可见性）和 token 膨胀。今天挫败感进一步加剧并扩展到 Codex 和 Copilot，还获得 The Register 的机构媒体报道。

1.3 VS Code 和 GitHub Copilot CLI 发布智能体基础设施 🡕¶

官方 @code 账号宣布了新的 VS Code 版本（348 点赞、68 收藏、24,669 浏览），通过过去会话的 debug logs、终端交互工具和内置 GitHub Copilot 增强智能体体验。@m_emanaftab 回复了竞争视角：“现在每个工具都在发布 agent features。VS Code、Claude Code、Codex、Cursor。长期赢家不会是功能最多的那个，而会是 agent 真正深入理解你的项目、让你信任它在你离开时继续工作的那个。”

@cinnamon_msft 推广了 Copilot CLI /remote 命令，使用户能够从任意设备访问本地开发环境。@JamesMontemagno 称赞 Copilot CLI 团队的速度：一条 PR 在中午到下午 1 点之间经历了发送、文档更新、合并、排队并部署到生产环境——负责工程师午饭回来前就已经上线。

@tristanbob 调查 Copilot 用户正在使用哪种智能体，并链接到 GitHub 第三方智能体文档。选项包括原生 VS Code agent、Anthropic Claude（Opus 4.5/4.6、Sonnet 4.5/4.6），或 OpenAI Codex（GPT-5.2-Codex、GPT-5.3-Codex、GPT-5.4）。每个智能体会话会消耗一次 premium request 加 GitHub Actions 分钟数。

讨论洞察： GitHub 的智能体平台现在让用户在原生、Claude 和 Codex agents 之间三选一——每个选项都有不同模型和成本结构。这种碎片化是刻意设计的（竞争推动质量），但也增加了用户的决策开销。

与前一天对比： 昨天追踪了 Copilot CLI 走向远程和移动端。今天通过 /remote 命令演示确认了这一方向，并增加了 VS Code 智能体基础设施更新——强化了 Microsoft 的双轨策略（IDE + CLI）。

1.4 OpenCode Remote Environments 接近发布 🡕¶

@jlongster 详细介绍了 OpenCode remote environments 背后的分布式系统工作（76 点赞、29 收藏、7,839 浏览）。该架构经由控制平面服务器把写入代理到远程环境，而读取来自本地同步。这造成了最终一致性：更新可能不会反映在后续读取中。修复方案是一种 “fence” 机制——remote env 在响应 header 中返回最新同步状态，control plane 等到自己的同步状态匹配后再返回读取结果。帖子链接了一个 PR，并称该功能“非常非常接近发布”。

后续评论揭示了路线图：Cloudflare 集成即将到来（“@threepointone 下周有很多要聊的”），该架构最终会支持 provider plugins，让不同 sandbox providers 原生利用各自平台。系统目前会在远程环境中运行完整 OpenCode server，但计划拆分组件以支持更灵活部署。

@LukeParkerDev 发布了一段 2 分钟 TUI plugin 教程（49 点赞、23 收藏、5,865 浏览），展示如何在 OpenCode 内构建自定义 panes——体现了 OpenCode 终端界面的可扩展性。

@atbeme 开始构建一个 wiki，记录 OpenClaw、Hermes、OpenCode 和类似开放智能体运行框架的内部结构，灵感来自 Karpathy 的 LLM personal wiki 概念。

讨论洞察： OpenCode 正在开发 Codex 已经拥有的同类远程执行能力，但采用开放架构和 provider-plugin 模型。fence 机制解决了一个真实的分布式系统问题，而公开 PR 的方式让社区能够检查代码。

与前一天对比： 这是新主题。OpenCode 在昨天报告中并不突出。remote environments 工作把 OpenCode 定位为 Codex 云执行的开源替代方案。

1.5 Claude Code 扩展到多智能体与企业工作流 🡒¶

@TheTuringPost 报道 OpenAI 发布了一个插件，让用户可以在 Claude Code 内直接调用 Codex。该插件把 Claude Code 变成多智能体设置，让 Codex 作为专门的子智能体用于代码审查、调试、异步后台任务和状态追踪。

Claude Code 的 Codex plugin README，展示用于 review、adversarial review 和后台任务管理的斜杠命令

该插件提供六个斜杠命令：/codex:review 用于只读审查，/codex:adversarial-review 用于可引导的挑战式审查，/codex:rescue、/codex:status、/codex:result、/codex:cancel 用于委托和管理后台任务。它采用 Apache-2.0 许可。

@wmthomson22 描述了如何在 Claude Code 中构建金融建模系统，大约用 40 小时覆盖 75 家公司。方法是：把 Claude Code 当作“一个什么都不知道的分析师”，然后迭代式教它——先理解财务报表，再从商业模式和运营分部中识别收入驱动因素，然后根据 10-Q、10-K 和 transcript 验证假设。该系统现在可以部署给“没有任何知识”的分析师。

@JeremyNguyenPhD 探索了 Claude Code Routines 用于每日简报，但提出隐私担忧：“我还没有把主邮箱连接到任何 AI，只是在考虑隐私等等。”

Claude Code Routines UI，显示 Briefing、Email triage、System health check 和 Issue triage 模板选项，以及 schedule 和 integration 详情

讨论洞察： Codex-inside-Claude-Code 插件体现了一种很特别的竞争行为——OpenAI 不是只与 Anthropic 竞争，也在构建进入 Anthropic 生态的入口。金融建模用例显示，Claude Code 正被用于复杂企业工作流，需要数周迭代教学，而不是单提示任务。

与前一天对比： 昨天的报告介绍了 Claude Code Routines 和桌面重设计。今天展示第 2 天采用情况：用户开始探索 routines（同时有隐私犹豫），金融建模案例则以迄今最详细的企业例子延续了“Claude Code 超越编程”的主题。

2. 令人困扰的问题¶

跨平台静默限流下调（High）¶

@rsuyoy 记录了 OpenAI 在没有任何公开公告的情况下大幅削减 Codex 限制。该帖获得 39 条回复——今日数据集中最多——作者排除了所有常见替代解释。@TheRegister 报道了同期 Copilot 反抗，并带来机构媒体触达（单条推文本身 970 浏览）。@mandraketech 首次触发 Copilot Pro+ 限流，尽管使用模式正常，而且没有关于限制或时间线的任何细节。持续存在的挫败感是不透明：限制变了，却没人被告知；发现新限制的唯一方式就是撞上它。

Anthropic API 与 Claude Code 可靠性（Medium）¶

@ChrisHayduk 量化了差距：Anthropic 的 Claude API 和 Claude Code “只有两个 9 的可用性”，相比之下 Codex 和 OpenAI API 有四个 9。该帖把 Claude Code 和 API 定位为 Anthropic 的“主要企业营收驱动因素”，使不可靠性成为直接商业风险。这延续了昨天的可靠性担忧，并增加了一个具体竞争基准。

Google Antigravity 与 Gemini 不稳定（Medium）¶

四篇不同帖子表达了对 Google AI 编程工具的挫败。@tinyblue_dev 取消了 Gemini Ultra，称 Antigravity “只不过是 VS Code 的一个 fork”和“半成品软件”。@procesor_x 报告，两个账号（Pro 和 Ultimate）都持续出现 green quota 问题，而且 Google 没有回应。@gujjutweeter 报告，在 Antigravity 内使用 OpenCode 触发了政策违规，申诉仍在等待。@ultramathi 抱怨持续出现 “server at high usage” 错误。

3. 人们期望的功能¶

透明、公开的限流政策¶

今天每个主要平台都引发了限流投诉。用户想要公开限制、变更通知和实时用量仪表盘——而不是在请求被限流后回头发现。当前这种静默调整限制的做法，同时侵蚀了 Codex、Copilot 和 Claude Code 的信任。

智能体可观测性与审计轨迹¶

@stefanjrice 在最高分串推中指出了缺口：“下一个重大解锁是更好的 observability，让团队能看到智能体为什么采取某个动作，而不只是它是否跑完。” VS Code 为过去智能体会话新增的 debug logs 解决了一部分问题，但需求扩展到所有智能体平台——尤其是运行在远程环境或定时 routines 中的自主智能体。

模型无关的智能体可移植性¶

@joe_lgtm 指出，Codex CLI 可以通过配置变更接受 OpenRouter、Databricks 和任何 OpenAI-compatible API。@JulianGoldieSEO 演示了用 Qwen 3.6 搭配 OpenCode。用户希望自由替换模型而无需更换智能体工具——这是开放运行框架（OpenCode、Codex CLI）具备但厂商锁定工具不具备的能力。

4. 使用中的工具与方法¶

工具	类别	评价	优势	局限
OpenAI Agents SDK	智能体框架	正面	开源运行框架；持久执行；带压缩的记忆；7 个沙箱合作伙伴；构建你自己的 Codex	新发布；生产记录尚未验证
VS Code + Copilot	IDE + 智能体	正面	过去会话 debug logs；终端工具；内置 Copilot；/remote 跨设备访问	三方智能体碎片化（native、Claude、Codex）；限流反弹
Copilot CLI	终端智能体	正面	/remote 命令支持跨设备；团队速度快；学生免费	Pro+ 首次触发限流；没有公开限制细节
Claude Code	编程智能体 / 平台	褒贬不一	Routines 用于定时自动化；覆盖 75 家公司的金融建模；Codex plugin 支持多智能体	两个 9 的可用性；限流与竞争对手相当；Routines 有隐私担忧
OpenCode	开源终端智能体	正面	remote environments 接近发布；TUI plugin 可扩展；模型无关（Qwen、OpenRouter）	fence 机制仍在 PR 中；provider plugins 尚不可用
Codex CLI	终端智能体	正面	四个 9 的可用性；兼容 OpenRouter/Databricks；OpenAI 内部采用	静默限流削减；GPT-5.3 模型老化；部分功能需要 ChatGPT 订阅
Antigravity (Google)	IDE	负面	与 Google 生态集成	“VS Code fork”；持续服务器错误；政策违规风险；多起取消报告
EDINET DB MCP	金融数据连接器	正面	3,847 家日本公司；121 个字段；通过 MCP 集成 7 个工具；XBRL 解析（无幻觉）	聚焦日本；每天 100 次免费 API 请求

5. 人们在构建什么¶

项目	构建者	功能	技术栈	阶段	链接
Financial modeling system	@wmthomson22	迭代训练的系统，可分析财务报表、识别收入驱动因素，并跨 75 家公司构建模型	Claude Code、10-Q/10-K/transcript analysis	已部署给分析师	推文
OpenCode remote environments	@jlongster	远程智能体执行，带基于 fence 的一致性、control plane proxy、provider plugin system	OpenCode、distributed sync	发布前（PR 已打开）	推文
Codex plugin for Claude Code	OpenAI	六个斜杠命令，可在 Claude Code 内将 Codex 作为子智能体用于审查、调试和后台任务	Claude Code、Codex API	已上线（Apache-2.0）	推文
Agent harness wiki	@atbeme	从零记录 OpenClaw、Hermes、OpenCode 内部结构，用于构建自定义运行框架	Wiki、源码分析	推进中	推文
Flipper Zero agent remote	@kasentuner	面向终端编程智能体的实体遥控器，已被 Official Flipper App Catalog 接受	Flipper Zero、Claude Code	已上线（在 catalog 中）	推文
Claude Code custom builds service	@Creatextravel	基于 Claude Code 定制构建应用并作为服务出售，包含 upsells	Claude Code、Stripe	第 1 天（$6,384 gross volume）	推文
EDINET DB MCP connector	@edinetdb_en	MCP server，将 7 个 AI 编程工具连接到来自 3,847 家公司的结构化日本金融数据	REST API、MCP、XBRL、SQLite	已上线	推文
X bookmarks triage skill	@arisehype	在一次 Claude Code 会话中整理 3,333 个收藏——79% 是垃圾，保留 10 个行动项	Claude Code	已上线（skill 已分享）	推文

6. 新动态与亮点¶

OpenAI Agents SDK：构建你自己的 Codex¶

当天最重要发布（2,111.2 分）把智能体运行框架与计算执行分离。开发者现在可以把持久执行、记忆、文件/计算机使用和技能与七个沙箱提供商中的任意一个组合——也可以自带提供商。运行框架是开源的。这把 OpenAI 的智能体策略从“使用我们的产品”改写为“基于我们的平台构建”。(推文)

Claude Code 的 Codex 插件：跨平台智能体集成¶

OpenAI 发布了一个 Apache-2.0 插件，把 Codex 作为子智能体嵌入 Claude Code。六个斜杠命令支持代码审查、对抗式审查，以及带状态追踪的后台任务委托。这是合作式而非纯竞争式动作——OpenAI 构建进入 Anthropic 生态的入口，无论哪个 agent 是编排者，都能捕获使用量。(推文)

OpenCode Remote Environments 与 Fence 一致性¶

OpenCode 的 remote environment 方案用 fence 机制解决分布式一致性问题——远程写入在响应头中返回同步状态，控制平面先等待同步收敛，再返回读取结果。计划支持提供商插件（Cloudflare 集成即将到来）。该功能“非常非常接近发布”。(推文)

用于控制编程智能体的 Flipper Zero App¶

@kasentuner 构建了一个用于控制终端编程智能体的实体遥控器，并让它被 Official Flipper App Catalog 接受。该设备可让用户从房间另一头、沙发上或踱步时控制 Claude Code 会话。这是 AI 辅助开发的一种新型物理-数字界面。(推文)

EDINET DB：覆盖 7 个工具的金融数据 MCP¶

一个覆盖 3,847 家日本上市公司的结构化金融数据服务，通过单个 MCP server 连接 Claude Code、Cursor、Codex、Copilot、Cline、Antigravity 和 ChatGPT。数据从 XBRL filings 中确定性解析，不涉及 LLM——“结构上没有幻觉”。覆盖 JP GAAP、IFRS 和 US GAAP 的 121 个财务字段，每日更新。(推文, 网站)

7. 机会在哪里¶

[+++] 限流透明度与用量仪表盘 — 今天每个主要 AI 编程平台都引发了限流投诉：Codex（静默削减，39 回复）、Copilot（首次触发 Pro+ 限制）、Claude Code（两个 9 的可用性）。The Register 报道了 Copilot 反弹。没有平台发布清晰限制、变更通知或实时用量仪表盘。第一个提供透明、可预测用量政策的工具，会获得一种无法仅靠功能平价匹配的信任优势。

[+++] 开放智能体运行框架生态 — OpenAI 开源了 Agents SDK 运行框架，并有 7 个沙箱合作伙伴。OpenCode 正在构建带提供商插件的 remote environments。@atbeme 正在记录运行框架内部结构。机会在生态层：标准化运行框架接口、提供商市场，以及可跨 OpenCode、Codex CLI 和任何开放运行框架运行的智能体技能注册表。“构建你自己的 Codex”信息会创造对组件、托管和集成服务的需求。

[++] 智能体可观测性平台 — 最高分串推中最有洞察的回复把 observability 识别为“下一个重大解锁”。VS Code 新增了过去会话的 debug logs，但需求延伸到远程运行、定时 routines 和多智能体配置（Codex-inside-Claude-Code）中的自主智能体。能展示智能体为什么采取动作、每次决策成本和置信度轨迹的工具，将在智能体从交互式走向自主式时变得必要。

[++] 领域专用 MCP 连接器 — EDINET DB 展示了 MCP 作为通用数据协议的价值：一个连接器、7 个 AI 编程工具、3,847 家公司、零幻觉风险。该模式可泛化到任何结构化领域数据——医疗记录、法律文件、物流、合规。每个垂直领域都需要自己的 EDINET 风格 MCP 连接器，具备确定性数据抽取和跨工具兼容性。

[+] 智能体控制的物理界面 — Flipper Zero agent remote 进入 Official App Catalog，验证了 AI 编程会话中对实体控制的需求。随着智能体会话变得更长、更自主，交互模式会从键盘密集转向监控与介入。专用硬件（遥控器、状态显示器、通知设备）可能服务这一新兴工作流模式。

8. 要点总结¶

OpenAI 开源了智能体运行框架，并将其与计算执行分离。 Agents SDK 更新——今日最高分项目，2,111.2 分——通过 7 个沙箱合作伙伴提供持久执行、记忆、文件/计算机使用和技能。信息是“构建你自己的 Codex”，把 OpenAI 的智能体基础设施从封闭产品转成平台。(推文)
限流挫败感在三大主要平台同时达到临界点。 Codex 因静默削减限制引发 39 条回复，Copilot 触发 The Register 关于客户反抗的报道，用户则把 Claude Code 两个 9 的可用性标记为企业风险。共同失败点是不透明——没有平台发布清晰限制或变更通知。(Codex, Copilot, Claude)
OpenAI 构建了一个运行在 Claude Code 内的 Codex 插件。 OpenAI 并非只竞争，而是发布了一个 Apache-2.0 插件，提供六个斜杠命令，可在 Claude Code 内审查、调试和委托后台任务。这种合作式竞争动作可以在不管哪个 agent 是主要编排者的情况下捕获 Codex 使用量。(推文)
OpenCode remote environments 即将发布，并带有新颖的 fence 一致性机制。 该架构经由控制平面代理写入，而读取来自本地同步，并用 fence 机制确保同步收敛。Cloudflare 集成即将到来，提供商插件系统将让沙箱提供商构建原生集成。(推文)
Claude Code 正被用于构建需要数周训练的企业金融建模系统。 一个 40 小时、75 家公司的金融建模系统——经过迭代教学以理解财务报表、识别收入驱动因素，并根据 SEC filings 验证——展示了 Claude Code 作为复杂非编程企业工作流平台的潜力。这是本系列记录过最深入的企业用例。(推文)