跳转至

Twitter AI Coding — 2026-04-15

1. 人们在讨论什么

1.1 OpenAI Agents SDK 推出生产级原语 🡕

OpenAI 发布了 Agents SDK 的重大更新,目标是支持生产环境中持久、长时间运行的智能体。@snsf 宣布了此次发布(424 赞,310 收藏,30,339 浏览),详细介绍了新原语:文件和计算机使用、技能、带压缩的记忆,以及 harness 与计算的分离。Harness 部分是开源的,计算执行可以委托给沙箱合作伙伴,包括 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 和 Vercel。定位非常明确:"你现在可以构建自己的 Codex 风格智能体。"

@rohanvarma 报告了 OpenAI 内部的采用情况(302 赞,9,762 浏览):"在 OpenAI 办公室走一圈,你每隔 2-3 分钟就会听到一句:'我正在问 Codex。'" @MatiBuildsWith 回复道:"一旦人们像说'我去 Google 一下'一样说'我去问 Codex',界面之争基本上就结束了。"另一条来自 @JDoeg53617 的回复请求推出超越 5.3 的新 Codex 模型,指出即使使用持续学习技能和 CLI 钩子,当前模型仍有局限。

讨论要点: Agents SDK 更新将 OpenAI 的开发者叙事从"使用 Codex"重新定义为"构建你自己的 Codex"。Harness 与计算的分离在架构上意义重大——这意味着智能体逻辑和执行环境可以独立替换。@stefanjrice 指出可观测性是"下一个重大突破":团队需要看到智能体为什么采取某个行动,而不仅仅是它是否完成了任务。

与前日对比: 昨日报告追踪了 Codex 演变为桌面 Super App。今天,OpenAI 转向上游——开源 harness,让开发者可以自行构建生产级智能体基础设施。这是一个平台策略,而非产品更新。


1.2 速率限制成为跨平台主要痛点 🡕

今天,速率限制的不满横跨三个平台,互动量异常之高。

@rsuyoy 批评 OpenAI 悄悄"大幅"削减了 Codex 限额,且没有公开通知(161 赞,39 条回复,17,833 浏览——今天数据集中回复数最高的帖子)。作者系统性地排除了其他解释:不是快速模式,不是高推理模型,不是过度使用技能,也不是 x2 后的调整。"现在的限额已经与 Claude 的代码限额持平,甚至更严格。" @Jacoob_shi 回复道:"悄悄降低限额是最糟糕的。你某天醒来,一切都变慢了,但没人说过什么。"

@TheRegister 报道了更广泛的 Copilot 反弹:"客户因 GitHub Copilot '修正'速率限制而反抗。" @mandraketech 报告首次在 Copilot Pro+ 订阅上遇到速率限制,尽管平均每天约 60 个请求,分布在 3-4 个并行会话中——"没有关于具体性质或时间线的任何细节。"

在 Anthropic 方面,@ChrisHayduk 提出了可靠性担忧(46 赞,11,588 浏览):"Claude API 和 Claude Code(它们的主要企业收入驱动器)的正常运行时间只有两个 9,这完全不可接受。尤其是 Codex 和 OpenAI API 有四个 9。"

讨论要点: 速率限制的不满不再是特定工具的问题——它现在横跨 OpenAI(Codex)、GitHub(Copilot)和 Anthropic(Claude Code 正常运行时间)。共同的主线是不透明:用户看不到自己的限额,无法预测何时会触及限制,限额变更时也没有收到任何正式通知。

与前日对比: 昨日报告记录了 Claude Code 的成本不透明(每天 200 美元但没有可见性)和 token 膨胀。今天,不满情绪加剧并扩展到 Codex 和 Copilot,The Register 进行了机构媒体报道。


1.3 VS Code 和 GitHub Copilot CLI 发布智能体基础设施 🡕

官方 @code 账号宣布了新的 VS Code 版本(348 赞,68 收藏,24,669 浏览),增强了智能体体验:包括过往会话的调试日志、终端交互工具和内置的 GitHub Copilot。@m_emanaftab 以竞争框架回复道:"现在每个工具都在推出智能体功能。VS Code、Claude Code、Codex、Cursor。长期获胜的不会是功能最多的那个,而是智能体真正深入理解你的项目、让你放心离开去做其他事的那个。"

@cinnamon_msft 推广了 Copilot CLI 的 /remote 命令,支持从任何设备访问本地开发环境。@JamesMontemagno 称赞了 Copilot CLI 团队的速度:一个 PR 被发送、文档更新、合并、排队并部署到生产环境,全部在中午到下午 1 点之间完成——在负责的工程师吃完午饭回来之前。

@tristanbob 调查了 Copilot 用户使用哪个智能体,链接到 GitHub 的第三方智能体文档。选项包括原生 VS Code 智能体、Anthropic Claude(Opus 4.5/4.6, Sonnet 4.5/4.6)或 OpenAI Codex(GPT-5.2-Codex, GPT-5.3-Codex, GPT-5.4)。每个智能体会话消耗一次高级请求加 GitHub Actions 分钟数。

讨论要点: GitHub 的智能体平台现在向用户展示原生、Claude 和 Codex 智能体之间的三方选择——每个都有不同的模型选项和成本结构。碎片化是有意为之的(竞争推动质量),但增加了用户的决策负担。

与前日对比: 昨天追踪了 Copilot CLI 走向远程和移动化。今天通过 /remote 命令演示确认了这一方向,并增加了 VS Code 智能体基础设施更新——巩固了 Microsoft 的双轨战略(IDE + CLI)。


1.4 OpenCode 远程环境接近发布 🡕

@jlongster 详细介绍了 OpenCode 远程环境背后的分布式系统工作(76 赞,29 收藏,7,839 浏览)。该架构通过控制平面服务器代理写入到远程环境,而读取来自本地同步。这产生了最终一致性问题:更新可能不会反映在后续读取中。修复方案是"栅栏"机制——远程环境在响应头中返回最新的同步状态,控制平面等待其同步状态匹配后才完成读取。一个 PR 已链接,该功能被描述为"非常非常接近发布"。

后续评论揭示了路线图:Cloudflare 集成即将到来("@threepointone 下周有很多要聊的"),该架构最终将支持提供商插件,让不同的沙箱提供商可以原生利用其平台。系统目前在远程环境中运行完整的 OpenCode 服务器,但计划拆分组件以实现更灵活的部署。

@LukeParkerDev 发布了一个 2 分钟的 TUI 插件教程(49 赞,23 收藏,5,865 浏览),展示如何在 OpenCode 内部构建自定义面板——展现了 OpenCode 终端界面的可扩展性。

@atbeme 开始构建一个 wiki,记录 OpenClaw、Hermes、OpenCode 和类似开放智能体 harness 的内部机制,灵感来自 Karpathy 的 LLM 个人 wiki 概念。

讨论要点: OpenCode 正在开发与 Codex 相同的远程执行能力,但采用开放架构和提供商插件模型。栅栏机制解决了一个真实的分布式系统问题,公开 PR 的方式让社区可以审查实现细节。

与前日对比: 新主题。OpenCode 在昨日报告中并不突出。远程环境工作将 OpenCode 定位为 Codex 云执行的开源替代方案。


1.5 Claude Code 扩展至多智能体和企业工作流 🡒

@TheTuringPost 报道 OpenAI 发布了一个插件,允许用户在 Claude Code 内直接调用 Codex。该插件将 Claude Code 转变为多智能体配置,Codex 作为专门的子智能体用于代码审查、调试、异步后台任务和状态追踪。

Codex plugin for Claude Code README showing slash commands for review, adversarial review, and background job management

该插件提供六个斜杠命令:/codex:review 用于只读审查,/codex:adversarial-review 用于可引导的挑战式审查,以及 /codex:rescue/codex:status/codex:result/codex:cancel 用于委托和管理后台任务。采用 Apache-2.0 许可证。

@wmthomson22 描述了在 Claude Code 中构建金融建模系统的过程,历时约 40 小时,覆盖 75 家公司。方法论是:将 Claude Code 视为"一个什么都不知道的分析师",然后迭代式地教它——先理解财务报表,然后从商业模式和运营部门中识别收入驱动因素,再根据 10-Q、10-K 和电话会议记录验证假设。该系统现在可以部署给"完全没有相关知识的"分析师使用。

@JeremyNguyenPhD 探索了 Claude Code Routines 用于每日简报,但提出了隐私担忧:"我仍然没有把我的主邮箱连接到任何 AI,只是在考虑隐私等问题。"

Claude Code Routines UI showing template options for Briefing, Email triage, System health check, and Issue triage with schedule and integration details

讨论要点: Codex 嵌入 Claude Code 的插件是一种引人注目的竞争行为——OpenAI 构建进入 Anthropic 的生态系统,而不仅仅是与之竞争。金融建模用例展示了 Claude Code 被用于需要数周迭代教学的复杂企业工作流,而非单次提示词任务。

与前日对比: 昨日报告发布了 Claude Code Routines 和桌面重新设计。今天展示了第二天的采用情况:用户探索 Routines(带有隐私顾虑),金融建模案例扩展了"Claude Code 超越编程"的主题,提供了迄今最详细的企业应用案例。


2. 令人困扰的问题

各平台悄然降低速率限制(高)

@rsuyoy 记录了 OpenAI 在没有任何公开声明的情况下大幅削减了 Codex 限额。该帖子引发了 39 条回复——是今天数据集中最多的——作者排除了每一种常见的替代解释。@TheRegister 报道了并行的 Copilot 反弹,具有机构媒体影响力(仅推文就有 970 次浏览)。@mandraketech 首次在 Copilot Pro+ 上遇到速率限制,尽管使用模式正常,且没有关于限额或时间线的任何细节。一致的不满在于不透明:限额变了,没人被告知,发现新限额的唯一方式就是触及它们。

Anthropic API 和 Claude Code 可靠性(中)

@ChrisHayduk 量化了差距:Anthropic 的 Claude API 和 Claude Code "正常运行时间只有两个 9",而 Codex 和 OpenAI API 有四个 9。该帖子将 Claude Code 和 API 定位为 Anthropic 的"主要企业收入驱动器",使不可靠性成为直接的商业风险。这延续了昨天的可靠性担忧,并增加了具体的竞争基准测试。

Google Antigravity 和 Gemini 不稳定(中)

四条独立帖子表达了对 Google AI 编程工具的不满。@tinyblue_dev 取消了 Gemini Ultra,称 Antigravity "不过是 VS Code 的一个 fork",是"完成了一半的软件"。@procesor_x 报告在两个账号(Pro 和 Ultimate)上持续出现绿色配额问题,且 Google 没有回应。@gujjutweeter 报告在 Antigravity 中使用 OpenCode 触发了违规政策,申诉待处理。@ultramathi 抱怨持续出现"服务器高负载"错误。


3. 人们期望的功能

透明、公开的速率限制策略

今天,每个主要平台都遭到了速率限制投诉。用户希望有公开的限额、变更通知和实时使用量仪表板——而不是通过被限流的请求来事后发现。当前悄然调整限额的做法同时侵蚀了用户对 Codex、Copilot 和 Claude Code 的信任。

智能体可观测性和审计追踪

@stefanjrice 在得分最高的帖子中指出了这一空白:"下一个重大突破是更好的可观测性,让团队能看到智能体为什么采取某个行动,而不仅仅是它是否完成了。"VS Code 新增的过往智能体会话调试日志部分解决了这一需求,但该需求延伸至所有智能体平台——尤其是在远程环境中运行或作为定时 Routine 执行的自主智能体。

模型无关的智能体可移植性

@joe_lgtm 指出 Codex CLI 通过配置更改即可接受 OpenRouter、Databricks 和任何兼容 OpenAI 的 API。@JulianGoldieSEO 演示了在 OpenCode 中使用 Qwen 3.6。用户希望在不更换智能体工具的情况下自由切换模型——这是开放 harness(OpenCode、Codex CLI)提供但供应商锁定工具不提供的能力。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
OpenAI Agents SDK 智能体框架 正面 开源 harness;持久执行;带压缩的记忆;7 个沙箱合作伙伴;构建你自己的 Codex 新发布;生产环境实践记录尚未验证
VS Code + Copilot IDE + 智能体 正面 过往会话调试日志;终端工具;内置 Copilot;/remote 跨设备访问 三方智能体碎片化(原生、Claude、Codex);速率限制反弹
Copilot CLI 终端智能体 正面 /remote 跨设备命令;团队高速度;学生免费 Pro+ 首次遇到速率限制;无公开限额详情
Claude Code 编程智能体/平台 褒贬不一 Routines 用于定时自动化;覆盖 75 家公司的金融建模;Codex 插件实现多智能体 两个 9 正常运行时间;速率限制与竞争对手持平;Routines 隐私担忧
OpenCode 开源终端智能体 正面 远程环境接近发布;TUI 插件可扩展性;模型无关(Qwen、OpenRouter) 栅栏机制仍在 PR 中;提供商插件尚不可用
Codex CLI 终端智能体 正面 四个 9 正常运行时间;兼容 OpenRouter/Databricks;OpenAI 内部采用 悄然削减速率限制;GPT-5.3 模型老化;部分功能需要 ChatGPT 订阅
Antigravity (Google) IDE 负面 与 Google 生态系统集成 "VS Code 的 fork";持续服务器错误;违规政策风险;多起取消报告
EDINET DB MCP 金融数据连接器 正面 3,847 家日本公司;121 个字段;通过 MCP 集成 7 个工具;XBRL 解析(无幻觉) 专注日本市场;每日 100 次免费 API 请求

5. 人们在构建什么

项目 构建者 功能 技术栈 阶段 链接
金融建模系统 @wmthomson22 迭代训练的系统,分析财务报表、识别收入驱动因素,并在 75 家公司中构建模型 Claude Code, 10-Q/10-K/电话会议记录分析 已部署给分析师 Post
OpenCode 远程环境 @jlongster 基于栅栏一致性的远程智能体执行、控制平面代理、提供商插件系统 OpenCode, 分布式同步 预发布(PR 已提交) Post
Claude Code 的 Codex 插件 OpenAI 六个斜杠命令,将 Codex 作为 Claude Code 内的子智能体用于审查、调试和后台任务 Claude Code, Codex API 已发布 (Apache-2.0) Post
智能体 harness wiki @atbeme 从底层记录 OpenClaw、Hermes、OpenCode 内部机制,用于构建自定义 harness Wiki, 源码分析 进行中 Post
Flipper Zero 智能体遥控器 @kasentuner 用于终端编程智能体的物理遥控器,已被 Official Flipper App Catalog 收录 Flipper Zero, Claude Code 已发布(已上架) Post
Claude Code 定制开发服务 @Creatextravel 基于 Claude Code 的定制应用构建服务,附加销售 Claude Code, Stripe 第 1 天(总交易额 $6,384) Post
EDINET DB MCP 连接器 @edinetdb_en 通过单个 MCP 服务器将 7 个 AI 编程工具连接到 3,847 家日本公司的结构化金融数据 REST API, MCP, XBRL, SQLite 已发布 Post
X 书签分类技能 @arisehype 在一次 Claude Code 会话中整理了 3,333 个书签——79% 为无用内容,保留了 10 个行动项 Claude Code 已发布(技能已分享) Post

6. 新动态与亮点

OpenAI Agents SDK:构建你自己的 Codex

当天最重要的发布(2,111.2 分)将智能体 harness 与计算执行分离。开发者现在可以将持久执行、记忆、文件/计算机使用和技能与七个沙箱提供商中的任何一个结合使用——或者自带提供商。Harness 是开源的。这将 OpenAI 的智能体战略从"使用我们的产品"重新定义为"在我们的平台上构建"。(Post

Claude Code 的 Codex 插件:跨平台智能体集成

OpenAI 发布了一个 Apache-2.0 插件,将 Codex 作为子智能体嵌入 Claude Code 内部。六个斜杠命令支持代码审查、对抗式审查以及带状态追踪的后台任务委托。这是一种合作而非纯粹竞争的举措——OpenAI 构建进入 Anthropic 的生态系统,以在无论哪个智能体是编排者的情况下捕获使用量。(Post

OpenCode 远程环境与栅栏一致性机制

OpenCode 的远程环境实现通过栅栏机制解决了分布式一致性问题——远程写入在响应头中返回同步状态,控制平面等待同步收敛后才完成读取。提供商插件已在规划中(Cloudflare 集成即将到来)。该功能"非常非常接近发布"。(Post

Flipper Zero 编程智能体控制应用

@kasentuner 构建了一个用于控制终端编程智能体的物理遥控器,并成功上架 Official Flipper App Catalog。该设备可以从房间另一端、沙发上或踱步时控制 Claude Code 会话。一种新颖的物理-数字界面,服务于 AI 辅助开发。(Post

EDINET DB:跨 7 个工具的金融数据 MCP

一个覆盖 3,847 家日本上市公司的结构化金融数据服务,通过单个 MCP 服务器连接到 Claude Code、Cursor、Codex、Copilot、Cline、Antigravity 和 ChatGPT。数据从 XBRL 申报文件中确定性解析,无 LLM 参与——"结构上不存在幻觉"。121 个金融字段,覆盖 JP GAAP、IFRS 和 US GAAP,每日更新。(Post, Site


7. 机会在哪里

[+++] 速率限制透明度和使用量仪表板 — 今天每个主要 AI 编程平台都遭到了速率限制投诉:Codex(悄然削减,39 条回复)、Copilot(Pro+ 首次触及限制)、Claude Code(两个 9 正常运行时间)。The Register 报道了 Copilot 的反弹。没有平台发布明确的限额、变更通知或实时使用量仪表板。第一个提供透明、可预测使用策略的工具将获得仅靠功能对等无法匹敌的信任优势。

[+++] 开放智能体 Harness 生态系统 — OpenAI 开源了 Agents SDK harness,拥有 7 个沙箱合作伙伴。OpenCode 正在构建带提供商插件的远程环境。@atbeme 正在记录 harness 的内部机制。机会在于生态系统层:标准化的 harness 接口、提供商市场和跨 OpenCode、Codex CLI 及任何开放 harness 工作的智能体技能注册表。"构建你自己的 Codex"的信息创造了对组件、托管和集成服务的需求。

[++] 智能体可观测性平台 — 得分最高帖子中最有洞察力的回复将可观测性定位为"下一个重大突破"。VS Code 增加了过往会话的调试日志,但需求延伸至远程运行、定时 Routine 以及多智能体配置(Codex 嵌入 Claude Code)中的自主智能体。能够展示智能体为什么采取某个行动、每决策成本和置信度追踪的工具,在智能体从交互式转向自主化时将变得至关重要。

[++] 领域特定 MCP 连接器 — EDINET DB 展示了 MCP 作为通用数据协议的能力:一个连接器,7 个 AI 编程工具,3,847 家公司,零幻觉风险。这种模式可推广到任何结构化领域数据——医疗记录、法律文件、物流、合规。每个垂直领域都需要自己的 EDINET 风格 MCP 连接器,具备确定性数据提取和跨工具兼容性。

[+] 智能体控制的物理界面 — Flipper Zero 智能体遥控器上架 Official App Catalog,验证了 AI 编程会话中对物理控制的需求。随着智能体会话变得更长、更自主,交互模式从键盘密集型转向监控与干预型。专用硬件(遥控器、状态显示器、通知设备)可以服务于这一新兴工作流模式。


8. 要点总结

  1. OpenAI 开源了智能体 harness 并将其与计算执行分离。 Agents SDK 更新——今天得分最高的项目,达 2,111.2 分——提供持久执行、记忆、文件/计算机使用和技能,以及 7 个沙箱合作伙伴。信息是"构建你自己的 Codex",将 OpenAI 的智能体基础设施转变为平台而非封闭产品。(Post

  2. 速率限制的不满在三大主要平台同时达到临界点。 Codex 因悄然削减限额引发 39 条回复,Copilot 触发了 The Register 关于客户反抗的文章,Claude Code 两个 9 的正常运行时间被标记为企业风险。共同的失败是不透明——没有平台发布明确的限额或变更通知。(Codex, Copilot, Claude

  3. OpenAI 构建了一个在 Claude Code 内运行的 Codex 插件。 OpenAI 不仅仅是竞争,而是发布了一个 Apache-2.0 插件,提供六个斜杠命令用于审查、调试和后台任务委托,直接在 Claude Code 内使用。这一合作-竞争举措无论哪个智能体是主要编排者,都能捕获 Codex 的使用量。(Post

  4. OpenCode 远程环境接近发布,采用新颖的栅栏一致性机制。 该架构通过控制平面代理写入,读取来自本地同步,栅栏机制确保同步收敛。Cloudflare 集成即将到来,提供商插件系统将让沙箱提供商构建原生集成。(Post

  5. Claude Code 被用于构建需要数周训练的企业金融建模系统。 一个耗时 40 小时、覆盖 75 家公司的金融建模系统——迭代式教学以理解财务报表、识别收入驱动因素并根据 SEC 文件验证——展示了 Claude Code 作为复杂非编程企业工作流平台的能力。这是本系列中记录的最深入的企业应用案例。(Post