跳转至

Twitter AI Coding - 2026-05-07

1. 人们在讨论什么

1.1 Antigravity 屏幕录制和自定义智能体继续占据主导 🡒

@testingcatalog 透露(311 赞,21 回复,3 引用,48 书签,21,036 浏览):"Google 正在为 Antigravity 开发屏幕录制支持和自定义智能体。如果屏幕录制由 Gemini Live 驱动,该功能可能复刻 AI Studio 的能力,让 Gemini 实时看到你屏幕上发生的事情。"在自回复中,testingcatalog 补充:"自定义智能体和插件可以在专用文件夹中配置,看起来比目前使用的 Rules 和 Skills 更高级。"

Antigravity UI 下拉菜单中显示屏幕录制选项,旁边有 Plan、Media、Mentions 和 Workflows

@HarshithLucky3 传播(73 赞,4 回复,13 书签,5,397 浏览):"Google 正在测试 Antigravity 的两项重大升级。Agent Mode 的屏幕共享让智能体能实时看到你的整个桌面。自定义智能体和插件也在测试中。"

Antigravity 设置界面展示自定义智能体板块、Skill 自定义路径和 MCP Servers 配置面板

@akline_SF 认为(3 赞,1 回复,2 书签,1,031 浏览):"辣评:@Google 在纸面上已经赢了 AI 技术栈之战。TPU 到 GCP 到 Gemini 到 Antigravity,每一层、每一个端点都有了。唯一的问题是他们能不能第一次把应用层做好。"

@1littlecoder 诊断(9 赞,3 回复,1 书签,1,111 浏览)了 Google 的碎片化问题:"Jules 是 IDE 但不,它是做智能体的!Google AI Studio 适合部署应用但跟 Antigravity 不一样。Antigravity 是官方 IDE 但不如 AI Studio 好用。Gemini CLI 潜伏在那但它也是个 IDE!Google 和他们的产品碎片化正在扼杀他们优秀模型的使用率。"

讨论要点: 屏幕录制泄漏连续第二天成为数据集中互动量最高的帖子,累计获得 311 赞和 48 书签。1littlecoder 的碎片化批评提供了反面视角:Google 的模型质量可能有竞争力,但产品表面积(Jules、AI Studio、Antigravity、Gemini CLI)让开发者不知道该投入哪个。

与前日对比: 5 月 6 日,testingcatalog 的泄漏与 thefox 的 Google Finance 生产发布和 akline_SF 的垂直整合论点同时出现。今天生产证据缺席;话语完全围绕未发布的路线图。1littlecoder 的碎片化批评引入了新的风险因素:Google 自身的产品混乱可能在屏幕录制上线之前就已经削弱了 Antigravity 的优势。


1.2 GitHub Copilot 定价冲击:6 月即将迎来 10 倍涨价 🡕

@SouthernValue95 报告(44 赞,3 回复,1 引用,19 书签,8,558 浏览):"仅供参考——目前 MSFT 以每月 30 美元的固定价格大量补贴 GitHub Copilot 客户,远低于成本地赠送大量免费 token。他们将在 6 月调整定价,一个大客户告诉我按他们当前的 token 用量,Copilot 的成本将涨 10 倍。原始 SKU 定价是为辅助编程设计的,不是为智能体设计的。"在对 @baroqueobama87 的回复中,SouthernValue95 补充:"Anthropic 也在做同样的事。Copilot 以不可持续的折价给客户提供 Claude/OpenAI 模型。"

@ihtesham2005 推荐(15 赞,2 回复,5 书签,1,093 浏览)开源替代方案:"GitHub Copilot 每月收费 10 美元。Cursor 每月收费 20 美元。而且它们都会把你的每一行代码发到服务器。有人开源了替代方案,现在已经有 33K+ star 了。叫 Continue。"

Continue dev 的 README 展示可在 CI 中强制执行的源码管控 AI 检查,Apache 2.0 许可证

讨论要点: SouthernValue95 的说法是第一个关于 Copilot 定价即将调整的具体报告。其结构性影响是:每月 30 美元的智能体时代定价是为自动补全式使用设计的。当开发者把 Copilot 用于完整的智能体工作流时,token 消耗远超 SKU 的定价覆盖范围。这为 Continue 等允许用户自带模型的开源工具创造了机会。

与前日对比: 5 月 6 日,Copilot 叙事聚焦品牌受损(GergelyOrosz 的"毁掉品牌"、Xbox Copilot 关停)。今天转向经济账:补贴定价模式不可持续,6 月重新定价可能推动用户迁移。两条叙事汇合——品牌收缩(砍掉消费端场景)和定价修正(智能体按用量计费)都是 Microsoft 为智能体时代理性化 Copilot 的表现。


1.3 Codex 迈向智能体化:Chrome 扩展、iOS 应用和 /goal 工作流 🡕

@VraserX 描述(92 赞,10 回复,4 书签,2,262 浏览)了 Codex 的 Chrome 更新:"Codex 现在可以直接在 Chrome 内工作,处理重复的浏览器任务,跨并行标签页运行,选择合适的工具,并在后台工作而不劫持你的浏览器。这不仅仅是编程了。这是智能体工作变成现实。"

Codex Chrome 扩展弹窗显示已连接状态,版本 v1.1.4

@davenotik 调侃(8 赞,1 引用,1 书签,740 浏览):"用 Codex 管理标签页"——展示 Codex 通过关闭重复和过期页面将 Chrome 标签页从 77 个减到 42 个。

Codex 管理 Chrome 标签页,通过关闭重复和过期页面从 77 个减少到 42 个

@mosesbabychrist 报告(15 赞,1 引用,3 书签,3,757 浏览)了一次 /goal 迁移会话:"我今早起来,设定目标把 codex-pets.net 的所有内容从 Supabase 迁移到 Cloudflare,它已经运行了将近 3 小时:用 Computer Use 自己设置一切,本地部署预览,测试它们,在工作时接收我的输入,不打断自己的流程。"

@jumperz 推荐(13 赞,1 回复,4 书签,511 浏览)了一个第三方移动客户端:"有人给 Codex 做了个遥控器,如果你整天在跑 /goal 又要离开工位的话挺有用的",引用了 @emanueledptRemodex 1.5 公告

Remodex 1.5 iOS 应用启动画面显示"从你的 iPhone 控制 Codex"

@mark_k 指出(136 赞,12 回复,3 书签,4,140 浏览):"更新:看起来今天是 Codex iOS 应用的日子,下周是来自 @OpenAI 的新 ChatGPT 语音模式。"

讨论要点: Codex 正在从编程扩展到通用桌面智能体。davenotik 的标签页管理演示和 mosesbabychrist 的 3 小时自主迁移表明该工具正作为计算机使用智能体运行,而不仅仅是代码生成器。Remodex 第三方移动客户端说明社区对远程监控长时间运行的 /goal 会话有需求——这种模式在竞品工具中不存在。

与前日对比: 5 月 6 日,Codex 通过下载指标(飙升 2,763%)和 GPT-5.5 派对亮相。今天叙事推进到产品执行:用于浏览器自动化的 Chrome 扩展、用于多小时自主会话的 /goal、以及新兴的移动控制生态。Codex 从"增长最快"转变为"覆盖面最广"。


1.4 GPT Realtime 2 与语音控制智能体的未来 🡕

@ziwenxu_ 引用(3 赞,2 回复,3 书签,293 浏览)了 OpenAI 的公告:"OpenAI 刚用 GPT Realtime 2 把每个人变成了 Tony Stark。想象一下这个跑在 Codex、Openclaw、Hermes、Claude 里面。"

@VraserX 预测(44 赞,6 回复,1,308 浏览):"OpenAI 很可能在 Google I/O 前后推出强大的双向全双工语音模式给 ChatGPT。我猜它不只是像人一样说话。它会是智能体化的,接入 Codex 等工具,让你用语音控制真正的工作流。"

@tinyblue_dev 反应(46 赞,2 回复,1 书签,1,727 浏览):"大哥——把这玩意放到 macOS 上的 Codex 里你就给我们搞出 Tony Stark 的 Jarvis 了。"

@elielAGI (4 赞,2 回复,1,597 浏览):"这会来到 Codex 的智能体(Openclaw、Hermes)吗?我知道可能还早但这会超棒的。"

讨论要点: GPT Realtime 2 立即引发了关于语音控制编程智能体的猜想。"Tony Stark"框架同时从 ziwenxu_ 和 tinyblue_dev 独立出现,表明 Jarvis 隐喻已成为语音 + 智能体集成的默认心智模型。结合 Antigravity 的屏幕录制泄漏(主题 1.1),汇聚方向指向既能看到你屏幕又能听到你声音的智能体。

与前日对比: 5 月 6 日,语音在讨论中缺席。GPT Realtime 2 的发布创造了新的维度:视觉上下文辩论(Antigravity 屏幕录制)现在与音频上下文(语音控制智能体)交叉。如果两者都上线,编程智能体的交互模型将从打字提示变为与一个能看到你屏幕的智能体对话。


1.5 氛围编程进入主流媒体与怀疑派重构 🡒

@WSJ 发表(9 赞,5 回复,1 引用,8,855 浏览):"人们正在氛围编程自己的应用。@nicnguyen 讲述了构建她梦想仪表盘的喜与忧。"在回复中,@mohbii 道出了怀疑派的看法:"氛围编程就是给那些想要应用但不想学技能的人准备的编程。'搞崩两次'是对用 AI 构建最诚实的评价。"

@seelffff 汇总(10 赞,4 回复,8 书签,70 浏览)了里程碑数据:"一年后:GitHub 上 46% 的新代码是 AI 生成的,92% 的开发者每天都在使用 AI,Lovable:12 个月内从 0 到 2 亿美元 ARR,Y Combinator W25:每 4 家初创公司中有 1 家——91%+ 的代码库由 AI 编写。"

@aryanlabde 给出(8 赞,10 回复,2 书签,197 浏览)了结论:"氛围编程太简单了。做了个产品。花了 200 美元。上线了。赚了 0 美元。写代码从来不是关键。"在回复中,@mrhaseebdotcom 提炼道:"分发一直是难点。构建只是变便宜了。"

@cyb3rops 主张(10 赞,3 回复,1 书签,537 浏览)重新定义:"能不能请把氛围编程用在它本来应该用的地方?非正经的编程工作。小型可视化、奇怪的集成、游戏化工具。比如 IDA Pro,但我可以在 Roblox、Doom 或帝国时代里走过函数图。"

IDA Pro 逆向工程视图叠加在 Roblox 游戏环境上,将函数图展示为 3D 可步行空间

讨论要点: cyb3rops 的重构是最新颖的观点:氛围编程最适合用于一次性的、有创意的、非生产环境的代码。他的 IDA Pro-in-Roblox 示例展示了一个真正有用的应用——在游戏引擎中可视化逆向工程数据——没人会费心正经去做。这与 aryanlabde 失败的产品发布形成对比,后者把氛围编程用在了需要分发而非只是构建的事情上。

与前日对比: 5 月 6 日,氛围编程进入了机构化阶段(Emergent 15 亿美元估值、意大利面智能体提案)。今天 WSJ 带来了主流媒体报道,而 cyb3rops 提供了从业者的重构。话语分化为三条路线:机构投资(Emergent)、消费现实(0 美元收入)和创意再利用(非正经工具)。叙事从"氛围编程是真的吗?"成熟为"氛围编程到底适合做什么?"


1.6 Claude Code 显微镜下:架构研究与 Skills 生态 🡒

@simplifyinAI 分享(1 赞,1 回复,1 书签,23 浏览)了一篇研究论文:"研究人员逆向工程了 Anthropic 泄漏的 Claude Code。他们的发现彻底颠覆了我们对 AI 智能体的认知。"

VILA Lab 的学术论文标题 "Dive into Claude Code: The Design Space of Today's and Future AI Agent Systems"

这篇来自 Mohamed bin Zayed University VILA Lab 的论文通过公开可用的 TypeScript 源码分析了 Claude Code 的架构。主要发现:核心是一个简单的 while 循环,调用模型、运行工具、重复。复杂性在循环周围:一个有七种模式的权限系统、一个基于 ML 的分类器、一个五层压缩管道、四种可扩展机制(MCP、插件、skills、hooks)以及一个子智能体委派系统。

@mikefutia 展示(8 赞,8 回复,4 书签,311 浏览)了 Claude Code Skills 的生产应用:"一个完整的品牌到广告流水线,构建永久品牌大脑并按命令产出 hook、brief、脚本和广告变体。全部在 Claude Code 内完成。"Skill 链包括品牌 DNA 构建器、声音画像器、ICP 深度分析、Hook 撰写器、Brief 生成器、广告脚本撰写器和变体引擎。

@NainsiDwiv50980 认为(8 赞,2 回复,4 书签,106 浏览):"Claude Opus 4.7 不只是让编程更快了。它改变了谁是最好的工程师。赢家不再是打代码最快的人。而是那些以系统思维思考、设计杠杆效应、管理上下文、正确引导智能的人。"

讨论要点: VILA Lab 的论文提供了首个对生产编程智能体的学术架构分析。Claude Code 的核心是一个简单 while 循环——所有复杂性在周围的基础设施(权限、压缩、可扩展性)中——这个发现表明智能体开发的难题不在 LLM 交互本身,而在其周围的系统工程。

与前日对比: 5 月 6 日,Claude Code 通过 Code with Claude 会议(GitHub 展示集成架构)和意大利面智能体质量概念出现。今天学术视角增添了深度:我们现在既有从业者反馈(mikefutia 的广告流水线 skills),也有研究分析(VILA Lab 的架构解剖)。话语从"如何使用 Claude Code"转向"Claude Code 到底是怎么工作的"。


1.7 GitHub Copilot CLI 功能交付速度加快 🡕

三条 @GHchangelog 帖子记录了快速的功能发布:

Rubber Duck 跨模型家族审查智能体(23 赞,4 书签,1,513 浏览):"GitHub Copilot CLI 中的 Rubber Duck 现在支持 GPT 和 Claude 模型的跨家族审查智能体。启用 /experimental 后,GPT 会话可以获得 Claude 驱动的第二意见。"

企业托管插件(23 赞,4 书签,1,504 浏览):"企业管理员现在可以为整个组织的 GitHub Copilot CLI 用户配置和分发插件。通过 settings.json 定义插件市场以实现自动安装。"

语义搜索和 /chronicle(13 赞,1 回复,2 引用,2 书签,1,402 浏览):"Copilot 现在可以跨工作区进行语义搜索,并在 GitHub 仓库和组织上运行 grep 风格的查询。使用实验性 /chronicle 功能查询你的聊天历史。"

@JamesMontemagno 调侃(9 赞,1 回复,2 书签,674 浏览):"我可能不小心签下了负责 GitHub Copilot CLI 自动更新组件的活……糟了!"

Teams 聊天截图显示 JamesMontemagno 同意负责 Copilot CLI 自动更新组件

讨论要点: 一天内三条 changelog 帖子说明 GitHub 正在加速 Copilot CLI 的功能交付。跨家族审查智能体(GPT 会话获得 Claude 的第二意见)尤其值得注意——它将 Copilot CLI 定位为多模型编排层,而非绑定单一供应商。企业托管插件将分发模型从个人开发者扩展到全组织部署。

与前日对比: 5 月 6 日,GitHub Copilot CLI 通过 C++ 代码智能和 /statusline 与 OhMyPosh 出现。今天功能集拓宽了:跨模型审查、企业插件分发、语义搜索和聊天历史查询。这样的速度表明 GitHub 正将 Copilot CLI 定位为比 Claude Code 和 OpenCode 等轻量终端智能体功能更丰富的替代方案。


2. 令人困扰的问题

Copilot 定价对智能体工作负载不可持续——高

@SouthernValue95 报告(44 赞,19 书签,8,558 浏览)一个大客户被告知在 6 月新定价下 Copilot 成本将涨 10 倍,因为"原始 SKU 定价是为辅助编程设计的,不是为智能体设计的。"SouthernValue95 补充:"Anthropic 也在做同样的事。"

应对策略:切换到 Continue 等开源替代方案(ihtesham2005)。通过 Ollama 自带模型(python_spaces)。等 6 月定价落地再做反应。

Google 产品碎片化让开发者困惑——中

@1littlecoder 列举(9 赞,1,111 浏览)了困惑:"Jules 是 IDE 但不,它是做智能体的!Google AI Studio 适合部署应用但跟 Antigravity 不一样。Antigravity 是官方 IDE 但不如 AI Studio 好用。Gemini CLI 潜伏在那但它也是个 IDE!"@AlejoJamC 报告(2 赞,1 回复,1 书签,481 浏览)卡在配额循环中:"在配额重置循环中卡了一个月。每次打开应用都显示'6 天 23 小时后刷新',尽管用量为零。"

Antigravity 模型设置显示所有模型配额都卡在"6 天 23 小时后刷新"

应对策略:部署用 AI Studio,编程用 Antigravity(1littlecoder 隐含的拆分方式)。配额问题联系 Google 客服(AlejoJamC)。

OpenCode 推理中切换中文——低

@sudoingX 报告(18 赞,9 回复,1 引用,1,380 浏览):"OpenCode 默认模型 big pickle 在回答一个关于内存的基础问题时开始用中文推理。我没要求用中文。"在回复中,@IBVibeCoding 表示这很正常:"你以前没用过中文模型吗?这很常见。直接告诉它切回英文就行。"

OpenCode 模型推理输出显示关于 RAM 内存的中英混杂文本

应对策略:告诉模型切回英文(IBVibeCoding)。语言一致性要求高时使用非中文模型。

GitHub Copilot 代码审查质量——低

@YoavCodes 抱怨(1 赞,2 回复,116 浏览):"人们一直让 GitHub Copilot 做代码审查。这太蠢了因为它的审查很烂,把本来可以快速合并的好 PR 带偏到疯狂的方向,而且我被通知轰炸了。"

GitHub Actions 显示 356 次失败的 Copilot 代码审查工作流运行

应对策略:在仓库上禁用 Copilot 代码审查。关键 PR 使用人工审查。


3. 人们期望的功能

语音控制的编程智能体

GPT Realtime 2 的发布立即引发了将语音集成到编程智能体的需求。@tinyblue_dev 请求(46 赞,1,727 浏览):"把这玩意放到 macOS 上的 Codex 里你就给我们搞出 Tony Stark 的 Jarvis 了。"@elielAGI (4 赞,1,597 浏览):"这会来到 Codex 的智能体(Openclaw、Hermes)吗?"目前没有编程智能体支持双向语音交互来实时控制工作流。

紧迫度:高。多个独立的"Jarvis"引用和 tinyblue_dev 请求获得的 46 赞说明潜在需求强烈。GPT Realtime 2 在技术上已可行;集成缺口就是机会。

长时间运行智能体会话的移动监控

@jumperz 展现(13 赞,4 书签,511 浏览)了远程监控 Codex 的需求,引用 Remodex 1.5:"有人给 Codex 做了个遥控器,如果你整天在跑 /goal 又要离开工位的话挺有用的,除非 @OpenAI 决定出个原生的。"@mosesbabychrist 描述(15 赞,3,757 浏览)了一个需要定期查看的 3 小时自主 /goal 会话。

紧迫度:中。/goal 工作流模式创造了多小时的自主会话,开发者需要远程监控。Remodex 作为第三方方案已经存在,但 Codex、Claude Code 或 OpenCode 都没有第一方工具支持这一点。

跨工具的统一模型选择

@PetrPoulik1492 (2 赞,2 回复,35 浏览):"搞什么。我该用 Codex CLI、GitHub Copilot CLI 还是 Codestral 22B LLM?有人能给个建议吗?"@Andres99Dev 请求(5 赞,2 回复,496 浏览):"能把模型标记为收藏也很好,我在 OpenCode 里真的不用那 200 个什么模型。"

紧迫度:低。模型数量激增正在造成选择疲劳。没有工具提供有主见的默认路径来自动将任务路由到最佳模型。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
OpenAI Codex 智能体平台 (+) Chrome 扩展实现浏览器自动化(VraserX,92 赞);/goal 运行 3 小时自主迁移(mosesbabychrist);iOS 应用上线(mark_k,136 赞);第三方移动客户端 Remodex(jumperz) EU 可用性缺口(Martininc1:"Claude 早就有了");Codex iOS 令部分人失望(mark_k:"我完全不在意")
Claude Code 终端智能体 (+) VILA Lab 架构分析验证设计;Skills 生态用于生产工作流(mikefutia 的品牌到广告流水线);Opus 4.7 改变"谁是最好的工程师"(NainsiDwiv50980) SpaceX 驱动的限制仍构成周度瓶颈(Pipc2025)
Google Antigravity IDE 智能体 (+/-) 屏幕录制 + 自定义智能体泄漏继续保持 311 赞(testingcatalog);教程生态增长(JulianGoldieSEO 2 小时和 4 小时课程) Jules/AI Studio/Antigravity/Gemini CLI 的产品碎片化(1littlecoder);配额重置循环(AlejoJamC)
GitHub Copilot IDE/CLI (+/-) 一天三个 changelog 功能(Rubber Duck 跨家族、企业插件、/chronicle);Unity MCP 游戏开发(SkarredGhost, dotnet) 6 月定价涨 10 倍(SouthernValue95);代码审查质量差(YoavCodes,356 次失败运行)
OpenCode 终端智能体 (+) 6 万订阅(StefanTMD);T3Code 与 OpenCode 对比显示产品差异化(krl_grn);本地模型配置文档化(Daniel_Farinax) 推理中切换中文(sudoingX);模型选择过多(Andres99Dev:"200 个模型")
Continue 开源 IDE (+) 33K GitHub star(ihtesham2005);每个 PR 上的 AI 检查作为 GitHub 状态检查;自带模型架构;Apache 2.0 "大规模重写时有严重缩进问题"(JamesNumb3rs)

总结: 工具格局呈现两个同步转变:Codex 从代码生成扩展到完整的计算机使用智能体(Chrome、iOS、/goal),而 GitHub Copilot CLI 加速功能交付以在广度上竞争。开源替代方案 Continue 随着商业工具定价担忧加剧而获得关注。Google Antigravity 的路线图野心(屏幕录制、自定义智能体)尚未发布,而其产品碎片化让现有用户感到沮丧。


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
Remodex 1.5(Codex 遥控器) @emanueledpt(经 jumperz) 原生 iOS 应用远程控制 Codex,支持插件和 GPT Image 2.0 长时间运行 /goal 会话缺少移动监控 iOS, Codex API 已上线 Post
品牌到广告流水线 @mikefutia 端到端创意制作:品牌 DNA、声音画像、hook 撰写、广告脚本、变体引擎 DTC 品牌的手动创意制作周期 Claude Code Skills 已发布 Post
多智能体迁移编排器 @JamesOR 编排 Antigravity 规划智能体和代码级 Agent Skills 实现 Express 到 Next.js 迁移 将遗留代码塞入单个提示词时 LLM 产生幻觉 Antigravity, Agent Skills 已发布 Post
Unity 场景(Copilot MCP) @SkarredGhost 完整游戏场景(物理、动画、脚本)无需打开 Unity 编辑器 手动 Unity 编辑器工作流用于场景创建 GitHub Copilot, VS Code, Unity MCP 演示 Post
ACB 社区构建器 @PayOwn(经 github) 为美国盲人委员会自动化每周任务 非开发者耗时的手动流程 GitHub Copilot, JAWS 已上线 Post
指标中心(205+ 指标) Nency(经 @MicrosoftLearn 可搜索的中心整合了来自文档、工具和团队的 205+ 指标 评审准备需要花数小时追踪指标 GitHub Copilot, VS Code 已上线 Post
Shipper(Claude Code 游戏构建器) @chddaniel Claude Opus 4.7 自动构建并发布视频游戏 手动游戏开发和 Steam 发布 Claude Code, Opus 4.7 已发布 Post
Codex iOS 应用启动模拟器 @iHarnoorSingh 用 HyperFrames skill 构建的 Codex iOS 应用启动动画模拟 展示 Codex iOS 发布 Codex, HyperFrames 演示 Post
开源视频裁剪器 @emironic 将视频转为带字幕的片段,本地运行 带可选 AI 字幕的视频片段制作 开源, Claude/Codex 可选 已发布 Post

6. 新动态与亮点

GPT Realtime 2 发布:具备 GPT-5 级语音推理能力

@OpenAI 宣布 GPT-Realtime-2 在 API 中上线:"我们迄今最智能的语音模型,将 GPT-5 级推理能力带入语音智能体。语音智能体现在是实时协作者,可以倾听、推理,并在对话展开时解决复杂问题。"该发布立即引发了与编程智能体集成的猜想。@ziwenxu_ 设想(3 赞,3 书签,293 浏览)它运行在 Codex、Openclaw、Hermes 和 Claude 中。如果实现,这将创造多位开发者今天请求的语音控制编程智能体。

Codex Chrome 扩展实现浏览器级智能体

@VraserX 描述(92 赞,2,262 浏览)Codex 直接在 Chrome 内跨并行标签页工作而不劫持浏览器。@cocktailpeanut 指出(3 赞,1 书签,257 浏览)了架构对比:"Codex 扩展只是一个连接面板。而 Claude 扩展则作为侧边栏嵌入你的浏览器。"这将 Codex 定位为后台智能体,Claude 定位为嵌入式助手——浏览器集成的不同设计哲学。

VILA Lab 发布首个 Claude Code 学术架构分析

@simplifyinAI 分享(1 赞,23 浏览)论文 "Dive into Claude Code: The Design Space of Today's and Future AI Agent Systems"。该研究通过 TypeScript 源码分析 Claude Code,识别了驱动架构的五个人类价值观、十三项设计原则,并与 OpenClaw 做了对比。发现核心是一个简单的 while 循环,复杂性集中在权限、压缩和可扩展性层。论文发布于 github.com/VILA-Lab/Dive-into-Claude-Code。

GitHub Copilot 定价将于 6 月转向按用量计费

@SouthernValue95 报告(44 赞,19 书签,8,558 浏览)Microsoft 正在结束 GitHub Copilot 每月 30 美元的固定价格补贴,一个大客户被告知预期成本将涨 10 倍。这标志着 AI 编程工具从固定费率到按用量计费的行业性转变,原因是智能体时代的 token 消耗远超自动补全时代定价所能覆盖的范围。

DeepSeek-V4-Pro 通过 Ollama 可供所有终端智能体使用

@python_spaces 报告(4 赞,3 转发,3 书签,842 浏览):"你现在可以用 Claude Code 运行 DeepSeek-V4-Pro。@ollama 现在可以让你用 Claude Code、OpenCode、Codex、OpenClaw 等运行 DeepSeek-V4-Pro——无需额外配置。DeepSeek-V4-Pro 是一个前沿的 Mixture-of-Experts 模型,拥有 100 万 token 的上下文窗口。"


7. 机会在哪里

[+++] 语音控制编程智能体集成 ——GPT Realtime 2 提供 GPT-5 级语音推理能力。tinyblue_dev(46 赞)和 ziwenxu_ 独立引用了"Jarvis"隐喻。VraserX(44 赞)预测智能体语音模式将"接入 Codex 等工具"。目前没有编程智能体支持双向语音交互用于工作流控制。结合 Antigravity 的屏幕录制泄漏,语音输入和视觉上下文的融合创造了全新的交互范式。第一个发布语音控制编程智能体的工具将占据一个品类。

[+++] 按用量计价套利工具 ——SouthernValue95 报告的 6 月 Copilot 涨价 10 倍(44 赞,19 书签)将推动成本优化需求。Continue(33K star,Apache 2.0)已提供自带模型架构。帮助团队估算、监控和优化跨 Copilot、Claude Code 和 Codex 的 AI 编程开支的工具——尤其是能自动将任务路由到更便宜模型的工具——在定价修正来临时将获得即时需求。

[++] 自主智能体会话的移动监控 ——Remodex(第三方 Codex 移动客户端)和 mosesbabychrist 的 3 小时 /goal 会话证明自主编程智能体现在可以无人值守运行数小时。没有第一方工具提供跨智能体的移动监控、通知或干预能力。一个用于监控 Codex /goal 会话、Claude Code 例行任务和 OpenCode 会话的跨平台移动仪表盘将服务于日益增长的"设定后走开"工作流模式。

[++] 多智能体迁移框架 ——JamesOR 的 Express 到 Next.js 编排器 skill(22 赞)展示了这一模式:规划智能体 + 代码级智能体配合验证阶段。遗留迁移是高价值、高风险的任务,单提示词方法容易产生幻觉。带有内建验证(审计数据模型、审计 API 契约、审计业务逻辑)的产品化迁移框架将服务企业现代化需求。

[+] Claude Code Skills 市场 ——mikefutia 的品牌到广告流水线证明 Claude Code Skills 可以编码整个专业工作流(品牌 DNA、声音画像、广告脚本、变体引擎)。该模式可跨行业复用。一个用于打包 Claude Code Skills 的市场或注册表——带版本管理、依赖管理和质量评级——将加速在个人开发者通过 Twitter DM 分享之外的采用。


8. 要点总结

  1. Copilot 定价即将迫使整个行业进行清算。 SouthernValue95 报告的 6 月成本涨 10 倍(44 赞,19 书签,8,558 浏览)揭示固定费率定价是为自动补全设计的,不是为智能体。随着补贴结束,团队要么优化用量,要么切换到 Continue(33K star)等开源替代方案,要么承担大幅增加的成本。这次重新定价也影响 Anthropic——SouthernValue95 指出"Anthropic 也在做同样的事。"(来源

  2. Codex 正从代码生成扩展到完整的计算机使用智能体。 Chrome 扩展跨并行标签页处理浏览器任务(VraserX,92 赞)。/goal 通过 Computer Use 运行 3 小时自主迁移(mosesbabychrist,3,757 浏览)。Remodex 提供移动控制。mark_k 确认官方 Codex iOS 应用即将推出。Codex 正定位为覆盖面最广的编程智能体,而不仅仅是增长最快的。(来源

  3. GPT Realtime 2 开启了语音控制编程智能体的竞赛。 多名开发者在公告发布数小时内独立引用了"Jarvis"隐喻。结合 Antigravity 的屏幕录制泄漏(311 赞,48 书签),编程智能体的交互模型正在向多模态汇聚:能看到你屏幕、听到你声音的智能体。第一个发布这种集成的工具将占据一个新品类。(来源

  4. Claude Code 的架构是一个 while 循环——难点在于周围的一切。 VILA Lab 的论文揭示 Claude Code 的核心很简单(调用模型、运行工具、重复)。工程复杂性在于七种权限模式、五层压缩管道、四种可扩展机制和一个子智能体委派系统。这一洞察重新定义了智能体开发的挑战:LLM 交互是简单的;系统工程才是关键。(来源

  5. GitHub Copilot CLI 正以前所未有的速度发布功能。 一天内三条 changelog 帖子——跨家族审查智能体(GPT 会话获得 Claude 的第二意见)、企业托管插件、以及带 /chronicle 的语义搜索——表明 GitHub 正大力投资基于 CLI 的工作流。JamesMontemagno 不小心接手自动更新组件的事确认了活跃的内部开发势头。(来源

  6. 氛围编程真正有用的定位是非正经的、一次性的工具。 cyb3rops 的论点(10 赞,537 浏览)——"比如 IDA Pro,但我可以在 Roblox 里走过函数图"——提供了迄今最有建设性的框架。同时,aryanlabde 的现实检验("花了 200 美元,赚了 0 美元")和 WSJ 的报道确认氛围编程适合构建但不适合分发。市场正在分化为创意探索(cyb3rops)和生产抱负(seelffff 的 2 亿美元 ARR 数据)。(来源