Twitter AI Coding - 2026-05-24¶
1. 人们在讨论什么¶
1.1 Antigravity 收到的怀疑多过信任 🡖¶
Google 的 Antigravity 依然很显眼,但证据重心更偏向挫败感,而不是采用证明。互动量最高的帖子,是一则对 Google AI 周的广泛抱怨;而当天被重复最多的 Antigravity 讨论串,则在多个账号间重复了同样的 NotebookLM 搭配、搭建时间和 4 个用例。这让整场讨论看起来像是分裂在重分发的宣传和未解决的产品摩擦之间。
@ishuagra02 认为(380 次点赞、43 条回复、30,706 次浏览、52 次收藏),Google 这周“糟透了”,他尤其点名 Gemini 3.5 Flash 令人失望、Antigravity CLI 坏掉且闭源,而 Google Cloud 对 Railway 的处理也让人无法接受。
@jackcoder0 声称(50 次点赞、30 条回复、12,018 次浏览、25 次收藏),NotebookLM 加上 Antigravity 可以做自治式深度研究、自定义业务技能、上下文感知应用和自动报告;而 @Heykazitarek 则用 几乎同样的配置和用例清单(41 次点赞、13 条回复、1,137 次浏览、28 次收藏)讲了几乎一模一样的故事。
@koltregaskes 抱怨(9 次点赞、6 条回复、864 次浏览)称,Antigravity 2.0 依然没有真正实用的自动模式,就算权限已经设为允许,仍会不断强迫用户点批准。

讨论要点: 那些反复出现的 NotebookLM 讨论串,把看多的一面讲得很细,但回复区和单独的抱怨帖,又不断把讨论拉回信任、权限,以及 Google 到底有没有交付出更顺滑的工作流。
与前日对比: 5 月 23 日的 Antigravity 仍是一个正反混杂的故事,仍有积极辩护者。到了 5 月 24 日,最高强度的互动进一步转向反弹情绪,而正面论据主要出现在重复的搭建讨论串里,而不是新的独立证明点中。
1.2 模型路由和账号可移植性,正在变成默认预期 🡕¶
最清晰的正向构建者趋势是:编程智能体越来越按它们路由账号、订阅和本地模型的能力来被评价。证据横跨一张基于 1,400 条回复的使用分布图、展示订阅切换的 Pi 截图、Codex 的本地模型演示,以及 OpenCode 持续扩大的提供商覆盖面。
@rauchg 表示(144 次点赞、30 条回复、16,753 次浏览、29 次收藏),在处理了 1,400 条关于“人们用 AI 构建了什么产品”的回复后,OpenAI 正在追近 Anthropic,Codex 在智能体名称提及数上超过了 Claude Code,而 Anthropic 模型仍然主导着模型层。

@morganlinton 展示 了 Pi 的做法(29 次点赞、8 条回复、2,807 次浏览、9 次收藏):用户既可以从订阅开始,也可以从 API key 开始,然后在 Anthropic、ChatGPT / Codex 和 GitHub Copilot 账号之间切换。


@RoundtableSpace 表示(83 次点赞、10 条回复、48,453 次浏览、26 次收藏),只要“3 行配置”,就能让 Codex 通过 Ollama 指向 Gemma 4;与此同时,@teslaownersSV 发帖(36 次点赞、6 条回复、2,125 次浏览)称,Grok 或 X Premium 现在也能在 OpenCode 里使用。公开的 OpenCode 网站 把 OpenCode 描述成一个面向终端、IDE 和桌面的开源编程智能体,支持 GitHub Copilot 登录、ChatGPT Plus 或 Pro 登录,以及通过 Models.dev 接入 75+ 个提供商。

@LyalinDotCom 补充(13 次点赞、627 次浏览),Codex、Gemini CLI 和 OpenCode 都足够开放,值得学习。这些仓库也印证了这一点:openai/codex 把自己描述成轻量级终端编程智能体,google-gemini/gemini-cli 把自己描述成开源终端 AI 智能体,而 anomalyco/opencode 则把自己描述成“开源编程智能体”。
讨论要点: 这些路由帖子下面的回复,并没有把“切换”当成稀奇能力,而是把它视作新常态。本地 Qwen 或 Gemma 配置、复用现有订阅,以及模型可移植性,都被当成了务实的默认基线。
与前日对比: 5 月 23 日已经把编程智能体视为可移植的运行框架。5 月 24 日则把这一点从抽象讨论推进到了更具体的认证界面、仓库链接和订阅路由演示。
1.3 构建者正把技能打包成狭窄工作流产品,而不只是通用编程 🡕¶
本周前几天出现的技能趋势,继续收缩成更具体的工作流包。构建者分享的已经不是泛泛的提示词建议,而是围绕品牌工作、SEO、运营和 n8n 自动化的可安装库,这说明智能体外围的打包层正在变得更专业化。
@tom_doerr 分享 了一组 99 个、与技术栈无关的 Claude Code 技能(11 次点赞、1 条回复、775 次浏览、15 次收藏),覆盖品牌、设计、SEO 和运营。链接的 rampstackco/claude-skills 仓库把自己描述成一套全生命周期 Claude Skills 库,用于构建、发布、运营和增长品牌与网站。

@tom_doerr 当天稍后还分享了 一个聚焦 n8n 的技能包(2 次点赞、132 次浏览)。链接的 czlonkowski/n8n-skills 仓库写道,它包含 7 个互补的 Claude Code 技能,用于通过 n8n-mcp 服务器构建可投入生产的 n8n 工作流,并明确针对验证循环、错误的 MCP 使用方式,以及节点配置错误。

@Hesamation 分享 了一份 8 分钟指南(9 次点赞、1 条回复、231 次浏览、6 次收藏),讲解 Codex、Claude Code 这类智能体运行框架,并把运行框架层本身讲成一种值得独立学习的东西,而不是附属于某个单独模型的技巧。
讨论要点: 共同的动作已经不是“这是我的提示词”,而是“这是我可安装的包、解释器,或面向特定工作流的那一层”。这进一步强化了一个趋势:杠杆正转移到可复用的上下文和工具体系里。
与前日对比: 5 月 23 日把技能和 MCP 推成产品表面。5 月 24 日则把这个趋势继续推进到更窄、更偏运营的技能包,明确瞄准生命周期营销和 n8n 自动化这类具体工作。
2. 令人困扰的问题¶
Antigravity 仍把自动化变成审批劳动¶
严重程度:高。围绕 Google 最强烈的不满,不是抽象的模型质量,而是工作流阻力。@koltregaskes 表示(9 次点赞、6 条回复、864 次浏览),即便已经把权限设为允许,Antigravity 2.0 仍会一遍又一遍地要求同样的批准,并强迫用户既要做选择、又要再点一次提交。@ishuagra02 则说(380 次点赞、43 条回复、30,706 次浏览、52 次收藏),这个 CLI 既坏掉又闭源,并把这条抱怨纳入了对 Google AI 周的更广泛控诉。今天的应对方式,与其说是绕行方案,不如说是公开的沮丧发泄。这个方向值得做,因为失效点恰好落在内循环里:如果批准不能保持生效,智能体就永远不会让人觉得是自治的。
重上下文的 Codex 会话,仍会在最糟的时候失败¶
严重程度:中高。@zerotalktoai 展示 了 Codex 在一次远程压缩任务中返回 context_length_exceeded(3 次点赞、4 条回复、75 次浏览),随后表示,实际的绕行办法只能是在客户项目已经跑起来的时候重新开一个新聊天。截图之所以重要,是因为它把一种含糊的可靠性抱怨,变成了活跃会话中的具体失效模式。

这个方向值得做,因为痛点不是表面体验问题,而是运营问题:一旦会话断掉,用户失去的是心流、连续性,以及对长时工作的信任。
套餐档位里的模型访问权,比品牌更在塑造感知价值¶
严重程度:中。@cheatyyyy 抱怨(15 次点赞、3 条回复、806 次浏览),GitHub Copilot 学生套餐暴露出来的是一个偏旧、偏 mini 的模型列表,而不是前沿选项。@morganlinton 展示 了为什么这件事重要(29 次点赞、8 条回复、2,807 次浏览、9 次收藏):Pi 的路由流程明确把 Anthropic、ChatGPT / Codex 和 GitHub Copilot 订阅当成可以互相比较、来回切换的输入。

当用户已经能在不同套餐间路由时,受限的模型菜单会立刻变成竞争劣势。这使得它既值得从定价透明度问题来做,也值得从路由 / 仪表盘问题来做。
3. 人们期望的功能¶
真正持久的自动模式,而不是没完没了的一次性批准¶
信息流里最直接的请求,就是一个真正的自动模式。@koltregaskes 明确追问,Antigravity 2.0 的自动模式到底在哪儿,并表示应该用一键批准取代现在这种“先选再提交”的循环。这不是一个愿景式诉求,而是实打实的实际需求。机会:直接。
面向订阅、模型和路由的中立控制平面¶
人们已经在按“模型访问权应该能跨工具迁移”这一前提行事。@morganlinton 展示 了 Pi 在 Anthropic、ChatGPT / Codex 和 GitHub Copilot 账号之间切换,而 @cheatyyyy 则把 Copilot 的学生套餐描述成缺乏吸引力,因为它的模型菜单落后于市场。缺失的那一层,是一个清晰的仪表盘:告诉用户每个套餐到底解锁了什么、哪些内容已经陈旧,以及什么时候改走别的路由更划算。机会:直接且具竞争性。
可审计、可跨智能体客户端迁移的技能包¶
围绕技能的构建活动,已经越来越像在说明一个打包缺口。@tom_doerr 抛出 了一个 99 技能的 Claude 工作流库,同一天稍后又 分享 了一个围绕 n8n-mcp 构建的 n8n 专用技能包。现在的需求已经不再是“给我一个提示词”,而是“给我一个可安装、可信赖的工作流模块”。机会:直接。
会优雅失败而不是直接重置的长时会话¶
@zerotalktoai 描述 说,在真实客户项目已经跑起来时,Codex 因上下文窗口失败后,他不得不重开一个新聊天。这指向了缺失的恢复层:无论是压缩、检查点,还是交接,核心都该是保住任务状态,而不是逼用户手动重来。机会:具竞争性。
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| OpenAI Codex | 编程智能体 | (+/-) | 在 1,400 条回复图表里讨论存在感很强;仓库把它定位成开源终端智能体;用户演示中可路由到本地模型 | 实时工作里仍会出现上下文窗口失败;使用和路由看起来仍很即兴 |
| Google Antigravity | 智能体 IDE / 运行时 | (+/-) | 经常与 NotebookLM 搭配,用于研究、自定义技能、应用生成和报告工作流 | “坏掉 / 闭源”的抱怨、批准摩擦和重复宣传文案削弱了信任 |
| NotebookLM | 研究 / 上下文工具 | (+) | 在 Antigravity 讨论串中充当深度研究、笔记本生成和内容输出的源层 | 今天的证据主要是打包式配对帖子,而不是独立的编程证据 |
| Pi | 路由运行框架 | (+) | 允许用户从订阅或 API key 起步,并在 Anthropic、ChatGPT / Codex 和 Copilot 账号之间切换 | 今天的价值主张主要是路由,不是独特编程能力 |
| OpenCode | 开源编程智能体 | (+) | 公开网站承诺提供终端、桌面和 IDE 界面,以及 GitHub、ChatGPT 和多提供商认证;Grok 集成扩展了其提供商叙事 | 今天的大多数证据仍集中在配置和集成截图,而不是深入的构建案例研究 |
| Claude Code | 编程智能体 | (+) | 影响力依然足够大,能催生大型技能库和 n8n 工作流包;在 rauchg 的图表里,Anthropic 模型主导模型层 | 用户仍在寻找更便宜的路由、更窄的工作流包,或围绕它的替代运行框架 |
| GitHub Copilot | 编程助手 / 运行框架 | (+/-) | 在路由工具里仍有可见度,也出现在 AI 辅助 Linux 内核补丁报道中 | 学生套餐的模型可用性相较竞品显得陈旧 |
| Gemini CLI | 开源编程智能体 | (+) | 公开仓库把它定位成支持 MCP 且具备大上下文的开源终端智能体 | 当天讨论更集中在 Antigravity 的抱怨,而不是 Gemini CLI 自身的使用 |
当工具提升可移植性,或把工作流知识打包出来时,整体满意度最高;当价值被批准流程、过期套餐档位或脆弱会话行为遮住时,满意度最低。实际的迁移模式,并不是从工具 A 干净利落地切到工具 B,而是路由:通过 Pi 或 OpenCode 复用现有订阅,经由 Ollama 测试本地模型,并把专用技能包继续叠加在那个还算可用的运行框架之上。
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| Claude Skills | rampstackco | 面向品牌、设计、SEO、运营以及网站生命周期工作的打包 Claude 工作流库 | 通用编程智能体在非代码网页工作中,仍需要可复用的领域上下文 | Claude Skills, Claude Code, repo language Python | 已发布 | 仓库 |
| n8n-skills | czlonkowski | 通过 n8n-mcp 构建 n8n 工作流的 7 个 Claude Code 技能 |
生成 n8n 工作流时,常会卡在验证循环、错误的 MCP 使用方式和节点配置错误上 | Claude Code, n8n-mcp, n8n, Shell |
已发布 | 仓库 |
| OpenCode | anomalyco | 可在终端、IDE 和桌面运行、并带多提供商认证的开源编程智能体 | 开发者想要一个既能复用现有订阅、又能切换提供商而无需更换产品的运行框架 | TypeScript, Models.dev provider routing, GitHub / ChatGPT auth | 已发布 | 网站, 仓库 |
@tom_doerr 分享 了 Claude Skills(11 次点赞、1 条回复、775 次浏览、15 次收藏),把它做成一个 99 技能、与技术栈无关的库;而链接仓库则把它讲成一套面向网站或品牌发布与增长的全生命周期支持,而不只是帮人写应用代码。这是一个值得注意的模式:构建者正在打包的是外围业务工作,而不只是编码命令。
@tom_doerr 又在同一天稍后分享了 n8n-skills(2 次点赞、132 次浏览),而仓库明确写道,它存在的目的,就是教会 Claude Code 在构建工作流时,避免错误使用 MCP 和陷入验证报错循环。正因为这个仓库就是为把有效行为迁移到重复任务里而设计的,所以它比一篇泛泛教程更像一个强工件。
OpenCode 不是作为新发布被介绍的,但它被分享出来时,已经是一套正在运行的可移植性基础设施。@teslaownersSV 发帖(36 次点赞、6 条回复、2,125 次浏览)展示了 Grok-in-OpenCode 的配置,而 OpenCode 网站 则写明,该产品已经支持 GitHub Copilot 登录、ChatGPT Plus 或 Pro 登录、75+ 个提供商,以及终端 / 桌面 / IDE 界面。贯穿这 3 个案例的重复构建模式非常清楚:人们正在既有智能体外围构建包装层、技能层和路由层,而不是试图再发明一个新的基础模型。
6. 新动态与亮点¶
AI 辅助的 Linux 内核修复,继续出现在每周补丁流中¶
@phoronix 报道(16 次点赞、1,100 次浏览)称,本周 GitHub Copilot 和 Claude Code 又协助修复了一批 Linux 7.1-rc5 问题。链接的 Phoronix 文章 写道,受影响的领域包括图形、WiFi、AMD 显示、SMB、Netfilter、sysfs、IO_uring 和 Bluetooth,并引导读者去看那些带有 Assisted-by: 标记的内核历史。这很重要,因为它说明 AI 编程工具已经出现在高信任、接近生产的代码库里,而不只是演示场景。
开源运行框架如今成了默认参照系¶
@LyalinDotCom 发帖(13 次点赞、627 次浏览),称 Codex、Gemini CLI 和 OpenCode 都足够开放,值得学习。这些仓库把这点说得更具体:openai/codex 在抓取时大约有 85k stars,google-gemini/gemini-cli 大约有 104k,而 anomalyco/opencode 大约有 164k。这一点之所以值得注意,是因为比较对象已经从封闭产品页,转向了开发者可以直接检查的源码可见运行框架。
7. 机会在哪里¶
[+++] 跨运行框架的订阅与模型路由 — 第 1 节显示,Pi、Codex 和 OpenCode 都在按它们复用订阅、本地模型和提供商账号的能力来被评价。第 4 节则显示,套餐菜单和路由灵活性,如今对感知价值的影响已经和模型质量一样大。
[++] 带可审计性的工作流专用技能包 — 第 5 节里最强的构建者信号,并不是新模型,而是 Claude Skills 和 n8n-skills 这类可复用库:它们把领域知识和 MCP 行为打包成可安装模块。
[+] 面向智能体批准、压缩和恢复的可靠性工具 — 第 2 节点出了 Antigravity 里反复出现的批准提示,以及 Codex 中上下文窗口失败的问题。这个机会正在涌现,因为这些失效非常具体,但今天的证据仍主要集中在零散投诉,而不是广泛的新项目发布上。
8. 要点总结¶
- Google 赢得了注意力,却没赢得信任。 当天最大的 Google / Antigravity 信号,是一条高互动抱怨帖;而正面论据大多出现在重复的 NotebookLM 搭配讨论串里,而不是新的独立证明中。(source)
- 模型路由已经变成核心产品能力。 Pi 的账号切换、Codex 的本地模型演示,以及 OpenCode 的多提供商界面,都说明可移植性正在变成基本门槛。(source)
- 可复用技能正在变成真正的软件类别。 Claude Skills 和 n8n-skills 说明,构建者正在把工作流知识打包成可安装单元,而不再把它留在口口相传的提示词里。(source)
- AI 编程的证据正在走出玩具示例。 Phoronix 那篇关于 Copilot 与 Claude Code 协助 Linux 内核修复的报道,比又一条演示讨论串更像生产级信号。(source)