跳转至

Twitter AI Coding - 2026-06-07

1. 人们在讨论什么

1.1 运行框架设计压过了模型讨论 🡕

6 月 7 日最强的一批帖子认为,决定表现的主层已经不再只是基础模型。大家反复提到的差异化因素,是记忆文件、规划阶段、MCP 接线、工具命名、压缩策略和推理服务选择。4 条留存条目支持了这一主题。

@Suryanshti777 认为(108 次点赞、16 条回复、4,910 次浏览、110 次收藏),Claude Code 用户如今分成两派:一派把它当成更聪明的 Copilot 来用,另一派则给它配上记忆、规划阶段、专用 MCP,以及为每个开发阶段预写的提示词。特别之处并不在于某个模型突然变得神奇了,而在于 plan -> code -> review -> test -> document 必须被编码成一套系统。

@usr_bin_roygbiv 写道(82 次点赞、20 条回复、3,037 次浏览、79 次收藏),人们一直在把运行框架、模型和推理服务混为一谈。他认为,相比更轻的运行框架,Claude Code 或 Codex 会消耗多得多的 token,因为工具调用、系统提示词和编辑策略会直接改变工作流本身;而一条回复把这一点说得很透:很多看似在评价模型的观点,本质上其实是在评价外层封装。

@JamesMontemagno 表示(7 次点赞、2 条回复、766 次浏览、5 次收藏),工具集很快会变得重要起来,而链接的 VS Code 改动《Support qualified tool names in user tool sets》加入了完整引用查找,以及针对工具集通配符和嵌套工具引用等限定名的测试(PR)。这只是一个小而具体的已发布细节,但它再次强化了同一个判断:竞争层正在转移到运行框架及其工具语法上。

@championswimmer 反驳(149 次点赞、15 条回复、22,128 次浏览、90 次收藏)了 Boris Cherny 的“write loops”说法,认为当前智能体化系统的质量和能力还没到位,并点名 OpenCode、Pi、Amp 和 Goose 是值得一试的替代方案。回复串补上了一个重要细节:有人说真正的问题不是缺测试,而是这些循环在合并前根本没有任何否决机制。

讨论要点: 最有价值的分歧不在于谁的基准测试领先,而在于失败究竟出在哪一层:模型本身、外层封装,还是阻止坏结果继续累积的审查闸口。

与前日对比: 6 月 6 日已经把 spec、技能和画布的重要性抬到原始上下文长度之上。到了 6 月 7 日,这种运行框架—模型—推理服务的拆分被明确说了出来,并成了当天最清晰的从业者论点。

1.2 访问路径套利成了工作流的一部分 🡕

关于经济性的讨论继续远离对价格的抽象抱怨,转向更具体的绕行方式。大家不再问哪个助手“值得付费”,而是开始强调捆绑访问、用户自带 key 的工具,以及不收席位费的替代方案。2 条留存条目支持了这一主题。

@hqmank 发帖(579 次点赞、100 条回复、117,160 次浏览、329 次收藏),Google AI Pro 订阅者可以在 Antigravity 里使用 Claude Opus 4.6。回复的重要性和原帖一样高:有人纠正说这个模型自 2 月 5 日起就已经在那里了,而 @hqmank 回应说,价值只在于又多了一条使用 Opus 的路径。这让这个信号从发布新闻变成了访问路径选择。

Antigravity 模型选择器,显示 Claude Opus 4.6 与 Gemini 3.5 和 GPT-OSS 选项并列列出

@heynavtoor 认为(27 次点赞、7 条回复、4,501 次浏览、39 次收藏),Copilot 和 Cursor 的定价如今意味着“到了 2026 年,你做 AI 编程已经得按配额来”,然后把 Cline 当成反例。截图和 Cline 的公开界面解释了为何这个对比会引发共鸣:这个项目把 CLI、web Kanban、VS Code 扩展、JetBrains 插件和 SDK,与按提供商直接计费的模型账单绑在一起,而不是再套一层按席位收费的封装(仓库)。

Cline README 截图,展示同一编程智能体产品的 CLI、Kanban、VS Code 扩展、JetBrains 插件和 SDK 界面

讨论要点: Antigravity 那条帖子下信息量最大的一条回复,并没有在庆祝什么新功能。它纠正了时间线,却仍然说明了同一种行为:人们更在意可用的访问路径,而不是发布本身的新鲜感。

与前日对比: 6 月 6 日仍把定价压力放在中心位置。到了 6 月 7 日,这种行为又进一步转向了找捆绑包、按提供商直接计费,以及那类既保留工作流又改变收费对象的开源封装。

1.3 构建者开始打包更广的智能体工作界面和可复用系统 🡕

构建者帖子越来越不像提示词技巧,更像在搭运行环境。值得注意的项目在打包的是更广的工作界面、跨平台安装方式或可复用的智能体系统,而不只是又一个聊天工作流。4 条留存条目支持了这一主题。

@sharbel 展示(175 次点赞、21 条回复、8,999 次浏览、294 次收藏)了 /last30days,这是一个会并行搜索 Reddit、X、YouTube、HN、TikTok、Polymarket、GitHub 和网页,再先给结果打分、最后生成简报的技能。真正让它不止于炒作的是截图和公开仓库:README 展示了 Claude Code 的单独安装流程,以及通过 npx skills 安装到 Codex、Cursor、Copilot、Gemini CLI 和 50+ 个 Agent Skills 宿主的流程;仓库还解释说,Reddit、HN、Polymarket 和 GitHub 可立即使用,而 X、YouTube 和 TikTok 则需要额外的可选设置(仓库)。

/last30days 的 README 截图,显示面向 Claude Code 以及 Codex、Cursor、Copilot、Gemini CLI 等 Agent Skills 宿主的安装命令

@_Evan_Boyle 展示(34 次点赞、7 条回复、3,914 次浏览、27 次收藏)了 Copilot App 画布:由智能体创建、支持热重载的应用。回复补上了关键细节:终端、浏览器和 Markdown 编辑器都算智能体画布,而自定义画布则是能控制会话并通过 Copilot SDK 暴露工具的 JavaScript/HTML 扩展。

@RoundtableSpace 分享(49 次点赞、11 条回复、32,790 次浏览、29 次收藏)了一份开源的 Claude Code 操作手册,它能把一个智能体变成拥有安全、记忆、规划和代码审查子智能体的工程团队。ECC 仓库则把这句话落到了实处:它把自己描述成一个原生面向运行框架的操作系统,包含技能、记忆优化、持续学习、安全扫描,以及覆盖 Codex、Claude Code、Cursor、OpenCode、Gemini、Zed 和 GitHub Copilot 的跨运行框架工作流(仓库)。

@rohanpaul_ai 报道(41 次点赞、8 条回复、3,236 次浏览),OpenAI 正在为编程、智能体、图像生成和商业软件准备一个 ChatGPT 超级应用。Livemint 转引《Financial Times》的报道补充说,这次推出将从 ChatGPT 网页端和移动端开始,让 Codex 占据更显眼的位置,并把用户引向编程、图像生成以及 Canva、Booking.com 等合作方应用(文章)。

讨论要点: 共同的目标不是更多聊天,而是一个可复用的界面,能跨 repo 工作、工具、浏览器和外部服务延续,而不丢掉智能体上下文。

与前日对比: 6 月 6 日强调的是 spec、技能、画布和具体基础设施。到了 6 月 7 日,这条线又扩展到了可安装的跨运行框架系统,以及更大的超级应用式界面。


2. 令人困扰的问题

计费和席位模式仍让 AI 编程像被配给

严重程度:高。@heynavtoor 认为(27 次点赞、7 条回复、4,501 次浏览、39 次收藏),Copilot 和 Cursor 的定价加上超额收费,意味着开发者已经不得不按配额使用 AI 编程;而 @hqmank 展示(579 次点赞、100 条回复、117,160 次浏览、329 次收藏)了 Antigravity 里另一条可用的 Opus 路径,回复关注的重点也不是新鲜感,而是这条访问路径本身。今天最清晰的应对模式,是转向 Google AI Pro + Antigravity 这类捆绑方案,或 Cline 这样的按提供商直接计费开源封装。这个问题值得构建,因为用户已经开始围绕计费边界重新设计工具选择,而不再是围绕品牌忠诚度做决定。

更好的模型,仍在脆弱的运行框架里被评判

严重程度:高。@usr_bin_roygbiv 认为(82 次点赞、20 条回复、3,037 次浏览、79 次收藏),许多日常失败其实来自运行框架或推理服务层,而不是模型本身;回复也强化了这一点:很多对模型的意见,其实是在评价外层封装。@championswimmer 则反驳(149 次点赞、15 条回复、22,128 次浏览、90 次收藏),认为 Claude Code 的质量和能力还没到位,而 @JamesMontemagno 指出(7 次点赞、2 条回复、766 次浏览、5 次收藏)一个正在推进中的具体修补点:限定工具名。这个问题值得构建,因为这种失败模式会反复出现:用户不断把责任归到模型头上,但问题其实出在工具语法、外层封装、审查流程或基础设施选择上。

更智能体化的工作流会制造监督缺口

严重程度:中。@Suryanshti777 描述(108 次点赞、16 条回复、4,910 次浏览、110 次收藏)了一种高表现配置:多阶段、记忆和专用 MCP 的组合;而 @_Evan_Boyle 展示(34 次点赞、7 条回复、3,914 次浏览、27 次收藏)的 Copilot 界面,则让浏览器、终端和 Markdown 面板都变成了智能体画布。在这种背景下,@mksglu 发布(5 次点赞、4 条回复、102 次浏览)了 Context Mode Insight,试图在不存储提示词或源代码的前提下,回答谁卡住了、团队之间如何比较,以及哪些会话最可能产出最终交付的 commit。这个问题值得构建,因为团队采用的智能体界面越多,没有新的观测层,就越难弄清到底发生了什么。


3. 人们期望的功能

可移植的智能体操作系统,而不是一次性的提示词堆栈

人们要的东西既务实又立刻可用。@Suryanshti777 (108 次点赞、16 条回复、4,910 次浏览、110 次收藏)性能理解成记忆、规划和专用 MCP 的组合,@sharbel (175 次点赞、21 条回复、8,999 次浏览、294 次收藏)一个研究技能分发到了 Claude Code 和许多其他宿主上,而 ECC 则把子智能体、记忆和安全规则打包成了一个可复用系统(仓库)。缺的那一层,是一种可以配置一次、再带着跨运行框架使用的层,而不是在每个工具里把同一套指令重建一遍。机会:直接且有竞争性。

清晰的 BYOK 路由与预算可见性

人们其实是在要一个既能保住工作流、又能把计费讲清楚的统一界面。@hqmank 看重(579 次点赞、100 条回复、117,160 次浏览、329 次收藏)的是 Antigravity 里另一条可靠的 Opus 访问路径,而 @heynavtoor 则把(27 次点赞、7 条回复、4,501 次浏览、39 次收藏)席位费和超额收费,与 Cline 按提供商直接计费的模型账单做了对比。捆绑套餐和开源封装今天已经部分满足了这个需求,但还没有提供一个可跨工具稳定成立的抽象层。机会:直接。

保持可检查的共享工作界面

构建者希望智能体待在一个看得见、能引导的界面上,而不是困在一个不透明的聊天窗里。@_Evan_Boyle 展示(34 次点赞、7 条回复、3,914 次浏览、27 次收藏)了能热重载、并把工具重新暴露回会话的画布,而 @rohanpaul_ai 概括(41 次点赞、8 条回复、3,236 次浏览)了一款据报道中的 OpenAI 超级应用:它会从同一个界面把人引向编程、图像生成和合作方应用。缺的不是野心,而是这样一种共享界面:随着更多工具被收进同一产品,它仍然可检查、可引导、可组合。机会:有竞争性。

不泄露源码的团队可观测性

最清晰的新兴需求,来自 @mksglu 推介(5 次点赞、4 条回复、102 次浏览)的一套东西:基于 15 种编程工具结构化事件的仪表盘、REST API 和远程 MCP 访问,而且明确避免采集提示词和源代码。这说明它瞄准的是一种实际需求,而不是虚荣指标:管理者想要的是进展和风险信号,而不是又一个监控味很重的智能体封装。这里的证据比其他需求类别更薄,但这个框架足够具体,因而值得注意。机会:新兴。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
Claude Code 智能体 CLI (+/-) 配上记忆、规划、MCP 和审查阶段后表现很强 用户仍报告输出有 bug、token 消耗重,而且循环常常过度自信
Google Antigravity 智能体工作区 (+/-) 以 UI 为先,模型选择多,Google AI Pro 用户还能捆绑使用 Opus 可发现性不均,而且批评者认为框架质量可能落后于模型质量
GitHub Copilot / Copilot App IDE 智能体 / 工作区 (+/-) 画布、Cloud Agent 工具集、热重载界面,加上强编辑器集成 按用量计费,加上仍在演进的工具集体验,让用户感到挫败
Cline 开源编程智能体 (+) CLI、Kanban、VS Code、JetBrains、SDK、提供商选择和人工审批一应俱全 用户仍需自己管理提供商 key 和模型花费
/last30days 研究技能 (+) 跨平台搜索、按互动量加权评分、可安装到多种宿主 一些来源在初始设置后仍需要用户 key 或浏览器会话
ECC 智能体操作系统 (+) 跨运行框架技能、子智能体、记忆优化、安全扫描、持续学习 功能面很大,配置复杂度本身就是学习曲线的一部分
Agent Skills / 用户工具集 打包 / 工具选择 (+) 行为可移植、安装入口可复用,工具和工具集支持限定命名 支持仍不均衡,而且命名底层仍在修补
Context Mode Insight 分析 / 治理 (+) 在不收集提示词或源代码的前提下,查看 15 种工具的结构化事件 仍属早期信号,除发布帖外公开证据有限

总体评价最偏正面的是那些提升可移植性或降低成本的封装层;最复杂、正负参半的则是高价旗舰界面。共同的绕行方式,是在模型外围加更多结构:记忆文件、规划阶段、技能、带命名空间的工具集,或按提供商直连的路由。迁移路径继续从编辑器自动补全转向智能体系统,也从平铺的席位订阅转向捆绑包或 BYOK 封装。如今主要的竞争分野,是一边的大平台试图吃下整个工作界面,另一边的开放系统则让这些平台更便宜或更可控。


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
/last30days mvanhorn 由智能体驱动的跨平台搜索技能,会先给 Reddit、X、YouTube、TikTok、HN、Polymarket、GitHub 和网页证据打分,再综合生成简报 打通没有任何单一助手能原生搜索的封闭来源 Agent Skill、分来源连接器、浏览器会话和 API key 桥接、排序 + 综合流水线 已发布 仓库, 推文
ECC affaan-m 跨运行框架的操作系统,包含技能、子智能体、记忆和安全工作流 把一次编程智能体会话变成可复用的工程系统 技能、hooks、MCP 配置、记忆优化、shell 加多语言界面 Beta 仓库, 推文
Cline cline 跨终端、Kanban、编辑器插件和 SDK 界面的编程智能体产品 在保留完整智能体工作流的同时,避免被席位费锁死 CLI、web Kanban、VS Code 扩展、JetBrains 插件、SDK、与提供商无关的模型层 已发布 仓库, 推文
Copilot Canvases GitHub 由智能体创建、可热重载、带会话感知的窗格,并把工具重新暴露给智能体 给智能体工作一个共享 UI,而不是把它埋在聊天里 GitHub Copilot App、JavaScript/HTML 画布、Copilot SDK Beta 推文
Context Mode Insight @mksglu 覆盖结构化 AI 编程事件的仪表盘/API/MCP 层 帮团队看清谁卡住了,以及哪些会话更可能产出已交付工作 结构化事件采集、仪表盘、REST API、远程 MCP Beta 推文

/last30days 和 ECC 从不同角度展示了同一种构建模式:把缺失的协调能力打包成一个可安装系统,而不是让用户再去记更多提示词。前者打包的是碎片化的社交与仓库搜索,后者则把多智能体工程行为、记忆和安全护栏收进一层可复用的操作层。

Cline 和 Copilot Canvases 说明,UI 界面本身已经成了产品的一部分。Cline 把一套智能体体验拉伸到终端、看板、编辑器插件和 SDK 上;GitHub 则把浏览器、终端和 Markdown 窗格变成智能体可以直接操作的画布。两种情况下,产品都不再只是模型回复,而是工作真正发生的地方。

Context Mode Insight 指向了智能体在团队中铺开之后的下一种构建模式:可观测性。这些项目反复回应的触发因素,不是原始自动补全质量,而是可移植性、成本控制、共享上下文和可见性。


6. 新动态与亮点

据报道,OpenAI 的 ChatGPT 改版把向 Codex 转向说透了

@rohanpaul_ai 报道(41 次点赞、8 条回复、3,236 次浏览),OpenAI 正在为编程、智能体、图像生成和商业软件准备一个更广的 ChatGPT 界面。Livemint 对《Financial Times》报道的摘要补充了具体细节:预计会先从 ChatGPT 网页端和移动端开始推出,而 OpenAI 想把用户引向编程、图像生成,以及 Canva、Booking.com 等合作方应用(文章)。

Copilot Cloud Agent 悄悄把工具定义得更精确了

@JamesMontemagno 表示(7 次点赞、2 条回复、766 次浏览、5 次收藏),工具集很快会变得重要起来,而链接的公开补丁正好说明了原因。PR 320265 增加了对用户工具集里限定工具名的支持,把解析方式转向完整引用名,并为限定工具引用和工具集引用补上了测试。这是一个小但有意义的信号:智能体工具链正在从松散标签走向带命名空间的契约(PR)。


7. 机会在哪里

[+++] 跨运行框架的智能体操作系统 — 证据横跨第 1、3、4 和 5 节:Suryanshti 的记忆 + 规划配置、/last30days、ECC,以及限定工具集命名,都指向对可复用行为的需求——它必须能跨运行框架延续。这类机会很强,因为用户和构建者正在从两端收敛到同一个缺失层。

[++] 预算感知的 BYOK 工作界面 — 证据来自 Antigravity 里捆绑的 Opus 访问、对 Copilot/Cursor 成本的批评,以及 Cline 的按提供商直接计费模型。这类机会为中等,因为痛点已经在改变行为,但许多局部封装也在快速冒出来。

[++] 可检查的共享画布与超级应用 — 证据来自 Copilot Canvases、据报道的 ChatGPT 超级应用改版,以及更广泛地推动把浏览器、终端、Markdown 和智能体工作合到一个界面上的趋势。这类机会为中等,因为平台推进得很快,但可检查性和引导能力仍未解决。

[+] 不采集源码的团队可观测性 — 证据主要来自 Context Mode Insight,以及多阶段、多界面智能体工作流的整体上升。这类机会仍在浮现,因为需求很具体,但今天的公开证据仍主要集中在一条发布帖上。


8. 要点总结

  1. 6 月 7 日最强的帖子把运行框架当成了产品本身。 反复出现的杠杆不是单纯的模型偏好,而是记忆、规划、MCP 接线、限定工具名、压缩和审查循环。(来源
  2. 定价压力现在驱动的是路由行为,而不只是抱怨。 Antigravity 里捆绑的 Opus 访问,以及 Cline 这类按提供商直连的替代方案,都被当成工作流决策来看待。(来源
  3. 构建者正在打包可复用系统,而不是一次性的提示词套件。 /last30days、ECC 和 Copilot Canvases 都把重复行为变成了可安装或可检查的界面。(来源
  4. 大平台想把工作界面做得更宽,但用户仍然要求可检查性。 Copilot Canvases 和据报道中的 ChatGPT 超级应用都指向了更大的 AI 工作界面,而当天对运行框架的批评则说明,为什么可见性仍然重要。(来源