跳转至

Twitter AI Coding - 2026-06-10

1. 人们在讨论什么

1.1 GitHub Copilot App 已从发布叙事转向日常控制界面 🡕

6 月 10 日的讨论不再把 GitHub Copilot App 当作一个预览期的新奇玩意,而是把它视为智能体工作已经开始被组织、审查和交付的地方。四条保留内容支撑了这一主题。

@github 宣布(205 次点赞、22 条回复、19,094 次浏览、48 次收藏),GitHub Copilot App 技术预览版已向 Copilot Pro、Pro+、Max、Business 和 Enterprise 套餐开放。关联的发布文章把定位讲得很具体:My Work 仪表板用于查看活跃会话、议题、拉取请求和自动化;每个会话都有独立的 git worktree;Agent Merge 用于让 PR 穿过审查和检查;同时提供云端/本地沙箱,让智能体不仅能建议代码,还能实际运行并验证工作。

@JamesMontemagno 敦促大家去试试(34 次点赞、8 条回复、4,035 次浏览、12 次收藏),因为它“每天都在改变我的工作方式”。回复之所以有用,是因为它们立刻从热炒转向缺失界面:有人追问 remote SSH 支持,说明一旦这个应用变成日常工作界面,连接能力和环境覆盖范围就会和 UI 打磨同样重要。

@_Evan_Boyle 解释了“跨仓库支持”:它会把子会话生成到不同仓库中;与此同时,@burkeholland 展示了(12 次点赞、1 条回复、727 次浏览、5 次收藏),他用 Copilot App 把 ResizeMe 用 Go、Wails 和 HTML/CSS 重写成了一个 10 MB 的可执行文件(项目网站)。这两者的组合让“控制中心”这一说法更可信:信息流里既有产品机制,也有一个借助该界面真正交付的小工具。

讨论要点: 最重要的细微差别在于运行边界,而不是这个 app 是否存在。回复提到了定价、审查清晰度和缺失的远程工作流,这说明开发者已经在把它当作基础设施来评判。

与前日对比: 6 月 9 日把 Copilot App 描述为一个带 worktree 和 canvas 的智能体原生控制中心。6 月 10 日则通过更广泛开放预览,以及跨仓库编排和借助该界面交付应用的具体案例,把这个故事又往前推了一步。

1.2 Antigravity 持续从工作空间向平台运行时扩展 🡕

围绕 Google 的讨论不断把 Antigravity 从一个独立的 AI 界面推向 Search 和 Android 开发的更广泛运行时。三条保留内容支撑了这一主题。

@antigravity (749 次点赞、45 条回复、51,642 次浏览、225 次收藏)Antigravity 定位成一个“面向 Android 的智能体式开发平台”,方法是让用户安装 Android CLI 和技能等可选资源。后续回复之所以重要,是因为 Antigravity 自己贴出了 Pixel Emulator 和修复 stopwatch 的例子,同时有用户要求修复 IDE 中的智能体权限,另一位用户则抱怨 Gemini 3.5 Flash 消耗 token 太凶。这让这条帖子同时成为能力信号和访问摩擦信号。

@Google 表示(314 次点赞、23 条回复、46,042 次浏览、74 次收藏),Search 很快将借助 Antigravity 为持续性任务构建可持久存在的自定义体验,并将其描述为用户可以反复返回的小型应用。配套回复把上线范围收窄到美国的 Google AI Pro 和 Ultra 用户,而一条持怀疑态度的回复则表示,只有当进度真的能持久保存、隐私在真实使用中也站得住脚时,这个概念才有意义。

@Ayzacoder 放大传播了(55 次点赞、31 条回复、1,215 次浏览、15 次收藏)NotebookLM 与 Antigravity 搭配,用于自动化研究和内容工作。图片本身更多只是 logo 级别,但这条推文依然强化了一点:Antigravity 越来越多被描述成其他 Google 产品背后的工作层,而不是一个独立目的地。

讨论要点: 围绕 Antigravity 的张力并不在于认知度,而在于这个运行时是否已经准备好面对日常工作:权限、token 经济性、持久性和隐私立刻都被提了出来。

与前日对比: 6 月 9 日把 Antigravity 当作贯穿 Search、NotebookLM 和模型路由的接入层。6 月 10 日则把它收束成两个更清晰的产品方向:面向重复任务的 Search mini apps,以及面向 Android 的开发工作流。

1.3 模型竞争越来越看路由、治理和测试框架质量 🡕

最技术化的讨论已经不再只是“哪个前沿模型更强”。6 月 10 日的帖子不断把模型选择和企业策略、路由界面以及测试框架设计绑在一起。五条保留内容支撑了这一主题。

@tomwarren 提到(297 次点赞、17 条回复、27,656 次浏览、57 次收藏),由于 Anthropic 的数据保留问题,Microsoft 已限制员工在 GitHub Copilot 中使用 Claude Fable 5。关联的 《The Verge》报道称,其他 Claude 模型在内部仍可在零数据保留规则下使用;而 GitHub 自己的 Fable 5 更新日志 则确认,Fable 5 需要最长 30 天的提示词/输出保留,并按使用量计费。

@_LuoFuli 推出了(172 次点赞、18 条回复、5,278 次浏览、35 次收藏)MiMo Code,称其是 5 个人在 14 天内做出的开源编程智能体。关联的 repo 让它的独特角度非常具体:跨会话记忆、compose mode、子智能体、目标驱动循环,以及同时支持 MiMo 托管和 OpenAI 兼容提供商。这条帖子读起来更像是“新的测试框架原语”讨论,而不是“新模型”讨论。

@gitlawb 发布了(119 次点赞、11 条回复、3,189 次浏览、4 次收藏)OpenClaude v0.18.0,加入 /model auto 路由、上下文裁剪工具、REPL 会话中的回退模型,以及带元数据的 GitHub Copilot 模型完整信息。与此同时,@arakharazian 分享了(28 次点赞、1,494 次浏览、8 次收藏)6 月 Ramp AI Index,显示 Anthropic 约占 41% 的公司,而 OpenAI 在 Codex 发布后基本持平。

Ramp AI Index 图表显示,Anthropic 覆盖约 41% 的公司,而 OpenAI 在 Codex 发布后略有持平

讨论要点: 6 月 10 日的模型之争,真正争的其实是模型外面的系统:运行时能否自动路由、保住上下文、保持合规,并赢得企业信任?

与前日对比: 6 月 9 日聚焦于 Fable 5 的基准测试和发布当天的可用性。6 月 10 日依然关注模型竞争,但决定性证据已经转向数据保留规则、采用数据,以及围绕每个模型搭建的测试框架质量。


2. 令人困扰的问题

前沿模型策略会让最强模型在真实组织内部也无法使用

严重性:高。@tomwarren 提到(297 次点赞、17 条回复、27,656 次浏览、57 次收藏),Microsoft 之所以限制 Claude Fable 5 的内部使用,是因为 Anthropic 的保留条款正在接受法务团队审查。GitHub 自己的 更新日志 也确认了关键产品差异:Fable 5 要求最长 30 天的提示词/输出保留,而 Copilot 中的其他 Claude 模型仍处于零数据保留规则之下。这值得投入构建,因为失败模式不是“模型太弱”,而是“模型过不了企业策略”,从而让治理直接变成产品阻塞点。

路由、回退和上下文处理仍然太依赖手工

严重性:高。@gitlawb 交付了(119 次点赞、11 条回复、3,189 次浏览、4 次收藏)OpenClaude 的一组功能,明确就是为减少模型选择和上下文窗口摩擦:自动路由、自管理的上下文裁剪,以及能让 REPL 会话继续活下去的回退模型。@_LuoFuli 也把(172 次点赞、18 条回复、5,278 次浏览、35 次收藏)MiMo Code 定位在跨会话记忆和 compose 工作流上,原因相同。从另一个方向也能看到这种痛点:在 Antigravity 的讨论串里,回复要求修复智能体权限,并抱怨 token 消耗。这值得投入构建,因为每当测试框架忘记上下文、选错模型,或在运行中途失去势头,用户都在为此付出税。

信息流充斥着 AI 工具清单,人们越来越把“策展”本身当作产品

严重性:中。6 月 10 日出现了多条高互动的“顶级 AI 工具”或“120+ 工具”风格帖子,包括 @ElizabethA77617 发布(123 次点赞、40 条回复、3,611 次浏览、55 次收藏)的一份 100 工具速查表,以及 @jethafanacc 发布(10 次点赞、7 条回复、190 次浏览、5 次收藏)的另一份 120 工具汇总。与此同时,@dtrain22k 抱怨(39 次点赞、10 条回复、914 次浏览),以前 NFT 时代的骗子现在只是转向了“AI 和氛围编程”;而 @cyrilXBT 推广了(46 次点赞、15 条回复、2,572 次浏览、17 次收藏)/last30days,把它当作一个按真实赞同、点赞和付费信号排序的搜索引擎。这值得投入构建,因为应对机制已经清晰可见:用户正在寻找能穿透清单刷屏和热炒循环的排序系统。


3. 人们期望的功能

零保留访问前沿编程模型

最明确的需求并不是“不惜代价换取更强能力”,而是法务和安全团队也能批准的前沿模型访问。@tomwarren 让这种阻塞在 Microsoft 内部清晰可见,而 GitHub 自己的 Fable 5 文档则写明,该模型需要数据保留,而其他 Claude 模型不需要。这是一个会立刻带来企业后果的现实需求。机会类型:直接型。

一个跨仓库、跨设备、跨智能体会话的统一控制平面

@github 以及关联的 Copilot App 发布文章,正是以此为卖点:一个覆盖会话、议题、PR 和自动化的 My Work 仪表板。@_Evan_Boyle 补充了跨仓库的子会话,而一条回复 @JamesMontemagno 的评论则立刻要求 remote SSH 支持。与此同时,Google 也在把 Antigravity 推向 Search 小型应用和 Android 工作流。需求是运营性的:无论工作在哪,用户都希望有一个地方统一指挥智能体。机会类型:直接型。

具备持久项目记忆的自动模型路由

@gitlawb 之所以描述 /model auto、上下文裁剪和回退模型,是因为用户并不想手工盯着每一个任务。@_LuoFuli 以及 MiMo Code 仓库 则从另一个角度推动了同一需求:跨会话记忆、检查点和 compose 工作流。这是一个现实需求,而不是一个理想化愿景:社区已经在围绕模型选择和上下文丢失的痛点构建方案。机会类型:直接型。

面向智能体扩展的安全与确定性审查闸门

@socialwithaayan 认为,智能体技能现在需要一个“npm audit moment”,而 SkillSpector 仓库 也用 64 种漏洞模式、SARIF 输出以及仓库/URL/文件扫描支撑了这一点。@ErikEJ 则在 SQL 工作流内部展示了一个平行需求:通过 MCP 把确定性的 T-SQL Analyzer 接进 SSMS 22.7。共同的诉求很清楚:让智能体保持灵活,但把高风险扩展和代码路径强制送进可预测的闸门。机会类型:直接型。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
GitHub Copilot App 智能体原生桌面端 (+) My Work 仪表板、worktree 隔离、Agent Merge 和沙箱执行,让并行智能体工作变得可检查 关于定价的抱怨,以及 remote SSH 等请求,说明这个界面对日常基础设施使用来说仍不完整
Google Antigravity 智能体工作空间 / 运行时 (+/-) 正扩展到 Search mini apps 和 Android 工作流,并给出 CLI 资源和持久任务界面的具体示例 回复立刻提出了权限、隐私和 token 消耗问题
Claude Fable 5 前沿编程模型 (+/-) 被包装成面向长周期编程和自治工作的前沿模型;GitHub 表示,它能用更少的工具调用和更低的 token 消耗跑完等价的内部工作流 数据保留要求和按量计费,让它更难获批,也更难被信任
MiMoCode 开源编程智能体 (+) 跨会话记忆、compose 工作流、子智能体和广泛的提供商支持,直接瞄准上下文丢失问题 公开讨论仍在质疑它与 OpenCode 风格前辈相比到底有多大差异
OpenClaude v0.18.0 多模型 CLI / 路由器 (+) 自动路由、上下文裁剪、回退模型和 Copilot 模型元数据,减少了手工 babysit 当天证据主要来自发布说明,而不是长时间运行的用户报告
SkillSpector 智能体技能安全扫描器 (+) 可扫描 repo、URL、zip 文件和单个文件;16 个类别覆盖 64 种模式;支持面向 CI 的 SARIF 输出 足够新,团队仍需要真正采用并接入工作流
T-SQL Analyzer MCP 确定性 MCP 工具 (+) 通过 Copilot Agent mode,把 140+ 条 SQL 规则带进 SSMS 22.7;结果可重复且能定位到具体行 仅适用于 SQL,且要求 SSMS 22.7 和 .NET 10 环境
/last30days 跨平台研究技能 (+) 跨多个社交/网页来源搜索,并按真实互动排序,契合社区对信号排序的需求 完整能力依赖于多平台连接器和配套配置
OpenAI Codex 编程智能体 (+/-) 仍然是每日出现的工具,并在农场自动化、原型构建等非传统场景里有具体使用 Ramp 6 月图表显示,其商业采用率持平,帖子仍不断要求更强模型或更广访问

整体情绪是务实而非站队。人们喜欢的是那些能降低协同成本的工具:控制中心、路由器、持久记忆、确定性分析器和安全扫描器。共同的权宜方案,是把多种工具叠加使用,而不是从头到尾信任一套栈:用 Copilot App 做编排,用 Antigravity 覆盖 Google 工作流,用路由层做模型选择,在最需要信任的地方接上专用分析器或扫描器。


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
GitHub Copilot App GitHub 面向会话、审查、自动化和合并的智能体原生桌面控制中心 否则智能体工作会散落在聊天线程、仓库、PR 和后台运行之间 My Work 视图、git worktrees、canvases、Agent Merge、云端/本地沙箱 Beta 发布文章, 推文
MiMoCode Xiaomi MiMo 具备跨会话记忆和 compose 工作流的终端原生编程智能体 长时间编程会话会丢失项目上下文,并需要手工编排 CLI/TUI、SQLite FTS5 记忆、subagents、checkpoints、自定义提供商 Beta 仓库, 推文
SkillSpector NVIDIA 在安装或部署前扫描 AI 智能体技能的安全工具 技能可能隐藏恶意行为、提示词注入或凭证窃取 Python CLI、静态分析加可选 LLM 分析、SARIF、OSV lookups Beta 仓库, 推文
/last30days mvanhorn 由 AI 智能体驱动、按真实互动排序的跨平台搜索 构建者需要比泛化工具清单和炒作讨论串更好的策展能力 skill/plugin、source connectors、排序与综合流水线 Shipped 仓库, 推文
T-SQL Analyzer MCP in SSMS ErikEJ 通过 MCP 向 SSMS 中的 Copilot 暴露确定性的 SQL 反模式检测 SQL 开发者希望在编辑器原生环境中获得无 LLM 随机性的分析 SSMS 22.7、MCP、DacFX parser、.NET 10 Shipped blog post, tweet
ResizeMe @burkeholland 一个用于像素级精确调整窗口大小的小型 Windows 工具 设计师和开发者仍然需要快速、精确地调整窗口尺寸,以便测试和演示 Go、Wails、HTML/CSS、built with GitHub Copilot App Shipped site, tweet
html-video @GithubProjects 把 HTML、CSS 和数据转成 MP4 的本地优先流水线 开发者希望生成工件,而不是把视频制作交给远程供应商 local renderer、coding-agent backends、templates、optional soundtrack Beta tweet

Copilot App 之所以重要,是因为 6 月 10 日把产品叙事和真实产出放在了一起。@burkeholland 用它(12 次点赞、1 条回复、727 次浏览、5 次收藏)用 Go、Wails 和 HTML/CSS 交付了 ResizeMe,这比泛泛的“智能体桌面端”定位更有说服力。

MiMoCode 和 OpenClaude 则从另一侧指向了同一种反复出现的构建模式:越来越多团队在构建记忆、路由、检查点和回退行为这类测试框架特性,而不是再做一个提示词包装器。SkillSpector 和 T-SQL Analyzer 展现了邻近的控制模式:如果智能体输出越来越多,人们也希望把扫描器和确定性分析器放进环路里。

@GithubProjects 展示了(24 次点赞、2 条回复、2,450 次浏览、26 次收藏)html-video,把它定位成一个面向编程智能体的本地优先 HTML 转视频工具。

html-video README 截图,展示了一个面向编程智能体的本地优先 HTML 转视频工作流,以及模板和预览界面

这张表中的独特模式,是围绕构建者的基础设施,而不只是构建者本身:控制中心、上下文系统、分析器、扫描器、排序层和工件生成器,都在试图让智能体输出更可靠、更可检查,或者更有用。


6. 新动态与亮点

Microsoft 对 Fable 5 的内部限制,让数据保留策略成了竞争变量

@tomwarren 提到(297 次点赞、17 条回复、27,656 次浏览、57 次收藏),即使 GitHub Copilot 和 Microsoft Foundry 正在公开推出 Claude Fable 5,Microsoft 仍限制了员工使用它。《The Verge》报道GitHub 更新日志 和 Microsoft 自己的 Foundry 文章 组合在一起,让这种分裂异常清晰:能力被广泛宣传,但数据保留条款对至少一条大型内部部署路径来说,仍然过于敏感。

智能体技能安全成为一个产品类别,而不再只是模糊警告

@socialwithaayan (22 次点赞、12 条回复、2,636 次浏览、6 次收藏)SkillSpector 描述成一个恶意技能扫描器,而 repo 也确实用 16 个类别下的 64 种漏洞模式、对 repo/URL/zip 文件/文件的支持,以及 SARIF 输出支撑了这一点。

NVIDIA SkillSpector 的 GitHub 仓库截图,展示了公开仓库和面向 AI 智能体技能的安全扫描定位

Ramp 6 月图表显示,Codex 的发布势头尚未转化为付费企业份额增长

@arakharazian 分享了(28 次点赞、1,494 次浏览、8 次收藏)6 月 Ramp AI Index,显示 Anthropic 约占 41% 的公司,而 OpenAI 在 Codex 发布后保持持平。这一点很重要,因为 6 月 10 日的大量讨论都假设 Codex 的势头会自动转化成企业采用,但这张图表认为,企业支出的变化路径仍然不同于社交媒体热度。


7. 机会在哪里

[+++] 受治理的智能体基础设施 —— 最强的跨章节信号很明确:市场需要让智能体工作可审批、可审查的系统。Microsoft 因保留条款而限制 Fable 5,SkillSpector 对恶意技能做扫描,ErikEJ 的确定性 MCP 分析器也指向同一个需求——在智能体执行周围加上策略、安全和可重复检查。

[++] 统一的智能体控制平面 —— GitHub Copilot App、Antigravity Search 小型应用、Antigravity 的 Android 工作流,以及跨仓库子会话模式,都说明市场想要一个能跨仓库、跨设备、跨运行时界面指挥工作的地方。

[++] 模型之上的路由与记忆层 —— MiMoCode 的跨会话记忆和 OpenClaude 的自动路由/上下文裁剪,都在攻击同一个反复出现的痛点:用户不想在任务形态一变时,就重新解释项目上下文或手工选模型。

[+] 面向构建者的工件生成与垂直工具链 —— html-video、ResizeMe、用 Codex 做农场自动化,以及 SSMS 原生 SQL 分析,都表明智能体经济正在扩展到具体终端产品和工作流专用工具,而不只是通用聊天界面。


8. 要点总结

  1. GitHub Copilot App 已经变成真实工作界面,而不只是发布幻灯片。 6 月 10 日把广泛开放预览、跨仓库子会话,以及借助该应用交付的 ResizeMe 工具等具体证据结合了起来。(GitHub 应用推文, 跨仓库讨论串, ResizeMe 构建帖)
  2. Antigravity 正在渗透进 Google 的各个界面,但“是否就绪”的问题也一路跟着它。 Android 工作流和 Search 小型应用是上行空间;权限、隐私和 token 消耗抱怨,则是立刻出现的制衡。(Antigravity Android 讨论串, Google Search 讨论串)
  3. 模型领先地位正被治理和测试框架质量重新筛选。 Fable 5 可以公开发布,却仍在内部被限制,而当天最强的构建者帖子谈的是路由、记忆和检查点,而不是基准测试幻灯片。(Tom Warren 报道, 《MiMo Code》, OpenClaude)
  4. 信任工具链正在成为一等 AI 编程基础设施。 SkillSpector 和 T-SQL Analyzer MCP 都说明,市场正在转向能嵌入智能体环路中的扫描器和确定性分析器。(SkillSpector 讨论串, T-SQL Analyzer 帖子)
  5. 社区正靠构建排序和策展层,对抗工具清单泛滥。 /last30days 是最清晰的例子:人们开始把社交互动本身变成排序输入,以对抗铺天盖地的 AI 工具盘点。(/last30days 讨论串, 100 工具推文)