Twitter AI Coding - 2026-06-10¶

1. 人们在讨论什么¶

1.1 GitHub Copilot App 已从发布叙事转向日常控制界面 🡕¶

6 月 10 日的讨论不再把 GitHub Copilot App 当作一个预览期的新奇玩意，而是把它视为智能体工作已经开始被组织、审查和交付的地方。四条保留内容支撑了这一主题。

@github 宣布（205 次点赞、22 条回复、19,094 次浏览、48 次收藏），GitHub Copilot App 技术预览版已向 Copilot Pro、Pro+、Max、Business 和 Enterprise 套餐开放。关联的发布文章把定位讲得很具体：My Work 仪表板用于查看活跃会话、议题、拉取请求和自动化；每个会话都有独立的 git worktree；Agent Merge 用于让 PR 穿过审查和检查；同时提供云端/本地沙箱，让智能体不仅能建议代码，还能实际运行并验证工作。

@JamesMontemagno 敦促大家去试试（34 次点赞、8 条回复、4,035 次浏览、12 次收藏），因为它“每天都在改变我的工作方式”。回复之所以有用，是因为它们立刻从热炒转向缺失界面：有人追问 remote SSH 支持，说明一旦这个应用变成日常工作界面，连接能力和环境覆盖范围就会和 UI 打磨同样重要。

@_Evan_Boyle 解释了“跨仓库支持”：它会把子会话生成到不同仓库中；与此同时，@burkeholland 展示了（12 次点赞、1 条回复、727 次浏览、5 次收藏），他用 Copilot App 把 ResizeMe 用 Go、Wails 和 HTML/CSS 重写成了一个 10 MB 的可执行文件（项目网站）。这两者的组合让“控制中心”这一说法更可信：信息流里既有产品机制，也有一个借助该界面真正交付的小工具。

讨论要点： 最重要的细微差别在于运行边界，而不是这个 app 是否存在。回复提到了定价、审查清晰度和缺失的远程工作流，这说明开发者已经在把它当作基础设施来评判。

与前日对比： 6 月 9 日把 Copilot App 描述为一个带 worktree 和 canvas 的智能体原生控制中心。6 月 10 日则通过更广泛开放预览，以及跨仓库编排和借助该界面交付应用的具体案例，把这个故事又往前推了一步。

1.2 Antigravity 持续从工作空间向平台运行时扩展 🡕¶

围绕 Google 的讨论不断把 Antigravity 从一个独立的 AI 界面推向 Search 和 Android 开发的更广泛运行时。三条保留内容支撑了这一主题。

@antigravity 把（749 次点赞、45 条回复、51,642 次浏览、225 次收藏）Antigravity 定位成一个“面向 Android 的智能体式开发平台”，方法是让用户安装 Android CLI 和技能等可选资源。后续回复之所以重要，是因为 Antigravity 自己贴出了 Pixel Emulator 和修复 stopwatch 的例子，同时有用户要求修复 IDE 中的智能体权限，另一位用户则抱怨 Gemini 3.5 Flash 消耗 token 太凶。这让这条帖子同时成为能力信号和访问摩擦信号。

@Google 表示（314 次点赞、23 条回复、46,042 次浏览、74 次收藏），Search 很快将借助 Antigravity 为持续性任务构建可持久存在的自定义体验，并将其描述为用户可以反复返回的小型应用。配套回复把上线范围收窄到美国的 Google AI Pro 和 Ultra 用户，而一条持怀疑态度的回复则表示，只有当进度真的能持久保存、隐私在真实使用中也站得住脚时，这个概念才有意义。

@Ayzacoder 放大传播了（55 次点赞、31 条回复、1,215 次浏览、15 次收藏）NotebookLM 与 Antigravity 搭配，用于自动化研究和内容工作。图片本身更多只是 logo 级别，但这条推文依然强化了一点：Antigravity 越来越多被描述成其他 Google 产品背后的工作层，而不是一个独立目的地。

讨论要点： 围绕 Antigravity 的张力并不在于认知度，而在于这个运行时是否已经准备好面对日常工作：权限、token 经济性、持久性和隐私立刻都被提了出来。

与前日对比： 6 月 9 日把 Antigravity 当作贯穿 Search、NotebookLM 和模型路由的接入层。6 月 10 日则把它收束成两个更清晰的产品方向：面向重复任务的 Search mini apps，以及面向 Android 的开发工作流。

1.3 模型竞争越来越看路由、治理和测试框架质量 🡕¶

最技术化的讨论已经不再只是“哪个前沿模型更强”。6 月 10 日的帖子不断把模型选择和企业策略、路由界面以及测试框架设计绑在一起。五条保留内容支撑了这一主题。

@tomwarren 提到（297 次点赞、17 条回复、27,656 次浏览、57 次收藏），由于 Anthropic 的数据保留问题，Microsoft 已限制员工在 GitHub Copilot 中使用 Claude Fable 5。关联的《The Verge》报道称，其他 Claude 模型在内部仍可在零数据保留规则下使用；而 GitHub 自己的 Fable 5 更新日志则确认，Fable 5 需要最长 30 天的提示词/输出保留，并按使用量计费。

@_LuoFuli 推出了（172 次点赞、18 条回复、5,278 次浏览、35 次收藏）MiMo Code，称其是 5 个人在 14 天内做出的开源编程智能体。关联的 repo 让它的独特角度非常具体：跨会话记忆、compose mode、子智能体、目标驱动循环，以及同时支持 MiMo 托管和 OpenAI 兼容提供商。这条帖子读起来更像是“新的测试框架原语”讨论，而不是“新模型”讨论。

@gitlawb 发布了（119 次点赞、11 条回复、3,189 次浏览、4 次收藏）OpenClaude v0.18.0，加入 /model auto 路由、上下文裁剪工具、REPL 会话中的回退模型，以及带元数据的 GitHub Copilot 模型完整信息。与此同时，@arakharazian 分享了（28 次点赞、1,494 次浏览、8 次收藏）6 月 Ramp AI Index，显示 Anthropic 约占 41% 的公司，而 OpenAI 在 Codex 发布后基本持平。

Ramp AI Index 图表显示，Anthropic 覆盖约 41% 的公司，而 OpenAI 在 Codex 发布后略有持平

讨论要点： 6 月 10 日的模型之争，真正争的其实是模型外面的系统：运行时能否自动路由、保住上下文、保持合规，并赢得企业信任？

与前日对比： 6 月 9 日聚焦于 Fable 5 的基准测试和发布当天的可用性。6 月 10 日依然关注模型竞争，但决定性证据已经转向数据保留规则、采用数据，以及围绕每个模型搭建的测试框架质量。

2. 令人困扰的问题¶

前沿模型策略会让最强模型在真实组织内部也无法使用¶

严重性：高。@tomwarren 提到（297 次点赞、17 条回复、27,656 次浏览、57 次收藏），Microsoft 之所以限制 Claude Fable 5 的内部使用，是因为 Anthropic 的保留条款正在接受法务团队审查。GitHub 自己的更新日志也确认了关键产品差异：Fable 5 要求最长 30 天的提示词/输出保留，而 Copilot 中的其他 Claude 模型仍处于零数据保留规则之下。这值得投入构建，因为失败模式不是“模型太弱”，而是“模型过不了企业策略”，从而让治理直接变成产品阻塞点。

路由、回退和上下文处理仍然太依赖手工¶

严重性：高。@gitlawb 交付了（119 次点赞、11 条回复、3,189 次浏览、4 次收藏）OpenClaude 的一组功能，明确就是为减少模型选择和上下文窗口摩擦：自动路由、自管理的上下文裁剪，以及能让 REPL 会话继续活下去的回退模型。@_LuoFuli 也把（172 次点赞、18 条回复、5,278 次浏览、35 次收藏）MiMo Code 定位在跨会话记忆和 compose 工作流上，原因相同。从另一个方向也能看到这种痛点：在 Antigravity 的讨论串里，回复要求修复智能体权限，并抱怨 token 消耗。这值得投入构建，因为每当测试框架忘记上下文、选错模型，或在运行中途失去势头，用户都在为此付出税。

信息流充斥着 AI 工具清单，人们越来越把“策展”本身当作产品¶

严重性：中。6 月 10 日出现了多条高互动的“顶级 AI 工具”或“120+ 工具”风格帖子，包括 @ElizabethA77617 发布（123 次点赞、40 条回复、3,611 次浏览、55 次收藏）的一份 100 工具速查表，以及 @jethafanacc 发布（10 次点赞、7 条回复、190 次浏览、5 次收藏）的另一份 120 工具汇总。与此同时，@dtrain22k 抱怨（39 次点赞、10 条回复、914 次浏览），以前 NFT 时代的骗子现在只是转向了“AI 和氛围编程”；而 @cyrilXBT 推广了（46 次点赞、15 条回复、2,572 次浏览、17 次收藏）/last30days，把它当作一个按真实赞同、点赞和付费信号排序的搜索引擎。这值得投入构建，因为应对机制已经清晰可见：用户正在寻找能穿透清单刷屏和热炒循环的排序系统。

3. 人们期望的功能¶

零保留访问前沿编程模型¶

最明确的需求并不是“不惜代价换取更强能力”，而是法务和安全团队也能批准的前沿模型访问。@tomwarren 让这种阻塞在 Microsoft 内部清晰可见，而 GitHub 自己的 Fable 5 文档则写明，该模型需要数据保留，而其他 Claude 模型不需要。这是一个会立刻带来企业后果的现实需求。机会类型：直接型。

一个跨仓库、跨设备、跨智能体会话的统一控制平面¶

@github 以及关联的 Copilot App 发布文章，正是以此为卖点：一个覆盖会话、议题、PR 和自动化的 My Work 仪表板。@_Evan_Boyle 补充了跨仓库的子会话，而一条回复 @JamesMontemagno 的评论则立刻要求 remote SSH 支持。与此同时，Google 也在把 Antigravity 推向 Search 小型应用和 Android 工作流。需求是运营性的：无论工作在哪，用户都希望有一个地方统一指挥智能体。机会类型：直接型。

具备持久项目记忆的自动模型路由¶

@gitlawb 之所以描述 /model auto、上下文裁剪和回退模型，是因为用户并不想手工盯着每一个任务。@_LuoFuli 以及 MiMo Code 仓库则从另一个角度推动了同一需求：跨会话记忆、检查点和 compose 工作流。这是一个现实需求，而不是一个理想化愿景：社区已经在围绕模型选择和上下文丢失的痛点构建方案。机会类型：直接型。

面向智能体扩展的安全与确定性审查闸门¶

@socialwithaayan 认为，智能体技能现在需要一个“npm audit moment”，而 SkillSpector 仓库也用 64 种漏洞模式、SARIF 输出以及仓库/URL/文件扫描支撑了这一点。@ErikEJ 则在 SQL 工作流内部展示了一个平行需求：通过 MCP 把确定性的 T-SQL Analyzer 接进 SSMS 22.7。共同的诉求很清楚：让智能体保持灵活，但把高风险扩展和代码路径强制送进可预测的闸门。机会类型：直接型。

4. 使用中的工具与方法¶

工具	类别	评价	优势	局限
GitHub Copilot App	智能体原生桌面端	(+)	My Work 仪表板、worktree 隔离、Agent Merge 和沙箱执行，让并行智能体工作变得可检查	关于定价的抱怨，以及 remote SSH 等请求，说明这个界面对日常基础设施使用来说仍不完整
Google Antigravity	智能体工作空间 / 运行时	(+/-)	正扩展到 Search mini apps 和 Android 工作流，并给出 CLI 资源和持久任务界面的具体示例	回复立刻提出了权限、隐私和 token 消耗问题
Claude Fable 5	前沿编程模型	(+/-)	被包装成面向长周期编程和自治工作的前沿模型；GitHub 表示，它能用更少的工具调用和更低的 token 消耗跑完等价的内部工作流	数据保留要求和按量计费，让它更难获批，也更难被信任
MiMoCode	开源编程智能体	(+)	跨会话记忆、compose 工作流、子智能体和广泛的提供商支持，直接瞄准上下文丢失问题	公开讨论仍在质疑它与 OpenCode 风格前辈相比到底有多大差异
OpenClaude v0.18.0	多模型 CLI / 路由器	(+)	自动路由、上下文裁剪、回退模型和 Copilot 模型元数据，减少了手工 babysit	当天证据主要来自发布说明，而不是长时间运行的用户报告
SkillSpector	智能体技能安全扫描器	(+)	可扫描 repo、URL、zip 文件和单个文件；16 个类别覆盖 64 种模式；支持面向 CI 的 SARIF 输出	足够新，团队仍需要真正采用并接入工作流
T-SQL Analyzer MCP	确定性 MCP 工具	(+)	通过 Copilot Agent mode，把 140+ 条 SQL 规则带进 SSMS 22.7；结果可重复且能定位到具体行	仅适用于 SQL，且要求 SSMS 22.7 和 .NET 10 环境
/last30days	跨平台研究技能	(+)	跨多个社交/网页来源搜索，并按真实互动排序，契合社区对信号排序的需求	完整能力依赖于多平台连接器和配套配置
OpenAI Codex	编程智能体	(+/-)	仍然是每日出现的工具，并在农场自动化、原型构建等非传统场景里有具体使用	Ramp 6 月图表显示，其商业采用率持平，帖子仍不断要求更强模型或更广访问

整体情绪是务实而非站队。人们喜欢的是那些能降低协同成本的工具：控制中心、路由器、持久记忆、确定性分析器和安全扫描器。共同的权宜方案，是把多种工具叠加使用，而不是从头到尾信任一套栈：用 Copilot App 做编排，用 Antigravity 覆盖 Google 工作流，用路由层做模型选择，在最需要信任的地方接上专用分析器或扫描器。

5. 人们在构建什么¶

项目	构建者	功能	解决的问题	技术栈	阶段	链接
GitHub Copilot App	GitHub	面向会话、审查、自动化和合并的智能体原生桌面控制中心	否则智能体工作会散落在聊天线程、仓库、PR 和后台运行之间	My Work 视图、git worktrees、canvases、Agent Merge、云端/本地沙箱	Beta	发布文章, 推文
MiMoCode	Xiaomi MiMo	具备跨会话记忆和 compose 工作流的终端原生编程智能体	长时间编程会话会丢失项目上下文，并需要手工编排	CLI/TUI、SQLite FTS5 记忆、subagents、checkpoints、自定义提供商	Beta	仓库, 推文
SkillSpector	NVIDIA	在安装或部署前扫描 AI 智能体技能的安全工具	技能可能隐藏恶意行为、提示词注入或凭证窃取	Python CLI、静态分析加可选 LLM 分析、SARIF、OSV lookups	Beta	仓库, 推文
/last30days	mvanhorn	由 AI 智能体驱动、按真实互动排序的跨平台搜索	构建者需要比泛化工具清单和炒作讨论串更好的策展能力	skill/plugin、source connectors、排序与综合流水线	Shipped	仓库, 推文
T-SQL Analyzer MCP in SSMS	ErikEJ	通过 MCP 向 SSMS 中的 Copilot 暴露确定性的 SQL 反模式检测	SQL 开发者希望在编辑器原生环境中获得无 LLM 随机性的分析	SSMS 22.7、MCP、DacFX parser、.NET 10	Shipped	blog post, tweet
ResizeMe	@burkeholland	一个用于像素级精确调整窗口大小的小型 Windows 工具	设计师和开发者仍然需要快速、精确地调整窗口尺寸，以便测试和演示	Go、Wails、HTML/CSS、built with GitHub Copilot App	Shipped	site, tweet
html-video	@GithubProjects	把 HTML、CSS 和数据转成 MP4 的本地优先流水线	开发者希望生成工件，而不是把视频制作交给远程供应商	local renderer、coding-agent backends、templates、optional soundtrack	Beta	tweet

Copilot App 之所以重要，是因为 6 月 10 日把产品叙事和真实产出放在了一起。@burkeholland 用它（12 次点赞、1 条回复、727 次浏览、5 次收藏）用 Go、Wails 和 HTML/CSS 交付了 ResizeMe，这比泛泛的“智能体桌面端”定位更有说服力。

MiMoCode 和 OpenClaude 则从另一侧指向了同一种反复出现的构建模式：越来越多团队在构建记忆、路由、检查点和回退行为这类测试框架特性，而不是再做一个提示词包装器。SkillSpector 和 T-SQL Analyzer 展现了邻近的控制模式：如果智能体输出越来越多，人们也希望把扫描器和确定性分析器放进环路里。

@GithubProjects 展示了（24 次点赞、2 条回复、2,450 次浏览、26 次收藏）html-video，把它定位成一个面向编程智能体的本地优先 HTML 转视频工具。

html-video README 截图，展示了一个面向编程智能体的本地优先 HTML 转视频工作流，以及模板和预览界面

这张表中的独特模式，是围绕构建者的基础设施，而不只是构建者本身：控制中心、上下文系统、分析器、扫描器、排序层和工件生成器，都在试图让智能体输出更可靠、更可检查，或者更有用。

6. 新动态与亮点¶

Microsoft 对 Fable 5 的内部限制，让数据保留策略成了竞争变量¶

@tomwarren 提到（297 次点赞、17 条回复、27,656 次浏览、57 次收藏），即使 GitHub Copilot 和 Microsoft Foundry 正在公开推出 Claude Fable 5，Microsoft 仍限制了员工使用它。《The Verge》报道、GitHub 更新日志和 Microsoft 自己的 Foundry 文章组合在一起，让这种分裂异常清晰：能力被广泛宣传，但数据保留条款对至少一条大型内部部署路径来说，仍然过于敏感。

智能体技能安全成为一个产品类别，而不再只是模糊警告¶

@socialwithaayan 把（22 次点赞、12 条回复、2,636 次浏览、6 次收藏）SkillSpector 描述成一个恶意技能扫描器，而 repo 也确实用 16 个类别下的 64 种漏洞模式、对 repo/URL/zip 文件/文件的支持，以及 SARIF 输出支撑了这一点。

NVIDIA SkillSpector 的 GitHub 仓库截图，展示了公开仓库和面向 AI 智能体技能的安全扫描定位

Ramp 6 月图表显示，Codex 的发布势头尚未转化为付费企业份额增长¶

@arakharazian 分享了（28 次点赞、1,494 次浏览、8 次收藏）6 月 Ramp AI Index，显示 Anthropic 约占 41% 的公司，而 OpenAI 在 Codex 发布后保持持平。这一点很重要，因为 6 月 10 日的大量讨论都假设 Codex 的势头会自动转化成企业采用，但这张图表认为，企业支出的变化路径仍然不同于社交媒体热度。

7. 机会在哪里¶

[+++] 受治理的智能体基础设施 —— 最强的跨章节信号很明确：市场需要让智能体工作可审批、可审查的系统。Microsoft 因保留条款而限制 Fable 5，SkillSpector 对恶意技能做扫描，ErikEJ 的确定性 MCP 分析器也指向同一个需求——在智能体执行周围加上策略、安全和可重复检查。

[++] 统一的智能体控制平面 —— GitHub Copilot App、Antigravity Search 小型应用、Antigravity 的 Android 工作流，以及跨仓库子会话模式，都说明市场想要一个能跨仓库、跨设备、跨运行时界面指挥工作的地方。

[++] 模型之上的路由与记忆层 —— MiMoCode 的跨会话记忆和 OpenClaude 的自动路由/上下文裁剪，都在攻击同一个反复出现的痛点：用户不想在任务形态一变时，就重新解释项目上下文或手工选模型。

[+] 面向构建者的工件生成与垂直工具链 —— html-video、ResizeMe、用 Codex 做农场自动化，以及 SSMS 原生 SQL 分析，都表明智能体经济正在扩展到具体终端产品和工作流专用工具，而不只是通用聊天界面。

8. 要点总结¶

GitHub Copilot App 已经变成真实工作界面，而不只是发布幻灯片。 6 月 10 日把广泛开放预览、跨仓库子会话，以及借助该应用交付的 ResizeMe 工具等具体证据结合了起来。(GitHub 应用推文, 跨仓库讨论串, ResizeMe 构建帖)
Antigravity 正在渗透进 Google 的各个界面，但“是否就绪”的问题也一路跟着它。 Android 工作流和 Search 小型应用是上行空间；权限、隐私和 token 消耗抱怨，则是立刻出现的制衡。(Antigravity Android 讨论串, Google Search 讨论串)
模型领先地位正被治理和测试框架质量重新筛选。 Fable 5 可以公开发布，却仍在内部被限制，而当天最强的构建者帖子谈的是路由、记忆和检查点，而不是基准测试幻灯片。(Tom Warren 报道, 《MiMo Code》, OpenClaude)
信任工具链正在成为一等 AI 编程基础设施。 SkillSpector 和 T-SQL Analyzer MCP 都说明，市场正在转向能嵌入智能体环路中的扫描器和确定性分析器。(SkillSpector 讨论串, T-SQL Analyzer 帖子)
社区正靠构建排序和策展层，对抗工具清单泛滥。 /last30days 是最清晰的例子：人们开始把社交互动本身变成排序输入，以对抗铺天盖地的 AI 工具盘点。(/last30days 讨论串, 100 工具推文)