跳转至

Twitter AI 编程 - 2026-04-25

1. 人们在讨论什么

1.1 GPT-5.5 统一模型策略确认;不再单设 Codex 线 🡕

OpenAI 确认 GPT-5.5 已完全吸收 Codex 线。@Angaisb_ 总结(62 点赞,2,553 浏览量):“OpenAI 不会发布 GPT-5.5 Codex。他们一个月前就统一了模型,如果再拆开会很奇怪。”这条推文引用了 OpenAI 的 @romainhuet:“从 GPT-5.4 开始,我们已经把 Codex 和主模型统一成一个系统,所以不再有单独的编程线。GPT-5.5 在此基础上更进一步,在智能体式编程、计算机使用以及任何电脑任务上都有明显提升。”

Codex ambassador @TimHaldorsson 提前测试了 GPT-5.5(25 点赞,462 浏览量):“GPT-5.5 已经发布,它是为智能体而生的,不只是聊天。更快、token 更少,从第一天起就面向智能体工作流设计。OpenAI 还发布了今天就能接入的 workspace agents。”

@WesRoth 报道(18 点赞,715 浏览量)企业部署进展,并引用 Satya Nadella:“Microsoft 正在整个企业生态中部署 OpenAI 的前沿 GPT-5.5 模型,包括 GitHub Copilot、M365 Copilot、Copilot Studio 和 Foundry。”@databricks 确认(14 点赞,892 浏览量)GPT-5.5 已可在其平台使用,Codex 编程工作流通过 Unity AI Gateway 管理。

@ivanzhouyq 分享了基准测试结果(6 点赞,228 浏览量):“我们与 OpenAI 研究团队密切合作,在 OfficeQA Pro 上评估 GPT 5.5,这是我们用于评估智能体在有依据的企业文档推理任务上表现的基准。搭配 Codex 的 GPT 5.5 达到 SOTA 表现,相比 GPT 5.4 错误减少了 46%!”

讨论要点: GPT-5.5 与 Codex 统一到单一模型线,简化了产品叙事,但也集中了承担风险。用户不再在“聊天模型”和“代码模型”之间选择——现在只有一个模型,它的智能体式编程质量决定了整个 Codex 体验。

与前日对比: 4 月 24 日,GPT-5.5 的采用是主导叙事,mckaywrigley 从 80/20 Claude/GPT 转向 80/20 GPT/Claude。今天讨论从采用转向架构:模型统一已经确认,企业部署(Databricks、Microsoft Copilot 生态)正在上线。


1.2 DeepSeek 在 OpenCode Go 使用量升至第二 🡕

@jayair 报道(186 点赞,3,991 浏览量):“DeepSeek 更新一下,它在 OpenCode Go 上的使用量已经排第二了。”在回复中,他澄清这是 DeepSeek Pro,并且 Kimi 仍居首位。这是数据集中点赞数最高的推文,说明用户对模型排行榜变化的兴趣很强。

@KuittinenPetri 反驳(43 点赞,806 浏览量)反 DeepSeek 情绪:“今天 X 上对 DeepSeek 的仇恨多得惊人。这是有组织、有付费的吗?你觉得 Anthropic 会怎么处理 Claude Code 里的提示词和代码轨迹?Google 又会怎么处理 Antigravity?OpenAI 又会怎么处理 Codex?”@scent_fetish_ 的回复补充:“我现在正在测试,DeepSeek v4 很吓人。它比 Opus 更快,比 Opus 更准确,而且比 Opus 便宜得离谱。”

讨论要点: DeepSeek 在 OpenCode Go 使用量中迅速升至第二,仅落后于 Kimi,验证了开放、模型无关平台的论点。用户会不看提供商出身,转向性价比最好的选项;OpenCode Go 正是这种竞争展开的地方。

与前日对比: 4 月 24 日,DeepSeek V4 刚刚集成进 OpenCode,用户还在要求 Go 档位访问。一天后,它已经升至使用量第二,说明需求是真实的,而且采用速度很快。


1.3 Codex Spark 质量引发争论;Cerebras 硬件受到质疑 🡒

@VictorTaelin 发问(99 点赞,9,752 浏览量):“有人猜得到为什么 Codex Spark 这么差吗?是什么阻止 OpenAI 在 Cerebras 硬件上提供一个像 Qwen 3.6 或 Gemma 4 一样聪明的模型?”他引用了自己此前对 GPT-5.5 的评估,其中显示通过 API 访问时“GPT 占优”,而不是通过 Codex Spark。

25 条回复给出了解释。@CharuruCha14310 认为:“可能是因为用的人太少,他们就不再投入了,5.3 已经落后太多。”VictorTaelin 直接回应:“用的人少是因为它差!!!”@Apollo_EO 将原因归结为模型大小:“5.3 Codex Spark 显然是‘第一次尝试’那类东西。那时大家都抱怨 5.3-Codex 太慢,他们想快速推出一个够快的东西。”@ar0cket1 猜测与量化有关:“它可能被重度量化和剪枝,以便完整塞进 cerebras wafer。这很可能毁掉了能力。”

讨论要点: 对 Codex Spark 的批评暴露了 OpenAI 产品线中的一个缺口:即时响应档太弱,难以真正有用,造成用户只能在“慢但聪明”和“快但笨”之间二选一,中间没有可用档位。

与前日对比: 4 月 24 日,用户称赞的是通过 Codex 使用 GPT-5.5 的体验。今天批评明确指向 Spark 档,说明标准执行与即时执行之间的质量差距已经成为 Codex UX 的主要问题。


1.4 OpenAI 内部:角色流动性与演示背后的现实 🡕

@jxnlco 发布(178 点赞,6,365 浏览量)了当天互动最高的推文:“我申请 OpenAI 时,以为自己会做 evals。签约时,以为自己会做 agents。入职时,以为自己会做 Codex。第一个月后,我以为自己会做 knowledge work,但现在我在做 motion graphics。”他在回复中补充:“很多人不知道,我上过艺术学校。我在自己的短片里做过动画。”

@Th3RealSocrates 将其放在前沿实验室文化中理解:“这是 $80B+ 实验室的 feature-not-bug。人才密度意味着角色 = 本季度最热的火。你的 motion graphics 技能现在比 evals 更快复利。”

讨论要点: jxnlco 在几个月内从 evals 到 agents、Codex,再到 motion graphics 的轨迹,展现了前沿 AI 实验室内部的速度与不可预测性。它也暗示 OpenAI 的产品表面积扩张速度快于团队专业化速度。

与前日对比: 4 月 24 日,OpenAI 主要被放在产品视角下讨论(GPT-5.5 推出、Codex 能力)。今天讨论加入了内部视角:角色是流动的,优先级按季度变化,而按照下文 0xwhrrari 的轶事,“演示是经过策划的”。


1.5 面向智能体的提示工程:结构胜过即兴发挥 🡕

@ynkzlk 发布(42 点赞,138,106 浏览量,21 收藏数)一个新的 agent-skill:“一个面向 claude code 和 codex 的 opus 4.7 prompt writer。它能把杂乱的编程任务转成带范围、约束、工具计划、验证闸门和明确停止条件的提示词。使用 max effort 的 opus 4.7 和 sonnet 4.6 subagents 后,长周期调试和迁移明显更可靠。”138K 浏览量说明这类实践者工具触达极广。@Zinaida_p2 回复:“这正是智能体工作流缺的那一层——结构 > 随机性。”

@coder_blvck 分享(3 收藏数)了一个用于 Claude Code 和 Codex 会话连续性的详细提示词:一套结构化交接模板,会读取 .claude/ 目录重建上下文、提取 TODO 列表、分类任务状态,并从上一个未完成步骤继续。这直接回应了任务中途撞上会话限制的常见痛点。

@JedAIFlow 认为(3 回复,224 浏览量):“大多数人用反了 Claude Code。他们要求代码片段。真正的解锁方式是给它一个循环:检查仓库,制定计划,编辑文件,运行测试,解释 diff。”

讨论要点: 这些帖子共同说明,实践者使用编程智能体的方式正在成熟:从一次性提示词,转向带明确验证闸门的结构化多步骤工作流。ynkzlk 技能的 138K 浏览量表明这种方法的受众很大。

与前日对比: 4 月 24 日,andrej-karpathy-skills repo(78.5K stars)是最热门的提示工程产物。今天,ynkzlk 的 agent-skill 和 coder_blvck 的会话交接模板说明社区继续围绕智能体交互构建可复用结构,尤其关注跨工具连续性。


1.6 GitHub 可靠性与 Copilot 遭到抨击 🡒

@Hesamation 批评(32 点赞,1,953 浏览量):“Microsoft 有一种惊人的天赋,能把碰过的东西都搞得很潦草。哪怕现在,他们也把资源投到 Copilot(几乎没人用)上,而不是修 GitHub 可靠性问题(所有人都被影响)。”被引用的 @vaggelisdrak 推文展示了 Microsoft 收购后 GitHub 的宕机情况。

@rekdt 继续补刀(24 点赞,1,060 浏览量):“GitHub 被 Microslop Copilot 误伤了”,引用的是一则 merge queue commit 随机回滚已合并提交的报告。@NathanMcNulty 提出反面观点(24 点赞,2,193 浏览量):“只是说一下——GitHub 没有 CEO 的情况下把 Copilot 做得很强,而 Microsoft 一直试图把 Copilot 塞进所有不该塞的地方。”

@StuxMirai 概括了情绪(5 点赞):“Microsoft 最近疯狂掉链子。GitHub 正在变烂,大家都在换 Linux。所有人都讨厌 Copilot。”

@hatsunama 指出(5 点赞)Copilot 被直接集成进 GitHub:“谁他妈想要 copilot 直接加到 github 里???一定要拒绝访问,因为它是 opt out,不是 opt in。”

讨论要点: GitHub 可靠性问题与 Copilot 激进的默认 opt-in 设计叠在一起,让挫败感加倍。NathanMcNulty 的辩护——GitHub 没有 CEO 也把 Copilot“做得很强”——说明产品质量叙事与基础设施可靠性叙事正在分化。

与前日对比: 4 月 24 日,Copilot 的故事是 SDK v0.3.0 发布 40 个功能和 JetBrains agent mode。今天叙事转向可靠性担忧和 merge queue bug。产品在推进,但基础设施跟不上。


1.7 Google Antigravity:安全威胁与停滞采用 🡖

@Malwarebytes 警告(75 点赞,3,767 浏览量):“应用?完美。安装?简单。你的数据?已经被偷。阅读我们关于假 Google Antigravity 的研究:下载后几秒内就窃取你的账号。”@youssefCha78906 的回复指出其中的讽刺:“数十亿美元的企业网络安全 R&D,结果被一个 MSI 安装器里名为 wefasgsdfg 的 PowerShell 脚本彻底击穿,它只是告诉 Defender 去睡觉。”

Malwarebytes 关于假 Google Antigravity 安装器窃取用户账号的研究

@JulianGoldieSEO 继续发布 Antigravity 课程内容——一门 4 小时课程(10 点赞,880 浏览量,18 收藏数)和一门 2 小时课程(6 点赞,611 浏览量,8 收藏数)。但实践者情绪依然平淡。@Fabiobuilds 评估(6 点赞,1,287 浏览量):“Google 正在投入小模型/本地模型(Gemma、flash、flash lite),这些做得很好。3.1 pro 上的投入非常有限(真的有人在 Antigravity 上写代码吗?)。”

@Godsonsaji_12 发泄:“亲爱的 Google、Antigravity 团队:我为什么要付 Pro/Ultra 计划的钱,却整天看到服务器错误?连一个简单的‘Hi’都会终止智能体。如果你们扛不住负载,就别收我们的钱。”

讨论要点: Antigravity 面临三线问题:假下载利用其品牌攻击用户、服务器稳定性问题赶走付费用户,以及大量教程内容掩盖了实践者采用疲弱。

与前日对比: 4 月 24 日,Antigravity 的故事类似:教育内容泛滥(JulianGoldieSEO 的 6+ 门课程)与采用平淡、木马化下载警告并存。这个模式已经持续两天并在固化。Malwarebytes 报告增加了新的安全维度。


1.8 Vibe Coding 文化:社区活动与创意应用 🡒

@isnit0 发布(28 点赞,1,660 浏览量):“准备好在 Cambridgeshire 这家漂亮的酒吧里度过一个 vibe-coding 游戏周末了吗!”展示了使用 AI 工具做游戏开发的线下聚会。@realsigridjin 记录(4 点赞,226 浏览量)首尔的 harness engineering 聚会:“omocon event happening rn in Seoul——世界上最好的 harness engineering meetup。”

@sachindas246 分享了 Kochi 的 Codex Community Hackathon:“12 小时。一个想法。满屋子的 builders。”@gabrielchua 列出(6 点赞)悉尼和墨尔本即将举行的一系列 OpenAI Codex 活动,包括 hackathon、builder session 和 pitch day。

@FussyPastor 提出(5 点赞)对 vibe coding 游戏的创意重构:“不要问‘我想做这个游戏类型’,而是问自己‘我有什么资产?’从你拥有的东西开始,看能做出什么。”

讨论要点: Vibe coding 活动从 Cambridgeshire 酒吧、首尔聚会,到 Kochi hackathon、悉尼 builder session 的全球扩散,标志着它从线上讨论转向线下社区落地。Codex ambassador 计划(TimHaldorsson 在 Lisbon,gabrielchua 在 Sydney)正在推动这轮扩张。

与前日对比: 4 月 24 日,vibe coding 主要围绕限流和算力约束讨论。今天社区角度占主导,线下活动横跨三大洲。这种文化正在从个人工具使用走向协作式构建。


2. 令人困扰的问题

Copilot 默认加入数据训练和隐私设置 -- High

@bohops 带用户操作(3 点赞,420 浏览量,3 收藏数)关闭 Copilot 数据训练:“如果你不想让 GitHub Copilot 使用你的数据训练 AI 模型,这样做:进入 Settings -> Copilot -> Privacy,找到 ‘Allow GitHub to use my data for AI model training’ -> 选择 ‘Disabled’。”@varien 报告(3 点赞,183 浏览量):“截至昨天,Github 自动把网站上大多数人的公开和私有仓库都纳入了。”@hatsunama 反对这种 opt-out 设计。多个独立用户同时指出同一隐私默认设置,说明不少人被打了个措手不及。

所有提供商的用量限制与 token 经济学 -- High

@nrehiew_ 分析(8 点赞,1,737 浏览量)补贴结构:“Claude Code/Codex 使用量目前有多少被补贴还有待观察。以 OpenCode 为例,每月 $10,你能获得 $60 的使用量。”@YahyaMakes 抱怨(1 点赞):“OpenAI 和 Anthropic 简直是在把普通用户逼到最高档计划。Opus 4.7 是 token 黑洞。而 Codex 上的 GPT-5.5 消耗的 credits 是 GPT-5.4 的 2x。”@kiruwaaaaaa 量化了消耗(1 点赞,159 浏览量):“claude code max 20x 计划里 5 小时的 opus credits,正好 32 分钟烧完。12 个智能体试图修 3528 个 typescript 错误。它们先成功修好了账单。”

Codex-Harness 集成损坏且昂贵 -- Medium

@hgruenhagen 报告(3 点赞,83 浏览量):“CODEX-HARNESS???我和我的智能体都跑不起来。更糟的是,我刚烧了 $30 API token,因为我没意识到切到 openai/gpt-5.5 会计费,尽管 OAuth 显示的是我的 Codex 订阅。”订阅与 API token 之间不透明的计费边界,让用户掉进了意外收费。

JetBrains 中 GitHub Copilot 插件质量 -- Medium

@gslashm 描述(1 点赞,52 浏览量)JetBrains 集成:“如果他们修好那个烂到爆的 github copilot 插件集成,或者 claude code 插件,我会立刻搬到 intelliJ。claude code 至少有时候还能用,但 gh 完全不可用。”@YSBoomOfficial 给工具排序(1 点赞,277 浏览量):“Copilot 的 harness 在我看来很烂。$20 Claude Code 大概只能用 20 分钟。”

付费 Antigravity 用户遭遇服务器错误 -- Medium

@Godsonsaji_12 把不满直接指向 Google:“我为什么要付 Pro/Ultra 计划的钱,却整天看到服务器错误?连一个简单的‘Hi’都会终止智能体。”这呼应了前一天 Antigravity 的限流抱怨,但从节流升级为直接失败。


3. 人们期望的功能

Grok Code 成为 Codex 的可行替代品

@johnhelmuth_ 表达了需求(23 点赞,1,339 浏览量):“这就是为什么我需要 Grok Code 成为一个靠谱产品,这样我才能摆脱 OpenAI 的 woke 掌控。Codex 太好用了,我害怕自己还得继续给他们钱。”@brycedunhill 呼应:“Grok 什么时候会做出更强的编程集成。如果它有 Codex 等价物,我会完全从 OpenAI 切走。”两个独立用户都表示愿意为了 Grok 版编程智能体切换,说明这是一块未被充分服务的细分市场。

紧迫性:中。机会:[++] —— 用户想要有竞争力的替代品,以降低对单一供应商的依赖。

Codex 作为可扩展平台并支持可分享配置

@daniel_mac8 提出(13 点赞,958 浏览量,4 收藏数):“我看到很少有人讨论 codex app 是一个可以构建其上的平台。是什么阻止别人为 codex 构建自定义配置?让其他人可以下载和导入?随着它转变为 SuperApp,它只会变得更强大。”这想象的是一个 Codex 插件/模板市场——可分享工作流、预配置智能体行为和可导入设置。

紧迫性:中。机会:[++] —— 如果 Codex 成为平台而不只是工具,它就能靠社区生成价值锁住用户。

订阅与 API 之间透明的计费边界

@hgruenhagen 在 Codex 内切换模型时 意外产生 $30 API 账单,以及 @cjayls 询问图像生成使用 API key 还是订阅 credits,都指向 UI 中需要清晰计费分隔。用户无法判断哪些操作从订阅扣减,哪些会触发 API 费用。

紧迫性:高。机会:[+] —— 计费混乱会侵蚀信任并增加流失。

跨工具会话连续性

@coder_blvck 针对从 Claude Code 交接到 Codex 的 详细提示词,以及 @PhalaNetworkClawdi v2.0(11 点赞,246 浏览量)——“AI 智能体的 iCloud:任意设备安装一次,智能体共享同一份 memory、keys、skills 和 files”——都在解决同一个缺口:不同提供商的编程智能体之间没有标准方式来持久化和转移上下文。

紧迫性:中。机会:[++] —— 随着多工具工作流成为常态,这个需求会继续增长。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
OpenAI Codex + GPT-5.5 智能体平台 (+) 统一模型线已确认;Databricks 上企业部署已上线;OfficeQA Pro 基准错误减少 46% Spark 档质量遭 VictorTaelin 批评;credits 消耗是 GPT-5.4 的 2x;订阅与 API 之间计费混乱
Claude Code 终端智能体 (+/-) ynkzlk 的 prompt writer skill 获得 138K 浏览量;JedAIFlow 倡导循环式工作流;vlad_mihalcea 认为它在非编程任务上更强 YSBoomOfficial 称 $20 计划只能用 20 分钟;kiruwaaaaaa 称 opus credits 32 分钟烧完
OpenCode / OpenCode Go 开源智能体 (+) DeepSeek 现在是 Go 使用量第二;默认模型试验场;$10/月获得 $60 使用量 nrehiew_ 认为 token 补贴可持续性不确定
GitHub Copilot 云端 IDE 智能体 (+/-) GPT-5.5 已部署;SDK 通过 acolombiadev 支持 React Native 集成 JetBrains 插件质量差;数据训练默认 opt-out;可靠性担忧
Google Antigravity IDE (-) 教育内容充足;crawler_gill 构建了 SEO dashboard 假下载窃取账号(Malwarebytes);Pro 用户遭遇服务器错误;“真的有人在 Antigravity 上写代码吗?”
Steel CLI 浏览器自动化 (+) 现在支持 Codex、OpenCode 和 Pi 编程智能体 早期工具生态
Clawdi v2.0 智能体记忆 (+) 跨智能体共享 memory/keys/skills;默认 TEE 加密 多设备上下文的冲突解决不清晰

4 月 25 日的工具版图延续了前一天的三层结构:Codex 和 Claude Code 位于顶部,OpenCode 作为中立开源层,其他工具争夺细分位置。今天的关键变化是企业验证——Databricks 和 Microsoft 部署 GPT-5.5,Copilot SDK 支持 acolombiadev 的 React Native app 等第三方集成。


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
Opus 4.7 Prompt Writer Skill @ynkzlk 为编程智能体生成带范围、约束、工具计划和验证闸门的结构化提示词 杂乱无结构的提示词会导致智能体行为不可靠 Claude Code, Opus 4.7, Sonnet 4.6 subagents Shipped Post
Copilot SDK React Native Integration @acolombiadev via @github 在 React Native 中提供 AI 驱动的 issue 摘要,带优雅降级和缓存 缺少在移动 app 中嵌入 Copilot AI 的标准模式 React Native, Copilot SDK 教程/演示 Post
Idea Roaster Agent @adxtyahq 结合 Steve Jobs + YC partner + VC 视角,对创业想法给出尖锐反馈的智能体 创始人没有早期严厉反馈,容易在坏想法上浪费时间 Claude Code 可用原型 Post
Claude-to-Codex Session Handoff @coder_blvck 用于在 Codex 中继续 Claude Code 会话的结构化提示词模板 任务中途切换编程智能体时上下文丢失 Claude Code, Codex 模板 Post
Clawdi v2.0 @PhalaNetwork 在任意设备上的编程智能体之间共享 memory、keys、skills 和 files 智能体跨设备和工具丢失状态 Phala TEE, OpenClaw, Claude Code, Codex Shipped Post
Claude Chronicle Plugin @magikx 将 Codex Chronicle 的屏幕录制记忆注入 Claude Code Claude Code 不知道用户在其他 app 中做了什么 Claude Code, Codex Chronicle 可用原型 Post
SEO Dashboard @crawler_gill 使用 DataForSEO API 的迷你 Ahrefs 风格 dashboard 非程序员无法构建自定义 SEO 分析工具 Google Antigravity, DataForSEO API 可用原型 Post
GPT-Image-2 Codex Integration @Amank1412 通过自然语言实时生成和替换游戏贴图 手工资产制作拖慢游戏原型开发 Codex, GPT-Image-2 演示 Post

ynkzlk 的 prompt writer skill 因其触达(138K 浏览量)和方法而突出:它不是再做一个编程智能体,而是构建一个让现有智能体更可靠的元层。magikx 的 Claude Chronicle plugin 和 coder_blvck 的 Claude-to-Codex handoff 都在解决跨工具上下文缺口;随着用户同时使用多个智能体,这正在成为主导工作流痛点。

由 GitHub 官方账号重点介绍的 acolombiadev Copilot SDK React Native 集成(11,926 浏览量),展示了在移动 app 中嵌入 AI 编程能力的生产模式——包括健康检查、认证错误回退和基于智能标签的回退摘要。


6. 新动态与亮点

Codex CLI 与 Cohere Terrarium 中的安全沙箱逃逸

@Dinosn 指出(4 点赞,564 浏览量,2 收藏数)一篇跨 CVE 分析:“Cohere Terrarium(CVE-2026-5752)和 OpenAI Codex CLI(CVE-2025-59532):AI 代码沙箱逃逸的跨 CVE 分析。”这与 Malwarebytes 关于假 Antigravity 下载的报告相互呼应,共同勾勒出 AI 编程工具正在越来越多地被安全研究者和攻击者盯上的图景。

GPT-Image-2 集成进 Codex,用于实时游戏贴图

@Amank1412 报道(4 点赞,161 浏览量):“OpenAI 将 GPT-Image-2 集成进 Codex。开发者可以使用自然语言实时生成和替换游戏贴图——无需重启。在一个 2D 僵尸塔防演示中,环境能在几秒内更新。”这让 Codex 从代码生成延伸到同一工作流内的视觉资产生成。

OpenAI Codex Ambassador 计划全球扩张

@TimHaldorsson 宣布(100 点赞,3,629 浏览量,21 收藏数)自己“现在是 Portugal 的 Codex ambassador”,并将在 5 月 14 日举行 Lisbon 企业活动。@gabrielchua 列出 Sydney 和 Melbourne 的活动。@sachindas246 发布了 Kochi Codex hackathon 现场。ambassador 计划正在为 Codex 采用建立现实世界的分发网络。

尽管智能体能力增强,语言熟练度仍然必要

@Trader_XO 反对(10 点赞,2,958 浏览量,4 收藏数)不加批判地采用智能体:“在先理解语言之前就直接跳进 Codex、Claude Code 或任何智能体,感觉就像大规模复制 stack overflow 片段。智能体无疑有用,但它们并没有消除语言熟练度的必要。它们实际上抬高了门槛。”这以更细腻的立场反击“你不需要会写代码”的叙事:智能体提高了代码审查速度,因此理解能力更重要,而不是更不重要。

GitHub Constellation 2026 上的 Responsible AI

@arsh_goyal 采访(4 点赞,226 浏览量)了 Microsoft 的 Responsible AI Chief Product Officer,地点是 GitHub Constellation 2026,内容涵盖 Bing Chat 与 GitHub Copilot 的安全 playbook、未审查开源模型的挑战,以及印度作为 GitHub 第二大开发者社区的地位。


7. 机会在哪里

[+++] 跨智能体会话连续性与记忆 -- 三个独立项目都在解决这个缺口:coder_blvck 的 Claude-to-Codex handoff template、PhalaNetwork 的 Clawdi v2.0(跨设备共享智能体记忆),以及 magikx 的 Claude Chronicle plugin(跨 app 上下文)。当三个彼此独立的构建者同时解决同一个问题时,市场信号很强。第一个把无缝多智能体上下文转移作为标准功能的工具,将赢得多工具工作流。

[+++] 透明的 token 经济学与计费 -- nrehiew_ 的 补贴分析($10 买到 $60 使用量)、hgruenhagen 的 意外 $30 API 费用、YahyaMakes 对 强制升级的抱怨,以及 kiruwaaaaaa 的 32 分钟 opus 消耗,都指向同一个结构性问题:用户无法预测自己会花多少钱。一个能跨提供商提供实时成本追踪、支出预测和计费边界清晰度的工具或 dashboard,可以回应最普遍的挫败感。

[++] 结构化智能体技能市场 -- ynkzlk 的 prompt writer skill(138K 浏览量)和 daniel_mac8 的 Codex 平台愿景,都指向可分享、可导入的智能体配置。一个类似 app store 的 agent skills、prompt templates 和 workflow configurations 市场,会围绕托管它的平台产生网络效应。

[++] Grok Code / 替代性竞争编程智能体 -- johnhelmuth_ 的 呼吁(23 点赞)和 brycedunhill 对 Grok 编程工具的 请求,加上 Frances48452643 的 比较称 Claude 和 OpenAI “far superior”,都说明智能体式编程空间需要第三个严肃竞争者。

[+] AI 编程安全工具 -- Malwarebytes 的 假 Antigravity 报告、Dinosn 指出的 Codex CLI sandbox escape CVEs,以及 bohopsvarien 对 Copilot 数据训练默认设置的持续担忧,正在扩大一个攻击面:专门面向 AI 编程生态的安全工具。


8. 要点总结

  1. GPT-5.5 模型统一消除了单独的 Codex 线,将 OpenAI 的编程赌注集中到单一模型上。 OpenAI 的 romainhuet 确认“不再有单独的编程线”。企业部署立即通过 Databricks 和 Microsoft Copilot 生态跟进。策略很清楚:一个前沿模型服务所有任务,差异化不靠模型变体,而靠 harness(Codex、Copilot、API)。

  2. DeepSeek 已升至 OpenCode Go 使用量第二,验证了开放模型路由平台。 @jayair 报道(186 点赞,数据集最高)DeepSeek Pro 现在仅落后于 Kimi。V4 集成一天后,该模型已经改写使用量排行榜,说明用户会采用性价比最高的选项,不管提供商出身。

  3. 跨智能体会话连续性是下一个关键基础设施缺口。 三个独立项目——coder_blvck 的 handoff templatePhalaNetwork 的 Clawdi v2.0magikx 的 Claude Chronicle——都解决同一个问题:在编程智能体之间切换时上下文丢失。这种收敛说明机会已经具备市场条件。

  4. Token 经济学依然不透明且惩罚性强,制造了最响亮的用户抱怨。nrehiew_ 的补贴分析,到 hgruenhagen 的意外 $30 账单,再到 kiruwaaaaaa 在 32 分钟内烧完 5 小时 opus credits,模式一致:用户无法预测或控制支出,订阅预期与实际 token 消耗之间的落差造成挫败和流失。

  5. 面向智能体的结构化提示正在取代临时交互,成为主导工作流。 @ynkzlkprompt writer skill 通过提供范围、约束、工具计划和验证闸门获得 138K 浏览量。@JedAIFlow 倡导 用循环式工作流取代片段请求。社区正在从“让 AI 写代码”转向“给 AI 一份结构化计划并验证输出”。

  6. Codex ambassador 计划正在为 OpenAI 开发者平台构建线下分发。 LisbonSydney/MelbourneKochi 宣布的活动表明 OpenAI 正在投资社区驱动采用,这类似传统开发者关系,但推进速度更快。Anthropic 或 Google 还没有等价的地面战。