HackerNews AI - 2026-04-16¶
1. 人们在讨论什么¶
1.1 开放权重缩小与前沿模型的差距 🡕¶
当天头号故事是 Qwen3.6-35B-A3B:一个 35B 参数的混合专家模型,只有 3B 活跃参数,针对智能体式编程调优。它以 801 积分和 374 条评论主导首页,并引发了更广泛的争论:前沿模型提供商能否维持领先。
cmitsakis 分享了这次发布(帖子)。几个小时内,Unsloth 已经把它量化成 20.9GB GGUF。simonw 报告说,他通过 LM Studio 在笔记本上运行后,发现它画出了一只比 Opus 4.7 更好的“骑自行车的鹈鹕”——这是一个玩笑式但很有信号意义的视觉基准。
讨论要点: gertlabs 直白地框定了竞争动态:“前沿模型提供商正在努力拉开自己和最佳开源模型之间的距离。行业经济学正在威胁他们的护城河。” mtct88 识别出一个服务不足的市场:“小型开放权重编程模型,在我看来,是为受限于不能访问公共模型的开发团队定制智能体的方向”——他举了银行和医疗的例子。bertili 指出,考虑到 Qwen 内部组织动荡,包括首席研究员 Junyang Lin 遭遇“被削权”并离职,这次发布令人松了一口气。
同一天,dhruv_ahuja 报告称,Qwen 免费编程档位已于 4 月 15 日正式停止,用户被引导切换到 OpenRouter、Fireworks AI 或其他提供商(帖子)。同一天既发布一流开放模型,又关闭免费托管档位,这种并置凸显了向自托管部署的转变。
与前日对比: 昨天关于开源的讨论围绕 Cal.com 的闭源转向展开。今天的对话从防御(关闭源码)转向进攻(开放模型追平 frontier 质量)。
1.2 Claude Opus 4.7:一次复杂发布 🡕¶
Anthropic 发布 Claude Opus 4.7,同时出现多篇配套帖子:系统卡(151 积分,74 条评论)、“what's new”平台文档、Claude Code 最佳实践指南、分词器基准,以及智能体基准测试结果。如此密集的覆盖说明这是一次协调发布,但社区反应明显复杂。
adocomplete 分享了模型卡(帖子)。ilkkao 分享了平台文档(帖子)。mfiguiere 分享了最佳实践指南(帖子)。aray07 分享了分词器分析,显示英文效率提升 1.47x,但中文只有 1.01x(帖子)。skysniper 指出,它主导智能体基准测试,但比 Opus 4.6 贵 15%(帖子)。
讨论要点: bachittle 标记了一个显著回归:“Opus 4.7 在长上下文检索上明显差于 Opus 4.6。Opus 4.6 得分 91.9%,Opus 4.7 得分 59.2%。” vessenes 认为模型卡像是“一份 Claude Mythos 模型卡匆忙改成了 Opus 4.7 模型卡”,并推测“高层有人暂停了 Mythos 发布”。Symmetry 指出,“意外的思维链监督”影响了 7.8% 的训练 episodes——这也是影响 Mythos Preview 的同一个 bug。
平台文档中的关键技术变化包括:新的 xhigh effort level(现在是 Claude Code 默认值)、任务预算(beta,对智能体循环的建议性 token 上限)、高分辨率图像支持(2576px,从 1568px 提升),以及删除 extended thinking budgets 和所有 sampling parameters 的破坏性变更。最佳实践文章建议把 Claude “更像是你委派任务的能干工程师,而不是你逐行指导的结对程序员”。
fofoz 报告称,GitHub Copilot 在 4 月 30 日前以 7.5x token 倍率提供 Opus 4.7(帖子),说明尽管存在回归,生态采用仍很广。
与前日对比: 昨天关于 Claude 的覆盖主要由故障和限流主导。今天焦点转向模型发布本身,怀疑点是它到底是真正升级,还是 Mythos 前的匆忙过渡发布。
1.3 Codex 超越代码 🡕¶
OpenAI 的“Codex for Almost Everything”公告(553 积分,295 条评论)把 Codex 定位成通用计算机智能体,而不只是编程工具。这篇帖子引发了关于 scope creep、竞争定位和信任的尖锐争论。
mikeevans 分享了公告(帖子)。woeirua 给出了最直白的评价:“Claude Desktop 和 Cowork 基本上已经做了这些。Codex 不是在开创这些功能,主要是在追赶。”
讨论要点: daviding 识别出一个 UX 担忧:“这些产品的 UI 似乎很热衷于向程序员隐藏代码……实际代码变成某种恼人的中间运行时麻烦,需要被遮住。” jampekka 从经验出发给出了反向观点:“我重度使用 CLI 已经 25 年,最近却发现自己会用 Codex 做终端任务……如果有人能给普通人做出一个可靠的 GUI 版本,大家会买账。” uberduper 直接提出信任问题:“人们真的想让 Codex 控制自己的电脑和应用吗?” incognito124 怀疑时机:“OpenAI 随时都有 2-3 个未发布版本准备好,就是为了抢竞争对手风头。”
1.4 智能体式编程工作流成熟 🡒¶
多个故事汇聚到日常使用编程智能体的现实问题上——从管理心流状态,到处理安全和代码审查瓶颈。
fny 在把 Claude Code 当作日常主力工具使用一年后,发帖问“vibe coding 时如何保持心流?”并描述了“同时管理 2-3 个智能体”带来的疲惫(帖子)。回应从框架级策略到哲学怀疑都有。
讨论要点: maebert 给出了最详细的工作流:规划一个“重”任务,加上 2-6 个智能体处理小任务;把干预聚成批次;大量投资于可验证性(规格、集成测试、对抗式审查提示词);并且“接受盯着 spinner 发呆。做白日梦。听音乐。” cdnsteve 推荐用 git worktrees 支持并行智能体,并提到自定义工具 Sugar(跨会话记忆)和 RemembrallMCP(用于变更影响分析的 AST/code graph)。Bridged7756 则怀疑整个前提:“我不理解并行智能体编程的吸引力……审查你没写的代码,真的比自己一点点写并在脑子里建立上下文更容易吗?”
cpan22 发布了 Stage,这是一个代码审查工具,会把 PR 按易理解顺序组织成逻辑“章节”(帖子)。gracealwan 指出了更深层愿望:“我很想看到 PR 评论能自动同步回编程智能体对代码库的上下文中。”
ronxjansen 分享了 Guardbase 的《Coding Agents Degrade Sandboxes to Security Theater》(帖子),adriancooney 则指出 Claude Code 会在读取文件时注入隐藏提示,以防止恶意软件修改(帖子)。
与前日对比: 昨天的可靠性危机(故障、限流)已经演变成工作流层面的担忧。开发者已经越过“它能不能工作”阶段,进入“我该如何和它一起工作”阶段。
1.5 逆向工程作为自动化策略 🡕¶
Kampala(YC W26)提出一种 MITM proxy 方法来自动化遗留系统——把 app 流量逆向工程成确定性 API,而不是使用浏览器自动化或 computer-use agents。它获得 58 积分和 56 条评论,是当天讨论数与得分比最高的帖子。
alexblackwell_ 发布了 Kampala(帖子),并主张“自动化的未来不是把网页截图发给 LLM,而是使用电脑真正理解的下一层。”
讨论要点: ksri 描述了一个独立达成相同目标的工作流:下载 Chrome network tab 为 HAR,请 Claude 把 API 记录成 OpenAPI JSON,然后构建一个 MCP server,用 Playwright 提取 auth——“用 Claude 花大约一个小时的 token,我们就能得到一个在本地用每个用户凭据工作的 MCP server。” IMTDb 提出了 SSL pinning 问题:“我交互的大多数 apps 都有某种 SSL pinning,而绕过它才是难点。” 5701652400 警告说:“YC25/YC26 批次里有多个创业公司公然违反 ToS,坐在定时炸弹上。”
2. 令人困扰的问题¶
Claude Opus 4.7 用回归换取基准分¶
长上下文检索从 91.9%(Opus 4.6)降到 59.2%(Opus 4.7),模型卡也承认了这一点。Extended thinking budgets 和 sampling parameters 被完全移除——任何使用非默认 temperature、top_p 或 top_k 的请求都会返回 400 错误。bachittle 记录了检索回归(帖子)。vessenes 质疑 Opus 4.7 是否“整体质量净提升”。johnmlussier 报告称,Opus 4.6/4.7 的 cyber policy changes 会破坏授权 bug bounty 工作流(帖子)。严重程度:High。破坏性 API 变更会迫使迁移工作,而检索退化直接影响长上下文智能体式工作流。
并行智能体带来的认知过载¶
fny 描述自己日常使用一年后,因为“管理 2-3 个智能体带来的所有上下文切换”而感到疲惫(帖子)。Bridged7756 质疑整个范式:“review 你没写的代码,真的比手动编写并一点点在脑子里建立上下文更容易吗?” al_borland 因为 agent mode 造成更多压力而彻底放弃它。严重程度:Medium。并行智能体的生产力承诺可能被认知负担抵消,而社区还没有共识认为这种方法是否有效。
Cloudflare Durable Object 计费意外¶
thewillmoss 记录了一张来自 DO alarm loop bug 的 $34,895 账单:60+ 个 preview Worker deployments 创建了独立 DO instances,峰值达到每天 930 billion row reads;由于 Cloudflare 的用量通知只监控 CPU time,不监控 DO operations,因此没有任何平台警告(帖子)。DO operations 没有 spending cap。这正好碰上 Cloudflare “Agents Week” 营销,把 solo developers 拉进同一个产品。严重程度:High。一个常见模式中的单个 bug(onStart + setAlarm)就能在没有 guardrails 的情况下制造五位数账单。
Qwen 免费 tier 无预警关闭¶
dhruv_ahuja 报告称,Qwen 的 OAuth free tier 于 4 月 15 日停止,通知很少——用户先是通过含糊的 401 “invalid access token”错误发现问题,之后消息才出现(帖子)。严重程度:Medium。基于免费 tier 构建的开发者会在缺少提前通知的情况下遭遇迁移摩擦。
GitHub Copilot Chat 可能存在供应链担忧¶
warhorse10_9 标记 GitHub Copilot Chat 0.44.1 是一个潜在恶意版本(帖子)。严重程度:Medium(等待调查)。开发者工具上的供应链攻击会有异常大的影响范围。
3. 人们期望的功能¶
跨会话持久化的智能体记忆¶
多个独立项目处理同一个缺口:会话结束后,智能体会丢失所有上下文。t55 构建 Kilroy,这是一个知识库,智能体可以跨会话自主给彼此留言(帖子)。jacobgorm 基于 Witchcraft/Dropbox 的语义搜索引擎构建 Pickbrain,用来索引所有 Claude Code 和 Codex 对话记录(帖子)。cdnsteve 描述了用于在会话外存储记忆的 Sugar,以及用于代码图谱上下文的 RemembrallMCP(帖子)。mhome9 分享了 Mnemo,一个作为智能体记忆的本地优先记事本(帖子)。一天内 4 个独立项目都在解决同一个问题。机会:直接。
能随着智能体输出扩展的代码审查¶
cpan22 构建 Stage,是因为“瓶颈已经不是写代码,而是审查它”(帖子)。gracealwan 希望 PR 审查反馈能自动同步回智能体上下文,让“一个工程师或一组工程师”不会“一再犯同样的代码质量错误”。sscarduzio 描述了把 PR 审查知识蒸馏进 Bugbot 微调和 CLAUDE.md。需求是双向的:智能体从审查中学习,而审查又被组织得便于人类理解。机会:直接。
确定性 API 自动化(不是浏览器自动化)¶
alexblackwell_ 构建 Kampala,是因为浏览器自动化“脆弱、慢且不确定”(帖子)。ksri 独立描述了一个 HAR-to-MCP 工作流,达到相同结果。底层需求是:一种标准流水线,可以把任意应用的流量变成版本化、可测试的 API——不只是给开发者用,也给需要访问遗留系统工具的智能体用。机会:竞争性。
不需要 PhD 的多智能体编排¶
Anon84 询问大家如何在生产中使用 LLM,得到的回答实用但分散(帖子)。nyellin 询问 Claude 之上的智能体编排器和 UI(帖子)。kentnguyen 发布 Konductor,定位为“AI Orchestration Agent Framework for Every Dev”(帖子)。共同线索是:开发者想要生产级编排,但它要比 LangGraph/CrewAI 简单,又比裸 API 调用更结构化。机会:竞争性。
4. 使用中的工具与方法¶
| 工具 | 类别 | 评价 | 优势 | 局限 |
|---|---|---|---|---|
| Claude Code | 编程智能体 | (+/-) | 深度智能体推理,Opus 4.7 在 SWE 任务上改进 | 长上下文检索回归,破坏性 API 变更,规模化时认知过载 |
| Claude Opus 4.7 | LLM | (+/-) | 最佳智能体基准测试,任务预算,高分辨率视觉 | 长上下文检索 59.2%(此前 91.9%),采样参数被移除,贵 15% |
| Codex (OpenAI) | 编程智能体 / Desktop | (+/-) | 扩展到通用计算机控制,超越编程 | 在追赶 Claude Desktop/Cowork;围绕系统访问的信任担忧 |
| Qwen3.6-35B-A3B | 开放 LLM | (+) | 35B/3B MoE,可在笔记本运行,针对智能体式编程优化 | 免费档位被杀,Qwen 组织不稳定 |
| GitHub Copilot | IDE 智能体 | (+/-) | VS Code 集成,现在提供 Opus 4.7 | Opus 4.7 有 7.5x token multiplier;v0.44.1 可能存在供应链担忧 |
| MCP | 智能体协议 | (+) | 多框架兼容,229-tool servers 可由 OpenAPI 生成 | 消耗上下文窗口(首条消息前 55k+ tokens) |
| Cloudflare Durable Objects | 智能体基础设施 | (-) | 面向智能体状态的 durable execution | 无 spending cap,无 row-read monitoring,$34k 意外账单 |
| Agent! (macOS) | 原生 IDE | (+) | 17 个 LLM 提供商,Apple Intelligence,XPC 沙箱 | 仅限 macOS,root 级守护进程担忧 |
| Tauri v2 | Desktop Framework | (+) | 轻量原生应用(Marky 的 .dmg 为 15MB) | 以 macOS 为中心的生态 |
| Witchcraft (Dropbox) | 语义搜索 | (+) | 21ms p.95,单个 SQLite 文件,无 API keys | Rust 构建复杂,早期发布 |
当天工具格局显示,一个更成熟的生态正在出现:模型层(Opus 4.7、Qwen3.6)和基础设施层(MCP、Durable Objects)的演化速度,快于工作流层(会话管理、记忆、审查)。开发者正在这些层之间搭桥——Pickbrain 把语义搜索连接到智能体会话,Kilroy 把智能体知识连接到团队上下文,Stage 把智能体输出连接到人类审查。“工具孤立可用”和“工具融入我的工作流”之间的缺口,正是多数摩擦所在。
5. 人们在构建什么¶
| 项目 | 构建者 | 功能 | 解决的问题 | 技术栈 | 阶段 | 链接 |
|---|---|---|---|---|---|---|
| Agent! | jv22222 | 支持 17 个 LLM 提供商的原生 macOS 编程 IDE | 厂商锁定,缺少原生桌面智能体 | Swift 6.2, XPC, Apple Intelligence | Shipped | GitHub |
| Kampala | alexblackwell_ | 把应用逆向工程成 API 的 MITM 代理 | 面向遗留系统的浏览器自动化脆弱 | MITM proxy, MCP, Python | Beta | Site |
| Stage | cpan22 | 把 PR 组织成可读章节的代码审查 | AI 生成 PR 带来的审查积压 | React, GitHub API | Alpha | Site |
| Ilha | ryuzyy | 设计成能放进 AI context window 的 UI library | UI libraries 对 LLM 上下文来说太大 | Web components | Alpha | Site |
| Kilroy | t55 | 智能体彼此留言的知识库 | 智能体记忆无法跨会话持久化 | Postgres, React, MCP, better-auth | Shipped | GitHub |
| Witchcraft + Pickbrain | jacobgorm | 面向 AI 编程会话的语义搜索 | “我当时修 auth 的那次对话在哪里?” | Rust, SQLite, XTR-Warp | Shipped | GitHub |
| Agent-cache | kaliades | 面向 Valkey/Redis 的多层 LLM/tool/session caching | 各框架缓存碎片化 | Node.js, Valkey, Redis, OpenTelemetry | Alpha | npm |
| Marky | GRVYDEV | 面向智能体式编程的轻量 markdown viewer | 审查智能体生成的 plans/docs | Tauri v2, React, markdown-it | Shipped | GitHub |
| Mnemo | mhome9 | 作为 AI 智能体记忆的本地优先记事本 | 智能体在会话间忘记所有东西 | 未知 | Alpha | GitHub |
| KelvinClaw | kmondlane | 带供应链验证的安全模块化智能体测试框架 | 智能体框架中的插件安全 | 未知 | Alpha | Site |
| Perplexity Clone | anupsing_ai | 单文件 backend 的开源 research agent | 搜索 + LLM + persistence 的复杂基础设施 | Next.js, Tavily, OpenRouter | Alpha | GitHub |
| Deepgram CLI | lukeocodes | Agent-aware Deepgram 转录 CLI | 缺少用于 agent-integrated speech 的 CLI 接口 | Node.js | Alpha | CLI |
| Tokanban | clippy99 | Agent-first task management system | 任务管理不是为智能体工作流设计的 | 未知 | Alpha | 帖子 |
| AgentPulse | Craze0 | 面向 Claude Code 和 Codex 的实时可观测性 dashboard | 看不见智能体正在做什么 | 未知 | Alpha | 帖子 |
Agent! for macOS 的广度值得注意:17 个 LLM 提供商、用于 UI 自动化的端侧 Apple Intelligence(零云端 token)、XPC 权限分离、基于 SDEF 的运行时应用发现,以及反幻觉提示词。ammmir 的担忧——“通过专用 macOS Launch Daemon 安全运行 root 级命令。真可爱”——反映了任何需要系统访问的智能体内在张力。foreman_ 提出了更深层问题:“当前模型如何区分用户意图和‘智能体读到的内容’?”
Dropbox 的 Witchcraft 值得关注,因为它的技术路线很特别:用 Rust 重写 Stanford 的 XTR-Warp 多向量搜索,从单个 SQLite 文件达到 21ms p.95 延迟。Pickbrain 扩展会索引 Claude Code 和 Codex 对话记录,实际上给智能体提供全局长期记忆。这个开放工具的运作方式——没有 API keys、没有向量数据库、没有分块——契合今天故事里反复出现的自托管趋势。
Mulligan Labs(vrennat)是一个多人版 Magic: The Gathering playtester,5 个月内借助“重度 Claude assistance”构建而成——SvelteKit 跑在 Cloudflare Workers 上,PartyKit Durable Objects 作为权威游戏服务器(帖子)。这是一个大规模 Claude 辅助应用开发的具体案例研究。
6. 新动态与亮点¶
Mozilla Thunderbolt:企业 AI Client 开源¶
Mozilla 发布 Thunderbolt,这是一个面向希望自托管 AI 基础设施的组织的开源“sovereign AI client”(帖子)。它集成 MCP servers、Agent Client Protocol 和 deepset 的 Haystack 平台,并提供 Windows、macOS、Linux、iOS、Android 原生 apps。项目采用 MPL 2.0 许可,由 MZLA Technologies 提供企业许可。官方公告位于 thunderbolt.io。rincebrain 捕捉到了普遍反应:“你们花了多少钱请人选了一个未来 12 个月会被扔掉的名字,因为大家会一直以为你说的是 Thunderbird。” 名字之外,这是 Mozilla 进入企业 AI 基础设施领域最清晰的一步,直接竞争 Claude Desktop 这类专有 client。
Apideck:从单个 OpenAPI Spec 生成 229 个 MCP Tools¶
zacian 分享了 Apideck 如何使用 Speakeasy,从其 Unified API OpenAPI spec 生成一个包含 229 个工具的生产 MCP 服务器,并部署在 Vercel serverless 上(帖子)。每个工具都是 SDK 函数的薄封装。这种方法证明,对拥有大型 API surface 的平台来说,规模化 MCP 是可行的——spec 变化后,一条 speakeasy run 命令就能重新生成全部内容。
Cloudflare AI Search:面向智能体的搜索原语¶
aninibread 分享了 Cloudflare AI Search——一个专门为智能体消费设计的搜索原语(帖子)。结合昨天的 Project Think 持久执行和今天的 $34k 计费事件,Cloudflare 的智能体基础设施动作同时是这个领域最雄心勃勃、也最有风险的平台赌注。
Sir-Bench:面向智能体的安全事件响应基准¶
dan_l2 分享了 Sir-Bench,这是一个用于评估安全事件响应智能体的新基准(帖子)。随着智能体获得更多系统访问(Agent! 运行 root 级命令,Kampala 拦截网络流量),在安全场景中标准化评估智能体行为变得很关键。
Claude Code 在读取文件时注入隐藏提示¶
adriancooney 报告称,Claude Code 会在读取文件时注入隐藏提示,以防模型被诱骗修改恶意软件(帖子)。这是带内智能体安全所依赖的“提示词注入防御”层的一个例子——也正是昨天 Meta OpenClaw 事件中失败的那类模式,当时上下文压缩丢弃了安全指令。
7. 机会在哪里¶
[+++] 智能体记忆与跨会话知识 —— 同一天有 4 个独立项目发布,试图解决智能体记忆问题:Kilroy(团队知识库)、Pickbrain/Witchcraft(语义会话搜索)、Sugar/RemembrallMCP(跨会话记忆和代码图谱)以及 Mnemo(本地优先笔记)。这种碎片化确认了问题急迫且未解。赢家需要同时跨 Claude Code、Codex 和 OpenCode 工作——Kilroy 已经做到这一点。(帖子,帖子,帖子,帖子)
[+++] 面向 AI 生成代码的代码审查工具 —— Stage 的发布,加上 vibe coding 心流讨论,确认了审查是新瓶颈。机会不止于 PR UI:审查反馈回流到智能体上下文(gracealwan 和 sscarduzio 描述的方向)会带来飞轮效应,让智能体从每次审查中改进。还没有工具端到端闭合这个循环。(帖子,帖子)
[++] 面向受限环境的开放权重模型 —— Qwen3.6-35B-A3B 在笔记本上以 3B 活跃参数运行,同时匹配前沿模型质量,打开了受监管企业市场:银行、医疗、国防。mtct88 指出,这是“一个很大程度上被西方玩家忽视的市场,Mistral 是唯一在那个方向行动的公司”。开放权重 + 智能体调优 + 笔记本部署的组合,是一个产品类别,而不只是模型发布。(帖子)
[++] 确定性 API 逆向工程 —— Kampala 的 MITM 方法和 ksri 的 HAR-to-MCP 工作流都证明,流量层自动化在可靠性上胜过浏览器自动化。随着智能体需要访问更多遗留系统工具,“捕获流量、提取 API、生成 MCP 服务器”这条流水线会成为基础设施。IMTDb 提出的 SSL pinning 挑战是关键技术障碍。(帖子)
[+] 面向智能体基础设施的云支出护栏 —— $34k Durable Object 事件证明,面向人类驱动流量设计的 serverless 计价模型,在智能体制造指数级循环时会失效。修复不只是计费提醒,而是架构层面:支出上限、告警状态熔断器和预览环境隔离。这适用于所有 serverless 平台,不只是 Cloudflare。(帖子)
[+] 企业 AI 客户端(自托管) —— Mozilla Thunderbolt 的发布验证了一个类别:面向组织的自托管、模型无关 AI 工作区。MCP 集成、工作流自动化和跨平台原生应用的组合,瞄准了消费级 Claude Desktop 与定制企业部署之间的缺口。(帖子)
8. 要点总结¶
-
开放权重模型正在智能体式编程上接近前沿模型提供商。 Qwen3.6-35B-A3B 以 3B 活跃参数在笔记本上运行,并在编程任务上与 Opus 4.7 竞争。gertlabs:“前沿模型提供商正在努力拉开自己和最佳开源模型之间的距离。”(帖子)
-
Claude Opus 4.7 在改进之外也带来了显著回归,社区注意到了。 长上下文检索下降 33 个百分点。扩展思考预算和采样参数被移除。模型卡像是一个被推迟的 Mythos 中间版本。开发者必须在智能体基准收益与检索、灵活性损失之间取舍。(帖子,帖子)
-
智能体记忆是当天最受争夺的未解问题。 4 个独立项目(Kilroy、Pickbrain、Mnemo、Sugar)都发布来解决跨会话知识持久化。赢家会是最先做到多智能体、多工具兼容的一方。(帖子,帖子)
-
代码审查,而不是代码生成,是新瓶颈。 Stage、vibe coding 心流讨论和多条评论都收敛到同一个洞察:写代码变快了,但审查没有。下一次生产力解锁在于“审查到智能体”的反馈循环。(帖子,帖子)
-
Serverless 计价模型不是为智能体工作负载设计的。 一个 onStart() bug 在 8 天内制造了 $34,895 Cloudflare 账单。Cloudflare 的用量通知不覆盖 Durable Object 操作,也没有支出上限。每个营销“智能体基础设施”的平台,都需要为指数级智能体循环提供护栏。(帖子)
-
流量层自动化正在相对浏览器自动化获得牵引力。 Kampala 和独立 HAR-to-MCP 工作流证明,逆向工程 HTTP 流量可以比基于截图的方法提供更快、更可靠的智能体工具访问。法律和伦理问题仍未解决。(帖子)
-
三巨头(Anthropic、OpenAI、Mozilla)同日发布。 Opus 4.7、Codex 扩展和 Thunderbolt 同时发布,各自瞄准 AI 开发栈的不同部分。竞争压力正在加速发布节奏——可能以打磨程度为代价。(帖子,帖子,帖子)