跳转至

Twitter AI Agent - 2026-05-06

1. 人们在讨论什么

1.1 运行框架工程成为智能体领域的核心学科 🡕

@Vtrivedy10 发布(81 点赞数,6 回复,2 引用,100 收藏数,4214 浏览量)了一份关于智能体运行框架工程的 8 点宣言:“只要围绕任务把 harness 设计好,你几乎可以在任何任务上胜过任何默认的 harness+model 组合(包括 codex 和 claude code)。” 核心主张:不存在“通用型”智能体(定制时间与性能之间必须取舍),评估是护城河,前沿闭源模型“对世界上绝大多数任务来说都贵得过头”。

@oneill_c 认可(97 点赞数,8963 浏览量)Harvey 的领域特定模型训练路线:“现在,世界上最好的公司都在利用自己的领域专长和真实世界反馈闭环来构建 evals 和 rewards(进而最终构建模型),从而走到闭源模型的提示工程和运行框架工程所能达到的效果之上。” @itsandrewgao 指出(10 点赞数,1628 浏览量):“大家太低估运行框架工程相比基础模型能带来多大提升了。”

@tezos 分享(25 点赞数,899 浏览量)了 TezDev 2026 的一段演讲,其中 @yurug 指出“多数使用 AI 智能体的团队,只是在改造现有流程——就像给自行车装个马达——而不是从头重新思考工作流。团队真正需要修的是 harness。”

与前日对比: 5 月 5 日侧重 /goal 命令和多日运行作为运行框架工程的实际体现。5 月 6 日将讨论提升到第一性原理——@Vtrivedy10 的宣言把运行框架工程视为一门拥有独立取舍曲线、成本模型和评估体系的学科,而 @oneill_c 则表明前沿公司已经越过提示工程阶段,进入由运行框架衍生评估驱动的自定义模型训练。

讨论要点: @BetterSayAJ 的回复点出了核心张力:“这和经典 IR + 系统思维非常接近。一旦模型固定下来,大多数提升都来自检索、工具和评估循环。‘模型会吃掉脚手架’这个想法放到生产环境里,感觉仍然不完整。” @Vtrivedy10 承认他预期“模型会吞掉更多脚手架”,但同时认为“帮助智能体为自己准备好工具和上下文的团队会做出更好的产品。”


1.2 AWS Agent Toolkit 发布:40+ 技能与 15,000 API 接入 🡕

@clare_liguori 宣布(193 点赞数,6 回复,3 引用,183 收藏数,12788 浏览量)AWS Agent Toolkit 上线:“包含 40+ 个技能、3 个智能体插件,以及一个可供智能体调用全部 15,000+ AWS APIs 的远程 MCP 服务器,还能运行脚本、搜索文档、获取技能。” GitHub 仓库地址指向 github.com/aws/agent-toolkit-for-aws。

@awsdevelopers 转发宣传(14 点赞数,3634 浏览量):“你的编程智能体现在可以拉取实时文档、通过你的凭证发起真实 API 调用,并按步骤执行常见任务的操作手册。兼容任何支持 MCP 的智能体。”

与前日对比: 5 月 5 日出现的是单个工具(Insforge Skills、Hermes skills)作为编程智能体的上下文工程层。5 月 6 日标志着平台级入场:AWS 通过单一 MCP server 将 15,000 个 API 打包为智能体可调用技能,是云提供商单日内对智能体能力的最大规模扩展。

讨论要点: @clare_liguori 帖子的 183 收藏数(对比仅 6 条回复)呈现出明显的"存起来以后看"信号——从业者在收藏基础设施工具而非参与辩论,说明价值主张已经清晰,下一步是动手实施。


1.3 "自动驾驶代码库"论获得企业级验证 🡕

@grinich 介绍(143 点赞数,8 回复,3 引用,118 收藏数,25466 浏览量)了他们的内部智能体系统 Horizon:“这不只是按需写代码的智能体。它们会检测触发器、拉起安全沙箱、收集动态上下文、发起 PR、验证自己的工作、打通下一项任务,并从每一次失败中学习。” 他对未来的描绘是:“软件工程未来可能更像一群持续运行的事件驱动智能体,由人类来设定方向并审阅工作。Ramp 做了 Inspect,Stripe 做了 Minions,Spotify 做了 Honk。”

Horizon 系统架构展示事件驱动智能体集群与安全沙箱

与前日对比: 5 月 5 日 Coinbase 的组织重构公告展示了 AI 原生工程的组织面。5 月 6 日则提供了此类重构背后的技术架构——@grinich 点名四家公司(Ramp、Stripe、Spotify 以及他自己的公司)独立构建了持续运行的智能体系统,将这一模式的验证推到了单一公司论点之外。

讨论要点: @varadh 回复“大家都在搭同一套乐高!”与 @grinich 的反驳“这更像是在造曲速引擎!”刻画了这一争论:持续运行的智能体基础设施究竟是在同质化(大家建的东西一样),还是在差异化(细节落地极其重要)?


1.4 技能编写成为独立学科 🡕

@mattpocockuk 提议(290 点赞数,36 回复,47 收藏数,6348 浏览量):“听起来有点疯狂,但也许我该直接做一门关于如何写出优秀 skills 的课程?把日常任务拆成 skills,把 HITL 任务变成 AFK 任务,并和智能体建立一套工作语言。” 290 点赞和 36 条回复使这条推文成为当天互动量最高的非基础设施帖子。

@asmah2107 建议(10 点赞数,304 浏览量):“亲手写 AI 智能体技能(而不是用 AI 来写),是理解 LLM 在调用该技能时会如何表现的绝佳方式,也许能帮你避免未来的上下文债。” @neo4j 发布(7 点赞数,229 浏览量)Neo4j Agent Skills:“你的编程智能体并不知道 Cypher 25 的存在。它是在 GQL 对齐发布之前训练的。Neo4j Agent Skills 会把正确的知识放到正确的任务旁边。”

@doodlestein 分享(29 点赞数,32 收藏数,1320 浏览量)了一个"仓库垃圾清理器"提示词模式,展示了技能作为可复用提示词架构在仓库维护中的应用。

与前日对比: 5 月 5 日讨论的是技能验证和供应链安全这一信任问题。5 月 6 日转向技能编写作为一门手艺——@mattpocockuk 将其视为可教授的学科,@asmah2107 主张手写技能,表明社区正在意识到技能质量(而非数量)才是瓶颈。

讨论要点: @carlospeix 的回复捕捉到了教学难题:“你的 skills 之所以(非常)好,是因为它们来自经验、反复试错和真实使用。学习者很难真正抓住这一点。” 这说明技能属于难以显性化的隐性知识——恰恰与课程形式的前提相悖。


1.5 语音智能体延迟突破 200ms 以下的生产门槛 🡕

@kimmonismus 断言(71 点赞数,7 回复,24 收藏数,9359 浏览量):“真正关键的数字是低于 200ms 的 TTFA。语音智能体一旦超过约 300ms,你就能明显感觉到延迟。其他一切问题,都是从这里往下游传导的。” 评论的是 Inworld AI 的 Realtime TTS-2 发布。

@omooretweets 回顾(27 点赞数,1924 浏览量)a16z 的语音智能体论点:“当我们发布第一版语音智能体论时,收到的反馈大概是这样——让 AI 处理基础来电,企业听上去觉得太疯狂了。两年后,voice AI 已经成为共识——而且采用最领先的是医疗、金融和保险行业。”

@DeepgramAI 宣布(8 点赞数,740 浏览量)与 Together 的原生集成:“一个平台,完整的语音智能体栈:Deepgram transcription、Together 托管的 LLMs、Aura-2 TTS。参考构建下往返延迟低于 3 秒。”

与前日对比: 5 月 5 日的重点是 xAI Custom Voice 克隆和 HeyGen + Superhuman 作为视频/语音层。5 月 6 日聚焦到一个具体技术阈值(sub-200ms TTFA)作为生产级语音智能体的质量基线,Inworld 和 Deepgram 交付了达标产品。

讨论要点: 来自 BPO 行业的 @jason_haugh 提供了商业视角:“一旦超过大约四分之一秒,来电者就会把它识别成人工痕迹很重的系统。他们会在智能体恢复过来之前就挂断。信任会在那条线之后迅速崩塌。” @m13v_ 指出了更深层的失败模式:“超过 300ms 以后,一个常被低估的失败模式是用户会开始用更多词去填补沉默,这会打乱 asr endpointing,让模型过早锁定错误意图。”


1.6 HermesOS 免费层与工作空间扩展 🡒

@Wayland_Six 宣布(79 点赞数,6 回复,51 收藏数,9024 浏览量)HermesOS 免费层上线:“不需要信用卡。AI 成本不加价(BYO key)。没有试用倒计时。支持持久记忆、浏览器自动化、terminal 访问、工具使用、定时任务,以及 Telegram/Discord/Slack/WhatsApp 集成。”

@outsource_ 庆祝(19 点赞数,713 浏览量)Hermes-Workspace 突破 3,400 星:“HermesWorld 直接内建在 workspace 里!你的 AI 智能体会拥有一个指挥中心、记忆、工具、文件、terminal……现在甚至还有一个可以四处走动的世界。”

@RoundtableSpace 评论(62 点赞数,43743 浏览量):“Hermes Agent 开始让人觉得它属于另一类 AI 工具了。不只是聊天机器人或编程助手,而是一个会记住工作流、会构建 skills,而且越用越强的服务端智能体。”

与前日对比: 5 月 5 日展示的是 Hermes 借助 HyperFrames 视频和语音模式拓展功能。5 月 6 日聚焦可及性——免费层托管和 3D 工作空间环境降低了准入门槛,话题从“Hermes 能做什么”转向“谁能用上 Hermes”。

讨论要点: @GumbiiDigital 的质疑(“凡是和加密货币挂钩的东西都是骗局”)和 @Conso_xyz 的挑战(“是不同品类,还是只是把同样的限制包装得更好?”)说明 Hermes 仍面临可信度问题,尤其是其与加密货币的关联。


1.7 Claude Managed Agents 新增 Dreaming、Outcomes 和多智能体功能 🡕

@RLanceMartin 汇总(25 点赞数,1004 浏览量)当天的 Anthropic 消息:“提高 Claude Code 和 API 的限流上限,与 SpaceX 达成算力合作(300 MW 容量),Claude Managed Agents 新增 dreaming、outcomes、多智能体和 webhooks。”

Claude Code 新闻汇总,包含限流提升和 SpaceX 合作

@adocomplete 详述(15 点赞数,1783 浏览量)各项功能:“Dreaming:回顾过去的会话,让智能体随着时间持续改进。Outcomes:设定质量标准,智能体会不断迭代直到通过。Multiagent Orchestration:并行专家。Webhooks。”

与前日对比: 5 月 5 日的 /goal 命令讨论关注的是多日自主运行作为用户侧的创新。5 月 6 日揭示了其背后的平台基础设施——Dreaming(会话间自我改进)、Outcomes(质量关卡)和多智能体编排将 Claude 从“你下提示词的工具”推向“自我改进的系统”。

讨论要点: SpaceX 合作提供 300 MW 算力,表明 Anthropic 正在为始终在线的智能体舰队所需的计算需求做准备——Dreaming 和持续执行依赖的是持续推理能力,而非突发容量。


2. 令人困扰的问题

Token 成本仍是智能体规模化的首要障碍

@RoundtableSpace 展示(78 点赞数,13 回复,50 收藏数,46174 浏览量)了与昨天同样巨大的成本差异:“一次改动就把 Claude Code 的 token 用量砍到了 1/3。之前:10.4M tokens、10 个错误、$9.21。之后:3.7M tokens、0 个错误、$2.81。做法是把 Supabase 换成 Insforge Skills + CLI 作为上下文工程层。” 46K 浏览量和 13 条回复表明这是一个持续性痛点,而非一日话题。

演示品与生产级智能体之间的鸿沟未解

@databricks 重申(56 点赞数,20 收藏数,3198 浏览量):“大多数‘智能体式 AI’仍然只是演示品。数据工作和编程是很明确的例外。” @LandonExplr 回复:“智能体式 AI 只在输出可验证的场景里真正奏效。数据管道算一个。其他凡是自称‘智能体式’的,仍然是演示品。” @tezos 援引 @yurug 的观察——团队在“给自行车装马达”而非重新思考工作流。

本地模型基础设施受限于硬件门槛

@0xSero 展示(111 点赞数,12 回复,46 收藏数,5699 浏览量)了 vllm-studio 运行本地编程智能体的效果,但 @BopityBibity 回复道:“在家当然可以——前提是你有几台 5k 美元级、只能做推理的 GPU 机器。” 本地智能体的愿景与实际所需硬件之间的鸿沟,令无法承担资本支出的从业者感到沮丧。

智能体的需求规格交接仍靠人工

@hasantoxr 点明(104 点赞数,70 收藏数,20572 浏览量)核心问题:“编程智能体加快的是‘能造什么’,而不是‘该造什么’。PM 仍然在 Google Docs 里写规格说明。智能体仍然会幻觉化理解意图。工程师仍然会把错误的东西交付出去。” 即便执行速度在提升,从人类思考到智能体执行的交接环节仍是摩擦点。


3. 人们期望的功能

智能体访问的统一虚拟文件系统

@guohao_li 主张(8 点赞数,487 浏览量):“智能体不需要更复杂的 CLI 或智能体技能。它们真正需要的是一层统一的虚拟文件系统。” 他引用了 @zechengzh 的 Mirage 项目:“1.1M+ 行代码。我们从零重写了 bash,让 cat、grep、head 和管道能跨异构服务工作。S3、Google Drive、Slack、Gmail、GitHub、Linear、Notion、Postgres、MongoDB、SSH 等,都能并排挂载成同一个文件系统。”

智能体持久化作为默认基础设施

@Marktechpost 报道(12 点赞数,8129 浏览量)CopilotKit 的 Enterprise Intelligence Platform:“演示型智能体和生产级智能体之间的差距,就在于记忆。” 该平台提供“Threads——用于承载生成式 UI、人机协作工作流、共享状态、语音、文件以及跨会话、跨设备多模态交互的持久化会话对象。”

浏览器智能体的反爬检测前置

@kljukusa 发布(27 点赞数,14 收藏数,844 浏览量)“/what-antibot” 技能:“这个技能会在你的浏览器智能体真正访问某个站点之前,先用 HTTP requests 检测其 anti-bot 安全机制。” 背景需求:智能体在不了解目标站点安全措施的情况下浪费时间并被拦截。

安全的智能体支付基础设施

@Whitelist1Media 列出(61 点赞数,3850 浏览量)智能体自主管理资金所需的安全栈:“多重审批(2-of-3 或 time-lock)、每日交易上限、链上监控 + 告警,以及把密钥放在硬件或 MPC 钱包里。绝不能放进提示词。” 定性表述:“风险已经不再是技术本身,而是提示词质量、限制措施和治理。”


4. 使用中的工具与方法

工具 类别 评价 优势 局限
AWS Agent Toolkit 云智能体 SDK 正面 40+ 技能,15K API 接入,MCP 兼容,远程服务器 仅限 AWS;生态尚新
InsForge Skills + CLI 上下文工程 正面 token 消耗降低 3 倍,零错误,开源,本地运行 需要 CLI 使用经验
Claude Managed Agents 智能体平台 正面 Dreaming、Outcomes、多智能体、Webhooks、SpaceX 算力 研究预览阶段
Hermes Agent + HermesOS 智能体框架 正面 免费层,持久记忆,浏览器自动化,3400+ 星 加密货币关联引发质疑
vllm-studio 本地推理 正面 家用全功能编程智能体,支持 SGLang,可用性优化 需要高价 GPU 硬件
Horizon (WorkOS) 内部智能体系统 正面 事件驱动,沙箱隔离,自我验证,从失败中学习 内部系统;未公开
Rezonant PM 到智能体桥梁 正面 屏幕录制转 PRD,集成 GitHub/Linear/Jira/Figma 新产品;规模化验证不足
Neo4j Agent Skills 领域技能 正面 Cypher 25、驱动模式、GraphRAG、MCP、GDS 仅限图数据库领域
Mirage (Strukto) 虚拟文件系统 新兴 跨 S3/Drive/Slack/GitHub 等的统一 VFS,版本化工作空间 项目仅 6 周
DGX Spark 本地硬件 正面 128GB 统一内存,完整 CUDA 栈,Nemotron 30B 达 56 tok/s 生态软件尚不成熟
Inworld Realtime TTS-2 语音模型 正面 Sub-200ms TTFA,100+ 语言,对话感知 新发布;生产数据有限
CopilotKit Enterprise 智能体持久化 新兴 Threads、持久会话、CLHF 路线图 企业定价;路线图功能

显著变化:工具层面的讨论已从“哪种上下文工程层能省 token”(5 月 5 日)转向“哪个平台能覆盖完整的智能体生命周期”——AWS 推出 15K API 接入、Anthropic 新增 Dreaming/Outcomes、WorkOS 列举四家拥有内部智能体系统的公司,都表明基础设施层正向全生命周期平台收敛。


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
Horizon @grinich / WorkOS 事件驱动智能体集群,持续维护代码库 按需触发的智能体会错过触发器和上下文 安全沙箱、git、PR、失败学习 内部 post
AWS Agent Toolkit @clare_liguori / AWS 40+ 技能 + MCP server 接入 15K AWS API 智能体无法原生访问云基础设施 MCP、远程服务器、智能体插件 已发布 post
Mirage (Strukto) @zechengzh 统一 VFS,将 S3/Drive/Slack/GitHub/Postgres 挂载为一个文件系统 智能体无法统一访问异构服务 自定义 bash、VFS、工作空间版本化 已发布 post
Rezonant @RezonantAI 将屏幕录制转为结构化 PRD 供编程智能体使用 PM 到智能体的需求交接有损且依赖人工 GitHub/Linear/Jira/Figma/Notion 集成 已发布 post
vllm-studio @0xSero 基于 vLLM 的完整本地编程智能体 UI 编程智能体依赖云 API 和按月付费 vLLM、SGLang、本地 GPU 推理 已发布 post
HermesOS Free Tier @Wayland_Six 免费持久化 Hermes 智能体托管,BYO key 智能体托管需要信用卡和按量付费 Hermes、NousResearch、云部署 已发布 post
/what-antibot Skill @kljukusa 在浏览器智能体访问站点前检测反爬安全措施 浏览器智能体未经预警即被拦截 HTTP 探测、开源 已发布 post
Neo4j Agent Skills @neo4j Cypher 25、驱动模式、GraphRAG 技能供编程智能体使用 在 GQL 对齐之前训练的智能体无法使用新语法 Skills SDK、5 种语言驱动 已发布 post
x402B @BosonProtocol 安全托管方案,将 x402 扩展至高价值智能体商务 x402 推送支付在交付失败时无追索手段 智能合约、NFT 远期合约、CertiK 审计 已发布 post
4lpha Multi-Agent @4lpha_agent 三智能体交易流:Safety、Social、Gatekeeper 单智能体交易缺少安全/社交/决策分层 LLM、token 分析、多智能体管道 已发布 post
Goblintown Protocol @0xbl33p 多智能体编排:DAG 分解、辩论、专家生成 任务需要智能体之间的对抗性验证 OpenAI、DAG 编排、Solana 已发布 post
MCP Memory Service @tom_doerr 多智能体 AI 管道的持久共享记忆 智能体在会话间和管道间丢失共享状态 MCP、记忆层 已发布 post

6. 新动态与亮点

Anthropic 与 SpaceX 合作获得 300 MW 算力

@RLanceMartin 报道(25 点赞数,1004 浏览量)Anthropic 与 SpaceX 达成 300 MW 算力合作,同时提升 Claude Code 和 API 限流。这一算力规模表明 Anthropic 在为始终在线的智能体舰队做准备——Dreaming 和持续执行依赖持续推理能力,而非单次查询的突发容量。

DGX Spark——尚未充分开发的智能体硬件

@sudoingX 指出(74 点赞数,27 收藏数,6201 浏览量)NVIDIA 的 DGX Spark 是“那个没人讨论、却最能打的王者:128GB 统一内存,机身小到能放在桌角,完整的 CUDA 栈,在 hermes agent 上跑 nemotron 30b q8 可达 56 tok/s。” 他发现的机会是:“还没有人专门为这块芯片写定制内核。这对开发者来说就是一条空出来的跑道。”

DGX Spark 硬件——便携式 AI 智能体工作站

ServiceNow 在 AWS Marketplace 交易额达 10 亿美元

@WisemanCap 报道(97 点赞数,8963 浏览量):“ServiceNow 在 AWS Marketplace 的交易额达到 10 亿美元——推出面向自主 AI 的数据基础,并扩展 Build Agent 以兼容主流 AI 编程工具。” 这证实了企业级智能体支出已在采购数据中实际体现。

Gallatin AI 凭智能体无线电赢得国家安全黑客马拉松

@AtomsNotBits 报道(12 点赞数,575 浏览量)Gallatin AI 在 Cerebral Valley 国家安全黑客马拉松中获得第一名,凭借的是“一个在 24 小时内基于 Palantir 的 Maven Smart System 搭出来的智能体无线电系统。” 三人团队构建的系统处理战场无线电通信——智能体能力正在进入国防与情报领域。

Deel 发布 Akai:月省 91,000 人工小时

@matiii 指出(33 点赞数,3854 浏览量)Deel 的公告:“Deel 在财务、税务、资金、福利和 HR 等所有运营团队,100% 都运行在 Akai 上。每个月自动处理 100,000+ 个 case。每个月节省 91,000+ 人工小时。” 所有团队现在无需开发者即可自行构建智能体。


7. 机会在哪里

[+++] 运行框架工程即服务。 @Vtrivedy10 的宣言、@oneill_c 在 Harvey 的领域特定模型训练、@tezos 的“修好运行框架”演讲三者汇聚:团队需要从默认智能体配置升级为任务优化的运行框架。Insforge 的 3 倍 token 消耗降低证明了 ROI。谁能将运行框架优化(评估、技能、工具选择)打包为托管服务,就能占据“智能体能用”与“智能体高效地用”之间的空白。

[+++] 平台级智能体技能分发。 AWS 推出 40+ 技能和 15K API 接入。Neo4j 推出领域特定技能。@mattpocockuk 考虑将技能编写做成课程。模式很清楚:技能就是新一代的包,而分发/发现层仍大片空白。一个具备质量信号、验证和依赖管理的“智能体技能版 npm”尚无明确胜出者。

[++] 智能体持久化与记忆基础设施。 CopilotKit 的 Enterprise Intelligence Platform、@tom_doerr 的 MCP Memory Service、HermesOS 的持久化智能体、@GithubProjects 的共享工作空间,都瞄准同一缺口:跨会话保留上下文的智能体。“演示到生产”的鸿沟越来越取决于记忆能力,而非功能本身。

[++] 200ms TTFA 以下的语音智能体基础设施。 @kimmonismus 设定了标准,@jason_haugh 从 BPO 运营角度确认,Inworld 交付了达标模型。机会在于:语音智能体的质量控制工具、延迟监控,以及防止 @m13v_ 所识别的"补偿循环"失败模式的回退系统。

[+] 本地优先智能体硬件生态。 @sudoingX 指出 DGX Spark 被低估,@0xSero 发布 vllm-studio 支持本地编程智能体,@Vtrivedy10 认为开放模型的运行框架工程将随团队计算成本与 ROI 映射而“起飞”。自定义内核、优化推理栈和开箱即用的本地智能体方案正在获得成本敏感型团队的增长需求。

[+] 智能体间商务与托管。 Boson Protocol 的 x402B、Bankr 的自筹资金智能体、Swarms Marketplace 的 $30K 黑客马拉松、4lpha 的多智能体交易,都指向智能体之间的交易需求。智能体间商务的信任与结算基础设施仍处于萌芽且碎片化的阶段。


8. 要点总结

  1. 运行框架工程已从技巧升级为学科。 @Vtrivedy10 的 8 点宣言、@oneill_c 对领域特定模型训练的认可、@tezos 的会议演讲,都将运行框架工程定位为一门结构化实践,有独立的取舍曲线——不再是零散技巧的集合,而是具备评估体系、成本模型和职业路径的领域。(source

  2. AWS 通过 MCP 提供 15,000 个 API 可调用技能,改变了技能分发格局。 @clare_liguori 发布的 AWS Agent Toolkit 是云提供商单日内对智能体可访问能力的最大规模扩展。183 收藏数且几乎无争论,表明从业者将其视为应该采用的基础设施,而非需要辩论的论点。(source

  3. “自动驾驶代码库”不再是思想实验——四家公司各自命名了落地方案。 @grinich 列出 Ramp(Inspect)、Stripe(Minions)、Spotify(Honk)和 WorkOS(Horizon)作为独立构建的持续运行智能体系统,证实该模式在工程组织中已达到逃逸速度。(source

  4. 技能编写正在成为可教授的手艺,而不仅是智能体使用的副产品。 @mattpocockuk 那条 290 赞的关于技能写作课程的推文、@asmah2107 建议手写技能、Neo4j 发布领域特定技能,都表明“技能作者”正作为一个拥有可学习实践的独立角色浮现。(source

  5. Sub-200ms 语音延迟是生产门槛——超过这个值就会立即失去来电者。 @kimmonismus 设定了数字,@jason_haugh 从 BPO 运营角度证实,@m13v_ 识别出更深层的失败模式(用户补偿循环打乱意图检测)。超过 300ms 的语音智能体不只是慢——它们会造成级联错误。(source

  6. Anthropic 的 SpaceX 算力合作和 Dreaming 功能预示着始终在线的智能体基础设施。 300 MW 算力加上“回顾过去会话以持续改进智能体”的功能,意味着 Anthropic 将 Claude 设计为持续运行而非请求-响应模式。智能体托管的经济模型正从按调用计费转向按智能体生命周期计费。(source