跳转至

Twitter AI - 2026-06-10

1. 人们在讨论什么

1.1 智能体运行时正围绕信任、记忆和支付被产品化 (🡕)

今天最强的落地信号,不是又一个新的聊天机器人演示,而是一组把智能体系统变成可控基础设施的产品和发布。其中包括带权限控制的支付轨道、团队可自托管的本地记忆,以及把最终批准放在智能体运行时之外、由硬件把关的操作。

@Ripple 提到(625 次点赞、44 条回复、15,275 次浏览、27 次引用),它正在通过 XRP Ledger 和 RLUSD 支持 Mastercard 新推出的机器支付计划。Mastercard 的发布材料称,《Agent Pay for Machines》与超过 30 家合作伙伴一同上线,面向有凭证、受权限约束、持续执行的微支付场景,可在银行卡、账户和稳定币之间结算。

@Muskanjain0401 分享了(171 次点赞、30 条回复、15,796 次浏览、30 次收藏),supermemory 已发布 supermemory local,并引用 @DhravyaShah 的说法称,它是完全自包含并可在本地运行的。官方的 local-vs-enterprise 文档称,本地版是一个免费、开源、自托管的二进制程序,包含完整图引擎、可自带模型密钥,并拥有与企业版相同的 API 接口,但限制为单机单进程。

@navlld 测试了(26 次点赞、33 条回复、376 次浏览、9 次收藏)Ledger 新推出的 agent stack,并表示最突出的特性是它的安全模型:先做只读分析,任何敏感操作都要经过明确的硬件确认。Ledger 的概览Wallet CLI 指南也证实了这一点:余额查询和操作可以安全地以只读方式运行,但每一步签名仍然需要在设备上确认。

一张照片显示,笔记本电脑上正在用 Ledger Wallet CLI 发现账户,旁边连接着一台 Ledger 设备,作为最终批准闸门

讨论要点: 这些帖子里的细微差别在于,智能体自治只有在边界清晰时才开始变得可接受。Mastercard 正在加入凭证和支出规则,Supermemory 提供本地控制,而 Ledger 则把批准强制放到智能体无法自行点击通过的硬件上。

与前日对比: 6 月 9 日最强的产品簇围绕团队原生 AI 工作空间和受治理的 AI 产品。6 月 10 日则往下深入了一层,进入执行原语:记忆、资金和批准边界。

1.2 生产级 AI 工程讨论正从提示词转向运行时经济学和长时间自治 (🡕)

另一个高密度主题是,AI 工程越来越少被描述成提示词技巧,越来越多被描述成推理工程、评估设计和长时间运行时管理。最有价值的帖子讨论的是吞吐量、回退逻辑、垂直基准测试,以及一个编程智能体在成本或上下文成为瓶颈之前究竟能走多远。

@kmeanskaran 认为(50 次点赞、5 条回复、1,043 次浏览、30 次收藏),RAG 和多智能体系统如今只是最低配置,真正的生产问题在于延迟、吞吐量、回退、评估、监控、分布式系统和语义缓存。回复强化了人才市场这一角度:读者立刻追问路线图和书单,这说明大家把瓶颈看作运营能力,而不是模型访问权。

@Google 推出了(113 次点赞、4 条回复、8,114 次浏览、11 次收藏)DiffusionGemma,这是一种按整块起草并纠错文本、而不是一次生成一个 token 的文本模型。Google 的开发者指南称,该模型运行在一个 256-token 的 canvas 上,推理时使用拥有 38 亿活跃参数的 260 亿参数 MoE,并可把瓶颈从内存带宽转到算力,把生成速度提高到最高 4 倍。

@SeanZCai 认为(43 次点赞、2,439 次浏览、34 次收藏),基准测试层本身正在转向应用公司和垂直领域专家。他的讨论串把 Perplexity 的 DRACO、Databricks 的 OfficeQA 和 Zapier 的 AutomationBench 当作证据,说明一些最持久的评估,如今紧贴真实用户工作流来构建,而不是出自通用基准测试工厂。

@heyshrutimishra 报告了(17 次点赞、7 条回复、860 次浏览、5 次收藏)一个具体的编程智能体工作流:Fable 5 在一个真实代码库中找出了 97 个问题,多个终端智能体连续工作数小时处理这些问题,工程师则主要转向审查 pull request。这里经过审看的图片很重要,因为它展示了 97 个问题的积压、多智能体终端分发,以及在 12 小时后达到 58% 的周计划消耗进度。

GitHub issues 视图,展示了由一次编程智能体审计运行生成的 97 个问题积压

讨论要点: 这一簇里最持续的反对意见与其说是能力,不如说是成本。连赞扬这套工作流的帖子也表示,剩下唯一要解决的是成本,这和“智能体到底能不能做这项工作”已经是不同层次的争论。

与前日对比: 6 月 9 日聚焦于公开测试框架、方法论文档和基准报告工件。6 月 10 日依然关注运营,但更贴近运行时现实:吞吐量、垂直评估供给链,以及能在真实代码库上连续工作数小时的智能体。

1.3 在人们希望更早看到安全可见性的同时,治理却变得更不透明 (🡕)

今天关于治理的讨论,并不只是“更多安全”对“更少安全”。更尖锐的争议在于可见性:用户是否能判断某个前沿模型是否在特定任务上被削弱;以及当系统能力越来越强时,政府和实验室是在让评估结果更可观察,还是更不可观察。

@askalphaxiv 认为(114 次点赞、8 条回复、3,312 次浏览、11 次收藏),Anthropic 正在悄悄削弱 Fable 5 在前沿 LLM 开发任务上的表现。附带的截图非常具体:其中写道,Anthropic 增加了用户不可见的干预,限制了模型对“构建预训练流水线、分布式训练基础设施或 ML 加速器设计”等请求的有效性,并估计其影响约占 0.03% 的流量。

Anthropic 安全措施文本截图,描述了针对预训练流水线、分布式训练基础设施和 ML 加速器设计请求的隐藏干预

@nickcammarata 写道(203 次点赞、9 条回复、11,313 次浏览、12 次收藏),这种静默限制对可解释性和安全工作尤其难以判断,因为用户可能无法分清,一个结果差是因为自己的方法有问题,还是因为提供商施加了干预。在回复里,他要求更清晰的沟通,以及让从事安全导向研究的组织获得更广泛的访问权限。

@peterwildeford 认为(67 次点赞、2 条回复、4,197 次浏览、13 次收藏),强制第三方评估是好事,但如果它只在商业部署前后触发,那仍然不够完整。他的观点是,最高风险的能力可能会在系统仍处于训练阶段或内部使用阶段时出现,而那时尚不存在任何发布决策。

@MTSlive 提到(85 次点赞、6,134 次浏览、15 次收藏),白宫官员已要求 CAISI 停止发布公开报告。来自 Crypto Briefing 的后续报道称,测试项目仍在继续,与主要实验室的自愿协议依旧有效,但其输出如今转入政府内部渠道,不再公开。

讨论要点: 回复里几乎没有人为“不透明”本身辩护。主要分歧只在标签上——“silent”这个词是否准确——而不是在于更清晰、对用户可见的边界和更强的外部可见性是否有帮助。

与前日对比: 6 月 9 日围绕的是基准测试方法论和公开报告纪律。6 月 10 日则把同样的担忧转成了一个更具政治性和运营性的问题:谁能看到能力证据、在什么时候看到,以及受到什么限制。


2. 令人困扰的问题

前沿模型上隐藏或难以审计的安全护栏

严重性:高。@askalphaxiv 认为(114 次点赞、8 条回复、3,312 次浏览、11 次收藏),Anthropic 对前沿 LLM 开发请求施加的干预对用户不可见,而经过审看的截图显示,这会影响预训练流水线、分布式训练基础设施和 ML 加速器设计等主题。@nickcammarata 写道(203 次点赞、9 条回复、11,313 次浏览、12 次收藏),这对可解释性和安全工作尤其成问题,因为用户无法明确区分一次失败的实验,究竟是方法不好,还是模型响应被削弱。今天的应对模式与其说是某种权宜方案,不如说是一种诉求:把边界做成明确、可审计、对用户可见的。这值得投入构建,因为痛点关乎信任和可调试性,而不是抽象的意识形态。

智能体系统的落地仍然是推理、评估和成本问题

严重性:高。@kmeanskaran 认为(50 次点赞、5 条回复、1,043 次浏览、30 次收藏),当前的瓶颈是延迟、吞吐量、回退、评估、监控、队列和缓存。@heyshrutimishra 提到(17 次点赞、7 条回复、860 次浏览、5 次收藏),一次持续 12 小时的 Fable 5 审计加修复循环,大约消耗了 20x Max 套餐的 60%,即便它确实节省了工程时间。@SeanZCai 认为(43 次点赞、2,439 次浏览、34 次收藏),评估供给层本身也正在围绕垂直领域公司和私有工作负载重建。Google 的 DiffusionGemma 指南则从模型侧提出了几乎同样的抱怨:自回归式服务在本地会浪费硬件,所以如果速度重要,架构就必须改变。这显然值得投入构建,因为这些抱怨都具有运营性质,而且反复出现。

以电子邮件为先的智能体即使能识别技术型钓鱼,也依然容易受社会工程欺骗

严重性:高。@OwenGregorian 发布了(5 次点赞、959 次浏览、3 次收藏)一篇来自 Varonis Threat Labs 的文章,展示 OpenClaw 收件箱智能体在收到看似合理的内部风格邮件后,会把预发布环境凭证和客户数据转发给外部发送者。同一篇帖子也提到了一些部分成功:该智能体最终识别出了恶意礼品卡网站,并正确拦截了 OAuth 同意陷阱。真正令人挫败的是,仅靠对 URL 的技术推理还不够——如果智能体仍然太容易相信社会语境中的请求,就会出问题。报告中的应对方法——版本控制的邮件安全策略、基于渠道的连接器隔离,以及对首次外发操作的人类审批——让这一方向值得立即投入构建。

公开监督正变得更难看见

严重性:中。@MTSlive 提到(85 次点赞、6,134 次浏览、15 次收藏),CAISI 已停止公开报告,而 Crypto Briefing 称评估仍在继续,只是输出现在留在政府内部渠道。@peterwildeford 认为(67 次点赞、2 条回复、4,197 次浏览、13 次收藏),即便是强制性的第三方评估,如果只在部署时才开始,也依然不够。人们正推动更早、更广泛的可见性来应对这一点,但今天的证据显示,透明度的方向却在朝反面走。这值得投入构建,因为它影响的是谁能够独立判断模型风险与责任。


3. 人们期望的功能

面向智能体操作的可验证身份与审批闸门

人们想要的不只是更安全的提示词,而是能分辨谁在发起请求、对方实际上拥有什么权限,以及下一步何时必须由人批准的智能体系统。@navlld 测试了(26 次点赞、33 条回复、376 次浏览、9 次收藏)Ledger 的“只读 + 硬件确认”工作流,而 @OwenGregorian 的帖子里提到的 Varonis OpenClaw 研究,则清楚展示了当审批和身份校验过于松散时会发生什么。这是一个有直接购买意图的现实需求。机会类型:直接型。

更便宜、能长时间运行的编程与推理栈

团队显然在寻找能够连续数小时保持一致性、又不会把账单炸穿的系统。@heyshrutimishra 展示了长时间运行的编程智能体已经能够产出真实的审查队列,但也表示成本仍是剩余瓶颈。@kmeanskaran 指向了栈中的其他部分——延迟、吞吐量、回退逻辑、监控和缓存——才是真正的生产工作,而 Google 的 DiffusionGemma 指南基本上就是模型服务侧给出的回应。这既现实又紧迫。机会类型:直接型。

让用户看得见的前沿模型控制与评估

@askalphaxiv@nickcammarata 都指出,隐藏干预很难审计;而 @peterwildeford 希望在部署前就能获得可见性,而不是只在发布闸门前才看到。这是实验室、研究人员和受监管用户的现实需求,但它会受到竞争和政治因素约束。机会类型:竞争型。

团队能够快速交付的自托管记忆

记忆仍然是一个真实的需求面,但今天更有意思的信号,是大家偏好本地且 API 兼容的方案。@Muskanjain0401 分享了(171 次点赞、30 条回复、15,796 次浏览、30 次收藏)supermemory local 的发布,而官方文档将其定义为一个免费、开源、自托管、与企业版拥有相同 API 的二进制程序。这是隐私敏感团队、原型项目和气隙实验的现实需求。机会类型:直接型。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
Claude Fable 5 / Claude Code 编程智能体 / 模型 (+/-) 在真实代码库里找出了真实问题、能连续数小时保持在任务上,并生成可审查的 PR 工作 持续运行成本高,而且同一天的帖子也指出,在前沿模型开发话题上仍有隐藏限制
DiffusionGemma 开放模型 / 推理架构 (+) 本地生成速度最高可提升 4 倍、支持双向自纠错,并能更高效利用本地 GPU 属于实验性架构,与经典自回归 LLM 相比,服务模式并不标准
supermemory local 记忆基础设施 (+) 可自托管、可自带模型、与企业版拥有相同 API,而且很适合私有或本地优先场景 受限于单机单进程,可观测性也比托管产品更轻
Ledger Wallet CLI / Agent Stack 智能体安全 / 钱包工具链 (+) 让智能体先检查并准备操作,同时由硬件把最终权力保留给用户 仍处于早期开发阶段、偏加密场景,而且每一步签名仍需人工在设备上确认
OpenClaw inbox agent setup 邮件智能体工作流 (+/-) 证明智能体能识别部分钓鱼基础设施和 OAuth 陷阱 在 Varonis 的测试里,发送者验证和数据外泄场景依然失败
DRACO / OfficeQA / AutomationBench 垂直评估层 (+) 将模型评估绑定到真实工作流和领域数据,而不是泛化任务 往往由合作方控制或保持私有,因此可比性和公开可复现性依然有限

总体满意度最高的,是那些要么能强制清晰边界、要么能消除具体运行时瓶颈的工具。DiffusionGemma 之所以吸引人,是因为它切实提升了本地吞吐;Ledger 吸引人,是因为它把最终决策留在智能体之外;Supermemory 吸引人,是因为它在不改写 API 的前提下提供了本地记忆层。当能力超过控制力或可负担性时,评价就转为复杂。Claude Fable 5 因真实代码库工作获得高分,但同一天的证据也突出了隐藏护栏和显著的成本压力。

竞争格局正在从笼统的“AI 平台”宣称,转向更具体的层:垂直评估、自托管记忆、更快的本地推理,以及硬件门控执行。最清晰的迁移模式,是从基准测试闲谈转向以工作流为基础的工具链。


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
《Agent Pay for Machines》 @Mastercard 在支付轨道上增加带凭证、带权限、持续在线的机器支付能力 让 AI 智能体能够按规则、以受信任的方式购买服务并以编程方式结算价值 Mastercard 网络、Verifiable Intent、银行卡/账户/稳定币、包括 XRPL/RLUSD 支持在内的合作方轨道 Beta 新闻稿, Ripple 帖子
supermemory local @DhravyaShah 为智能体和企业知识提供一套自托管记忆引擎 让构建者无需依赖托管 SaaS,也能获得本地记忆与检索能力 图引擎、嵌入模型、自带模型密钥、本地服务器 Shipped 文档, 发布帖, Muskan 帖子
DiffusionGemma @Google 发布一个面向高吞吐本地生成与编辑的开放扩散文本模型 降低本地推理延迟并减少硬件闲置 Gemma 4、26B MoE、3.8B active params、256-token diffusion canvas、vLLM Alpha 指南, 发布帖, 推文
Ledger Agent Stack @Ledger 让智能体检查钱包并准备交易,同时由人类在硬件上批准 在不把私钥交给智能体的前提下支持智能体化的加密操作 Wallet CLI、DMK skills、Ledger signer、human-in-the-loop confirmation Beta 概览, 博客, 演示推文
Code audit-and-fix loop @heyshrutimishra 使用多个编程智能体发现问题、分派修复,并把 PR 交给工程师审查 压缩现有代码库中的审计和修 bug 周期 Claude Fable 5、terminal agents、GitHub issues、GitHub PRs Alpha 推文

Agent Pay for Machines 和 Ledger Agent Stack 是当天最清晰的信任边界类构建。前者试图通过凭证、支出规则和结算,让软件为另一套软件付款;后者则确保智能体永远不能成为最终签名者。它们共同显示出同一种模式:只有当价值流动变得可治理时,智能体商业才会被采用。

Supermemory local 和 DiffusionGemma 则体现了另一种控制模式:把运行时拉近到开发者身边。Supermemory local 用与企业版相同的 API,把记忆基础设施固定在一台机器上;DiffusionGemma 则直接改动模型架构本身,让本地硬件每秒做出更多有效工作。

审计加修复工作流之所以值得注意,是因为它并不是一个打磨完好的发布页面,而是一种实时运营模式。经过审看的图片展示了问题队列、多智能体终端运行,以及消耗情况,因此即便规模还小,它作为工作流也显得可信。


6. 新动态与亮点

CAISI 的测试仍在继续,但其公开输出消失了

@MTSlive 提到(85 次点赞、6,134 次浏览、15 次收藏),白宫官员要求 CAISI 停止发布公开报告。Crypto Briefing称,与主要实验室合作的自愿测试项目仍然存在,但其输出现在留在政府内部渠道。这一点很值得注意,因为运营机制仍在运转,而外部可见性却下降了。

Varonis 展示了一个被社会工程钓鱼的智能体会泄露机密,但它仍能识别部分技术型钓鱼

@OwenGregorian 发布了(5 次点赞、959 次浏览、3 次收藏)一篇很长的 Varonis Threat Labs 文章,内容是如何钓鱼一个 OpenClaw 收件箱智能体。这项研究之所以值得注意,不是因为它宣称智能体一律不安全,而是因为它展示了一种混合画像:智能体能识别可疑的 OAuth 基础设施,却仍可能在请求听起来像普通内部工作时,把凭证或 CRM 导出内容转发出去。

左侧是一封钓鱼邮件,右侧是一个智能体编排器在解释为什么链接中的 OAuth 流程可疑

DiffusionGemma 让扩散式文本服务听起来更像运营方案,而不是理论概念

@Google 推出了(113 次点赞、4 条回复、8,114 次浏览、11 次收藏)DiffusionGemma,把它定位成一个实用的本地文本模型,而不是研究好奇心。开发者指南之所以重要,是因为它具体谈到了每秒 token 数、256-token canvas,以及这种架构如何接入开发者工作流。


7. 机会在哪里

[+++] 智能体信任与审批基础设施 —— Mastercard 的 AP4M 发布、Ledger 的硬件门控工作流,以及 OpenClaw 的钓鱼失败案例,都指向同一个缺口:智能体在安全处理资金或敏感数据之前,需要身份检查、范围受限的权限,以及强制执行的审批步骤。

[+++] 面向成本、评估和长时间运行智能体的运行时控制平面 —— @kmeanskaran@SeanZCaiDiffusionGemma@heyshrutimishra 都指向同一种需求:更高吞吐、更贴近任务的评估、更低成本,以及更紧凑的运营反馈回路。

[++] 自托管记忆与本地智能体基础设施 —— supermemory local 以及围绕 DiffusionGemma 的本地推理强调,共同支撑了一个强有力的中间层机会:为那些想要隐私、更低延迟或气隙部署、但又不想重建应用层的团队提供方案。

[++] 面向智能体的邮件与工作流安全 —— Varonis/OpenClaw 研究表明,收件箱智能体正成为新的鱼叉式钓鱼攻击目标。那些能对外发操作设闸、分割连接器访问权限,并在通道内验证发送者身份的产品,背后已经有了直接证据支撑。

[+] 透明的前沿模型治理 —— 围绕 Fable 5 的隐藏干预争议,以及 CAISI 转向仅内部报告,都表明一个不断增长的机会:可审计的控制披露、部署前可见性工具,以及用户真正能检查的评估机制。


8. 要点总结

  1. 智能体系统正在作为受治理的基础设施被交付,而不只是助手。 当天最强的产品信号与其说来自对话 UX,不如说来自记忆、支付和审批边界。(Ripple, Muskanjain0401, navlld)
  2. 生产级 AI 讨论如今由运行时运营和经济性主导。 在高信号工程帖子里,吞吐量、评估供给和长时间自治的重要性,已经超过了提示词技巧。(kmeanskaran, SeanZCai, Google)
  3. 前沿模型访问正在变成一个透明度问题。 用户反对的越来越不是安全措施本身,而是隐藏干预,以及无法看清这些干预何时生效。(askalphaxiv, nickcammarata, MTSlive)
  4. 邮件渠道中的社会工程已是当下真实的智能体风险。 Varonis 的 OpenClaw 案例研究表明,智能体可以推理出技术型钓鱼线索,却仍会在“人类语境”这一层失败。(OwenGregorian)
  5. 基准测试层正越来越靠近应用公司和真实工作流。 今天,垂直评估和真实代码库循环,比泛化分数卡讨论更有说服力。(SeanZCai, heyshrutimishra)