跳转至

YouTube AI - 2026-05-22

1. 人们在讨论什么

1.1 搜索反弹情绪正在变成替代品市场 🡕

Google 仍是 YouTube 上 AI 讨论的中心,但今天这组内容的重点,已经不是看 I/O 剪辑,而是在判断是否还要留在 Google 新的搜索界面里。3 条强信号内容支撑了这一转向:其中两条高互动视频把 AI 搜索讲成 Google 正在毁掉一个人们原本信任的产品,第三条则把这种不满变成了一份具体的退出指南。Google 自己的 Search 文章Gemini Spark 页面 也解释了为什么反应会这么强烈:Search 正在变成一个 AI 优先的入口,里面有后台信息智能体、预订和拨打电话等动作,以及可定制的迷你应用。

Google 现在正在亲手杀死自己的搜索引擎……

SomeOrdinaryGamers 把这种变化概括为,Google 正在把“我们这个时代最具争议的技术”进一步塞进它最受信任的产品里。这里最特别的角度,不只是 AI 答案本身,而是 Google 正在把一个已经成形的用户习惯,改写成用户并未要求的智能体式工作流 (视频)。

Google Search 完了,这些更好用

Techlore 则把同样的反弹情绪转成了实际迁移行为。视频并不只是批评 AI 搜索,而是逐一介绍 6 个尊重隐私的搜索引擎,并展示 bang 式快捷方式如何让切换成本显得没那么高;这比单纯抱怨是更强的信号 (视频)。

Google 的新 AI 智能体刚让其他一切都过时了

Craig Hewitt 把 Gemini Spark、Gemini 3.5 Flash、Search agents、Android XR 和 Google 的新芯片,都归进一次协同推进的智能体攻势里。这一点重要,是因为官方产品页面也确认了同样的收敛:Spark 里是后台任务,Search 里是 24/7 监测,而查询结束后仍会继续运行的智能体式体验,也正成为共同方向 (视频, Gemini Spark, Google Search)。

讨论要点:争议已经不只是“AI 搜索好不好”,而是当 Google 不断把重复性任务移交给后台智能体时,人们能否还看清来源、保有控制权,并让浏览意图保持可见。

与前日对比:和 2026-05-21 相比,叙事已经从 Search 作为 Google 的头条发布,转向搜索替代行为,以及叠加其上的个人智能体工作流。

1.2 智能体工作流正在分化:一边是有纪律的操作系统,一边是工作噪音 🡕

智能体仍是当天最大的内容簇之一,但语气比昨天更分化。信号最强的教程现在都在强调角色、worktree、评审关卡和任务边界;而负面内容则认为,自治智能体不过是在给白领团队制造更多工作。结果是,YouTube 上的“agentic AI”看起来不再像一个单一类别,而更像一场受管工作流与失控噪音之间的对抗。

你还没掉队(暂时):13 分钟学会 AI 智能体

theMITmonk 是结构化路线中传播最广、表述也最清晰的案例。视频用 ARR、4 种角色和 OODA 循环来解释智能体,随后指出,它们一旦放大含糊思考和糟糕流程就会失败,这也把采用问题从提示词技巧改写成了运营纪律问题 (视频)。

2026 年你只需要这一套智能体式工程师工作流

Zen van Riel 则把实践者视角讲得更具体:4 个并行的 Claude Code 窗口、不同强度档位、git worktree,以及在真实团队评审流程里对 MCP 和 Bash 的明确取舍。这里最特别的角度,是把智能体式编程讲成一套带人工检查点的工程操作系统,而不是玩具演示 (视频)。

我试用了一个按交付团队方式构建的 AI 编程工具(Routa)

Better Stack 则把这个类别进一步推向软件交付结构。它对 Routa 的演示,核心是本地优先的 Kanban 看板、专职智能体、评审关卡、追踪记录和证据;而公开文档则把 Routa 描述成一个以工作区为先的多智能体协调平台,围绕会话、看板、专职角色和代码库来组织 (视频, Routa)。

讨论要点:BusinessCringe 给出了反向权重,认为自治智能体正在增加工作量;而 Lewis Jackson 则用同样的智能体语言,真的交付出一个会自我改进的交易系统。分歧并不在于是否相信智能体,而在于人们是信任受管的智能体工作流,还是把失控的智能体劳动视为新的额外负担。

与前日对比:和 2026-05-21 相比,这个主题更偏落地,也更两极化:真实团队工作流、看板和垂直系统在上升,同时对白领工作的反弹也说得更直接了。

1.3 验证压力仍在塑造 AI 叙事 🡒

信任仍是当天最清晰的主线之一,但今天的证据,已经不再围绕某一条孤立主张,而是围绕 AI 创作者和实验室如今到底需要带上多少公开证明。3 条强信号内容支撑这一模式:围绕 Llama 4 的基准测试可信度攻击、更广泛的对当前模型是否真的具备推理能力的怀疑,以及把视线从 LLM 推向物理世界智能与新基础设施的高管讨论。共同点是,单靠品牌已经不足以结束争论。

Meta 如何从开源英雄变成 AI 最大反派

Coding with Lewis 给出了最尖锐的基准测试案例。视频把 Meta 自己发布 Llama 4 时的措辞,与其链接的一篇 The Decoder 报道并列起来;在后者里,Yann LeCun 说结果“稍微修饰了一点”,这让可信度缺口直接暴露在公开来源之间,而不只是停留在传闻层面 (视频, The Decoder, Meta)。

AI “推理”的令人不安的真相 | World Science Festival

World Science Festival 把这种怀疑从一次发布扩展到了整个范式。Gary Marcus 和 Brian Greene 反复回到幻觉、抽象失败,以及对更强世界模型或神经符号方法的需要,因此问题不只是一场基准测试丑闻,而是当前这套推理范式本身到底靠不靠谱 (视频)。

人工智能的下一个阶段

Bloomberg Television 则补上了高管视角,把 Yann LeCun 和 JP Vert 对“AI 如何落到物理世界、又需要什么新基础设施”的讨论放到中心。这让验证这条线不再只是基准测试审计,而是进一步变成一个问题:当前的 LLM 路线,是否甚至算得上正确的长期底座 (视频)。

讨论要点:这份数据集持续奖励那些自带证据、公开分歧或明显不同研究方向的主张;而对那种先用发布式口吻下定论、事后再来补辩护的确定性叙事,则明显更不买账。

与前日对比:和 2026-05-21 相比,信任这条主线保持稳定,但变得更制度化了:LeCun、JP Vert 和研究界的怀疑,取代了昨天对某一项单独突破主张能否被外部核验的更窄关注。

1.4 算力瓶颈正在把注意力收窄到电力、芯片和系统级绕行方案 🡒

一个排名略低但仍然重要的内容簇,把 AI 的物理栈持续拉回视野。这里的条目从不同角度指向同一个约束:芯片设计仍是基础,数据中心扩张正撞上电网和元器件限制,而实验室也在积极寻找单一主导供应商之外的替代方案。共同信息是,软件叙事最终还是不断撞上电力、供应和系统设计。

从底层讲起的芯片设计 - Reiner Pope

Dwarkesh Patel 给出了最清晰的一次基础梳理。Reiner Pope 从逻辑门讲起,一路往上讲到 GPU、TPU 和 FPGA,这让 AI 基础设施看起来不再只是一个抽象的短缺故事,而更像一套带有硬性设计取舍的工程栈 (视频)。

为什么科技公司正在悄悄取消 AI 数据中心

Economy Media 则把这些约束推进到部署经济学层面。它的视频简介认为,电网瓶颈、不断上涨的能源成本、电气元件短缺,以及 GPU 可能出现的过剩,已经在拖慢甚至取消原本要承接 AI 热潮的项目 (视频)。

为什么 Anthropic 想要 Microsoft 的 AI 芯片

The Information 补上了供应商策略这一角度。Aaron Holmes 表示,Anthropic 曾评估 Microsoft 的 Maya 200 定制芯片用于推理,这让替代芯片采购看起来不再是遥远的实验室好奇心,而是当下正在发生的产品和平台决策 (视频)。

讨论要点:SinoShift Media 则从另一个方向推进了同样的逻辑,认为 Huawei 的 Cloud Matrix 384 靠的不是单一主导芯片,而是系统级工程和大量协同处理器。注意力正在从“最好的 GPU”转向“到底什么样的技术栈真的能部署出去”。

与前日对比:和 2026-05-21 相比,基础设施报道的焦点,已经从笼统的记忆和电力瓶颈,收窄到更具体的替代方案:被取消的数据中心、定制推理芯片,以及协同的非 Nvidia 算力栈。


2. 令人困扰的问题

搜索自动化越来越强,但来源可控性正在变差

这是高严重度,因为最显眼的 Search 视频把 Google 的产品方向讲成了用户主动权的流失,而不是一次干净利落的升级。SomeOrdinaryGamers 把 AI 搜索视为 Google 正在损坏一个本来就能用的东西,Techlore 则给出 6 个尊重隐私的替代品,而 Google 自己的 Search 路线图 也确认,Search 里会出现更多后台智能体、预订和拨打电话等动作,以及自定义迷你应用。当前可见的应对策略,是部分退出:改用替代搜索引擎、使用 bangs,并更刻意地切换,而不是把信任完全交给单一答案层。这非常值得围绕来源可辨识的搜索、浏览控制和迁移工具来构建产品。

如果记忆、范围和评审不够明确,智能体仍会制造返工

这是高严重度,因为就连正面的智能体视频也一直在描述失败模式。theMITmonk 说,智能体会放大含糊思考和糟糕流程;Zen van Riel 在真实团队里仍需要 worktree 和有纪律的上下文管理;Better Stack 强调评审关卡和证据;而 BusinessCringe 则认为,自治智能体不是在减少工作量,而是在增加它。当前可见的应对动作,是缩小任务范围、保留产物、写清角色,并设置人工检查点,而不是盲目追求自治。这一点非常值得围绕它来构建产品。

当基准测试营销跑在证据前面,信任就会断裂

这是高严重度,因为这组数据不断把大胆主张和公开怀疑并排摆在一起。Coding with LewisThe Decoder 以及 Meta 自己的 Llama 4 文章 把基准测试操纵指控和“同类领先”的基准测试营销放在一起,而 World Science Festival 则认为,流畅输出仍然离真正的推理有距离。当前的应对策略,是更慢地建立信任、更重地核查来源,并更多依赖公开证据,而不是发布话术。这非常值得围绕它来构建产品。

AI 部署仍不断撞上电力、芯片和电网的天花板

这是高严重度,因为今天这些基础设施内容,全都指向硬性的物理限制。Economy Media 描述了被推迟或取消的数据中心,Dwarkesh Patel 展示了现代加速器底下到底叠着多少架构复杂度,The Information 突出了 Anthropic 对 Microsoft Maya 200 芯片的兴趣,而 SinoShift Media 则认为 Huawei 正在用系统级工程来补足差距。当前可见的应对策略,是供应商多元化、定制芯片,以及更明确的基础设施规划,而不是假设产能总会自己出现。这非常值得在容量规划、供应商路由和基础设施可见性上构建产品。

编程工具蔓延仍迫使用户自己拼装技术栈

这是中严重度,因为整体语气常常偏宣传,但底层的过载已经非常明显。Vaibhav Sisinty 在价格和便利性上,把 Antigravity 放到 Claude Code 和 Codex 的对立面;Ankita Kulkarni 推销开放编程模型和本地 / Ollama 配置,来绕开托管限制;而 Lewis Jackson 则仍然得把 Hermes Agent、Claude Code 和 Railway 亲手接成一个能跑的闭环。当前可见的应对动作,是打包方案、一次性配置提示词和本地模型,但工作流本身仍然是碎片化的。这值得构建,不过也已经是一个竞争激烈的类别。


3. 人们期望的功能

能保住来源、控制权和切换灵活性的搜索

最清晰的未被满足需求,不是“搜索里有更多 AI”,而是那种在帮助处理重复任务的同时,仍能保住链接、来源可见性和用户控制权的搜索。SomeOrdinaryGamersTechlore 从相反方向展示了这种张力,而 Google 自己的 Search 路线图 也确认,产品正朝着综合、后台监测和自定义迷你应用推进。这是一个紧迫的现实需求,因为用户想要的是帮助,而不是被答案层挤出中间环节。机会:直接。

把记忆、评审和并行泳道明确做出来的智能体工作台

人们想要的是能做长周期工作、又不会塌成聊天混乱的智能体。theMITmonk 强调角色和 OODA 循环,Zen van Riel 加上了 worktree 和不同强度的窗口,Better Stack 强调看板和评审关卡,而 Lewis Jackson 则展示了垂直智能体技术栈会多快变成多工具系统。这是一个直接的工作流需求,而且紧迫度很高,因为另一种选择就是更快地返工。机会:直接。

带基准测试谱系和外部审查、可直接审计的 AI 主张

这组数据持续指向一个缺失层:需要有人能展示到底测了什么、是谁核验的,以及为什么这项主张值得相信。Coding with LewisThe DecoderWorld Science Festival 都指向同一个缺口:当评估过程不透明时,流畅的演示和基准测试表格并不能解决信任问题。这是一个紧迫的现实需求,而不只是哲学问题。机会:直接。

能智能选择芯片、供应商和部署落点的算力路由

用户和实验室需要的不只是更多算力;他们还需要帮助来决定推理该跑在哪里,以及在现实约束下该选哪家供应商或哪种架构。Economy MediaDwarkesh PatelThe InformationSinoShift Media 都在暗示,跨电网、芯片和供应商做路由,正在变成产品本身的一部分。这是一个紧迫度真实存在的现实需求,但想把它做好,需要非常深的技术集成。机会:直接。

具备前沿级易用性的开源和本地编程技术栈

另一个清晰的需求,是那种既能保留开放或本地模型在价格和控制上的优势,又不会逼用户变成基础设施发烧友的编程系统。Ankita Kulkarni 推开放编程模型和 Ollama 式本地工作流,Vaibhav Sisinty 则在卖一个免费打包、可替代 Claude Code 和 Codex 的方案,而 Zen van Riel 也展示了高端技术栈仍然需要多少工作流经验。这是一个具体而现实的需求,但它会一直很拥挤,因为界面看起来可以很简单,底下的编排却并不简单。机会:竞争激烈。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
Google Search agents 消费级智能体 (+/-) 后台监测、预订 / 拨打电话动作、自定义迷你应用和追踪器 会触发来源可辨识度和控制权担忧
Gemini Spark 个人智能体 (+/-) 跨 Gmail、Calendar、Drive、Docs、Sheets、Slides、YouTube 和 Maps 的 24/7 任务执行;技能与日程 发布范围有限,而且后台自动化的信任门槛很高
Google Antigravity 开发平台 (+) 管理界面、跨编辑器、终端和浏览器的异步智能体,以及便于评审的产物 仍处于公开预览,而且大多仍被包装在单一生态捆绑方案里
Claude Code multi-window workflow 编程智能体 (+/-) 推理强、并行档位、worktree,以及显式评审习惯 要保持可靠,需要非常仔细的上下文管理和人工评审
Routa 多智能体协调 (+) Kanban 泳道、专职角色、追踪记录,以及以工作区为先模型里的评审关卡 比聊天优先工具更有工作流开销,而且仍处于早期
Hermes Agent + Claude Code 垂直智能体技术栈 (+/-) 自我改进闭环、真金白银自动化,以及可部署到 Railway 的技术栈 运行风险高,而且证据几乎只来自单一创作者案例
Open coding models via Ollama-style local setups 本地 LLM (+) 免费或低价本地使用、大上下文能力,以及对托管限制依赖更低 模型选型和本地配置复杂度仍然很高
Microsoft Maya 200 AI 芯片 (+/-) 有潜力成为 Nvidia 之外的推理方案,并与 Azure 更紧密整合 仍只有早期 / 谈判阶段证据,供应商依赖也依然很高
Privacy-first search engines plus bangs 搜索方法 (+) 激励更清晰、用户控制更强、切换成本更低 生态更小,也不如 Google 那样主流方便

整体评价最偏向那些把控制显式做出来的工具和方法:Antigravity 的管理界面、Routa 的看板,以及 Zen van Riel 那套重度依赖 worktree 的 Claude Code 工作流,都比单纯提示词更能提供可检查性。只要工具会隐藏来源,或者在后台替用户行动,评价就会分化;这也是为什么 Search agents 和 Spark 即便明显有人感兴趣,仍然处在争议之中。

当前可见的绕行方案,是替代搜索引擎、bangs、worktree、评审关卡、一次性配置提示词和本地模型。迁移正在从经典搜索转向隐私优先的替代品,从单一聊天窗格转向带评审关卡的工作台,也从“只能用 Nvidia”的假设转向对定制芯片的兴趣。竞争态势越来越由打包方案驱动:Google 把 Search、Spark 和 Antigravity 组合在一起,而开源 / 本地创作者则在价格和自治上竞争,基础设施供应商则在争夺推理该跑在哪里。


5. 人们在构建什么

项目 构建者 功能 解决的问题 技术栈 阶段 链接
Gemini Spark Google 在 Google 应用之间执行后台任务的个人 AI 智能体 减少收件箱、文件、日程和文档之间的重复协调工作 Gemini 3.5 Flash、Personal Intelligence、Gmail / Calendar / Drive / Docs / Sheets / Slides / YouTube / Maps 连接 Beta 页面, 视频
Google Search agents Google 在后台监测网络、发送综合更新,并能替用户预订或拨打电话 取代重复性的搜索、监测和协调任务 Gemini 3.5 Flash、Search、Antigravity 驱动的生成式 UI Beta 博客, 视频
Google Antigravity Google 面向异步软件工作的智能体开发平台,带编辑器视图和管理界面 卸载多工具软件任务和长时维护工作 编辑器、终端、浏览器编排;产物;支持 Gemini、Claude、GPT-OSS Beta 博客, 视频
Routa Phodal / Routa 以工作区为先的多智能体协调,带有会话、看板、专职角色和评审关卡 用显式阶段、产物和责任归属取代聊天混乱 本地优先看板、追踪记录、证据、专职角色、代码库感知会话 Beta 文档, 仓库, 视频
自我改进的 AI 交易智能体 Lewis Jackson 一套 24/7 交易智能体,会从每笔交易中学习并更新自己 把原本需要持续人工调参的垂直工作流自动化 Hermes Agent、Claude Code、Railway Alpha 应用, 视频

构建者活动主要聚集在两种模式上。Google 正在把后台智能体产品化,覆盖个人工作、Search 和开发;而更小的构建者则在做更紧的控制界面或更窄的垂直闭环。Routa 把智能体协调变成看板和关卡,而 Lewis Jackson 的交易系统则把自我改进自动化绑定到一条具体的交易工作流上,而不是泛化成通用助手行为。

反复出现的触发器,是重复性工作:监测、收件箱分拣、搜索、代码交付,或交易执行。真正的区分动作,是持续性。这些项目不是想把一次提示词回答得更好,而是要持续保有状态、随着时间采取行动,并保持足够可检查,让用户能信任结果。


6. 新动态与亮点

搜索反弹变成了切换指南

Techlore 值得注意,是因为它没有停在抱怨 Google 新搜索方向这一步,而是给了用户一条迁移路径:尊重隐私的搜索引擎,加上 bangs。这很重要,因为它显示,对话正在从情绪反应转向替代行为,而不只是愤怒本身 (来源, 来源)。

Google 把 Spark 讲成了真正的后台个人智能体

Gemini Spark 值得注意,是因为 Google 明确把它描述成一个 24/7 后台智能体,带有任务、技能、日程,以及横跨用户工作区的应用连接。Craig Hewitt 把它和 Search agents、Gemini 3.5 Flash 放在一起讲,这让 Spark 看起来更像 Google 整体智能体叙事里的核心组件,而不是一个边缘实验。

智能体式编程正从聊天窗口转向看板、worktree 和管理界面

Google AntigravityRoutaZen van Riel 都在强调产物、异步协作、worktree、评审关卡,以及用于委派的显式界面。这很值得注意,因为可信的 AI 编程形态,开始看起来更像工作流编排,而不是一段超长的助手对话。

开源和本地编程技术栈正被包装成价格与控制权的制衡选项

Vaibhav Sisinty 在价格和便利性上,把 Antigravity 放到 Claude Code 和 Codex 的对立面;与此同时,Ankita Kulkarni 则认为,开放编程模型和本地配置可以绕开托管限制。这很值得注意,因为编程智能体这条线如今明显是在价格、本地控制和配置开销上竞争,而不只是比基准测试质量。

定制芯片正在成为主流 AI 叙事,而不只是基础设施备忘录

The Information 把 Microsoft 的 Maya 200 带进了日常创作者 / 新闻周期,SinoShift Media 认为 Huawei 的 Cloud Matrix 384 之所以重要,在于系统级工程,而 Economy Media 则把数据中心延迟和电力、元器件瓶颈直接连了起来。这很值得注意,因为芯片路由和供应约束已经不再只是背景信息,而开始成为 AI 表层叙事的一部分。


7. 机会在哪里

[+++] 来源可辨识的智能体搜索与切换层 - 这是这一组里最强的机会。SomeOrdinaryGamersTechloreCraig Hewitt、Google 自己的 Search 路线图,以及 Gemini Spark 都指向同一个缺口:用户想要的是能帮忙处理重复性工作、又不会藏起链接、来源或切换出口的智能体。

[+++] 面向真实团队、带评审关卡的智能体工作台 - theMITmonkZen van RielRoutaBetter StackBusinessCringe 都汇聚到同一个教训上。智能体要先具备记忆、任务边界、产物和评审检查点,才会成为可靠的工作系统。

[++] 基准测试审计与信任解释层 - Coding with LewisThe DecoderWorld Science FestivalBloomberg Television 都说明,信任的得失,如今取决于一项主张背后的证据链,而不只是模型名称。

[++] 算力与供应商路由决策层 - Economy MediaDwarkesh PatelThe InformationSinoShift Media 展示了一个正在发生的需求:在团队过度押注之前,把芯片选项、基础设施瓶颈和部署取舍摊到台面上。

[++] 带受管式配置的开源 / 本地编程技术栈 - Ankita KulkarniVaibhav SisintyZen van RielLewis Jackson 都显示,人们明显想要更便宜或更可控的编程系统,同时又不想失去可用默认值、评审和部署纪律。

[+] 带显式人工接管的垂直自治执行系统 - Gemini SparkGoogle Search agentsLewis Jackson 都在朝着让智能体在单一领域里持续工作的方向推进。机会最强的地方,是那些本来就存在重复监测或执行任务、用户需要监督而不是彻底放手的场景。


8. 要点总结

  1. Google 的搜索转向,如今已经开始催生替代行为,而不只是反应。 YouTube 上对 Search 的反弹已经强到,创作者开始发布使用替代搜索引擎和 bangs 的具体逃生路线,而 Google 自己的产品页面还在继续扩张后台智能体行为。 (来源, 来源, 来源)
  2. 有用的智能体采用,越来越取决于工作流结构,而不是模型选型。 信号最强的智能体视频,重点都放在角色、worktree、评审关卡、看板和显式运营纪律上,而不是某个模型打败了另一个模型。 (来源, 来源, 来源)
  3. 对智能体的热情和反弹正在一起上升。 同一组数据里,一边在庆祝会自我改进的交易系统和带评审关卡的工程流程,另一边也直接宣称自治智能体正在让白领工作变得更糟。 (来源, 来源)
  4. 如今,信任取决于围绕一项主张的公开证据链。 基准测试争议、对推理的批评,以及研究界的怀疑,都说明如果来源、评估者或底层路径仍然不清楚,品牌已经不够用了。 (来源, 来源, 来源, 来源)
  5. 算力稀缺正在被重新表述成路由和系统设计问题。 今天的基础设施视频,重点已经不再是抽象短缺,而是围绕定制芯片、电力上限、供应商依赖和协同集群的具体选择。 (来源, 来源, 来源, 来源)
  6. 构建者活动正汇聚到持续型智能体和协调界面上。 Spark、Search agents、Antigravity、Routa,以及 Lewis Jackson 的交易智能体这类垂直系统,都把 AI 打包成一种会保有状态、会随时间行动、而且需要检查的东西,而不是一次性的聊天机器人回答。 (来源, 来源, 来源, 来源, 来源)