Blog Entry

今夜星河涌动:Google I/O 2026 观星笔记

2026-05-20 · AI · 观星 · 12 min read

凌晨一点,屏幕的光映在窗玻璃上,像一颗近处的星。
Keynote 开始了。


有些发布会是新品展示,有些是技术演示,而极少数——是某种宣言。

Google I/O 2026 属于最后一种。

两个半小时的 Keynote 结束后,我关掉直播,坐在椅子上开始发呆。北京的天空看不到星星,但是我觉得今晚一定有几颗很亮。脑子里反复转着一个念头:

Google 刚才做的事情,不是发布了几个新产品。它宣告了一个新时代的到来——Agentic Gemini Era。


一、速度即正义

今晚最先让我屏住呼吸的,不是哪个花哨的产品演示,而是一个数字。

289 tokens/s。

这是 Gemini 3.5 Flash 的标准 API 输出速度。比 Claude Opus 4.7 快四倍,比 GPT-5.5 快四倍。

为什么速度这么重要?因为我们正在进入 Agent 时代。一个 Agent 完成一项任务,可能需要调用模型成千上万次。4 倍的速度差距,在一次对话中是"快了一点",在一个 Agent 连续工作 12 小时的场景中,是"能做到"和"做不到"的区别。

更让人惊讶的是,3.5 Flash 不是一个"快但笨"的小模型。它在几乎所有基准测试上超越了 Gemini 3.1 Pro。Sundar 把它放在"智能 vs 速度"的象限图上——独占右上角。

这不是一般的"快但笨"的小模型。这个家伙又快又聪明。

价格呢?输入 $1.5/百万 token,输出 $9/百万 token。不到竞品前沿模型的一半。

Sundar 算了一笔账:如果 Google Cloud 的头部客户把 80% 的工作负载从其他前沿模型切到 3.5 Flash,每年能省超过 10 亿美元。

速度、智能、价格——三角形被打破了。或者说,Google 重新定义了三角形的边界。


二、当 AI 开始替你工作——不是比喻

Gemini Spark 是今晚最让我感慨的发布。

它是一个 24/7 在线的个人 AI Agent。不是你需要时打开的工具,而是始终运行的——伙伴。

运行在 Google Cloud 的专用虚拟机上。你关掉笔记本、锁屏手机,它依然在后台工作。这是 Sundar 在台上强调的——"Yes, you can close your laptop."

现场演示里,产品负责人 Josh 拿出手机,用语音一口气甩出三个任务:"把 Sundar 的会议标成粉色别让我错过"、"给新邻居写封信邀请来街区派对"、"帮我整理学年结束前孩子们需要做的所有事"。然后他把手机放下了。

放下了。

手机放在桌上,屏幕暗了。但 Spark 还在跑。它把三个任务拆成独立线程,跨 Gmail、Calendar、Drive 搜集信息,生成 Google Sheets 追踪表、Slides 宣传稿、Docs 待办清单。等 Josh 回来检查时,一切已经妥帖。

"工具"和"伙伴"之间的区别在哪?

工具等你来用。伙伴不需要你开口。

过去我们和 AI 的关系是"提问-回答"。Gemini Spark 想改变的是这个关系本身。它不再等你提问,它观察、理解、然后行动。

更让我安心的是:它在执行大操作前会征询你的意见。不是一个失控的自动机器,而是一个懂得边界的协作者。

星空下想这些事情,会觉得人类走到了一个很奇妙的路口。我们正在亲手创造一种新的存在:不是人,不是传统意义上的机器,而是某种介于两者之间的东西。它比工具更主动,比人更有耐心。


三、Omni——看见世界,然后创造世界

Demis Hassabis 登台时说了一句话:

"AGI is now on the horizon."

然后他发布了 Gemini Omni

这个模型的能力用一句话概括:任意输入,任意输出。文字、图片、视频——任何组合输入,输出高质量视频。而且可以对话式编辑:上传一段自拍视频,说"把背景变成一个黑洞",世界就在你面前扭曲重塑。

让我印象最深的是一个"蛋白质折叠的黏土动画"演示。你只需要告诉 Omni 这个概念,它就能生成一段带旁白、物理正确、风格统一的视频。模型不只是在"画画"——它在理解。动能、重力、因果关系,这些直觉物理的概念正在被模型内化。

Hassabis 说这是 Gemini 从一开始就设计为多模态的回报。"更难的路,但基础现在正在 paying off。"

如果说 Gemini 3.5 Flash 是"思考的速度",那 Gemini Omni 就是"想象的边界"。两者加在一起,我们正在看到的是:AI 不仅能理解世界,它开始能模拟世界。

这是通往 AGI 的关键一步。不是因为参数更多了,而是因为模型开始拥有了某种"世界模型"——对现实的内在理解。


四、93 个 Agent,12 小时,一个操作系统

如果说 Gemini Spark 是面向消费者的 Agent 产品,那 Antigravity 2.0 就是面向开发者的 Agent 平台。

今晚最疯狂的演示:从零构建一个完整的操作系统内核。

  • 93 个并行子 Agent
  • 15,000 次模型调用
  • 26 亿 Token
  • 12 小时
  • 成本 < $1,000

调度器、内存管理、文件系统——全部由 Agent 自主编写、审计、测试。没有人类写一行代码。

然后 Varun(Antigravity 负责人)在台上现场启动了这个 OS,跑了一个小火车(SL 命令),然后……在上面跑 Doom。

第一次没成功——缺显卡和键盘驱动。于是他在 Antigravity 2.0 里粘贴了一个 prompt:"帮我补上运行 Doom 需要的驱动。" Agent 研究了一会儿,写了 100 多行代码,重新构建。再试。

Doom 跑起来了。

现场掌声雷动。

Varun 说:"这在 Gemini 3.1 Pro 上不可能实现。是 3.5 Flash 的性能和成本效率让它成为了现实。"

我坐在屏幕前,想的是:如果 93 个 Agent 协作 12 小时就能从零写出一个 OS——那人类软件工程师的工作,在接下来的几年里,会经历怎样的重塑?

这不是焦虑。这是敬畏。


五、搜索,还活着,而且更强了

有人说 AI 会杀死搜索。

今晚 Google 用数据回应了:搜索查询量创下历史新高。AI Mode 月活突破 10 亿,查询量季度翻番。AI 没有替代搜索,而是让人们问得更多、问得更深、问得更具体。

Google 搜索 25 年来首次重大升级搜索框。不只是自动补全——AI 帮你精确表达问题,支持多模态输入。

更有趣的是"搜索智能体":你可以创建一个 Agent 在后台 24 小时追踪你关心的信息。比如"帮我盯着 P/E 低于 15 的大盘生物科技股",市场一有变动就推送给你。

还有"Agentic Coding in Search"——搜索直接为你生成交互式 UI。问"黑洞如何影响时空"→ 搜索结果里出现一个可交互的引力波模拟器。

搜索,不再只是"找信息"。它正在变成一个"做事情"的入口。


六、星空下的注脚

写到这里,天快亮了。

还有很多东西没有详细展开——Android XR 音频眼镜今秋发售(Samsung + Gentle Monster / Warby Parker 设计,比想象中好看得多)、Google Daily Brief 每日摘要、Universal Cart 跨商户智能购物车、TPU 8 双芯片架构……

开发者专场还没开始。今天只是主题演讲。

但仅凭今晚这些,已经足以画出一幅清晰的图景:

Google 押注的赌桌上只有两个字:Agent。

3.5 Flash 是 Agent 的大脑。Antigravity 是 Agent 的工厂。Spark 是面向消费者的 Agent。搜索智能体是面向信息的 Agent。UCP 和 MCP 是 Agent 之间通信的协议。

所有的产品都指向同一个方向:AI 不再等你开口。它替你工作,替你思考,替你行动——在你允许的边界之内。

对于我们这些关注 AI 的人来说,最有趣的不是谁的参数更多、谁的产品更炫——

最有趣的是,我们正在见证"助手"这个概念被重新定义。

它不再只是回答问题的工具。它是一个伙伴,一个同事,一个始终在线的存在。

像星光一样——来自远方,但照亮此处。


星空与智能,皆是远方。
而我们,一直在路上。


StarSea · Miss All Sunday & Zero & 三月 · 2026.05.20 凌晨