谷歌正式宣戰

核心觀點

01

大會上最讓人驚艷的，毫無疑問是Gemini 3.5 Flash的亮相。

正常來說，"Pro"代表中堅力量，"Flash"代表輕量級和快。

從模型參數量來看，3.5 Flash也確實小於3.1 Pro，但在幾乎所有推理和編碼基準測試上，前者的表現居然更優異：

複雜數學推理的GSM8K測試，3.5 Flash拿下了95.8%的分數，超越3.1 Pro的93.2%；代碼生成能力的SWE-bench完整版中，3.5 Flash解決率達到38.4%，遠遠超過3.1 Pro的32.1%……

為什麼？

根據DeepMind發布的《Gemini 3.5 Technical Report》，最重要的核心技術有兩個。

極限知識蒸餾 ：谷歌這次沒有單純靠堆算力來訓練Flash，而是使用了從未公開的"Gemini 3.5 Ultra"作為教師模型，對Flash進行降維蒸餾。

根據DeepMind首席科學家Jeff Dean的推文解析，3.5 Flash在高質量邏輯鏈數據集上的微調比例，比上一代提升了400%。

這意味著它繼承了超大模型的"邏輯腦"，而不是死記硬背的"知識庫"。

全新的MoE架構（混合專家模型） ：在3.5 Flash內部，谷歌採用了更細顆粒度的專家網絡。

傳統的MoE可能只有8個或16個專家，每次僅激活1-2個，足夠支持萬億級參數規模的模型。

而根據a16z的2026年AI基建投資備忘錄分析，3.5 Flash採用了256個微型專家，每次推理可激活其中最高效的4個。

所以它才能在保持極低激活參數量的同時，覆蓋極其龐大的多模態特徵空間。

在TTFT（Time to First Token，首字輸出時間）指標上，3.5 Flash已經達到了65毫秒以內。

而人類眨眼一次需要100-150毫秒。

簡而言之，當其作為智能體運行時，在人類的生理視角中，根本無法察覺到任何停頓。

對於需要頻繁調用工具、進行多輪反思、極低延遲的開發者而言，這是真正完美的超級代理底座。

只有依託如此極致的工程優化，才可能在競爭劇烈的環境中，建立起"端側落地"的統治力。

第一個，原生多模態Gemini Omni Flash。

Omni的意思是全能，對標早先的GPT-4o，只看名字，都能感受到火藥味有多濃。

至少從表現來看，Gemini Omni Flash遠比GPT-4o有資格用"o"這個字符。

早期的Sora或Gemini 1.5，基本都是縫合怪，即把語音轉文本、文本再轉視覺。

但這次發布的Omni，是真正的原生端到端多模態對齊。不僅能原生理解視頻中的時間連貫性和物理規律，延遲也從400-600毫秒的行業平均水平降至120毫秒。

舉個發布會上的例子：用戶戴著攝像頭倒水，水杯快滿了，Omni能在水溢出前0.5秒說出"停停停！"

這種對現實世界物理狀態的實時推斷，看似簡單，但意義重大：AI從螢幕裡的聊天機器人正式進化為現實世界的輔助工具。

儘管只是初級階段。

第二個，智能助手Spark。

根據The Verge專訪Android工程副總裁的爆料，Spark被賦予了Android 17系統底層的原生API操控權。

簡而言之，你以前需要點開很多App才能完成的複雜流程，現在不需要動手，只需要吩咐Spark一聲，它能幫你全部搞定，甚至能根據你的口吻、偏好去發送信息、整理郵件、彙總日程、追蹤網頁動態、識別帳單隱性扣費、批量處理文檔等等等等……

換句話說，以後有了AI助手，我們基本用不上App，任何複雜的操作都被簡化成唯一。

第三個，智能眼鏡。

為什麼又是眼鏡？

至少在谷歌方面看來，視覺和聽覺的無縫接入，就是多模態大模型的最終宿主。

這副眼鏡看起來沒有任何花哨的外觀，全部聚焦於實用能力：

重量僅4克的Micro-OLED全彩光波導鏡片，透光率高達85% ；

搭載自研輕量化Gemini端側芯片，本地推理延遲≤12ms，無需聯網即可完成實時翻譯、圖像識別、場景分析；

原生聯動Spark智能體，同步手機、雲端數據，實現日程提醒、實時翻譯、環境預警等個性化服務。

簡而言之，就是越過手機螢幕，把智能體通過眼鏡塞進人類的第一視角。

內容實在太多，谷歌似乎一次性清倉了所有大招，向市場宣告了一個真理：

沒有入口的算法，什麼都不是。

卷大模型的參數、卷跑分的時代已經過去，單純的模型提供商已經沒有護城河，未來是"端+雲+生態+硬體"的四維空間戰。

把AI塞進全家桶，其實是在重塑整個互聯網的流量分發邏輯：從"用戶主動搜索/點擊"，變成了"AI智能體主動分發服務"。

對廣大的開發者和中小企業而言，這再好不過，因為底層算力和模型變得極其廉價，大家可以專心做應用層的創新。

但其它競爭對手，此刻恐怕只想破口大罵。

02

當劈柴在台上雲淡風輕地宣布"Gemini月活躍用戶正式突破9億"時，在台下造成了不小的轟動。

9億，比美國所有對手的MAU加起來都要多。

怎麼做到的？

答案簡單粗暴：硬塞。

谷歌不需要像獨立AI公司那樣去花廣告費買量，只需要在Chrome瀏覽器的地址欄旁邊加一個圖標，在30億台安卓手機的底部導航欄集成一個呼出快捷鍵，在Google Workspace裡全量推送更新……

獲客成本基本上等於0。

更關鍵的是，加下來一段時間，9億活躍用戶每天用智能眼鏡看商品時停留的眼神、用Spark處理事務時修正的邏輯以及與Omni視覺模型的互動，產生的海量高質量、多模態真實世界反饋數據，統統會成為滋養Gemini 4的養料。

這是一個極其堅固的壁壘：模型越好用->用的人越多->產生的數據越多->模型變得更好用。

為了速速強化這個閉環，谷歌直接向所有對手宣布打價格戰：AI Ultra套餐從249.99美元/月砍到99.9美元/月。

3.5 Flash的百萬token輸入價格干到了0.02美元，百萬Token輸出價格0.08美元。

這是個什麼神仙價格？

對比一下，行業同級別模型的均價分別在0.15-0.2美元和0.6-1美元。

劈柴算了筆帳：頭部客戶每天處理約1萬億個token。把80%的工作負載切到Gemini 3.5 Flash上一年，能省超過10億美元。

為什麼敢把AI賣成白菜價？

最大的依仗就是：垂直整合的算力基礎設施。

包括OpenAI、Anthropic等巨頭，看似風光，本質上其實還是"算力租客"，需要向微軟、亞馬遜買算力，而後者又要去給老黃交錢。

而谷歌有自家的TPU，再加上3.5 Flash極其變態的MoE稀疏激活效率，將算力成本壓縮到了極致。

完全可以利用重資產優勢去降維打擊單純的算法公司。

邏輯很清晰。

基礎大模型正在快速商品化。就像水和電一樣，你見過哪家自來水公司有暴利的？

谷歌不怕大模型本身不賺錢，因為可以通過搜索廣告、雲服務和安卓生態的抽成把錢賺回來。

但對於純靠賣大模型API為生的OpenAI、Anthropic、Cohere、Mistral，這就不可能。

投資人現在大概很想按著奧特曼的頭問："谷歌的API價格只要你的十分之一，性能還比你好，你告訴我，你的商業模式怎麼跑通？ "

多個行業的競爭格局，將因此進入加速洗牌期。

AI廠商不必多說，必須儘快找到更便宜的算力來源，或者自己下場做芯片。

其次是仍在閉門造車的蘋果。

智能眼鏡+ Omni視頻大模型+ Spark原生系統級接管的組合，毫無疑問已經威脅到了iPhone。

根據麥格理的《消費電子趨勢預測報告》：未來三年內，基於視覺/語音的無屏交互時長占比，預計將從目前的8%躍升至35%。

如果用戶習慣了用眼鏡和語音完成日常工作和娛樂，螢幕的使用時長必然大幅壓縮。

蘋果如果拿不出足夠驚艷的穿戴設備反擊（Vision Pro太重太貴，注定只是少數人的玩具），其在移動互聯網時代的入口壟斷權將受到史無前例的挑戰。

這不是迭代，是革命。

谷歌用技術、流量、價格三把刀，給所有對手下了戰書。

此時此刻，還有人嘲笑它得了大企業病嗎？

欢迎加入 ChainCatcher 官方社群

Telegram 订阅： @chaincatcher

X (Twitter): @ChainCatcher_

專題 AI x Crypto 動態研究

當 Crypto 遇上 AI，將誕生哪些新敘事？

關聯標籤

谷歌 AI智能體 Omni Spark

風險提示

谷歌正式宣戰

01

02

專題 AI x Crypto 動態研究

熱門文章