谷歌正式宣戰
本文作者:城北徐公 數據支持:勾股大數據
2026年Google I/O開發者大會,給人的感覺只有兩個字:張狂。
不僅把AI智能體像填鴨一樣,無縫塞進搜索、瀏覽器、手機、智能眼鏡等所有核心流量入口,還連續甩出Gemini 3.5 Flash、視頻模型Omni、全新AI助手Spark三張王炸。
亮完肌肉後,劈柴甚至炫耀般地宣布,Gemini月活破9億;並同步官宣大幅降價。
意思再直白不過了:我比你強,還比你便宜。
這不是宣戰是什麼?
01
大會上最讓人驚艷的,毫無疑問是Gemini 3.5 Flash的亮相。
正常來說,"Pro"代表中堅力量,"Flash"代表輕量級和快。
從模型參數量來看,3.5 Flash也確實小於3.1 Pro,但在幾乎所有推理和編碼基準測試上,前者的表現居然更優異:
複雜數學推理的GSM8K測試,3.5 Flash拿下了95.8%的分數,超越3.1 Pro的93.2%;代碼生成能力的SWE-bench完整版中,3.5 Flash解決率達到38.4%,遠遠超過3.1 Pro的32.1%……
為什麼?
根據DeepMind發布的《Gemini 3.5 Technical Report》,最重要的核心技術有兩個。
極限知識蒸餾 :谷歌這次沒有單純靠堆算力來訓練Flash,而是使用了從未公開的"Gemini 3.5 Ultra"作為教師模型,對Flash進行降維蒸餾。
根據DeepMind首席科學家Jeff Dean的推文解析,3.5 Flash在高質量邏輯鏈數據集上的微調比例,比上一代提升了400%。
這意味著它繼承了超大模型的"邏輯腦",而不是死記硬背的"知識庫"。
全新的MoE架構(混合專家模型) :在3.5 Flash內部,谷歌採用了更細顆粒度的專家網絡。
傳統的MoE可能只有8個或16個專家,每次僅激活1-2個,足夠支持萬億級參數規模的模型。
而根據a16z的2026年AI基建投資備忘錄分析,3.5 Flash採用了256個微型專家,每次推理可激活其中最高效的4個。
所以它才能在保持極低激活參數量的同時,覆蓋極其龐大的多模態特徵空間。
在TTFT(Time to First Token,首字輸出時間)指標上,3.5 Flash已經達到了65毫秒以內。
而人類眨眼一次需要100-150毫秒。
簡而言之,當其作為智能體運行時,在人類的生理視角中,根本無法察覺到任何停頓。
對於需要頻繁調用工具、進行多輪反思、極低延遲的開發者而言,這是真正完美的超級代理底座。
只有依託如此極致的工程優化,才可能在競爭劇烈的環境中,建立起"端側落地"的統治力。
第一個,原生多模態Gemini Omni Flash。
Omni的意思是全能,對標早先的GPT-4o,只看名字,都能感受到火藥味有多濃。
至少從表現來看,Gemini Omni Flash遠比GPT-4o有資格用"o"這個字符。
早期的Sora或Gemini 1.5,基本都是縫合怪,即把語音轉文本、文本再轉視覺。
但這次發布的Omni,是真正的原生端到端多模態對齊。不僅能原生理解視頻中的時間連貫性和物理規律,延遲也從400-600毫秒的行業平均水平降至120毫秒。
舉個發布會上的例子:用戶戴著攝像頭倒水,水杯快滿了,Omni能在水溢出前0.5秒說出"停停停!"
這種對現實世界物理狀態的實時推斷,看似簡單,但意義重大:AI從螢幕裡的聊天機器人正式進化為現實世界的輔助工具。
儘管只是初級階段。
第二個,智能助手Spark。
根據The Verge專訪Android工程副總裁的爆料,Spark被賦予了Android 17系統底層的原生API操控權。
簡而言之,你以前需要點開很多App才能完成的複雜流程,現在不需要動手,只需要吩咐Spark一聲,它能幫你全部搞定,甚至能根據你的口吻、偏好去發送信息、整理郵件、彙總日程、追蹤網頁動態、識別帳單隱性扣費、批量處理文檔等等等等……
換句話說,以後有了AI助手,我們基本用不上App,任何複雜的操作都被簡化成唯一。
第三個,智能眼鏡。
為什麼又是眼鏡?
至少在谷歌方面看來,視覺和聽覺的無縫接入,就是多模態大模型的最終宿主。
這副眼鏡看起來沒有任何花哨的外觀,全部聚焦於實用能力:
重量僅4克的Micro-OLED全彩光波導鏡片,透光率高達85% ;
搭載自研輕量化Gemini端側芯片,本地推理延遲≤12ms,無需聯網即可完成實時翻譯、圖像識別、場景分析;
原生聯動Spark智能體,同步手機、雲端數據,實現日程提醒、實時翻譯、環境預警等個性化服務。
簡而言之,就是越過手機螢幕,把智能體通過眼鏡塞進人類的第一視角。
內容實在太多,谷歌似乎一次性清倉了所有大招,向市場宣告了一個真理:
沒有入口的算法,什麼都不是。
卷大模型的參數、卷跑分的時代已經過去,單純的模型提供商已經沒有護城河,未來是"端+雲+生態+硬體"的四維空間戰。
把AI塞進全家桶,其實是在重塑整個互聯網的流量分發邏輯:從"用戶主動搜索/點擊",變成了"AI智能體主動分發服務"。
對廣大的開發者和中小企業而言,這再好不過,因為底層算力和模型變得極其廉價,大家可以專心做應用層的創新。
但其它競爭對手,此刻恐怕只想破口大罵。
02
當劈柴在台上雲淡風輕地宣布"Gemini月活躍用戶正式突破9億"時,在台下造成了不小的轟動。
9億,比美國所有對手的MAU加起來都要多。
怎麼做到的?
答案簡單粗暴:硬塞。
谷歌不需要像獨立AI公司那樣去花廣告費買量,只需要在Chrome瀏覽器的地址欄旁邊加一個圖標,在30億台安卓手機的底部導航欄集成一個呼出快捷鍵,在Google Workspace裡全量推送更新……
獲客成本基本上等於0。
更關鍵的是,加下來一段時間,9億活躍用戶每天用智能眼鏡看商品時停留的眼神、用Spark處理事務時修正的邏輯以及與Omni視覺模型的互動,產生的海量高質量、多模態真實世界反饋數據,統統會成為滋養Gemini 4的養料。
這是一個極其堅固的壁壘:模型越好用->用的人越多->產生的數據越多->模型變得更好用。
為了速速強化這個閉環,谷歌直接向所有對手宣布打價格戰:AI Ultra套餐從249.99美元/月砍到99.9美元/月。
3.5 Flash的百萬token輸入價格干到了0.02美元,百萬Token輸出價格0.08美元。
這是個什麼神仙價格?
對比一下,行業同級別模型的均價分別在0.15-0.2美元和0.6-1美元。
劈柴算了筆帳:頭部客戶每天處理約1萬億個token。把80%的工作負載切到Gemini 3.5 Flash上一年,能省超過10億美元。
為什麼敢把AI賣成白菜價?
最大的依仗就是:垂直整合的算力基礎設施。
包括OpenAI、Anthropic等巨頭,看似風光,本質上其實還是"算力租客",需要向微軟、亞馬遜買算力,而後者又要去給老黃交錢。
而谷歌有自家的TPU,再加上3.5 Flash極其變態的MoE稀疏激活效率,將算力成本壓縮到了極致。
完全可以利用重資產優勢去降維打擊單純的算法公司。
邏輯很清晰。
基礎大模型正在快速商品化。就像水和電一樣,你見過哪家自來水公司有暴利的?
谷歌不怕大模型本身不賺錢,因為可以通過搜索廣告、雲服務和安卓生態的抽成把錢賺回來。
但對於純靠賣大模型API為生的OpenAI、Anthropic、Cohere、Mistral,這就不可能。
投資人現在大概很想按著奧特曼的頭問:"谷歌的API價格只要你的十分之一,性能還比你好,你告訴我,你的商業模式怎麼跑通? "
多個行業的競爭格局,將因此進入加速洗牌期。
AI廠商不必多說,必須儘快找到更便宜的算力來源,或者自己下場做芯片。
其次是仍在閉門造車的蘋果。
智能眼鏡+ Omni視頻大模型+ Spark原生系統級接管的組合,毫無疑問已經威脅到了iPhone。
根據麥格理的《消費電子趨勢預測報告》:未來三年內,基於視覺/語音的無屏交互時長占比,預計將從目前的8%躍升至35%。
如果用戶習慣了用眼鏡和語音完成日常工作和娛樂,螢幕的使用時長必然大幅壓縮。
蘋果如果拿不出足夠驚艷的穿戴設備反擊(Vision Pro太重太貴,注定只是少數人的玩具),其在移動互聯網時代的入口壟斷權將受到史無前例的挑戰。
這不是迭代,是革命。
谷歌用技術、流量、價格三把刀,給所有對手下了戰書。
此時此刻,還有人嘲笑它得了大企業病嗎?














