QR 코드를 스캔하여 다운로드하세요.
BTC $76,863.47 -0.59%
ETH $2,117.19 -0.61%
BNB $648.34 +0.57%
XRP $1.35 -1.05%
SOL $85.89 +1.02%
TRX $0.3614 +0.88%
DOGE $0.1041 +0.06%
ADA $0.2467 -1.25%
BCH $376.21 +2.76%
LINK $9.58 -0.19%
HYPE $59.96 +17.97%
AAVE $88.30 +0.37%
SUI $1.08 +2.52%
XLM $0.1437 +0.32%
ZEC $662.43 +7.98%
BTC $76,863.47 -0.59%
ETH $2,117.19 -0.61%
BNB $648.34 +0.57%
XRP $1.35 -1.05%
SOL $85.89 +1.02%
TRX $0.3614 +0.88%
DOGE $0.1041 +0.06%
ADA $0.2467 -1.25%
BCH $376.21 +2.76%
LINK $9.58 -0.19%
HYPE $59.96 +17.97%
AAVE $88.30 +0.37%
SUI $1.08 +2.52%
XLM $0.1437 +0.32%
ZEC $662.43 +7.98%

구글이 공식적으로 전쟁을 선포하다

핵심 관점
Summary: 구글은 기술, 트래픽, 가격 세 가지 무기로 모든 경쟁자에게 전쟁을 선포했다.
추천 읽기
2026-05-21 21:33:39
수집
구글은 기술, 트래픽, 가격 세 가지 무기로 모든 경쟁자에게 전쟁을 선포했다.

본 문서 저자: 성북서공 데이터 지원: 구구대데이터

2026년 Google I/O 개발자 회의에서 사람들에게 주는 느낌은 두 글자: 방탕.

AI 지능체를 마치 오리알처럼, 검색, 브라우저, 휴대폰, 스마트 안경 등 모든 핵심 유입구에 매끄럽게 끼워 넣었을 뿐만 아니라, Gemini 3.5 Flash, 비디오 모델 Omni, 새로운 AI 도우미 Spark라는 세 장의 왕패를 연속으로 던졌다.

근육을 자랑한 후, 심지어 자랑하듯이 발표했다, Gemini의 월간 활성 사용자 수가 9억을 돌파했다; 그리고 동시에 대폭 가격 인하를 공식 발표했다.

의미는 너무나 직설적이다: 나는 너보다 강하고, 너보다 싸다.

이것이 전쟁 선포가 아닌가? 이미지

01

회의에서 가장 놀라운 것은 의심할 여지 없이 Gemini 3.5 Flash의 등장이다.

정상적으로 "Pro"는 중견 세력을, "Flash"는 경량 및 빠름을 의미한다.

모델 파라미터 수를 보면, 3.5 Flash는 실제로 3.1 Pro보다 작지만, 거의 모든 추론 및 코딩 벤치마크 테스트에서 전자의 성능이 더 우수하다:

복잡한 수학 추론의 GSM8K 테스트에서, 3.5 Flash는 95.8%의 점수를 기록하며 3.1 Pro의 93.2%를 초과했다; 코드 생성 능력의 SWE-bench 전체 버전에서, 3.5 Flash의 해결률은 38.4%에 달하며, 3.1 Pro의 32.1%를 훨씬 초과했다……

왜일까? 이미지

DeepMind가 발표한 《Gemini 3.5 기술 보고서》에 따르면, 가장 중요한 핵심 기술은 두 가지이다.

극한 지식 증류: 구글은 이번에 단순히 연산력을 쌓아 Flash를 훈련시키지 않고, 공개되지 않은 "Gemini 3.5 Ultra"를 교사 모델로 사용하여 Flash에 대해 차원 축소 증류를 수행했다.

DeepMind의 수석 과학자 Jeff Dean의 트윗 분석에 따르면, 3.5 Flash는 고품질 논리 체인 데이터 세트에서의 미세 조정 비율이 이전 세대보다 400% 향상되었다.

이는 그것이 초대형 모델의 "논리 뇌"를 계승했음을 의미하며, 단순히 암기한 "지식 저장소"가 아니다.

완전히 새로운 MoE 구조(혼합 전문가 모델): 3.5 Flash 내부에서 구글은 더 세분화된 전문가 네트워크를 채택했다.

전통적인 MoE는 8개 또는 16개의 전문가만 있을 수 있으며, 매번 1-2개만 활성화되어도 조 단위 파라미터 규모의 모델을 지원하기에 충분하다.

a16z의 2026년 AI 인프라 투자 메모에 따르면, 3.5 Flash는 256개의 미니 전문가를 사용하며, 매번 추론 시 가장 효율적인 4개를 활성화할 수 있다.

그래서 그것은 극히 낮은 활성화 파라미터 수를 유지하면서도 매우 방대한 다중 모드 특성 공간을 커버할 수 있다.

TTFT(첫 번째 토큰까지의 시간) 지표에서, 3.5 Flash는 이미 65밀리초 이내에 도달했다.

인간이 한 번 눈을 깜빡이는 데 필요한 시간은 100-150밀리초이다.

간단히 말해, 그것이 지능체로 작동할 때, 인간의 생리적 관점에서 전혀 어떤 정지감도 느낄 수 없다.

도구를 자주 호출하고, 여러 번 반성하며, 매우 낮은 지연이 필요한 개발자에게는, 이것이 진정으로 완벽한 슈퍼 에이전트 기반이다.

이처럼 극단적인 엔지니어링 최적화에 의존해야만, 경쟁이 치열한 환경에서 "단말기 측의 지배력"을 구축할 수 있다. 이미지

첫 번째, 원주율 다중 모드 Gemini Omni Flash.

Omni는 전능함을 의미하며, 이전의 GPT-4o와 비교된다. 이름만 봐도 화약 냄새가 얼마나 진한지 느낄 수 있다.

적어도 성능 면에서, Gemini Omni Flash는 GPT-4o보다 "o"라는 문자를 사용할 자격이 훨씬 더 많다.

초기 Sora 또는 Gemini 1.5는 기본적으로 봉합 괴물로, 음성을 텍스트로 변환하고, 텍스트를 다시 비주얼로 변환하는 방식이었다.

하지만 이번에 발표된 Omni는 진정한 원주율 엔드 투 엔드 다중 모드 정렬이다. 단순히 비디오의 시간적 연속성과 물리적 법칙을 이해할 수 있을 뿐만 아니라, 지연도 400-600밀리초의 업계 평균 수준에서 120밀리초로 줄어들었다.

발표회에서의 예를 들어보자: 사용자가 카메라를 착용하고 물을 따를 때, 컵이 거의 가득 차면, Omni는 물이 넘치기 0.5초 전에 "멈춰! 멈춰! 멈춰!"라고 말할 수 있다.

이런 현실 세계의 물리적 상태에 대한 실시간 추론은 간단해 보이지만, 의미는 크다: AI가 화면 속의 채팅 로봇에서 현실 세계의 보조 도구로 진화했다.

비록 아직 초기 단계에 불과하지만.

두 번째, 스마트 도우미 Spark.

The Verge의 Android 엔지니어 부사장과의 인터뷰에 따르면, Spark는 Android 17 시스템의 기본 원주율 API 조작 권한을 부여받았다.

간단히 말해, 예전에는 여러 앱을 열어야만 완료할 수 있었던 복잡한 프로세스를 이제는 손을 대지 않고, Spark에게 한 마디로 명령하면 모든 것을 처리할 수 있으며, 심지어 사용자의 어조와 선호에 따라 메시지를 보내고, 이메일을 정리하고, 일정을 요약하고, 웹 페이지 동향을 추적하고, 청구서의 숨겨진 요금을 인식하고, 문서를 일괄 처리하는 등의 작업을 할 수 있다……

다시 말해, 앞으로 AI 도우미가 생기면, 우리는 기본적으로 앱을 사용할 필요가 없고, 모든 복잡한 작업이 단일 작업으로 단순화된다.

세 번째, 스마트 안경.

왜 또 안경인가?

적어도 구글 측에서는 시각과 청각의 매끄러운 접속이 다중 모드 대모델의 최종 주체라고 생각한다.

이 안경은 화려한 외관이 전혀 없고, 오로지 실용성에 집중하고 있다:

무게가 단 4그램인 Micro-OLED 풀컬러 광파도 렌즈, 투과율이 85%에 달한다;

자체 개발한 경량화 Gemini 단말기 칩을 탑재하여, 로컬 추론 지연이 ≤12ms로, 네트워크에 연결하지 않고도 실시간 번역, 이미지 인식, 장면 분석을 수행할 수 있다;

원주율 Spark 지능체와 연동되어, 스마트폰, 클라우드 데이터를 동기화하여 일정 알림, 실시간 번역, 환경 경고 등의 개인화된 서비스를 제공한다.

간단히 말해, 스마트폰 화면을 넘어, 안경을 통해 지능체를 인간의 첫 번째 시각에 끼워 넣는 것이다. 이미지

내용이 너무 많아서, 구글은 모든 대책을 한 번에 쏟아내며 시장에 진리를 선언한 것 같다:

입구가 없는 알고리즘은 아무것도 아니다.

대형 모델의 파라미터와 점수를 쌓는 시대는 이미 지나갔고, 단순한 모델 제공자는 더 이상 성벽이 없다. 미래는 "단말기 + 클라우드 + 생태계 + 하드웨어"의 사차원 공간 전쟁이다.

AI를 모든 패키지에 끼워 넣는 것은 사실상 전체 인터넷의 트래픽 배포 논리를 재구성하는 것이다: "사용자가 능동적으로 검색/클릭"에서 "AI 지능체가 능동적으로 서비스 배포"로 변화하는 것이다.

광범위한 개발자와 중소기업에게는 더할 나위 없이 좋은 소식이다. 왜냐하면 기본적인 연산력과 모델이 극히 저렴해져서, 모두가 애플리케이션 레이어의 혁신에 집중할 수 있기 때문이다.

하지만 다른 경쟁자들은 지금 이 순간, 아마도 욕을 하고 싶어할 것이다.

02

피차이가 무대에서 담담하게 "Gemini의 월간 활성 사용자 수가 공식적으로 9억을 돌파했다"고 발표했을 때, 관중석에서는 적지 않은 소란이 일어났다.

9억은 미국의 모든 경쟁자의 MAU를 합친 것보다 많다.

어떻게 이뤄냈을까?

답은 간단하고 직설적이다: 억지로 밀어넣기.

구글은 독립 AI 회사처럼 광고비를 써서 유입을 늘릴 필요가 없다. 단지 Chrome 브라우저의 주소창 옆에 아이콘을 추가하고, 30억 대의 안드로이드 휴대폰 하단 내비게이션 바에 호출 단축키를 통합하고, Google Workspace에서 전량 업데이트를 푸시하면 된다……

고객 획득 비용은 사실상 0이다.

더 중요한 것은, 앞으로 일정 기간 동안 9억 활성 사용자가 스마트 안경으로 상품을 볼 때 머무는 시선, Spark로 업무를 처리할 때 수정하는 논리, Omni 비주얼 모델과의 상호작용에서 생성되는 방대한 고품질 다중 모드 현실 세계 피드백 데이터가 모두 Gemini 4의 양분이 될 것이다.

이는 매우 견고한 장벽이다: 모델이 더 잘 사용될수록 -> 사용하는 사람이 더 많아지고 -> 생성되는 데이터가 더 많아지며 -> 모델이 더 잘 사용된다.

이 폐쇄 루프를 빠르게 강화하기 위해, 구글은 모든 경쟁자에게 가격 전쟁을 선언했다: AI Ultra 패키지를 249.99달러/월에서 99.9달러/월로 대폭 인하했다.

3.5 Flash의 백만 토큰 입력 가격은 0.02달러, 백만 토큰 출력 가격은 0.08달러에 이른다.

이게 무슨 신기한 가격인가?

비교해보면, 업계 동급 모델의 평균 가격은 각각 0.15-0.2달러와 0.6-1달러이다.

피차이는 계산을 해보았다: 주요 고객이 매일 약 1조 개의 토큰을 처리한다. 80%의 작업 부하를 Gemini 3.5 Flash로 전환하면, 연간 10억 달러 이상을 절약할 수 있다.

왜 AI를 배추 가격에 팔 수 있을까?

가장 큰 의존은: 수직 통합된 연산력 인프라.

OpenAI, Anthropic 등 거대 기업들은 겉보기에는 화려하지만, 본질적으로는 여전히 "연산력 임대인"이다. 그들은 마이크로소프트, 아마존에게 연산력을 구매해야 하고, 후자는 다시 황 회장에게 돈을 지불해야 한다.

하지만 구글은 자체 TPU를 보유하고 있으며, 3.5 Flash의 극단적인 MoE 희소 활성화 효율 덕분에 연산력 비용을 극한으로 압축할 수 있다.

완전히 자산 우위를 활용하여 단순한 알고리즘 회사를 압도할 수 있다. 이미지

논리는 매우 명확하다.

기초 대형 모델이 빠르게 상품화되고 있다. 마치 물과 전기처럼, 당신은 어느 자치수도 회사가 폭리를 취하는 것을 본 적이 있는가?

구글은 대형 모델 자체가 수익을 내지 못하는 것을 두려워하지 않는다. 왜냐하면 검색 광고, 클라우드 서비스 및 안드로이드 생태계의 수수료를 통해 돈을 벌 수 있기 때문이다.

하지만 순수하게 대형 모델 API 판매로 생계를 유지하는 OpenAI, Anthropic, Cohere, Mistral에게는 불가능하다.

투자자들은 지금 아마도 울트라맨의 머리를 눌러 "구글의 API 가격이 당신의 10분의 1인데 성능은 더 좋다. 당신의 비즈니스 모델은 어떻게 돌아가나요?"라고 묻고 싶어할 것이다.

여러 산업의 경쟁 구도가 이로 인해 가속화된 재편기에 들어설 것이다.

AI 업체들은 더 저렴한 연산력 출처를 빨리 찾아야 하며, 아니면 직접 칩을 만들어야 한다.

다음은 여전히 문을 닫고 작업 중인 애플이다.

스마트 안경 + Omni 비디오 대모델 + Spark 원주율 시스템 수준의 인수 조합은 의심할 여지 없이 iPhone에 위협이 되고 있다.

맥쿼리의 《소비자 전자 제품 트렌드 예측 보고서》에 따르면: 향후 3년 내에 시각/음성을 기반으로 한 무스크린 상호작용 시간 비율이 현재의 8%에서 35%로 급증할 것으로 예상된다.

사용자가 안경과 음성을 사용하여 일상 업무와 오락을 완료하는 데 익숙해지면, 화면 사용 시간은 반드시 대폭 줄어들 것이다.

애플이 충분히 놀라운 웨어러블 장치를 반격하지 못한다면(비전 프로는 너무 무겁고 비싸서 소수의 사람들만의 장난감이 될 운명이다), 이동 인터넷 시대의 입구 독점권은 전례 없는 도전에 직면할 것이다. 이미지

이것은 반복이 아니라 혁명이다.

구글은 기술, 트래픽, 가격이라는 세 가지 칼로 모든 경쟁자에게 전쟁을 선포했다.

지금 이 순간, 여전히 누군가가 그들이 대기업 병에 걸렸다고 비웃고 있는가?

Join ChainCatcher Official
Telegram Feed: @chaincatcher
X (Twitter): @ChainCatcher_
warnning 위험 경고
app_icon
ChainCatcher Building the Web3 world with innovations.