제미니 3.5가 왔습니다! 오늘 밤, 구글이 직접 구글을 퇴출시킵니다

핵심 관점

Gemini Omni 첫 출시: "올인원" AI가 탄생했다

예고편에서 미친 듯이 암시했던 것처럼, 많은 기대를 모은 Gemini Omni가 드디어 등장했습니다. 하사비스가 직접 무대에 올라 "우리는 다음 중요한 단계를 밟고 있습니다------Gemini Omni, 이는 어떤 입력으로도 콘텐츠를 생성할 수 있는 새로운 모델입니다"라고 발표했습니다.

이 장면은 모든 것을 설명합니다. 구글이 이번에 만들고자 하는 것은 "올인원" AI 창작 엔진입니다. 그것은 Gemini의 지능과 가장 강력한 생성 AI를 통합하여 세계 이해, 다중 모드 및 편집의 세 가지 차원에서 모두 극대화했습니다. 간단히 말해, 이미지, 오디오, 비디오, 텍스트의 어떤 조합을 주면, 고품질 비디오를 생성할 수 있습니다. 또한, 채팅 방식으로 비디오를 편집할 수 있습니다.

더 중요한 것은, Omni는 단순히 "보이는 것처럼"이 아니라, 실제로 물리적 세계를 이해하고 있다는 것입니다. 하사비스의 원래 말은, 이전 시스템은 중력, 운동 에너지와 같은 개념을 시뮬레이션할 때 자주 실패했지만, Omni는 "단계적 변화"를 실현했습니다. 그것은 Gemini의 "세계 지식"과 "추론 능력"을 비디오 생성에 주입했습니다.

"점토 애니메이션으로 단백질 접힘을 설명해 주세요"라는 프롬프트를 주면, 생성된 비디오에서 아미노산 사슬이 α 나선과 β 접힘으로 접히는 모든 단계가 과학적으로 정확하며, 시각적으로 정교한 스톱 모션 애니메이션입니다.

예를 들어, 영어 26개 알파벳에 해당하는 물체를 배치하는 것입니다. C는 카피바라, D는 디스코 볼, L은 용암 램프입니다. Omni는 자료를 조합하는 것이 아니라, 언어, 이미지 및 의미를 실제로 연결하고 있습니다.

말할 필요도 없이, 사실적에서 의미 있는 단계로의 도약은 너무나 컸습니다.

무대에서 하사비스는 자신의 비디오 클립을 꺼내 현장에서 즉석에서 수정하기 시작했습니다. 손바닥에 그린 원이 블랙홀로 변하고, 저녁 산책 중의 거리가 사이버펑크 장면으로 변했습니다. 한 문장으로 화면을 다시 쓰고, 한 문장으로 세상을 바꿉니다. 어떤 것이든 새로운 현실을 창조하는 캔버스가 될 수 있습니다. 예를 들어, 손안에서 불을 가지고 놀며, 종이에 원을 그리면 즉시 블랙홀로 변하는 등 다양한 창의적인 방식이 가능합니다.

게다가, 이것은 일회성 생성이 아닙니다. 계속 대화할 수 있습니다. Gemini Omni가 출력한 비디오에서, 캐릭터는 일관성을 유지하고, 물리적 논리는 성립하며, 장면 기억은 일관됩니다.

원래의 연주 장면에서 시작합니다. 두 번째 라운드에서는 "바이올리니스트를 이 사진의 환경으로 전송해 주세요"라고 요청하며, 눈 덮인 산과 풀밭의 참고 이미지를 첨부하면, 장면이 즉시 전환되고, 동작과 빛의 그림자가 새 환경에 모두 적응합니다.
세 번째 라운드에서는 "카메라를 바이올리니스트의 어깨 뒤로 전환해 주세요"라고 요청하며, 시점이 회전하지만 연주 동작과 음악은 완전히 연속적입니다.

장면이 어떻게 변하든, 화면의 주체는 무너지지 않습니다.

더욱 소름 끼치는 것은, Omni의 입력 유연성입니다. 이미지, 텍스트, 비디오, 오디오, 어떤 참조 물체도 혼합 입력할 수 있으며, 일관된 출력을 생성합니다. 심지어 자신의 아바타를 생성하여 AI 버전의 자신이 어떤 장면에든 등장하게 하고, 자신의 목소리로 말하고, 자신이 하지 않았던 일을 하게 할 수 있습니다.

현재, Omni Flash는 공식 출시되었으며, API 버전은 향후 몇 주 내에 열릴 예정입니다. 더 강력한 Omni Pro도 곧 출시될 예정입니다. 구글의 강력한 통합 능력 덕분에, Omni는 첫 출시부터 Gemini App, Google Flow 및 YouTube Shorts에 통합되었으며, YouTube Shorts 사용자들은 심지어 무료로 사용할 수 있습니다.

Flash가 Pro를 압도하다: 3.5가 "플래그십"의 정의를 재작성하다

Gemini Omni 이후, I/O 대회의 또 다른 주요 하이라이트는 새로운 플래그십 Gemini 3.5 Flash의 발표입니다. 구글이 정의한 바에 따르면, 지금까지 가장 강력한 코딩 및 에이전트 모델입니다.

현장에서 피차이는 "3.5 Flash는 거의 모든 벤치마크 테스트에서 Gemini 3.1 Pro를 완전히 압도했습니다!"라고 발표했습니다! 3.1 Pro는 구글이 3개월 전에 출시한 플래그십 모델인데, 이제 Flash 수준의 모델이 그것을 압도했습니다.

예상치 못하게, 구글은 이렇게 짧은 시간 안에 눈에 띄는 성과를 내놓았습니다:

Terminal-Bench 2.1 (코딩): 76.2%
GDPval-AA (실제 세계 에이전트 작업): 1656 Elo
MCP Atlas (대규모 도구 사용): 83.6%
CharXiv Reasoning (다중 모드 이해): 84.2%

위의 네 가지 벤치마크 테스트에서, Gemini 3.1 Pro에 비해 3.5 Flash는 단층 도약을 이루었습니다. 속도 면에서, 3.5 Flash는 독점적으로 하나의 사분면을 차지하며, 289 tokens/초로, 다른 최전선 모델보다 4배 이상 빠릅니다. 또한, 3.5 Flash는 일부 벤치마크 테스트에서 성능이 GPT-5.5, Claude Opus 4.7에 필적하거나 심지어 압도할 수 있습니다. 3.5 Flash는 빠르고 강력하며, 거의 상대가 없습니다.

매개변수가 너무 추상적이므로, 실제 극한 시연을 보는 것이 좋습니다. 단 한 순간에, 3.5 Flash는 천서 같은 학술 논문을 소화하고, 완벽한 상호작용을 가진 시각화 웹사이트를 작성할 수 있습니다. 에이전트 작업에서, Antigravity를 통해 다단계 작업 흐름을 완료하고, 화면에 표시된 자산을 자동으로 분류하고 명명할 수 있습니다. 또는 두 개의 에이전트를 활용하여, 단 6시간 만에 AlphaZero 논문을 재현하고, 완전히 실행 가능한 게임을 작성했습니다.

93개의 에이전트가 OS를 만들다, 단 12시간 만에

3.5 Flash의 모든 능력은 전적으로 새로운 Antigravity 2.0을 통해 실현되었습니다. 오늘, 구글 에이전트 개발 플랫폼 Antigravity는 2.0으로 업그레이드되어 IDE에서 독립형 데스크탑 애플리케이션으로 변모하며, 에이전트 우선 설계를 완전히 수용했습니다.

바룬이 무대에 올라 모든 이의 숨을 멈추게 하는 데모를 선보였습니다. 그는 Antigravity를 통해 3.5 Flash를 탑재하여, 제로에서 운영 체제를 구축했습니다. 93개의 하위 에이전트가 병렬로 작업하며, 15000회 이상의 모델 요청을 보내고, 26억 개의 토큰을 처리했습니다. 12시간 후, 완전히 빈 프로젝트가 기능이 완전한 OS 커널로 변모했습니다. 스케줄러, 메모리 관리, 파일 시스템, 모든 코드 한 줄이 에이전트에 의해 작성되고, 에이전트가 테스트하고, 에이전트가 감사했습니다. API 비용은 1000달러도 안 됩니다.

그 후, 그는 이 AI가 작성한 운영 체제에서 DOOM을 실행해 보았습니다. 첫 번째 시도는 실패했으며, 비디오 및 키보드 드라이버가 부족했습니다. 그래서 그는 현장에서 Antigravity 2.0에 수정 명령을 입력하였고, 에이전트가 드라이버 코드를 자동으로 보완하기 시작했습니다. 잠시 후, DOOM의 화면이 화면에 나타나며, 현장은 열광했습니다.

요약하자면, Antigravity 2.0이 가져온 핵심 업그레이드는 다음과 같습니다:

하위 에이전트는 동적으로 생성할 수 있으며, 주 에이전트가 작업을 하위 작업으로 나누어 배분하고, 서로 간섭 없이 병렬로 실행됩니다;
비동기 작업 관리로 긴 시간 소요되는 작업이 더 이상 주 스레드를 차단하지 않습니다;
Scheduled Tasks를 통해 "정기 작업"을 설정하여 에이전트가 자동으로 실행하도록 할 수 있습니다. 예를 들어, 매일 PR 상태를 확인하거나 매시간 건강 검사 스크립트를 실행하는 등의 작업입니다.
새로운 슬래시 명령: /goal은 에이전트가 한 번에 실행하게 하고, /grill-me는 에이전트가 요구 사항을 명확히 한 후 작업을 시작하게 하며, /browser는 브라우저 사용을 명시적으로 제어합니다.

하지만, 이 모든 것은 내부에서 이미 실행된 능력입니다. 구글 내부에서 Antigravity가 토큰을 처리하는 속도는 3월에 하루 5000억이었고, 이제는 하루 3조로 급증했습니다. 그리고 이 12배 가속화된 Flash는 오늘부터 Antigravity에서 사용할 수 있습니다.

3.5 Flash는 Gemini App 및 Google 검색 AI 모드의 기본 모델이 되어 전 세계 모든 사용자에게 제공됩니다. 개발자는 Antigravity 2.0, Gemini API, Google AI Studio를 통해 호출할 수 있습니다. 기업 사용자는 Gemini Enterprise Agent Platform을 통해 접속할 수 있습니다. 더욱 놀라운 것은, 3.5 Pro가 내부 테스트 중이며, 다음 달에 출시될 예정입니다.

7x24h 개인 비서: 구글 Spark가 드디어 왔다

오늘 밤 세 번째 발표는 Gemini Spark입니다! 피차이는 이를 매우 명확하게 정의했습니다: 당신의 개인 AI 에이전트. 노트북을 닫더라도, 그것은 멈추지 않습니다. 클라우드의 전용 가상 머신에서 실행되며, 7x24시간 온라인으로 운영됩니다.

Gemini Spark는 Gemini 3.5 + Antigravity 프레임워크에 의해 구동되며, 구글의 "오피스 패키지"와 깊이 통합되어 있습니다. 제품 부사장 조쉬 우드워드가 두 가지 장면을 시연하여, 현장을 열광하게 만들었습니다.

첫 번째는 업무 장면: "팀에 보낼 이메일 초안을 작성해 주세요, 지난 주 Gemini Live 출시와 관련된 모든 정보를 요약해 주세요"라는 지시를 입력합니다. Spark는 자동으로 Gmail, Docs, 채팅 기록에서 정보를 수집하고, 우드워드가 직접 작성한 "고스트라이터" 기술을 호출하여 이메일이 그의 개인적인 어조에 맞게 자동으로 조정됩니다. 전체 과정은 백그라운드에서 완료되며, 인간은 단지 검토하고 발송하기만 하면 됩니다. 맞습니다, Spark는 사용자 정의 기술(skills)을 지원하여, 당신의 어조, 선호도, 작업 방식을 학습할 수 있습니다.

두 번째는 생활 장면: 동네 파티를 계획합니다. Spark는 작업을 받은 후 단계별로 실행합니다. Google Sheets의 RSVP 추적 표를 생성하고, Gmail과 직접 연결하여, 누가 응답했는지 자동으로 업데이트합니다. 등록하지 않은 이웃에게는 Spark가 자동으로 독촉 이메일 초안을 작성하고, 초안이 확인된 후에 발송합니다. 그리고 Google Slides의 홍보 자료를 생성하여, 동네에 설치할 풍선 성의 정보도 포함됩니다. 전체 과정에서 어떤 앱도 열지 않았습니다.

뿐만 아니라, Spark는 강력한 음성 입력 기능도 갖추고 있습니다. 현장에서 우드워드는 휴대폰을 꺼내어 세 가지 작업을 음성으로 전달했습니다: "Sundar와의 모든 회의에 핑크색으로 표시해 주세요", "새 이웃 John에게 block party 명단에 초대장을 보내 주세요", "학년이 끝나기 전에 아이를 위해 해야 할 일을 정리한 문서를 생성하고, 마감일 순으로 정렬해 주세요".

음성이 직접 텍스트 명령으로 변환되었고, Spark는 연속적인 음성을 세 개의 독립적인 작업 스레드로 자동으로 분할하여 백그라운드에서 병렬로 실행했습니다.

가격 측면에서, AI Ultra 구독은 매달 100달러로 Spark Beta를 사용할 수 있습니다. 최고급 Ultra 계획은 250달러에서 200달러로 인하되었습니다. Spark는 다음 주에 미국 AI Ultra 사용자에게 먼저 Beta 버전을 개방할 예정입니다.

이 밤, 구글은 ASI의 문을 열었다

이번 I/O를 되돌아보면, 진정으로 소름 끼치는 것은 특정 제품이 아닙니다. 모든 능력이 동시에 갖춰졌다는 것입니다.

전모드 이해, 전모드 생성, 24시간 온라인 에이전트------이 세 가지 퍼즐 조각을 구글은 하룻밤 사이에 모두 맞췄습니다. Omni는 한 문장을 세계로 변환하며, 인간이 어떤 자료도 제공할 필요가 없습니다; 93개의 에이전트가 제로에서 운영 체제를 만들며, 인간이 한 줄의 코드를 작성할 필요가 없습니다; Spark는 7×24시간 당신을 대신해 일하며, 인간이 어떤 앱도 열 필요가 없습니다.

AI가 더 이상 인간에게 "자료를 제공"할 필요가 없고, 스스로 이해하고, 스스로 결정하고, 스스로 실행하고, 스스로 반복할 수 있게 되면------이 길의 끝은 ASI(초지능)입니다.

아무도 정확한 일정표를 제시할 수 없습니다. 하지만 오늘 밤의 Google I/O는 모든 이에게 한 가지를 깨닫게 했습니다: 초지능으로 가는 길에는 더 이상 "기술적으로 불가능하다"는 장애물이 없습니다. 남은 것은 단지 공학적 배치의 속도일 뿐입니다. 반년 전 우리는 AGI가 허상인지 논의하고 있었습니다. 반년 후, 구글은 이미 에이전트를 사용해 운영 체제를 작성하고 있습니다. 이 산업의 가속도는 인간의 직관이 감지할 수 있는 범위를 초과했습니다.

참고 자료:

https://youtu.be/wYSncx9zLIU
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/
https://antigravity.google/blog/introducing-google-antigravity-2-0
https://antigravity.google/blog/google-io-2026-feature-deep-dive

Join ChainCatcher Official

Telegram Feed: @chaincatcher

X (Twitter): @ChainCatcher_

위험 경고