a16z:게임 분야에서 생성적 AI의 기회
저자 :James Gwertzman\&Jack Soslow
편집:아파투
A16Z는 최근 생성형 AI와 게임의 결합 기회에 대해 흥미로운 기사를 작성하였고, 필자는 번역 후 일부 내용에 주석을 추가했습니다. 이 기사는 주로 두 부분으로 나뉘어 있습니다: 첫 번째 부분은 A16Z의 게임 분야에서 생성형 AI에 대한 관찰과 예측을 포함하고, 두 번째 부분은 A16Z의 게임 + 생성형 AI 분야의 시장 생태에 대한 판단을 포함합니다.
서론
게임 분야와 생성형 인공지능 사이에는 어떤 연관성이 있을까?
게임 디자인 분야에는 불가능한 삼각형이 존재합니다: 비용, 품질 또는 속도 중에서 보통 두 가지를 선택할 수 있으며, 이제 디자이너는 이러한 AIGC 도구를 통해 많은 인력 제작 시간을 들이지 않고도 몇 시간 만에 고품질 이미지를 생성할 수 있습니다. 이 중에서 진정으로 혁신적인 점은 누구나 몇 가지 간단한 도구를 배우기만 하면 창의적인 능력을 얻을 수 있다는 것입니다.
이 도구들은 빠른 반복 방식으로 무한한 변화를 창출할 수 있으며, 일단 훈련을 받으면 전체 과정이 실시간으로 이루어지므로 결과는 거의 즉시 사용할 수 있습니다.
Real-time 3D 기술이 등장한 이후로 게임에 이렇게 큰 잠재적 변화를 가져올 수 있는 기술은 없었습니다(실시간 3D 소프트웨어 덕분에 전체 가상 세계가 더 빠른 속도로 디지털 렌더링되어 사용자에게 더 매력적이고 몰입감 있는 경험을 제공합니다).
생성형 AI의 발전 방향은 무엇이며, 게임을 어떻게 변화시킬 것인가?
우선, 생성형 AI는 기계 학습의 한 종류로, 컴퓨터가 사용자 입력/프롬프트에 따라 원본의 새로운 콘텐츠를 생성할 수 있습니다. 현재 이 기술의 가장 성숙한 응용은 주로 텍스트와 이미지 분야에 있지만, 거의 모든 창의적 분야에서 유사한 발전(생성형 AI의 기술 응용)이 이루어지고 있으며, 애니메이션, 음향 효과, 음악, 심지어 완전한 개성을 가진 가상 캐릭터의 원작에까지 적용되고 있습니다.
물론, 인공지능은 게임에서 새로운 것이 아닙니다. 초기 게임인 아타리의 《퐁(Pong)》조차 컴퓨터가 제어하는 상대와 플레이어가 대결하는 방식이었습니다.
그러나 이러한 컴퓨터의 가상 상대는 오늘날 우리가 이야기하는 생성형 인공지능과는 다릅니다. 이러한 컴퓨터 상대는 게임 디자이너가 정교하게 설계한 스크립트 프로그램일 뿐이며, 실제로 인공지능의 상대를 시뮬레이션하지만, 학습하거나 반복할 수 없고, 그들의 수준은 그것들을 작성한 엔지니어와 같습니다.
그렇다면 생성형 AI와 게임의 결합에서 기술적 기반에는 어떤 변화가 있을까요?
마이크로프로세서의 속도가 빨라지고, 클라우드 컴퓨팅과 다양한 계산 능력이 강화되어 대규모 신경망을 구축할 수 있는 잠재력을 가지며, 복잡한 분야의 패턴과 표현을 인식할 수 있습니다.
첫 번째 부분: 몇 가지 가정 및 산업 관찰
몇 가지 가정:
먼저, 기사의 나머지 부분에서 기반이 되는 몇 가지 가정을 살펴보겠습니다:
1. 범용 인공지능 연구(성공)의 수가 계속 증가하고, 더 효과적인 기술이 등장할 것이다. 위 이미지는 매달 arXiv에 발표된 기계 학습 또는 인공지능에 관한 학술 논문의 수입니다. 그림에서 보듯이, 논문의 수는 기하급수적으로 증가하고 있으며, 둔화의 조짐이 없습니다. 이 데이터는 이미 발표된 논문만 포함되며, 많은 연구가 공개되지 않고 오히려 오픈 소스 모델이나 제품 개발에 직접 적용되고 있습니다. 이러한 오픈 소스 모델과 제품은 폭발적인 혁신을 가져왔습니다.
2. 모든 오락 분야 중에서 게임이 생성형 인공지능의 가장 큰 영향을 받을 분야가 될 것이다.
현재 관련된 자산 유형(2D 아트, 3D 아트, 음향 효과, 음악 등) 중에서 게임은 오락 분야에서 가장 복잡한 형태이며, 동시에 가장 상호작용성이 강합니다. 이는 실시간 경험을 매우 강조합니다. 이러한 점은 새로운 게임 개발자에게 매우 높은 진입 장벽을 만들어주며, 진정한 AAA 대작 게임을 제작하는 데 높은 비용을 초래합니다. 이러한 장벽과 비용 문제는 게임 분야에서 생성형 인공지능의 파괴적 혁신을 위한 거대한 기회를 창출합니다(아래 그림 참조):
예를 들어, 《레드 데드 리뎀션 2(Red Dead Redemption 2)》와 같은 게임은 역사상 제작 비용이 가장 비싼 게임 중 하나로, 제작 비용이 거의 5억 달러에 달합니다. 그리고 《레드 데드 리뎀션》은 시장에서 가장 뛰어난 시각 효과를 가진 게임 중 하나로, 제작에 거의 8년이 걸렸으며, 1000개 이상의 게임 캐릭터(각 캐릭터는 고유한 개성과 전속 성우를 가짐), 약 30평방 마일 크기의 게임 세계, 6개의 챕터와 100개 이상의 임무, 100명 이상의 음악가가 작곡한 약 60시간의 음악이 포함되어 있습니다. 이 게임의 모든 콘텐츠 제작은 매우 방대합니다.
그렇다면 《레드 데드 리뎀션 2》와 《마이크로소프트 플라이트 시뮬레이터》를 비교해보면, 《마이크로소프트 플라이트 시뮬레이터》는 훨씬 더 거대합니다… 왜냐하면 마이크로소프트 플라이트 시뮬레이터의 플레이어는 게임 내에서 지구 전체를 비행할 수 있기 때문입니다. 모든 1.97억 평방 마일의 지역을 탐험할 수 있습니다. 그렇다면 마이크로소프트는 어떻게 이렇게 대규모 게임을 만들었을까요? 주로 인공지능을 통해 이루어졌습니다. 마이크로소프트는 blackshark.ai와 협력하여 인공지능을 훈련시켜 2D 위성 이미지를 바탕으로 무한히 사실적인 3D 세계를 생성했습니다.
blackshark.ai는 어떤 회사인가요?
blackshark.ai는 기계 학습 기술을 통해 전 세계의 지구 기반 시설을 추출하는 회사로, 전 세계의 위성 및 항공 이미지를 통해 데이터를 추출하고, 인공지능을 기반으로 현재의 지리 데이터를 디지털 쌍둥이 장면으로 변환합니다. 이러한 결과는 시각화, 시뮬레이션, 드로잉, 혼합 현실 환경 및 기타 기업 솔루션에 사용될 수 있으며, 기술 자체의 클라우드 컴퓨팅 업데이트 기능 덕분에 이러한 데이터를 실시간으로 업데이트할 수 있습니다.
이것은 단지 하나의 예일 뿐입니다. 인공지능 기술을 사용하지 않으면 《마이크로소프트 플라이트 시뮬레이터》라는 게임은 실제로 제작될 수 없었습니다. 그 외에도 게임의 성공은 이러한 모델이 시간이 지남에 따라 지속적으로 개선될 수 있다는 점에 기인합니다. 예를 들어, "고속도로 클로버리프 오버패스" 모델을 강화하여 인공지능이 전체 건설 과정을 운영하면, 게임 내의 모든 고속도로 입체교차로가 즉시 개선될 수 있습니다.
3. 게임 제작에 관련된 모든 자산은 생성형 AI 모델을 가질 것이다.
현재까지 Stable Diffusion이나 MidJourney와 같은 2D 이미지 생성기는 그들이 생성할 수 있는 이미지가 매우 눈에 띄기 때문에 현재 생성형 인공지능의 대부분의 인기 포인트를 차지하고 있습니다. 현재 게임 내 거의 모든 자산에 대한 생성형 인공지능 모델이 등장했으며, 3D 모델에서 캐릭터 애니메이션, 대화 및 음악에 이르기까지 다양합니다.(다음 기사에서는 특정 회사의 시장 생태도 다룰 예정입니다)
4. 콘텐츠 비용은 지속적으로 감소할 것이며, 특정 경우에는 콘텐츠 비용이 제로로 떨어질 것이다.
우리가 생성형 AI를 게임 제작 장면에 통합하려고 시도하는 개발자와 대화할 때, 가장 큰 흥미로운 점은 게임 제작의 시간과 비용이 대폭 줄어든다는 것입니다. 한 개발자는 이미지의 개념도를 생성하는 데 걸리는 시간이 3주에서 1시간으로 줄어들었다고 말했습니다. 우리는 전체 게임 제작 과정에서도 유사한 "비용 절감 및 효율 증대"가 이루어질 수 있다고 믿습니다.
예술가들이 대체될 위험이 없다는 점은 주목할 만합니다. 이는 예술가들이 모든 작업을 직접 수행할 필요가 없다는 것을 의미합니다: 예술가와 디자이너는 초기 창의적 방향을 설정한 후, 대부분의 시간 소모적이고 기술적인 실행 작업을 인공지능에 맡길 수 있습니다. 이 점에서, 초기 손으로 그린 애니메이션의 화가와 유사하게, 고도로 숙련된 "그림 전문가"가 애니메이션의 윤곽을 그리고, 상대적으로 저렴한 화가들이 시간 소모적인 작업을 완료하여 애니메이션 필름에 색을 입히고 선을 채우는 방식입니다. 우리가 이야기하는 것은 게임 창작 분야의 응용입니다.
5. 우리는 여전히 이 산업 혁명의 초기 단계에 있으며, 많은 부분이 개선되어야 한다.
최근 많은 사람들이 흥분하고 있지만, 우리는 여전히 출발선에 불과합니다. 사람들이 이 새로운 기술을 게임 분야에 실제로 어떻게 적용할 수 있을지에 대해 많은 작업이 필요하며, 이전에 이 새로운 분야에 빠르게 진입한 회사들에게는 거대한 기회가 존재할 것입니다.
두 번째 부분: 미래에 대한 예측
위의 가정을 바탕으로, 본문은 게임 산업이 어떻게 변화할 것인지에 대한 예측과 추론을 진행합니다.
1. 생성형 인공지능을 효과적으로 적용하는 방법을 배우는 것이 시장 기술이 될 것이다.
이미 선구자들은 다른 사람들보다 생성형 인공지능을 더 효과적으로 적용할 수 있습니다. 이 새로운 기술을 최적으로 활용하기 위해서는 다양한 도구와 기술을 이해하고, 그것들을 조합하여 적용하는 방법을 알아야 합니다. 우리는 생성형 인공지능을 효과적으로 적용하는 것이 매우 잠재력 있는 기술이 될 것이라고 예측합니다. 이는 예술가의 창의적 비전과 프로그래머의 기술 능력을 결합할 수 있기 때문입니다.
Chris Anderson은 "모든 풍요는 새로운 희소성을 창출한다"는 유명한 말을 했습니다. 콘텐츠가 점점 더 풍부해짐에 따라, 인공지능 도구와 가장 효율적으로 협력하는 방법을 아는 예술가가 가장 부족할 것입니다.
예를 들어, 생성형 인공지능을 예술품 생성에 사용하는 것은 몇 가지 도전 과제를 동반합니다:
일관성 유지: 게임 내의 다양한 자산을 수정하거나 편집할 수 있어야 하며, 이는 인공지능 도구가 동일한 신호로 (디지털) 자산을 복제할 수 있어야 함을 의미합니다. 그래야만 우리는 그것을 수정하고 도전할 수 있습니다. 이는 까다로울 수 있습니다. 왜냐하면 동일한 프롬프트가 전혀 다른 결과를 생성할 수 있기 때문입니다.
스타일 일관성 유지: 단일 게임 내의 모든 예술 작품은 일관된 스타일을 유지해야 하며, 이는 인공지능 도구가 훈련되거나 예술가/디자이너의 기존 스타일과 연결되어야 함을 의미합니다.
2. 게임 개발의 진입 장벽이 낮아짐에 따라 더 많은 모험과 창의적 탐색이 이루어질 것이다.
우리는 곧 새로운 게임 개발의 "황금 시대"에 접어들 수 있으며, 낮은 진입 장벽은 더 많은 혁신적이고 창의적인 게임의 출현을 초래할 것입니다. 이는 단순히 낮은 제작 비용으로 인해 게임 제작자가 부담해야 할 위험이 줄어드는 것뿐만 아니라, 이러한 도구들이 더 많은 청중을 위해 고품질 콘텐츠를 생성할 수 있는 능력을 나타내기 때문입니다.
3. 인공지능 지원의 "미니 게임 스튜디오"가 점차 부상할 것이다.
생성형 인공지능 도구와 서비스 덕분에, 아마도 더 많은 실행 가능한 상업 게임이 1명 또는 2명의 직원으로 구성된 소규모 "미니 스튜디오"에서 제작될 것입니다. 물론, 소규모 독립 게임 스튜디오는 이미 흔하며, 인기 게임 《어몽 어스(Among Us)》는 5명의 직원이 있는 스튜디오 Innersloth에서 제작되었습니다. 이러한 소규모 스튜디오가 창출할 수 있는 게임의 규모는 증가할 것입니다.
4. 매년 출시되는 게임의 수가 증가할 것이다.
Unity와 Roblox의 성공은 강력한 창의적 도구를 제공하면 더 많은 게임이 제작된다는 것을 보여줍니다. 생성형 인공지능은 진입 장벽을 더욱 낮추어 더 많은 게임을 창출할 것입니다. 이 산업은 발견의 도전에 직면해 있으며, 지난해에만 1만 개 이상의 게임이 Steam에 추가되었습니다. 이는 발견에 더 큰 압력을 가할 것입니다. 그러나 우리는 또한…
5. 새로운 게임 유형이 창조될 것이다.
새로운 게임 유형이 발명될 것이며, 앞서 언급한 《마이크로소프트 플라이트 시뮬레이터》와 같은 게임이 될 것입니다. 그러나 완전히 새로운 게임 유형이 발명될 것이며, 이러한 게임은 새로운 콘텐츠의 실시간 생성과 결합될 것입니다.
예를 들어, Spellbrush의 RPG 게임 Arrowmancer는 인공지능으로 생성된 캐릭터를 특징으로 하며, 거의 제한 없는 새로운 게임 플레이를 제공합니다. 또 다른 게임 개발자는 인공지능을 사용하여 플레이어가 게임 내에서 자신의 아바타를 생성하도록 하고 있습니다: 플레이어의 설명에 따라 아바타 이미지를 자동으로 생성합니다. 사용자 경험 측면에서, 플레이어가 인공지능을 통해 콘텐츠를 생성하게 하면 플레이어는 더 큰 소유권을 느낄 수 있습니다.
6. 가치가 특정 산업의 AI 도구에 귀속될 것이며, 단순한 기본 모델에 국한되지 않을 것이다.
Stable Diffusion 및 Midjourney와 같은 기본 모델을 둘러싼 열기는 극도로 과장된 평가를 낳고 있지만, 새로운 연구가 지속적으로 쏟아져 나오면서 새로운 모델이 새로운 기술의 발전과 함께 등장하고 지속적으로 진화할 것입니다. 현재 3개의 인기 있는 생성형 인공지능 모델(Dall-E, Midjourney 및 Stable Diffusion)의 웹사이트 검색 트래픽을 보면, 각 새로운 모델은 그에 대한 특정 관심사를 가지고 있습니다.
또 다른 접근 방식은 산업 요구(수직 산업)에 맞는 도구 세트를 구축하는 것입니다. 이러한 도구는 특정 산업의 생성형 인공지능 요구에 집중하고, 특정 청중을 깊이 이해하며, 기존의 생산 장면(Unity 또는 Unreal)과 통합될 것입니다.
전형적인 예는 Runway입니다. Runway는 비디오 제작자의 요구에 맞춰 인공지능 지원 도구를 제공하며, 비디오 편집, 그린 스크린 제거, 내화 및 모션 추적과 같은 도구를 제공하여 시간이 지남에 따라 새로운 응용 장면을 추가할 수 있습니다. 현재 Runway와 같은 게임 도구는 나타나지 않았지만, 이는 잠재력이 있는 분야입니다.
7. 곧 다가올 법적 도전
이 모든 생성형 인공지능 모델의 공통점은 이러한 AI 모델이 대량의 콘텐츠 데이터 세트를 사용하여 훈련되었다는 것입니다. 일반적으로 인터넷 데이터 세트를 통해 생성됩니다. 예를 들어, "Stable Diffusion"은 50억 장 이상의 이미지/제목을 기반으로 훈련되었습니다. 이 이미지/제목은 모두 인터넷에서 수집된 것입니다. 현재 이러한 모델은 "공정 사용"의 저작권 원칙 하에 운영된다고 주장하지만, 이 주장은 법적으로 명확하게 검증되지 않았습니다. 분명히 다가오는 법적 도전은 생성형 인공지능의 판도를 변화시킬 수 있습니다.
대형 영화사는 자신의 저작권 이점을 활용하여 독점 모델을 구축하고 경쟁 우위를 추구할 가능성이 있습니다. 예를 들어, 마이크로소프트는 많은 자회사를 보유하고 있으며, 특히 액티비전 블리자드를 인수했습니다.
8. 현재로서는 예술 분야와는 달리, 생성형 AI가 프로그래밍 분야에 큰 변화를 가져오지 않을 것이다.
소프트웨어 엔지니어링은 게임 개발의 또 다른 주요 비용 원천이지만, 인공지능 모델을 사용하여 코드를 생성하는 데는 더 많은 테스트와 검증이 필요합니다. 따라서 코드 생성은 창의적 자산 생산성 향상 정도보다 낮습니다. 우리는 Copilot과 같은 코딩 도구가 엔지니어에게 적절한 성능 개선을 제공할 수 있지만, 단기적으로 콘텐츠 분야의 변화만큼 크지 않을 것이라고 생각합니다.
세 번째 부분: 몇 가지 제안
1. 생성형 인공지능 탐색 시작하기:
다가오는 생성형 인공지능 혁명의 힘을 최대한 활용하는 방법을 이해하는 데는 시간이 필요합니다. 사업을 일찍 시작하는 회사는 미래에 우위를 점할 것입니다. 몇몇 스튜디오는 내부 실험 프로젝트를 진행하며 이러한 기술이 게임 제작에 미치는 영향을 탐색하고 있습니다.
2. 시장의 공백을 찾는 기회:
현재 전체 분야의 많은 부분이 매우 혼잡하지만, 애니메이션, 음성, 대화와 같은 분야 외에도 여전히 광범위하게 개방된 분야가 많습니다. 우리는 이 분야에 관심이 있는 기업가들이 아직 개발되지 않은 분야, 즉 "게임 + 생성형 AI 분야"에 집중할 것을 권장합니다.