a16z:生成的AIがゲーム分野での機会
著者:James Gwertzman&Jack Soslow
編纂:アファトゥ
A16Zは最近、生成AIとゲームの結びつきに関する興味深い記事を執筆しました。筆者は翻訳後、一部の内容に注釈を加えました。記事は主に二つの部分から成り立っています:第一部は、A16Zによるゲーム分野における生成AIの観察と予測;第二部は、A16Zによるゲームと生成AIの市場エコシステムの判断です。
前書き
ゲーム分野と生成的人工知能の関係は?
ゲームデザインの分野には不可能な三角形が存在します:コスト、品質、速度の三つのうち通常は二つしか選べません。しかし今、デザイナーはこれらのAIGCツールを使うことで、多くの手作業の制作時間をかける必要がなく、数時間で高品質な画像を創造できるようになりました。この中で、真に革命的なのは、誰でも簡単なツールを学ぶことで創造的な能力を得られることです。
これらのツールは、迅速な反復の方法で無限の変化を生み出すことができ、トレーニングを受けた後は、全プロセスがリアルタイムで行われるため、結果はほぼ即座に利用可能です。
リアルタイム3D技術が登場して以来、ゲームに対してこれほどの潜在的な変化をもたらす技術は存在しません(リアルタイム3Dのソフトウェアにより、仮想世界全体がより速くデジタルレンダリングされ、ユーザーにより魅力的で没入感のある体験を提供します)。
生成AIの発展方向は?ゲームをどう変えるのか?
まず、生成AIは機械学習の一種であり、コンピュータはユーザーの入力やプロンプトに基づいてオリジナルの新しいコンテンツを生成します。現在、この技術の最も成熟した応用は主にテキストと画像の分野にありますが、ほぼすべてのクリエイティブな分野で同様の進展(生成AIの技術応用)が見られ、アニメーション、音響効果、音楽、さらには完全な個性を持つバーチャルキャラクターのオリジナル制作にまで及びます。
もちろん、ゲームにおける人工知能は新しいものではありません。初期のゲーム、例えばアタリの『Pong』では、すでにコンピュータ制御の対戦相手が存在していました。
しかし、これらのコンピュータ内の仮想対戦相手は、今日私たちが話している生成AIとは異なります。これらのコンピュータ対戦相手は、ゲームデザイナーが精巧に設計したスクリプトプログラムに過ぎず、確かに人工知能の対戦相手を模倣していますが、学習や反復はできず、レベルはそれを作成したエンジニアと同じです。
では、生成AIとゲームの結びつきには、技術的な基盤にどのような変化があるのでしょうか?
マイクロプロセッサの速度が向上し、クラウドコンピューティングやさまざまな計算能力が強化され、大規模な神経ネットワークを構築する潜在能力が生まれ、高度に複雑な分野のパターンや表現を認識することが可能になりました。
第一部:いくつかの仮定と業界観察
いくつかの仮定:
まず、この記事の残りの部分が基づいているいくつかの仮定を探ります:
1. 汎用人工知能の研究(成功)数は引き続き増加し、より効果的な技術が登場する。 上の図は、毎月arXivに発表される機械学習または人工知能に関する学術論文の数です。図に示されているように、論文の数は指数関数的に増加しており、減速の兆しはありません。このデータは、すでに発表された論文のみを含んでおり、公開されていない多くの研究がオープンソースモデルや製品開発に直接適用されています。これらのオープンソースモデルや製品は、爆発的な革新をもたらしています。
2. すべてのエンターテインメントカテゴリの中で、ゲームが生成AIの最大の影響を受ける分野になる。
現在関与している資産タイプ(2Dアート、3Dアート、音響効果、音楽など)に関して、ゲームはエンターテインメントカテゴリの中で最も複雑なものであり、同時にインタラクティブ性が最も高いです。これは新しいゲーム開発者に非常に高い参入障壁を生み出し、真のAAAタイトルを制作するための高額なコストを生み出します。これらの障壁とコストの問題は、ゲーム分野における生成AIの破壊的革新に対して巨大な機会を生み出します(下の図参照):
例えば、『レッド・デッド・リデンプション2』のようなゲームは、史上最も制作コストが高いゲームの一つであり、その制作コストは約5億ドルです。また、『レッド・デッド・リデンプション』は市場で最も優れた視覚効果を持つゲームの一つであり、制作には約8年を要し、1000以上のゲームキャラクター(それぞれが独自の個性と専属の声優を持つ)を含み、約30平方マイルのゲーム世界、6つの章にわたる100以上のミッション、100人以上の音楽家によって作曲された約60時間の音楽が含まれています。このゲームのすべてのコンテンツの制作は非常に膨大です。
では、『レッド・デッド・リデンプション2』と『Microsoft Flight Simulator』を比較すると、後者の方がさらに巨大です…なぜなら、Microsoft Flight Simulatorのプレイヤーは、ゲーム内で地球全体を飛行できるからです。すべての1.97億平方マイルの場所を飛行できます。では、Microsoftはどのようにしてこのような大規模なゲームを作り上げたのでしょうか?主に人工知能を通じて実現しました。Microsoftはblackshark.aiと協力し、2D衛星画像から無限にリアルな3D世界を生成するためにAIをトレーニングしました。
blackshark.aiとは何の会社ですか?
blackshark.aiは、機械学習技術を通じて、地球のインフラストラクチャを世界中から抽出する会社です。世界中の衛星および航空画像からデータを抽出し、人工知能を用いて現在の地理データに基づくデジタルツインシーンを生成します。これらの結果は、可視化、シミュレーション、描画、混合現実環境、その他の企業ソリューションに使用されます。また、技術自体のクラウドコンピューティングの更新能力により、これらのデータをリアルタイムで更新することが可能です。
これは単なる一例です。人工知能技術を使用しなければ、『Microsoft Flight Simulator』は実際には制作不可能でした。さらに、ゲームの成功は、これらのモデルが時間の経過とともに改善され続けることにも起因しています。例えば、「ハイウェイ・クローバーリーフ・オーバーパス」モデルを強化し、人工知能を通じて建設プロセス全体を運営することで、ゲーム内の地球上のすべての高速道路の立体交差が即座に改善されることが可能です。
3. ゲーム制作に関与するすべての資産には生成AIモデルが存在する
これまでのところ、Stable DiffusionやMidJourneyのような2D画像生成器は、その生成する画像が非常に目を引くため、現在の生成AIの人気の大部分を占めています。そして、現在ではゲーム内のほぼすべての資産に対する生成AIモデルが登場しています。3Dモデルからキャラクターアニメーション、対話、音楽に至るまで。(次の記事では具体的な企業の市場エコシステムについて説明します)
4. コンテンツコストは引き続き低下し、特定の状況ではコストがゼロになる
生成AIをゲーム制作のシーンに統合しようとする開発者と話すと、最も興奮する点は、ゲーム制作の時間とコストが大幅に削減されることです。ある開発者は、画像の概念図を生成する時間が3週間から1時間に短縮されたと教えてくれました。私たちは、ゲーム制作プロセス全体でも同様の「コスト削減と効率向上」が実現できると信じています。
重要なのは、アーティストが置き換えられる危険がないことです。これは、アーティストがすべての作業を自分で行う必要がなくなることを意味します。アーティストやデザイナーは初期の創造的な方向性を設定し、その後の多くの時間のかかる技術的な実行作業を人工知能に任せることができます。この点において、初期の手描きアニメーションの画家のように、高度に熟練した「絵画の専門家」がアニメーションの輪郭を描き、その後、コストが比較的低い画家たちがアニメーションフィルムに色を付け、線を埋めるのと同じです。ただし、私たちが話しているのはゲーム制作の分野の応用です。
5. 私たちはまだこの業界の変革の初期段階にあり、改善すべき部分が多く残っている
最近、多くの人々が興奮していますが、私たちはまだスタートラインに立ったばかりです。新技術とゲーム分野の結びつきを本当に応用する方法を理解するには、まだ多くの作業が必要です。そして、以前からこの新しい分野に迅速に参入している企業には、大きな機会が存在します。
第二部:未来への予測
上記の仮定を考慮して、この記事ではゲーム業界がどのように変革されるかについて予測と推論を行いました。
1. 生成AIを効果的に応用する方法を学ぶことが市場スキルになる。
すでに先駆者たちは、他の人々よりも生成AIをより効果的に応用しています。この新技術を最大限に活用するためには、さまざまなツールや技術を理解し、それらを組み合わせて応用する方法を知る必要があります。私たちは、生成AIを効果的に応用すること自体が非常に有望なスキルになると予測しています。なぜなら、それはアーティストの創造的なビジョンとプログラマーの技術的能力を結びつけることができるからです。
クリス・アンダーソンの名言があります。「豊かさは新たな希少性を生む」。コンテンツがますます豊かになるにつれて、人工知能ツールと最も効率的に協力する方法を理解しているアーティストが最も不足することになるでしょう。
例として、生成AIをアート作品の生成に使用することは、いくつかの課題をもたらします。
一貫性を保つこと:ゲーム内のさまざまな資産を変更または編集できる必要があります。これは、人工知能ツールにとって、同じ信号で(デジタル)資産を複製できる必要があることを意味します。そうすることで、私たちはそれを変更し、挑戦することができます。これは非常に厄介な場合があります。同じプロンプトがまったく異なる結果を生む可能性があるからです。
スタイルの一貫性を保つこと:単一のゲーム内のすべてのアート作品は、一貫したスタイルを維持する必要があります。これは、人工知能のツールが訓練されるか、アーティストやデザイナーの既存のスタイルと関連付けられる必要があることを意味します。
2. ゲーム開発の参入障壁の低下は、より多くの冒険と創造的探求をもたらす。
私たちはすぐに新しいゲーム開発の「黄金時代」に突入するかもしれません。低い参入障壁は、より多くの革新と創造的なゲームの出現を促すでしょう。これは、低い制作コストがゲーム制作会社が負うリスクを低下させるだけでなく、これらのツールがより多くのオーディエンスに高品質なコンテンツを創造する能力を象徴しているからです。
3. 人工知能によって支援される「ミニゲームスタジオ」が徐々に台頭する。
生成AIのツールやサービスがあれば、1人または2人の従業員だけの小規模な「ミニスタジオ」が、より実行可能な商業ゲームを制作するかもしれません。もちろん、小規模な独立ゲームスタジオはすでに一般的であり、人気ゲーム『Among Us』はわずか5人の従業員によって制作されたスタジオInnerslothによるものです。そして、これらの小規模スタジオが創造できるゲームの規模は拡大するでしょう。
4. 毎年リリースされるゲームの数が増加する。
UnityやRobloxの成功は、強力なクリエイティブツールを提供することで、より多くのゲームが構築されることを示しています。生成AIはさらに参入障壁を低下させ、より多くのゲームを創造します。この業界は発見の課題に直面しており、昨年だけで1万以上のゲームがSteamに追加されました。これにより、発見のプレッシャーが増すでしょう。しかし、私たちはまた…
5. 新しいゲームタイプが創造される。
新しいゲームタイプが発明されるでしょう。前述の『Microsoft Flight Simulator』のように、全く新しいゲームタイプが発明され、リアルタイム生成された新しいコンテンツと結びつくでしょう。
例えば、SpellbrushのRPGゲーム『Arrowmancer』は、人工知能によって生成されたキャラクターを特徴とし、ほぼ無限の新しいプレイスタイルを提供します。また、あるゲーム開発者は、プレイヤーがゲーム内で自分のアバターを作成できるように、プレイヤーの説明に基づいてアバター画像を自動生成するために人工知能を使用しています。ユーザー体験の観点から、プレイヤーが人工知能を通じてコンテンツを生成することで、プレイヤーはより大きな所有権を感じることができます。
6. 特定の業界のAIツールに価値が帰属するようになる。
Stable DiffusionやMidjourneyなどの基盤モデルの熱気は、非常に誇張された評価を生んでいますが、新しい研究が続々と登場する中で、新しいモデルは新技術の進展に伴って登場し、継続的に進化します。現在の3つの人気のある生成AIモデル(Dall-E、Midjourney、Stable Diffusion)のウェブサイト検索トラフィックを見ると、各新モデルには特定の関心が集まっています。
もう一つのアプローチは、業界のニーズに合った(垂直産業)ツールキットを構築することです。これらのツールは、特定の業界の生成AIニーズに焦点を当て、特定のオーディエンスを深く理解し、既存の制作シーン(UnityやUnreal)と統合されます。
典型的な例はRunwayです。Runwayは動画クリエイターのニーズに応じて、動画編集、グリーンスクリーン除去、内画、モーショントラッキングなどのAI支援ツールを提供しています。このようなツールは、時間の経過とともに新しい応用シーンを増やすことができます。現在、Runwayのようなゲームツールは登場していませんが、これは有望な分野です。
7. 迫り来る法的課題
これらすべての生成AIモデルの共通点は、これらのAIモデルが大量のコンテンツデータセットを使用してトレーニングされていることです。通常、インターネットのデータセットを通じて作成されます。例えば、「Stable Diffusion」は、50億枚以上の画像/タイトルを基にトレーニングされています。これらの画像/タイトルはすべてインターネットから収集されたものです。現在、これらのモデルは「フェアユース」の著作権原則の下で運用されていると主張していますが、この主張は法的に明確に検証されていません。明らかに、迫り来る法的課題は生成AIの状況を変える可能性があります。
大手映画会社は、自社の著作権の優位性を利用して専用モデルを構築し、競争優位を求める可能性があります。例えば、Microsoftは多くのスタジオを傘下に持ち、特にActivision Blizzardを買収しました。
8. 現時点では、アート分野とは異なり、生成AIがプログラミング分野に大きな変革をもたらすことはない。
ソフトウェアエンジニアリングはゲーム開発のもう一つの主要なコスト源ですが、人工知能モデルを使用してコードを生成するには、より多くのテストと検証が必要です。そのため、コード生成は創造的資産の生産性向上の程度よりも低いと考えています。私たちは、Copilotのようなコーディングツールがエンジニアに適度な性能向上を提供する可能性があると考えていますが、短期的にはコンテンツ分野の変化ほど大きな影響はないでしょう。
第三部:いくつかの提案
1. 生成的人工知能の探索を始める:
この生成的人工知能革命の力を最大限に活用する方法を理解するには、しばらく時間がかかります。早期にビジネスを発展させる企業は、将来的に優位性を持つでしょう。いくつかのスタジオが内部実験プロジェクトを進めており、これらの技術がゲーム制作にどのように影響するかを探求しています。
2. 市場の隙間を探す機会:
現在、全体のトラックの多くの部分は非常に混雑しています。アニメーション、音声、対話などですが、まだ広く開かれた分野がたくさんあります。この分野に興味のある起業家には、「ゲーム+生成AIトラック」のような未開発の分野に目を向けることをお勧めします。