Numeraiが発表したTrue Contribution信号評価方法
作者: Numerai
编译: ChainCatcher
Numerai は、新しい信号評価方法「True Contribution」を発表しました。True Contribution は、Numerai をエンドツーエンドの人工知能システムとして捉えることで計算されます。最適化された投資ポートフォリオのリターンに対する、信号に対して NMR を担保にした微分可能な凸最適化層を使用した勾配を計算することで、Numerai は今や信号を浮き彫りにし、我々のヘッジファンドに最大の情報貢献をするように信号を促進することができます。Numerai のパフォーマンスはすでに良好で(過去 12 か月間のシャープレシオ* は 2.54)、True Contribution は Numerai を初の「IV 型」ヘッジファンドにする可能性があります。
ソ連の天体物理学者ニコライ・カルダシェフが提唱したカルダシェフスケールは、文明が利用するエネルギーに基づいて技術進歩を分類する方法です。I 型文明は、自身の星球上のすべてのエネルギーを利用できます。II 型文明は、自身の太陽系内のすべてのエネルギーを利用でき、III 型文明は、自身の銀河系内のすべてのエネルギーを利用できます。
カルダシェフスケールは、これらの文明を創造するための実際の青写真を含んでいませんが、異なるタイプの文明に必要な技術を考えるための思想実験に肥沃な土壌を提供します。たとえば、II 型文明になるためには、太陽からのすべてのエネルギーを捕えるようなダイソン球のようなものを発明する必要があります。III 型文明になるためには、銀河系を横断するための自己複製ロボット技術が必要です。
では、ヘッジファンドにはカルダシェフスケールがあるのでしょうか?ヘッジファンド内の異なるレベルの技術進歩は何を意味するのでしょうか?
私たちは、各ヘッジファンドが株式市場の予測信号を取引していると考えることができます。これらの信号は、株式の将来のリターンに関連しているべきです。もしその信号が将来のリターンを予測できるのであれば、信号の中で最も買いに適した株は最高の信号値を持ち、最も売りに適した株は最低の信号値を持つことになります。量的ヘッジファンドにとって、彼らの信号は数学モデルから直接得られます。
私は、信号の質に基づいてヘッジファンドを評価する以下のカルダシェフスケールを提案したいと思います:
I 型ヘッジファンドは、取引コスト前の後続リターンを予測できる信号を持っています。
II 型ヘッジファンドは、取引コスト後の後続リターンを予測できる信号を持っています。
III 型ヘッジファンドは、世界で最も優れたヘッジファンドに対して有利な変更信号を提供できる信号を持っています。
IV 型ヘッジファンドは、他の信号を使って有利な変更を行うことができないほど非常に良い信号を持っています。
I 型ヘッジファンドは、将来の価格動向を予測する能力を持っています。しかし、これらの予測は利益を上げることができず、市場影響コストなどの取引コストが利益を相殺します。II 型ヘッジファンドは、コストを差し引いた後に利益を上げることができるため、効率的市場仮説に違反します。
III 型は物事が面白くなるところであり、III 型ヘッジファンドを説明するために例を挙げましょう。世界で最も優れたヘッジファンドを見つけることができると仮定しましょう。それを Renaissance Technologies としましょう。ある平行宇宙で、Two Sigma(別のヘッジファンド)の CEO が、彼が唯一やりたいことは Renaissance の信号を改善することだと決めたと仮定します。彼は Renaissance に Two Sigma の最高の信号、つまり彼らの最高品質の株式予測を提供することに決めました。彼は Two Sigma の最高の信号を Renaissance が今見ることができる FTP サーバーにアップロードしました。もし Renaissance が自分たちの信号が非常に良いと考え、Two Sigma の信号を使って取引を有利に変更する方法がないのであれば、Two Sigma は III 型ヘッジファンドではありません。しかし、もし Renaissance が Two Sigma の信号を使って取引を有利に変更する方法があるのであれば、Two Sigma は III 型ヘッジファンドです。たとえ Renaissance が 96% 同じ取引を行っていて、通常は Two Sigma の信号なしで行っているとしても、4% の Renaissance の信号を改善するための有利な取引変更があれば、Two Sigma は III 型ヘッジファンドとなります。
III 型ヘッジファンドになることは、II 型ヘッジファンドになることよりもはるかに難しいです。なぜなら、II 型ヘッジファンドは市場で有利な取引を行うだけでよいのに対し、III 型ヘッジファンドはすでに存在する信号を使って市場で非常に有利な取引を行う必要があるからです。
IV 型ヘッジファンドは、誰もその信号を有利に変更できない信号を持っています。IV 型ヘッジファンドは、世界で最も優れたヘッジファンドであるだけでなく、宇宙のどこにも他の既知の信号がその信号を改善するために組み合わされることができないヘッジファンドです。(上記の例で、もし Two Sigma が Renaissance の取引変更の下で III 型ヘッジファンドであれば、Renaissance は IV 型ヘッジファンドではありません。)IV 型ヘッジファンドは、完璧な株式市場予測精度を持つ完璧な信号を取引する必要はありません。それは、取引する信号が現在知られているすべての信号に対して最大の利益をもたらすことを意味します。それは、すべての既知の信号を完璧に統合しています。
IV 型ヘッジファンドは、株式市場の異星のスーパーインテリジェンスのようなものです。これは、DeepMind の AlphaZero が囲碁をプレイする最良のバージョンのようなもので、人間(または AlphaZero や AlphaGo の古いバージョン)がそのゲームに対して何らかの変更を加えても改善されることはありません。
私は IV 型ヘッジファンドはまだ存在しないと思います。しかし、私は Numerai という新しいタイプのヘッジファンドの創設者であり、過去数年間、IV 型ヘッジファンドの必要な属性は何か?それを構築できるのか?という思想実験を行ってきました。
明らかに、IV 型ヘッジファンドは、IV 型ヘッジファンドになるのを妨げる新しい信号を迅速かつ自動的に受け取る能力が必要です。もし IV 型ヘッジファンドが存在するなら、それは最高のヘッジファンドであるため、III 型ヘッジファンドの信号が IV 型ヘッジファンドに吸収されないことはあり得ません。IV 型ヘッジファンドは、即座に III 型信号を吸収できる必要があります。そうでなければ、それは IV 型ヘッジファンドではありません。このため、IV 型ヘッジファンドはオープンシステムである必要があり、誰でも新しい信号をアップロードし、取引にすべての変更を加えることができる必要があります。そうすることで、彼らは利益を得ることができます。
Renaissance、Two Sigma、または他のどのヘッジファンドも、前インターネット、前ブロックチェーンの組織設計を閉じており、これらの設計は IV 型ヘッジファンドを作成することができません。ちょうどシティバンクの組織設計がビットコインを作成できないのと同じです。IV 型ヘッジファンドは本当に新しいものです。それは、Two Sigma よりもビットコインに近いように見え、感じられるかもしれません。
もちろん、IV 型ヘッジファンドの明らかな特徴の一つは、すべての III 型信号を購入するために十分な資金を提供できるだけの裕福さが必要です。もし Two Sigma が候補となる IV 型ヘッジファンドの取引に対して有利な変更を行うことができるなら、その IV 型ヘッジファンドは Two Sigma に完全に取引業務を閉じさせ、彼らの信号を IV 型ヘッジファンドに販売するための資金を持っている必要があります。Two Sigma に信号を変更させることは非常に高価です。おそらく、Renaissance が本当に IV 型ヘッジファンドになりたいと思っても、そのコストを負担できないかもしれません。
IV 型ヘッジファンドは、信号を購入するためのオープンマーケットである必要があります。Numerai はすでにそのようなシステムです。誰でも私たちの無料の混乱データを使用するか、自分のデータを使用して Numerai に信号を提出できます。Numerai はそれほど多くの資金を持っていませんが、約 1.5 億ドルの暗号通貨 NMR を持っており、これにより Numerai はこれまでで最も収益性の高いデータサイエンスコンペティションとなり、インターネット上で株式市場信号の最大の買い手となっています。
オープンな方法で信号を受け取り、暗号通貨を使用して人々に新しい信号を提出するように促すことで、Numerai は IV 型ヘッジファンドになるための適切な属性を持っているようです。
しかし、この議論には、視界の外に隠れている厄介な仮定があります。これは、思想実験では見落とされますが、実際の現実では現れます。それはこうです:Numerai は、新しい信号が我々の既存の良好な信号を改善するかどうかを評価する方法を知っているでしょう。
Numerai は、データサイエンティストが提出した数千の信号を、我々が「メタモデル」と呼ぶものに組み合わせてきました。したがって、新しい信号が与えられた場合、我々はその信号をすでに大きな信号集合に含めることができ、取引戦略に有利な変更をもたらすことができるかどうかをどうやって知るのでしょうか?この信号評価の問題に対する良好な技術的解決策がなければ、信号が III 型に属するかどうかを知ることはできず、したがって IV 型に到達することもできません。
Numerai のこれらの年の中で、我々は信号評価を得意とする方法を学ばなければなりませんでした。Numerai が設立されて以来、我々は信号評価に多くの改善を行ってきました。たとえば、我々は MMC を導入し、Numerai のデータサイエンティストが自分のモデルに NMR を担保にして、彼らのモデルがサンプル外で機能する(一般化する)ことを信じていることを証明しました。MMC と担保は、Numerai 上の信号の質を向上させました。
しかし、我々は信号評価の問題を解決したことはありません。我々のエンドツーエンドシステムの中で、信号が我々の既存のメタモデルに関する III 型信号であるかどうかを確認することはできません。しかし、今日は、我々が数年をかけて構築した新しいシステム「True Contribution」を発表します。これは信号評価の問題を解決します。
未来の株式リターンと高度に関連する信号が、Numerai のメタモデルに最も役立つ可能性があるというのは自然なことのようです。したがって、Numerai は長年にわたり、データサイエンティストが Numerai の目標(残余リターンに類似)に密接に関連する信号を生成するパフォーマンスに基づいて報酬を支払ってきました。しかし、これは I 型信号を促進し、信号と目標の関連性に基づいた報酬信号は、その信号が Numerai の最適化された投資ポートフォリオリターンにどれだけ真の貢献をしているかを正確に示すものではありません。ユーザーに目標との関連性に基づいて報酬を与えることは、信号と他の信号との関連性、既存のメタモデルとの相互作用、または Numerai がメタモデルを変換するために使用する数百のポートフォリオ最適化パラメータ信号を無視してしまいます。
明らかに、我々は、Numerai に対して有利な変更を行うことができる信号を評価するために、システム内のすべての詳細を考慮する信号評価方法が必要です。
エンドツーエンドで、我々は信号とその信号に関連する NMR 株式が、Numerai の最適化器が構築した最終的なポートフォリオの各側面にどのように影響するかを描く必要があります。
上の図に示されているように、Numerai はまずデータサイエンティストの機械学習モデルによって生成された信号を組み合わせます。我々は、各信号の株式加重平均を計算することで、株式加重メタモデルを作成します。モデルに大量の NMR を投入したデータサイエンティストは、株式加重メタモデル内でより大きな重みを持つことになります。
株式加重メタモデルは、約 5000 の世界中の株式に対する予測信号に過ぎません。それは、数百のリスク制約(市場、国、セクターリスクのヘッジなど)を持つ現実のポートフォリオに変換する必要があります。これが最適化ステップで行われることです。最適化器がすべてのリスク制約を満たす現実の仮定ポートフォリオを作成すると、Numerai はポートフォリオの後続リターンを観察できます。
信号を正しく評価するためには、信号が上記の全システムに与える影響を考慮する必要があります。信号から株式加重メタモデル、そして最適化後のポートフォリオのリターンへと至るまで。これが真の貢献が行うことです。
簡単に言えば、真の貢献は次の質問への回答です:データサイエンティストが彼らのモデルにもっと多くの NMR を投入した場合(したがって、株式加重メタモデル内での彼らの重みを増加させる場合)、最適化されたポートフォリオのリターンはどのように変化するでしょうか?
量的金融分野の人々にとって、真の貢献は複雑な信号帰属のように考えることができます。
機械学習分野の人々にとって、上記の Numerai の動作に関する図は、神経ネットワークアーキテクチャを思い起こさせるかもしれません。そして、もしあなたが神経ネットワークを構築したことがあるなら、株式の最適化された投資ポートフォリオリターンに関する勾配を取得することが可能かどうか疑問に思うかもしれません。これが真の貢献です。
しかし、ポートフォリオ最適化層を通じて勾配をどのように計算するのでしょうか?
実際、これはスタンフォード大学のスティーブン・ボイド、Facebook AI のブランドン・エイモスなどが開発した新しい技術を使用して行うことができます(彼らの論文を参照:可微分凸最適化層)。
cvxpylayers を使用することで、cvxpy で定義された凸ポートフォリオ最適化を PyTorch モデル内の層として使用できます。これにより、株式価値に対する最適化されたポートフォリオリターンの勾配を効果的に計算し、Numerai に提出された各信号の真の貢献を特定できます。
真の貢献のポートフォリオ構築では、株式規模、モデルの独創性、信号強度が正確な比率で考慮されます。これらの比率は、Numerai が実際に取引している現実のポートフォリオでリターンを生み出すために非常に重要です。
元の信号は、Numerai に対して我々が元々持っていた取引とは異なる、より有利な取引を行うのに役立ち、今では最高の NMR 報酬を得るため、株式加重メタモデル内でますます大きな重みを持つことが多くなります。この報酬フィードバックは、Numerai 上のすべてのデータサイエンティストにとっても重要です。なぜなら、彼らは今、自分たちのモデルを改善して真の貢献を最大化できるからです。
真の貢献を通じて、Numerai は信号の作成と提出を持続的に促進することを目的としたフィードバックループを作成しています。これにより、我々のヘッジファンドに有利な変更を加え、他のすべての信号を抑制します。Numerai の各ラウンドは、Numerai 全体の制御論システムのもう一つの逆伝播となります。フィードバックと誤り修正は、分散型 AI モデル層、ブロックチェーン担保層、メタモデル、凸最適化を通じて伝播します。言い換えれば、Numerai の各ラウンドを通じて、我々は IV 型ヘッジファンドになる方向に一歩近づいています。
真の貢献の担保は 4 月 9 日に開始されますが、その間に、我々は過去約 2 年間にわたり、Numerai 上のすべてのユーザーに真の貢献をバックフィルしました。
結果は、真の貢献が Numerai 上の新しい信号評価指標として巨大な潜在能力を持っていることを示しています。
たとえば、多くのデータサイエンティスト(例:LANCEALOT)は非常に高い真の貢献ランキングを持っていますが、他の指標(例:目標との関連性)でのランキングははるかに低いです。明らかに、少なくとも最近の期間において、LANCEALOT は Numerai に最も貢献したモデルを持っていますが、彼らの貢献は適切に報われていません。
HB は NASA のジェット推進研究所のエンジニアで、Europa Clipper ミッションに従事しており、長年の Numerai データサイエンティストです。HB は Numerai に複数のモデルを提出しましたが、彼が最も多くの NMR(22,000 ドル相当の 765 NMR)を投入したモデルの真の貢献は、彼の他のモデルよりもはるかに低いです。真の貢献に関して、彼のいくつかの最良のモデルは全く株式を持っておらず、これはこれらの優れたモデルがメタモデル内での重みがゼロであり、全く報酬を得ていないことを意味します。
真の貢献を担保にする能力が始まることで、データサイエンティストは、最高の期待される真の貢献を持つモデルに彼らの担保を移すことを始めるでしょう。この動的システムの中で、HB や LANCEALOT のようなデータサイエンティストが彼らの株式を調整してより多くの真の貢献を得るにつれて、Numerai の株式加重メタモデルがより賢くならない理由はありません。
もちろん、我々は IV 型に到達するかどうかは分かりません。しかし、もし我々が IV 型になる道を歩むなら、あなたはどのようなものを見たいですか?私が考えるべき重要な点は、リスク調整後のパフォーマンスが時間と資産管理規模の増加に伴って増加することです。
時間が経つにつれて、ヘッジファンドはしばしば悪化します。なんと悲しいことでしょう。これが起こる理由は、信号の減衰(市場効率が向上するにつれて、ヘッジファンドが開始した取引信号が時間とともに悪化する)と容量制限(1000 万ドルでうまく機能する取引戦略が 1 億ドルでは全く機能しない)です。
しかし、これまでのところ、Numerai は時間とともに悪化していません------むしろ良くなっています。これは非常に良い兆候です。
図のこの期間中、Numerai のヘッジファンド AUM はほぼ 10 倍に増加し、約 700 万ドルから 6400 万ドルに増加しました(まだ初期段階です)。時間が経つにつれて、我々の信号の減衰と資産管理規模の増加は、パフォーマンスを損なうはずですが、我々のリスク調整リターン(シャープレシオ)は時間とともに増加し続けています。これは、同じ期間に、Numerai のメタモデル内の担保モデルが 300 から 4000 以上に増加したためです。Numerai には信号の減衰がなく、持続的な信号の回復があります------メタモデルは毎週最新の信号で再構築されます。
Numerai ユーザーが彼らのモデルに関する正しいフィードバックを受け取らない場合、つまり真の貢献がない場合……
AI によって生成されたカバーアートを提供してくれた Midjourney の天才たちに感謝します。(ここでのプロンプトは「ウォール街の紫色の制御論ダイソン球」です)
*シャープレシオの計算は、費用を差し引いた総リターンに基づいており、無リスク利率が 0% であると仮定しています。
提供されたシャープレシオ情報は歴史的情報であり、将来のパフォーマンスの指針ではありません。投資家は、投資損失が発生する可能性があることを認識する必要があります。示された利益や損失を実現する投資家は、いないかもしれません。














