Numerai 發布的 True Contribution 信號評估方法
作者: Numerai
編譯: ChainCatcher
Numerai 發布了一種新的信號評估方法,稱為 True Contribution。 True Contribution 是通過將 Numerai 視為端到端的人工智慧系統來計算的。通過計算優化投資組合回報率相對於使用可微凸優化層在信號上質押的 NMR 的梯度,Numerai 現在可以浮出水面並激勵信號,為我們的對沖基金做出最大的情報貢獻。 Numerai 的表現已經不錯(過去 12 個月我們的夏普比率* 為 2.54),但 True Contribution 有可能使 Numerai 成為第一個「IV 型」對沖基金。
蘇聯天體物理學家尼古拉卡爾達舍夫提出的卡爾達舍夫等級是一種根據文明利用的能量對技術進步文明進行分級的方法。 I 型文明可以利用其星球上的所有能量。 II 型文明可以利用其太陽系中的所有能量,而 III 型文明可以利用其銀河系中的所有能量。
卡爾達舍夫量表不包含創造這些文明的實際藍圖,但它確實為考慮不同類型文明所需技術的思想實驗提供了肥沃的土壤。例如,為了成為 II 型文明,我們必須發明類似戴森球的東西來捕獲來自太陽的所有能量。為了成為 III 型文明,我們需要自我複製機器人技術以跨越銀河系。
那麼對沖基金有卡爾達舍夫量表嗎?對沖基金中不同水平的技術進步有何意義?
我們可以認為每個對沖基金都在交易一些股票市場預測信號,這些信號應該與股票的未來回報相關。如果該信號可預測未來回報,則信號中最適合買入的股票將具有最高信號值,而最適合做空的股票將具有最低信號值。對於量化對沖基金,他們的信號直接來自他們的數學模型。
我想為對沖基金提出以下 Kardashev 等級,它根据信號的質量對對沖基金進行評級:
I 類對沖基金有一個信號,可以預測交易成本之前的後續回報。
II 類對沖基金有一個信號,可以預測交易成本後的後續回報。
III 類對沖基金有一個信號,可以用來對世界上最好的對沖基金進行有利可圖的改變信號。
IV 類對沖基金有一個非常好的信號,以至於沒有其他信號可以用來對其進行有利可圖的改變。
I 類對沖基金具有預測未來價格走勢的能力;然而,這些預測無法獲利,因為市場影響成本等交易成本會抵消收益。 II 類對沖基金可以在扣除成本後賺錢,因此違反了有效市場假說。
類型 III 是事情變得有趣的地方,所以讓我用一個例子來解釋類型 III 對沖基金。假設我們可以找出世界上最好的對沖基金,我們就說它是 Renaissance Technologies。假設在某個平行宇宙中,Two Sigma(另一家對沖基金)的首席執行官決定他唯一想做的就是改善 Renaissance 的信號。他決定給 Renaissance Two Sigma 最好的信號------他們最高質量的股票預測。他將 Two Sigma 的最佳信號上傳到 Renaissance 現在可以看到和使用的 FTP 伺服器。現在,如果 Renaissance 認為他們自己的信號已經非常好,以至於沒有辦法使用 Two Sigma 的信號來改變他們的交易獲利,那麼 Two Sigma 就不是 Type III 對沖基金。但是,如果 Renaissance 有辦法使用 Two Sigma 的信號對其交易進行有利可圖的改變,那麼 Two Sigma 就是 Type III 對沖基金。即使 Renaissance 仍然進行 96% 的相同交易,它們通常會在沒有 Two Sigma 信號的情況下進行,但 4% 的可改善 Renaissance 信號的有利可圖的交易變更足以使 Two Sigma 成為 III 類對沖基金。
成為 III 類對沖基金比成為 II 類對沖基金要困難得多,因為 II 類對沖基金只需在市場上進行有利可圖的交易,而 III 類對沖基金必須對已經產生的信號進行有利可圖的改變市場上非常有利可圖的交易。
IV 類對沖基金有一個信號,沒有人可以對其進行有利可圖的改變。 IV 類對沖基金不僅是世界上最好的對沖基金,而且是宇宙中任何地方都沒有其他已知信號可以與其改進信號相結合的對沖基金。 (在上面的例子中,如果 Two Sigma 是 Renaissance 交易變更下的 III 類對沖基金,那麼 Renaissance 就不是 IV 類對沖基金。)IV 類對沖基金不一定交易具有完美股市預測準確性的完美信號,它只是意味著它交易的信號對目前已知的所有信號都是最大的好處。它完美地整合了所有已知信號。
IV 類對沖基金就像是股市的外星超級智能。這有點像 DeepMind 的 AlphaZero 下圍棋的最佳版本,人類(或 AlphaZero 或 AlphaGo 的舊版本)對其遊戲進行任何更改都無法改進它。
我認為 IV 類對沖基金還不存在。但我是一種名為 Numerai 的新型對沖基金的創始人,過去幾年我一直在進行一個思想實驗:IV 類對沖基金的必要屬性是什麼?能否建立它?
顯然,IV 類對沖基金需要能夠快速自動地接收任何阻止他們成為 IV 類對沖基金的新信號。如果有 Type IV 對沖基金,那將是最好的對沖基金,因此不可能有任何 Type III 對沖基金的信號不被 Type IV 對沖基金吸收。 IV 類對沖基金必須能夠即時吸收任何 III 類信號,否則它們就不是 IV 類對沖基金。正因如此,IV 類對沖基金需要是一個開放系統,任何人都可以上傳新信號,對交易進行所有更改,以便他們能夠從中獲利。
Renaissance、Two Sigma 或任何其他對沖基金都關閉了前互聯網、前區塊鏈的組織設計,這些設計無法創建 Type IV 對沖基金,就像花旗銀行的組織設計無法創建比特幣一樣。 IV 類對沖基金確實是一種全新的事物。它可能看起來和感覺起來更像比特幣,而不是二西格碼。
當然,IV 類對沖基金的一個明顯特性是它需要足夠富有才能提供足夠的資金來購買所有 III 類信號。如果 Two Sigma 可以對候選 Type IV 對沖基金的交易做出有利可圖的改變,那麼該 Type IV 對沖基金需要有資金來激勵 Two Sigma 完全關閉其交易業務,並將其信號出售給 Type IV 對沖基金。讓 Two Sigma 改變他們的信號確實非常昂貴。也許即使 Renaissance 真的想成為 IV 類對沖基金,也負擔不起成為 IV 類對沖基金的代價。
IV 類對沖基金必須是購買信號的開放市場。 Numerai 已經是這樣一個系統。任何人都可以使用我們的免費混淆數據或使用他們自己的數據向 Numerai 信號提交信號。 Numerai 沒有那麼多錢,但我們有大約 1.5 億美元的加密貨幣 NMR,這使得 Numerai 已經成為迄今為止世界上收入最高的數據科學競賽,也是互聯網上股票市場信號的最大買家。
通過一種開放的方式來接收信號和加密貨幣來激勵人們提交新信號,看起來 Numerai 似乎擁有成為 IV 類對沖基金的合適屬性。
但在這一論點中有一個揮之不去的、有害的假設,它隱藏在視線之外。這是一種在思想實驗中遺漏但在實際現實中出現的假設。就是這樣:Numerai 會知道如何評估一些新信號是否會改善我們現有的良好信號。
Numerai 已經將我們的數據科學家提交的數千個信號組合到我們所說的元模型中。因此,給定一個新信號,我們怎麼知道我們可以將其包含在這個已經很大的信號集合中,並讓該包含對交易策略產生有利可圖的改變?如果沒有針對這信號評估問題的良好技術解決方案,就不可能知道信號是否屬於 III 類,因此不可能達到 IV 類。
在 Numerai 的這些年裡,我們不得不學習如何擅長信號評估。自 Numerai 成立以來,我們對信號評估進行了許多改進。例如,我們推出了 MMC 並在 Numerai 數據科學家將 NMR 質押在他們的模型上以證明他們相信他們的模型能夠在樣本外工作(泛化)。 MMC 和質押都提高了 Numerai 上的信號質量。
但我們從未解決過信號評估問題。我們無法確定在我們的端到端系統中,信號是否是關於我們現有元模型的 III 類信號。但今天我們宣布了一個我們花了數年時間構建的新系統,稱為 True Contribution,它解決了信號評估問題。
假設與未來股票回報高度相關的信號可能對 Numerai 的元模型最有幫助,這似乎很自然。正因如此,Numerai 多年來一直根據數據科學家在生成與 Numerai 目標(類似於剩餘回報)密切相關的信號方面的表現向他們支付報酬。但這會激勵 I 類信號,而基於信號與目標相關性的獎勵信號並不能準確表示該信號對 Numerai 優化後投資組合回報的真正貢獻有多大。基於用戶與目標的相關性來獎勵用戶只是忽略了太多非常重要的細節,例如:信號與其他信號的相關性、它與現有元模型的交互效果或 Numerai 用來轉變元模型的數百個投資組合優化參數信號進入由數百隻股票組成的平衡投資組合。
顯然,我們需要一種信號評估方法來考慮系統中的每個細節,以便能夠評估信號是否可以對 Numerai 做出有利可圖的改變。
為了端到端,我們需要繪製出信號和與該信號相關的 NMR 股份如何影響 Numerai 優化器構建的最終投資組合的各個方面。
正如您在上圖中看到的,Numerai 首先結合了數據科學家的機器學習模型生成的信號。我們通過計算每個信號的權益加權平均值來創建權益加權元模型來做到這一點。在模型上投入大量 NMR 的數據科學家將在 Stake-Weighted Meta 模型中擁有更大的權重。
股權加權元模型仍然只是對約 5000 隻全球股票的預測信號。它仍然需要轉化為具有數百個風險約束(例如市場、國家和部門風險中和)的現實投資組合,而這正是優化步驟所做的。一旦優化器創建了滿足所有風險約束的現實假設投資組合,Numerai 就可以觀察投資組合的後續回報。
為了正確評估信號,我們必須考慮信號對上述整個系統的影響,從信號到權益加權元模型,再到優化後投資組合的回報。這就是真正的貢獻所做的。
簡而言之,真實貢獻是對以下問題的回答:如果數據科學家在他們的模型上投入更多(從而增加他們在權益加權元模型中的權重),那麼優化後的投資組合回報會發生什麼變化?
對於量化金融領域的人來說,您可以將真實貢獻視為一種複雜的信號歸因。
對於機器學習領域的人來說,上面關於 Numerai 工作原理的圖表可能讓人想起神經網絡架構。而且,如果您曾經構建過神經網絡,您可能想知道是否有可能採用關於股權的優化投資組合回報的梯度。這正是真正的貢獻。
但是如何通過投資組合優化層計算梯度呢?
事實證明,這可以使用斯坦福大學的 Stephen Boyd、Facebook AI 的 Brandon Amos 等人開發的新技術(參見他們的論文:可微分凸優化層)
通過使用 cvxpylayers,我們可以將 cvxpy 定義的凸投資組合優化作為 PyTorch 模型中的一個層。這使我們能夠有效地計算優化投資組合回報相對於股權價值的梯度,並確定提交給 Numerai 的每個信號的真實貢獻。
在 True Contribution 投資組合構建中,股權規模、模型的獨創性和信號強度都按確切比例考慮在內,在這些比例中,它們對於在 Numerai 實際交易的現實投資組合中產生回報非常重要。
原始信號可以幫助 Numerai 進行與我們原本擁有的交易不同的、更有利可圖的交易,現在將獲得最高的 NMR 獎勵,因此在股權加權元模型中往往具有越來越大的權重。這種獎勵反饋對 Numerai 上的每一位數據科學家也很重要,因為他們現在可以改進他們的模型以最大化他們的真實貢獻。
借助 True Contribution,Numerai 正在創建一個反饋循環,旨在持續激勵信號的創建和提交,從而對我們的對沖基金進行有利可圖的改變,並抑制所有其他信號。 Numerai 的每一輪都將成為 Numerai 整體控制論系統的另一次反向傳播。反饋和糾錯通過分佈式 AI 模型層、區塊鏈質押層、元模型和凸優化進行傳播。換句話說,隨著 Numerai 的每一輪,我們都朝著成為 IV 類對沖基金的方向邁進了一步。
對 True Contribution 的質押將於 4 月 9 日開始,但與此同時,我們在過去約 2 年內為 Numerai 上的每個用戶回填了 True Contribution。
結果顯示,True Contribution 作為 Numerai 上的新信號評估指標具有巨大潛力。
例如,有許多數據科學家(例如 LANCEALOT)具有非常高的真實貢獻排名,但在其他指標(例如與目標的相關性)上的排名要低得多。很明顯,至少在最近一段時間內,LANCEALOT 有一個對 Numerai 幫助最大的模型,但他們的貢獻並沒有得到適當的回報。
HB 是 NASA 噴氣推進實驗室的一名工程師,從事 Europa Clipper 任務,並且是一名長期的 Numerai 數據科學家。 HB 向 Numerai 提交了多個模型,但他投入最多 NMR 的模型(價值 22,000 美元的 765 NMR)的真實貢獻比他的其他模型低得多。就真實貢獻而言,他的一些最佳模型根本沒有任何股份,這意味著這些優秀模型在元模型中的權重為零,並且根本沒有得到獎勵。
有了開始對真實貢獻進行質押的能力,數據科學家將開始將他們的質押轉移到具有最高預期真實貢獻的模型上。在這個動態系統中,隨著像 HB 和 LANCEALOT 這樣的數據科學家調整他們的股份以獲得更多的真實貢獻,沒有理由相信 Numerai 的股份加權元模型不會變得更加智能。
當然,我們不知道我們是否會達到類型 IV。但是,如果我們走上成為 IV 型的道路,您希望看到什麼類型的東西?我認為要尋找的關鍵是風險調整後的績效隨著時間和資產管理規模的增加而增加。
隨著時間的推移,對沖基金往往會變得更糟。多麼悲傷。發生這種情況的原因是信號衰減(隨著市場效率的提高,對沖基金開始的交易信號會隨著時間的推移而變差)和容量限制(在 1000 萬美元時運作良好的交易策略在 1 億美元時根本不起作用)。
但到目前為止,Numerai 並沒有隨著時間的推移而變得更糟------它正在變得更好,這是一個非常好的跡象。
在圖中的這段時間裡,Numerai 的對沖基金 AUM 幾乎翻了 10 倍,從大約 700 萬美元增至 6400 萬美元(仍處於早期階段)。隨著時間的推移,我們的信號衰減和資產管理規模的增長應該會隨著時間的推移損害績效,但我們的風險調整回報率(夏普比率)會隨著時間的推移繼續增加。這是因為在同一時期,Numerai 在元模型中的抵押模型從 300 個增加到 4000 多個。 Numerai 沒有信號衰減,我們有持續的信號恢復------元模型每週都會用最新的信號重建。
在沒有 Numerai 用戶收到關於他們模型的正確反饋的情況下,即沒有真正的貢獻……
感謝 Midjourney 的天才們為 AI 生成的封面藝術。 (這裡的提示是:「華爾街的紫色控制論戴森球」)
*夏普比率的計算基於扣除費用後的總回報,並假設無風險利率為 0%。
所提供的夏普比率信息是歷史信息,不是未來表現的指南。投資者應意識到投資損失是可能的。不代表任何投資者將或可能實現與所示類似的利潤或損失。







