掃碼下載
BTC $66,592.47 +3.95%
ETH $1,814.47 +9.18%
BNB $625.33 +3.11%
XRP $1.25 +9.96%
SOL $73.84 +9.61%
TRX $0.3187 +0.37%
DOGE $0.0895 +3.98%
ADA $0.1869 +11.97%
BCH $226.85 +12.77%
LINK $8.44 +7.78%
HYPE $67.83 +12.26%
AAVE $76.31 +16.41%
SUI $0.8142 +8.80%
XLM $0.2184 +19.68%
ZEC $530.79 +25.20%
BTC $66,592.47 +3.95%
ETH $1,814.47 +9.18%
BNB $625.33 +3.11%
XRP $1.25 +9.96%
SOL $73.84 +9.61%
TRX $0.3187 +0.37%
DOGE $0.0895 +3.98%
ADA $0.1869 +11.97%
BCH $226.85 +12.77%
LINK $8.44 +7.78%
HYPE $67.83 +12.26%
AAVE $76.31 +16.41%
SUI $0.8142 +8.80%
XLM $0.2184 +19.68%
ZEC $530.79 +25.20%

poq-judge

DGrid AI 發布最新研究論文 PoQ-Judge,以多架構評估框架完成去中心化 LLM 質量評估閉環

ChainCatcher 消息,去中心化 AI 基礎設施網絡 DGrid AI 今日發布最新研究論文 "PoQ-Judge",提出一套無需參考答案的多架構質量評估框架。這意味著在真實部署環境中,往往沒有標準答案可供比對,協議依然能夠對模型回答的質量做出可靠評分,並據此分配激勵。這是 DGrid 去中心化 LLM 推理質量評估體系長期缺失的一塊關鍵拼圖。PoQ(Proof of Quality,質量證明)是 DGrid 自研的共識機制,用於在協議層防止模型提供方投放劣質模型、偽造數據或隱藏計算費用,從而保障服務質量與定價透明。DGrid 團隊圍繞 PoQ 持續深耕,已陸續發表四篇研究論文。本次發布的 PoQ-Judge,訓練了三款覆蓋不同質量與成本場景的評估模型,在留存測試集上與人工評分的相關性最高達 0.747,顯著優於此前所有基於參考答案的評估器,同時通過級聯評估與在線權重校準將評估成本降低超 72%。隨著 PoQ-Judge 落地,從質量評估 → 評分 → 激勵分配的完整流程已全部擺脫對參考答案的依賴,去中心化 LLM 推理的質量閉環就此打通。DGrid AI 是一個去中心化的 AI 智能網絡,致力於構建開放、透明、由社區驅動的 AI 基礎設施。圍繞模型調用與應用體驗,DGrid 已推出多款核心產品:統一聚合全球主流大模型的 AI Gateway、AI 智能體一鍵部署平台 DClaw、匿名模型競技平台 AI Arena,以及智能模型推薦助手 Dori,為開發者與用戶提供一站式服務。據悉,DGrid AI 半年營收已突破 2000 萬美元。
app_icon
ChainCatcher 與創新者共建Web3世界