掃碼下載
BTC $64,086.72 +0.80%
ETH $1,729.60 +0.24%
BNB $589.15 +0.43%
XRP $1.13 -0.32%
SOL $73.65 +3.14%
TRX $0.3270 +1.42%
DOGE $0.0830 -1.24%
ADA $0.1612 -1.29%
BCH $197.74 -0.77%
LINK $7.95 +0.02%
HYPE $68.00 -3.70%
AAVE $74.64 +0.11%
SUI $0.7096 -1.34%
XLM $0.2119 -1.42%
ZEC $456.04 -3.27%
BTC $64,086.72 +0.80%
ETH $1,729.60 +0.24%
BNB $589.15 +0.43%
XRP $1.13 -0.32%
SOL $73.65 +3.14%
TRX $0.3270 +1.42%
DOGE $0.0830 -1.24%
ADA $0.1612 -1.29%
BCH $197.74 -0.77%
LINK $7.95 +0.02%
HYPE $68.00 -3.70%
AAVE $74.64 +0.11%
SUI $0.7096 -1.34%
XLM $0.2119 -1.42%
ZEC $456.04 -3.27%

框架

DGrid AI 發布最新研究論文 PoQ-Judge,以多架構評估框架完成去中心化 LLM 質量評估閉環

ChainCatcher 消息,去中心化 AI 基礎設施網絡 DGrid AI 今日發布最新研究論文 "PoQ-Judge",提出一套無需參考答案的多架構質量評估框架。這意味著在真實部署環境中,往往沒有標準答案可供比對,協議依然能夠對模型回答的質量做出可靠評分,並據此分配激勵。這是 DGrid 去中心化 LLM 推理質量評估體系長期缺失的一塊關鍵拼圖。PoQ(Proof of Quality,質量證明)是 DGrid 自研的共識機制,用於在協議層防止模型提供方投放劣質模型、偽造數據或隱藏計算費用,從而保障服務質量與定價透明。DGrid 團隊圍繞 PoQ 持續深耕,已陸續發表四篇研究論文。本次發布的 PoQ-Judge,訓練了三款覆蓋不同質量與成本場景的評估模型,在留存測試集上與人工評分的相關性最高達 0.747,顯著優於此前所有基於參考答案的評估器,同時通過級聯評估與在線權重校準將評估成本降低超 72%。隨著 PoQ-Judge 落地,從質量評估 → 評分 → 激勵分配的完整流程已全部擺脫對參考答案的依賴,去中心化 LLM 推理的質量閉環就此打通。DGrid AI 是一個去中心化的 AI 智能網絡,致力於構建開放、透明、由社區驅動的 AI 基礎設施。圍繞模型調用與應用體驗,DGrid 已推出多款核心產品:統一聚合全球主流大模型的 AI Gateway、AI 智能體一鍵部署平台 DClaw、匿名模型競技平台 AI Arena,以及智能模型推薦助手 Dori,為開發者與用戶提供一站式服務。據悉,DGrid AI 半年營收已突破 2000 萬美元。
app_icon
ChainCatcher 與創新者共建Web3世界