掃碼下載
BTC $59,471.11 -0.78%
ETH $1,590.81 +0.83%
BNB $552.14 -0.08%
XRP $1.04 +0.08%
SOL $73.91 +2.45%
TRX $0.3192 -1.08%
DOGE $0.0723 -0.81%
ADA $0.1453 +0.40%
BCH $199.31 +1.57%
LINK $7.29 +0.03%
HYPE $65.29 +4.47%
AAVE $90.65 -1.29%
SUI $0.6955 +0.74%
XLM $0.1836 +5.75%
ZEC $398.91 +4.42%
BTC $59,471.11 -0.78%
ETH $1,590.81 +0.83%
BNB $552.14 -0.08%
XRP $1.04 +0.08%
SOL $73.91 +2.45%
TRX $0.3192 -1.08%
DOGE $0.0723 -0.81%
ADA $0.1453 +0.40%
BCH $199.31 +1.57%
LINK $7.29 +0.03%
HYPE $65.29 +4.47%
AAVE $90.65 -1.29%
SUI $0.6955 +0.74%
XLM $0.1836 +5.75%
ZEC $398.91 +4.42%

grid

全部
文章
快訊

DGrid AI 發布最新研究論文 PoQ-Judge,以多架構評估框架完成去中心化 LLM 質量評估閉環

ChainCatcher 消息,去中心化 AI 基礎設施網絡 DGrid AI 今日發布最新研究論文 "PoQ-Judge",提出一套無需參考答案的多架構質量評估框架。這意味著在真實部署環境中,往往沒有標準答案可供比對,協議依然能夠對模型回答的質量做出可靠評分,並據此分配激勵。這是 DGrid 去中心化 LLM 推理質量評估體系長期缺失的一塊關鍵拼圖。PoQ(Proof of Quality,質量證明)是 DGrid 自研的共識機制,用於在協議層防止模型提供方投放劣質模型、偽造數據或隱藏計算費用,從而保障服務質量與定價透明。DGrid 團隊圍繞 PoQ 持續深耕,已陸續發表四篇研究論文。本次發布的 PoQ-Judge,訓練了三款覆蓋不同質量與成本場景的評估模型,在留存測試集上與人工評分的相關性最高達 0.747,顯著優於此前所有基於參考答案的評估器,同時通過級聯評估與在線權重校準將評估成本降低超 72%。隨著 PoQ-Judge 落地,從質量評估 → 評分 → 激勵分配的完整流程已全部擺脫對參考答案的依賴,去中心化 LLM 推理的質量閉環就此打通。DGrid AI 是一個去中心化的 AI 智能網絡,致力於構建開放、透明、由社區驅動的 AI 基礎設施。圍繞模型調用與應用體驗,DGrid 已推出多款核心產品:統一聚合全球主流大模型的 AI Gateway、AI 智能體一鍵部署平台 DClaw、匿名模型競技平台 AI Arena,以及智能模型推薦助手 Dori,為開發者與用戶提供一站式服務。據悉,DGrid AI 半年營收已突破 2000 萬美元。
app_icon
ChainCatcher 與創新者共建Web3世界