掃碼下載
BTC $67,136.57 +4.73%
ETH $1,838.76 +10.36%
BNB $627.84 +3.31%
XRP $1.28 +12.35%
SOL $75.55 +11.67%
TRX $0.3187 +0.12%
DOGE $0.0902 +4.35%
ADA $0.1888 +12.86%
BCH $226.74 +12.12%
LINK $8.52 +8.49%
HYPE $68.11 +12.82%
AAVE $76.39 +16.03%
SUI $0.8239 +9.79%
XLM $0.2277 +24.43%
ZEC $534.53 +26.48%
BTC $67,136.57 +4.73%
ETH $1,838.76 +10.36%
BNB $627.84 +3.31%
XRP $1.28 +12.35%
SOL $75.55 +11.67%
TRX $0.3187 +0.12%
DOGE $0.0902 +4.35%
ADA $0.1888 +12.86%
BCH $226.74 +12.12%
LINK $8.52 +8.49%
HYPE $68.11 +12.82%
AAVE $76.39 +16.03%
SUI $0.8239 +9.79%
XLM $0.2277 +24.43%
ZEC $534.53 +26.48%

poq-judge

DGrid AI 發布最新研究論文 PoQ-Judge,以多架構評估框架完成去中心化 LLM 質量評估閉環

ChainCatcher 消息,去中心化 AI 基礎設施網絡 DGrid AI 今日發布最新研究論文 "PoQ-Judge",提出一套無需參考答案的多架構質量評估框架。這意味著在真實部署環境中,往往沒有標準答案可供比對,協議依然能夠對模型回答的質量做出可靠評分,並據此分配激勵。這是 DGrid 去中心化 LLM 推理質量評估體系長期缺失的一塊關鍵拼圖。PoQ(Proof of Quality,質量證明)是 DGrid 自研的共識機制,用於在協議層防止模型提供方投放劣質模型、偽造數據或隱藏計算費用,從而保障服務質量與定價透明。DGrid 團隊圍繞 PoQ 持續深耕,已陸續發表四篇研究論文。本次發布的 PoQ-Judge,訓練了三款覆蓋不同質量與成本場景的評估模型,在留存測試集上與人工評分的相關性最高達 0.747,顯著優於此前所有基於參考答案的評估器,同時通過級聯評估與在線權重校準將評估成本降低超 72%。隨著 PoQ-Judge 落地,從質量評估 → 評分 → 激勵分配的完整流程已全部擺脫對參考答案的依賴,去中心化 LLM 推理的質量閉環就此打通。DGrid AI 是一個去中心化的 AI 智能網絡,致力於構建開放、透明、由社區驅動的 AI 基礎設施。圍繞模型調用與應用體驗,DGrid 已推出多款核心產品:統一聚合全球主流大模型的 AI Gateway、AI 智能體一鍵部署平台 DClaw、匿名模型競技平台 AI Arena,以及智能模型推薦助手 Dori,為開發者與用戶提供一站式服務。據悉,DGrid AI 半年營收已突破 2000 萬美元。
app_icon
ChainCatcher 與創新者共建Web3世界