DGrid AI 發布最新研究論文 PoQ-Judge,以多架構評估框架完成去中心化 LLM 質量評估閉環
ChainCatcher 消息,去中心化 AI 基礎設施網絡 DGrid AI 今日發布最新研究論文 "PoQ-Judge",提出一套無需參考答案的多架構質量評估框架。這意味著在真實部署環境中,往往沒有標準答案可供比對,協議依然能夠對模型回答的質量做出可靠評分,並據此分配激勵。這是 DGrid 去中心化 LLM 推理質量評估體系長期缺失的一塊關鍵拼圖。
PoQ(Proof of Quality,質量證明)是 DGrid 自研的共識機制,用於在協議層防止模型提供方投放劣質模型、偽造數據或隱藏計算費用,從而保障服務質量與定價透明。DGrid 團隊圍繞 PoQ 持續深耕,已陸續發表四篇研究論文。本次發布的 PoQ-Judge,訓練了三款覆蓋不同質量與成本場景的評估模型,在留存測試集上與人工評分的相關性最高達 0.747,顯著優於此前所有基於參考答案的評估器,同時通過級聯評估與在線權重校準將評估成本降低超 72%。
隨著 PoQ-Judge 落地,從質量評估 → 評分 → 激勵分配的完整流程已全部擺脫對參考答案的依賴,去中心化 LLM 推理的質量閉環就此打通。
DGrid AI 是一個去中心化的 AI 智能網絡,致力於構建開放、透明、由社區驅動的 AI 基礎設施。圍繞模型調用與應用體驗,DGrid 已推出多款核心產品:統一聚合全球主流大模型的 AI Gateway、AI 智能體一鍵部署平台 DClaw、匿名模型競技平台 AI Arena,以及智能模型推薦助手 Dori,為開發者與用戶提供一站式服務。據悉,DGrid AI 半年營收已突破 2000 萬美元。






