扫码下载
BTC $67,131.14 +4.76%
ETH $1,839.45 +10.52%
BNB $627.39 +3.24%
XRP $1.28 +12.35%
SOL $75.55 +11.67%
TRX $0.3187 +0.12%
DOGE $0.0902 +4.35%
ADA $0.1877 +12.26%
BCH $226.28 +11.97%
LINK $8.52 +8.49%
HYPE $68.11 +12.82%
AAVE $76.39 +16.03%
SUI $0.8208 +9.45%
XLM $0.2277 +24.43%
ZEC $534.53 +26.48%
BTC $67,131.14 +4.76%
ETH $1,839.45 +10.52%
BNB $627.39 +3.24%
XRP $1.28 +12.35%
SOL $75.55 +11.67%
TRX $0.3187 +0.12%
DOGE $0.0902 +4.35%
ADA $0.1877 +12.26%
BCH $226.28 +11.97%
LINK $8.52 +8.49%
HYPE $68.11 +12.82%
AAVE $76.39 +16.03%
SUI $0.8208 +9.45%
XLM $0.2277 +24.43%
ZEC $534.53 +26.48%

DGrid AI 发布最新研究论文 PoQ-Judge,以多架构评估框架完成去中心化 LLM 质量评估闭环

2026-06-15 21:58:12
收藏

ChainCatcher 消息,去中心化 AI 基础设施网络 DGrid AI 今日发布最新研究论文 “PoQ-Judge”,提出一套无需参考答案的多架构质量评估框架。这意味着在真实部署环境中,往往没有标准答案可供比对,协议依然能够对模型回答的质量做出可靠评分,并据此分配激励。这是 DGrid 去中心化 LLM 推理质量评估体系长期缺失的一块关键拼图。

PoQ(Proof of Quality,质量证明)是 DGrid 自研的共识机制,用于在协议层防止模型提供方投放劣质模型、伪造数据或隐藏计算费用,从而保障服务质量与定价透明。DGrid 团队围绕 PoQ 持续深耕,已陆续发表四篇研究论文。本次发布的 PoQ-Judge,训练了三款覆盖不同质量与成本场景的评估模型,在留存测试集上与人工评分的相关性最高达 0.747,显著优于此前所有基于参考答案的评估器,同时通过级联评估与在线权重校准将评估成本降低超 72%。

随着 PoQ-Judge 落地,从质量评估 → 评分 → 激励分配的完整流程已全部摆脱对参考答案的依赖,去中心化 LLM 推理的质量闭环就此打通。

DGrid AI 是一个去中心化的 AI 智能网络,致力于构建开放、透明、由社区驱动的 AI 基础设施。围绕模型调用与应用体验,DGrid 已推出多款核心产品:统一聚合全球主流大模型的 AI Gateway、AI 智能体一键部署平台 DClaw、匿名模型竞技平台 AI Arena,以及智能模型推荐助手 Dori,为开发者与用户提供一站式服务。据悉,DGrid AI 半年营收已突破 2000 万美元。

app_icon
ChainCatcher 与创新者共建Web3世界