DGrid AI 发布最新研究论文 PoQ-Judge,以多架构评估框架完成去中心化 LLM 质量评估闭环
ChainCatcher 消息,去中心化 AI 基础设施网络 DGrid AI 今日发布最新研究论文 “PoQ-Judge”,提出一套无需参考答案的多架构质量评估框架。这意味着在真实部署环境中,往往没有标准答案可供比对,协议依然能够对模型回答的质量做出可靠评分,并据此分配激励。这是 DGrid 去中心化 LLM 推理质量评估体系长期缺失的一块关键拼图。
PoQ(Proof of Quality,质量证明)是 DGrid 自研的共识机制,用于在协议层防止模型提供方投放劣质模型、伪造数据或隐藏计算费用,从而保障服务质量与定价透明。DGrid 团队围绕 PoQ 持续深耕,已陆续发表四篇研究论文。本次发布的 PoQ-Judge,训练了三款覆盖不同质量与成本场景的评估模型,在留存测试集上与人工评分的相关性最高达 0.747,显著优于此前所有基于参考答案的评估器,同时通过级联评估与在线权重校准将评估成本降低超 72%。
随着 PoQ-Judge 落地,从质量评估 → 评分 → 激励分配的完整流程已全部摆脱对参考答案的依赖,去中心化 LLM 推理的质量闭环就此打通。
DGrid AI 是一个去中心化的 AI 智能网络,致力于构建开放、透明、由社区驱动的 AI 基础设施。围绕模型调用与应用体验,DGrid 已推出多款核心产品:统一聚合全球主流大模型的 AI Gateway、AI 智能体一键部署平台 DClaw、匿名模型竞技平台 AI Arena,以及智能模型推荐助手 Dori,为开发者与用户提供一站式服务。据悉,DGrid AI 半年营收已突破 2000 万美元。