poq-judge

全部

文章

快讯

DGrid AI 发布最新研究论文 PoQ-Judge，以多架构评估框架完成去中心化 LLM 质量评估闭环

ChainCatcher 消息，去中心化 AI 基础设施网络 DGrid AI 今日发布最新研究论文 “PoQ-Judge”，提出一套无需参考答案的多架构质量评估框架。这意味着在真实部署环境中，往往没有标准答案可供比对，协议依然能够对模型回答的质量做出可靠评分，并据此分配激励。这是 DGrid 去中心化 LLM 推理质量评估体系长期缺失的一块关键拼图。 PoQ（Proof of Quality，质量证明）是 DGrid 自研的共识机制，用于在协议层防止模型提供方投放劣质模型、伪造数据或隐藏计算费用，从而保障服务质量与定价透明。DGrid 团队围绕 PoQ 持续深耕，已陆续发表四篇研究论文。本次发布的 PoQ-Judge，训练了三款覆盖不同质量与成本场景的评估模型，在留存测试集上与人工评分的相关性最高达 0.747，显著优于此前所有基于参考答案的评估器，同时通过级联评估与在线权重校准将评估成本降低超 72%。随着 PoQ-Judge 落地，从质量评估 → 评分 → 激励分配的完整流程已全部摆脱对参考答案的依赖，去中心化 LLM 推理的质量闭环就此打通。 DGrid AI 是一个去中心化的 AI 智能网络，致力于构建开放、透明、由社区驱动的 AI 基础设施。围绕模型调用与应用体验，DGrid 已推出多款核心产品：统一聚合全球主流大模型的 AI Gateway、AI 智能体一键部署平台 DClaw、匿名模型竞技平台 AI Arena，以及智能模型推荐助手 Dori，为开发者与用户提供一站式服务。据悉，DGrid AI 半年营收已突破 2000 万美元。

2026-06-15

去中心化 LLM

app_icon

ChainCatcher 与创新者共建Web3世界