DGrid AIは最新の研究論文PoQ-Judgeを発表し、複数のアーキテクチャ評価フレームワークを用いて分散型LLMの品質評価の閉ループを完成させました。
去中心化 AI 基盤インフラネットワーク DGrid AI は、本日最新の研究論文 "PoQ-Judge" を発表し、参照解答を必要としない多構造品質評価フレームワークを提案しました。これは、実際の展開環境では標準解答が比較のために存在しないことが多いことを意味し、プロトコルはモデルの回答の品質に対して信頼できる評価を行い、それに基づいてインセンティブを配分することができます。これは DGrid の去中心化 LLM 推論品質評価システムにおいて長らく欠けていた重要なピースです。
PoQ(Proof of Quality、品質証明)は DGrid が独自に開発したコンセンサスメカニズムであり、プロトコル層でモデル提供者が劣悪なモデルを提供したり、偽データを生成したり、計算コストを隠したりするのを防ぎ、サービスの品質と価格の透明性を確保します。DGrid チームは PoQ に関して継続的に研究を進めており、これまでに四篇の研究論文を発表しています。今回発表された PoQ-Judge は、異なる品質とコストシナリオをカバーする三つの評価モデルを訓練し、保持テストセットにおいて人工評価との相関性が最高で 0.747 に達し、これまでのすべての参照解答に基づく評価器を大幅に上回っています。また、級連評価とオンライン重み調整を通じて評価コストを 72% 以上削減しました。
PoQ-Judge の導入により、品質評価 → 評点 → インセンティブ配分の完全なプロセスはすべて参照解答への依存から解放され、去中心化 LLM 推論の品質のクローズドループが実現しました。
DGrid AI は去中心化の AI インテリジェントネットワークであり、オープンで透明性があり、コミュニティ主導の AI インフラを構築することを目指しています。モデルの呼び出しとアプリケーション体験に関して、DGrid は複数のコア製品を発表しています:世界の主要な大規模モデルを統合する AI Gateway、AI インテリジェントエージェントのワンクリックデプロイメントプラットフォーム DClaw、匿名モデル競技プラットフォーム AI Arena、そしてインテリジェントモデル推薦アシスタント Dori など、開発者とユーザーにワンストップサービスを提供しています。報告によれば、DGrid AI の半年間の収益は 2000 万ドルを突破しました。






