QRコードをスキャンしてダウンロードしてください。
BTC $77,265.73 +3.04%
ETH $2,432.35 +3.70%
BNB $644.59 +1.67%
XRP $1.48 +2.22%
SOL $89.07 +0.09%
TRX $0.3276 +0.18%
DOGE $0.1000 +1.22%
ADA $0.2602 +0.48%
BCH $454.18 +1.02%
LINK $9.66 +1.56%
HYPE $44.73 +2.21%
AAVE $116.02 +0.88%
SUI $1.00 +0.35%
XLM $0.1750 +3.84%
ZEC $329.66 -2.30%
BTC $77,265.73 +3.04%
ETH $2,432.35 +3.70%
BNB $644.59 +1.67%
XRP $1.48 +2.22%
SOL $89.07 +0.09%
TRX $0.3276 +0.18%
DOGE $0.1000 +1.22%
ADA $0.2602 +0.48%
BCH $454.18 +1.02%
LINK $9.66 +1.56%
HYPE $44.73 +2.21%
AAVE $116.02 +0.88%
SUI $1.00 +0.35%
XLM $0.1750 +3.84%
ZEC $329.66 -2.30%

合成データ

TetherはAIモデルのトレーニング用に合成データセットQVAC Genesis Iを発表し、AIアプリケーションQVAC Workbenchをリリースしました。

ChainCatcher のメッセージによると、公式ブログで、Tether Data の AI 研究部門 QVAC が QVAC Genesis プロジェクトを発表し、合成データセット Genesis I をリリースしました。このデータセットには 410 億のテキストマークが含まれており、世界中でよりスマートで正確な STEM 言語モデルを構築するのに役立ちます。訓練されたモデルは単語と関連する論理を理解することができます。これは教育と科学の基準に厳格に検証されており、数学や物理などの分野で卓越した推論能力と問題解決能力を示しています。教育コンテンツのために特別に構築され、厳格に検証された初の公開合成データセットであり、重要な STEM 分野の公開訓練データセットの不足を補います。QVAC Genesis I は、オープンで高品質なデータを通じて、人工知能の訓練の権限を一般に返還することを目指しています。さらに、Tether Data は初の消費者向けアプリ QVAC Workbench を発表しました。これは人工知能愛好者などを対象にしており、さまざまな大型言語モデルをサポートしています。このアプリはスマートフォン(現在は Android のみ、iOS は近日中にリリース予定)とデスクトッププラットフォームに対応しており、包括的なローカルデバイスサポートを提供します。ユーザーがこのアプリを使用する際、チャットやインタラクションデータは 100% プライベートであり、「委託推論」機能はモバイル版とデスクトップ版を接続し、ワークステーションのリソースを最大限に活用します。

マスクはAIのトレーニングデータが尽きたという見解に同意し、合成データが未来の方向性になると述べた。

ChainCatcher のメッセージによると、TechCrunch の報道で、イーロン・マスクは Stagwell の会長マーク・ペンとのライブ対話の中で、現在の AI モデルのトレーニングは実世界のデータをほぼ使い果たしており、「私たちは人類の知識の蓄積の総和を使い尽くしました。これは昨年に起こりました。」と述べました。マスクは、前 Open AI のチーフサイエンティストであるイリヤ・サツケバーと同じ見解を持っており、彼は NeurIPS 機械学習会議で AI 業界が「データのピーク」に達しており、今後はモデル開発の方法を変える必要があると提案しました。マスクは、合成データが実データを補完する手段になると考えており、AI は生成と自己評価データを通じて自己学習を実現すると述べています。この傾向は、マイクロソフト、Meta、Open AI、Anthropic などのテクノロジー大手によって採用されており、マイクロソフトの Phi-4 モデルやグーグルの Gemma モデルは、実データと合成データを組み合わせてトレーニングされています。ガートナーは、2024年の AI および分析プロジェクトの約 60% のデータが合成生成されると予測しています。合成データの利点にはコスト削減が含まれます。例えば、AI スタートアップの Writer は、ほぼ完全に合成データに基づく Palmyra X 004 モデルを開発するのに約 70 万ドルを費やしましたが、同規模の Open AI モデルの開発コストは約 460 万ドルです。しかし、合成データにはリスクもあり、モデルの創造性の低下、出力の偏りの悪化、そして潜在的なモデルの崩壊が含まれます。特に、トレーニングデータ自体に偏りがある場合、生成結果にも影響を与える可能性があります。
app_icon
ChainCatcher Building the Web3 world with innovations.