AIエージェントフレームワークはパズルの最後のピースですか?フレームワークの「波動粒子二重性」はどのように解釈されますか?

ブロックブースター
2025-01-03 15:27:56
コレクション
Eliza、Rig、Swarms、ZerePy などのフレームワークは、Github Repo を通じて開発者を引き付け、評判を築いています。「ライブラリ」としてトークンを発行する形で、これらのフレームワークは光と同様に波と粒子の特性を持ち、Agent フレームワークは深刻な外部性と Memecoin の特性を同時に備えています。

著者: Kevin, BlockBoosterの研究者

AIエージェントフレームワークは、業界の発展における重要なピースとして、技術の実装とエコシステムの成熟を促進する二重の潜在能力を秘めている可能性があります。市場で注目されているフレームワークには、Eliza、Rig、Swarms、ZerePyなどがあります。これらのフレームワークは、Github Repoを通じて開発者を惹きつけ、評判を築いています。「ライブラリ」としてトークンを発行する形式は、これらのフレームワークが光と同時に波と粒子の特性を持つことを示しています。エージェントフレームワークは、厳格な外部性とMemecoinの特性を同時に持っています。本稿では、フレームワークの「波粒二重性」と、エージェントフレームワークがなぜ最後のピースになり得るのかを重点的に解読します。

エージェントフレームワークがもたらす外部性は、バブルが収束した後に春の芽を残すことができる

GOATの誕生以来、エージェントの物語が市場に与える影響力は増しており、まるで武道の達人のように、左拳は「Memecoin」、右手は「業界の希望」で、どちらか一方で敗北することになるでしょう。実際、AIエージェントの適用シーンは厳密に区別されておらず、プラットフォーム、フレームワーク、具体的なアプリケーションの境界は曖昧ですが、トークンやプロトコルの好みに基づいて大まかに分類することは可能です。しかし、トークンやプロトコルの発展の好みに基づいて、以下のように分類することができます:

  • Launchpad:資産発行プラットフォーム。Baseチェーン上のVirtuals Protocolとclanker、SolanaチェーンのDasha。
  • AIエージェントアプリ:エージェントとMemecoinの間を漂い、メモリの構成において優れた点があるもの、例えばGOAT、aixbtなど。これらのアプリは一般的に一方向の出力であり、入力条件は非常に限られています。
  • AIエージェントエンジン:SolanaチェーンのgriffainおよびbaseチェーンのSpectre AI。griffainは読み書きモードから読み、書き、行動のモードに進化することができます;Spectre AIはRAGエンジンで、チェーン上の検索を行います。
  • AIエージェントフレームワーク:フレームワークプラットフォームにとって、エージェント自体が資産であるため、エージェントフレームワークはエージェントの資産発行プラットフォームであり、エージェントのLaunchpadです。現在、代表的なプロジェクトにはai16、Zerebro、ARC、そして最近話題のSwarmsがあります。
  • その他の小さな方向性:総合型エージェントSimmi;AgentFiプロトコルMode;反証型エージェントSeraph;リアルタイムAPIエージェントCreator.Bid。

エージェントフレームワークをさらに議論すると、それが十分な外部性を持っていることがわかります。主要なパブリックチェーンやプロトコルの開発者が異なる開発言語環境の中で選択することしかできないのに対し、業界全体の開発者規模は市場価値の増加に対応して成長していません。Github RepoはWeb2とWeb3の開発者が合意を形成する場であり、ここで開発者コミュニティを構築することは、どのプロトコルが単独で開発した「ワンクリックで使える」パッケージよりも、Web2の開発者にとってより強力な魅力と影響力を持っています。

本稿で言及された4つのフレームワークはすでにオープンソースです:ai16zのElizaフレームワークは6200スターを獲得;ZerebroのZerePyフレームワークは191スターを獲得;ARCのRIGフレームワークは1700スターを獲得;SwarmsのSwarmsフレームワークは2100スターを獲得しています。現在、Elizaフレームワークはさまざまなエージェントアプリケーションで広く使用されており、最も広範囲にカバーされています。ZerePyの開発レベルはそれほど高くなく、発展方向は主にXにあり、ローカルLLMや統合メモリをサポートしていません。RIGは相対的に開発難易度が最も高いですが、開発者に最大限のパフォーマンス最適化の自由を提供します。Swarmsはチームがmcsを発表した以外には他のユースケースはありませんが、Swarmsは異なるフレームワークを統合できるため、大きな想像の余地があります。

さらに、上記の分類でエージェントエンジンとフレームワークを分けることは、混乱を招くかもしれません。しかし、私は両者には違いがあると考えています。まず、なぜエンジンなのか?現実の検索エンジンを例に挙げると、比較的適切です。同質化したエージェントアプリとは異なり、エージェントエンジンのパフォーマンスはその上にありますが、同時に完全にカプセル化されており、APIインターフェースを通じて調整されるブラックボックスです。ユーザーはフォークの形式でエージェントエンジンのパフォーマンスを体験できますが、基本フレームワークのように全貌やカスタマイズの自由を把握することはできません。各ユーザーのエンジンは、調整されたエージェントの上に生成されたイメージのようなものであり、イメージに対してインタラクションを行います。一方、フレームワークはチェーンに適合するために存在します。エージェントがエージェントフレームワークを作る最終目的は、対応するチェーンとの統合です。データの相互作用の方法、データ検証の方法、ブロックサイズの定義、コンセンサスとパフォーマンスのバランスを取る方法など、これらはフレームワークが考慮すべき事項です。一方、エンジンは特定の方向において、モデルとデータの相互作用、メモリとの関係を十分に微調整すればよく、パフォーマンスが唯一の評価基準となりますが、フレームワークはそうではありません。

「波粒二重性」の視点でエージェントフレームワークを評価することは、正しい方向に進むための前提かもしれない

エージェントが一度の入力出力のライフサイクルを実行するには、3つの部分が必要です。まず、基盤となるモデルが思考の深さと方法を決定し、次にメモリがカスタマイズの場所であり、基盤モデルが出力を持った後、メモリに基づいて修正され、最後に異なるクライアントで出力操作を完了します。

出典:@SuhailKakar

エージェントフレームワークが「波粒二重性」を持つことを証明するために、「波」は「Memecoin」の特性を持ち、コミュニティ文化と開発者の活発さを表し、エージェントの魅力と伝播能力を強調します;「粒」は「業界の期待」の特性を表し、基盤の性能、実際のユースケース、技術の深さを示します。私は、2つの側面から3つのフレームワークの開発チュートリアルを例に説明します:

簡単に組み立てられるElizaフレームワーク

  1. 環境を設定する

出典:@SuhailKakar

  1. Elizaをインストールする

出典:@SuhailKakar

  1. 設定ファイル

出典:@SuhailKakar

  1. エージェントの性格を設定する

出典:@SuhailKakar

Elizaのフレームワークは比較的扱いやすいです。これはTypeScriptに基づいており、ほとんどのWebおよびWeb3開発者が慣れ親しんでいる言語です。フレームワークはシンプルで、過度に抽象化されておらず、開発者が自分の望む機能を簡単に追加できるようになっています。ステップ3を通じて、Elizaは複数のクライアント統合が可能であり、これは複数のクライアント統合のアセンブラとして理解できます。ElizaはDC、TG、Xなどのプラットフォームをサポートし、さまざまな大規模言語モデルをサポートしており、上記のソーシャルメディアを通じて入力し、LLMモデルを出力し、内蔵のメモリ管理をサポートしており、任意の習慣を持つ開発者がAIエージェントを迅速に展開できるようにします。

フレームワークのシンプルさとインターフェースの豊富さにより、Elizaは接続のハードルを大幅に下げ、比較的統一されたインターフェース標準を実現しました。

ワンクリックで使用できるZerePyフレームワーク

  1. ZerePyのライブラリをフォークする

出典: https://replit.com/@blormdev/ZerePy?v=1

  1. XとGPTを設定する

出典: https://replit.com/@blormdev/ZerePy?v=1

  1. エージェントの性格を設定する

出典: https://replit.com/@blormdev/ZerePy?v=1

パフォーマンス最適化型のRigフレームワーク

RAG(検索強化生成)エージェントを構築する例:

  1. 環境とOpenAIキーを設定する

出典:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

  1. OpenAIクライアントを設定し、Chunkingを使用してPDFを処理する

出典:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

  1. ドキュメント構造と埋め込みを設定する

出典:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

  1. ベクトルストレージとRAGエージェントを作成する

出典:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

Rig(ARC)は、Rust言語に基づくLLMワークフローエンジンのAIシステム構築フレームワークであり、より基盤的な性能最適化の問題を解決することを目的としています。言い換えれば、ARCはAIエンジンの「ツールボックス」であり、AI呼び出し、性能最適化、データストレージ、異常処理などのバックエンドサポートサービスを提供します。

Rigが解決しようとしているのは「呼び出し」問題であり、開発者がLLMをより良く選択し、プロンプトを最適化し、トークンをより効果的に管理し、同時処理をどのように扱い、リソースを管理し、遅延を減らすかに焦点を当てています。そのため、AI LLMモデルとAIエージェントシステムの協力プロセスにおいて「それをうまく使う」ことが重要です。

++Rig++は、LLM駆動のアプリケーション(RAGエージェントを含む)の開発を簡素化することを目的としたオープンソースのRustライブラリです。Rigのオープン度が高いため、開発者に対する要求も高く、Rustとエージェントの理解が必要です。ここでのチュートリアルは、最も基本的なRAGエージェントの設定プロセスです。RAGはLLMと外部知識検索を組み合わせてLLMを強化します。公式サイトの他のデモでは、Rigが以下の特性を持っていることがわかります:

  • LLMインターフェースの統一:異なるLLMプロバイダーの一貫したAPIをサポートし、統合を簡素化します。
  • 抽象ワークフロー:事前構築されたモジュール化コンポーネントにより、Rigは複雑なAIシステムの設計を受け入れることができます。
  • ベクトルストレージの統合:内蔵の裁体ストレージサポートにより、RAGエージェントなどの類似の検索型エージェントで高効率のパフォーマンスを提供します。
  • 柔軟な埋め込み:埋め込みを処理するための使いやすいAPIを提供し、RAGエージェントなどの類似の検索型エージェントの開発時に意味理解の難易度を下げます。

Elizaと比較すると、Rigは開発者に追加のパフォーマンス最適化の余地を提供し、開発者がLLMとエージェントの呼び出しと協力の最適化をより良くデバッグできるようにします。RigはRustの駆動性のパフォーマンスを利用し、Rustの利点を活かしたゼロコストの抽象化とメモリ安全性、高パフォーマンス、低遅延のLLM操作を実現します。これにより、基盤レベルでより豊かな自由度を提供します。

分解組み合わせ型のSwarmsフレームワーク

Swarmsは、企業向けの生産レベルのマルチエージェントオーケストレーションフレームワークを提供することを目的としており、公式サイトでは数十種類のワークフローとエージェントの並行・直列アーキテクチャを提供しています。ここではその一部を紹介します。

順次ワークフロー

出典:https://docs.swarms.world

順次Swarmアーキテクチャは、タスクを線形順序で処理します。各エージェントは、次のエージェントに結果を渡す前に自分のタスクを完了します。このアーキテクチャは、秩序ある処理を保証し、タスクに依存関係がある場合に非常に便利です。

ユースケース:

  • ワークフロー内の各ステップが前のステップに依存している場合、例えば組立ラインや順次データ処理。
  • 操作の順序を厳密に守る必要があるシナリオ。

階層型アーキテクチャ:

出典:https://docs.swarms.world

上位エージェントが各下位エージェント間のタスクを調整することで、上から下への制御を実現します。各エージェントは同時にタスクを実行し、その結果をフィードバックして最終的に集約します。これは、高度に並列化可能なタスクに非常に便利です。

スプレッドシート型アーキテクチャ:

出典:https://docs.swarms.world

同時に作業する複数のエージェントを管理するための大規模な群体アーキテクチャです。数千のエージェントを同時に管理でき、それぞれのエージェントが独自のスレッドで実行されます。これは、大規模なエージェントの出力を監視するのに理想的な選択肢です。

Swarmsは単なるエージェントフレームワークではなく、上記のEliza、ZerePy、Rigフレームワークとも互換性があり、モジュール化の考え方で異なるワークフローやアーキテクチャの中でエージェントのパフォーマンスを最大限に引き出し、対応する問題を解決します。Swarmsの構想と開発者コミュニティの進展には問題がありません。

  1. Eliza:使いやすさが最も高く、初心者や迅速なプロトタイプ開発に適しており、特にソーシャルメディアプラットフォームのAIインタラクションに適しています。フレームワークはシンプルで、迅速な統合と修正が容易で、過度なパフォーマンス最適化を必要としないシナリオに適しています。
  2. ZerePy:ワンクリックでデプロイ可能で、Web3やソーシャルプラットフォームのAIエージェントアプリケーションの迅速な開発に適しています。軽量なAIアプリケーションに適しており、フレームワークはシンプルで、柔軟な設定が可能で、迅速な構築と反復に適しています。
  3. Rig:パフォーマンス最適化に重点を置いており、特に高い同時処理と高パフォーマンスのタスクで優れた性能を発揮し、細かな制御と最適化が必要な開発者に適しています。フレームワークは比較的複雑で、一定のRustの知識が必要で、より経験豊富な開発者に適しています。
  4. Swarms:企業向けのアプリケーションに適しており、複数のエージェントの協力と複雑なタスク管理をサポートします。フレームワークは柔軟で、大規模な並列処理をサポートし、さまざまなアーキテクチャ構成を提供しますが、その複雑さのために、効果的に適用するにはより強い技術的背景が必要かもしれません。

全体として、ElizaZerePyは使いやすさと迅速な開発において優位性を持ち、RigSwarmsは高パフォーマンスと大規模処理を必要とする専門の開発者や企業アプリケーションにより適しています。

これがエージェントフレームワークが「業界の希望」の特性を持つ理由です。上記のフレームワークはまだ初期段階にあり、急務は先発優位を確保し、活発な開発者コミュニティを築くことです。フレームワーク自体の性能の高さや、相対的にWeb2の人気アプリケーションに対して遅れているかどうかは主要な矛盾ではありません。開発者が絶え間なく流入するフレームワークだけが最終的に勝利することができるのです。なぜなら、Web3業界は常に市場の注目を引きつける必要があり、フレームワークの性能がどれほど優れていても、基本的な面での強さがあっても、使いにくさが原因で誰も関心を持たなければ本末転倒だからです。フレームワーク自体が開発者を惹きつけることができる前提のもとで、より成熟した完全なトークン経済モデルを持つフレームワークが際立つでしょう。

エージェントフレームワークが「Memecoin」特性を持つことは非常に理解しやすいです。上記のフレームワークのトークンには合理的なトークン経済設計がなく、トークンにはユースケースがないか、ユースケースが非常に単一で、検証されたビジネスモデルも存在せず、実行可能なトークンのフライホイールもありません。フレームワークは単なるフレームワークであり、トークンとの有機的な結合が完了していません。トークン価格の上昇はFOMOを除いて、基本的な面での支援を得ることが難しく、安定した持続的な価値の成長を確保するための十分な防御線がありません。同時に、上記のフレームワーク自体も比較的粗雑であり、その実際の価値と現在の市場価値は一致していないため、強い「Memecoin」の特性を持っています。

注意すべきは、エージェントフレームワークの「波粒二重性」は欠点ではなく、単純に「純粋なMemecoinでもなく、トークンのユースケースもない半端なもの」と理解してはいけません。私が前回の記事で述べたように、軽量なエージェントは曖昧なMemecoinのベールを覆っており、コミュニティ文化と基本面はもはや矛盾しないでしょう。新しい資産の発展パスが徐々に浮かび上がっています;エージェントフレームワークは初期にバブルと不確実性が存在しますが、開発者を惹きつけ、アプリケーションの実装を促進する潜在能力は無視できません。将来的には、完全なトークン経済モデルと強力な開発者エコシステムを持つフレームワークが、この分野の重要な柱となるでしょう。

BlockBoosterについて: BlockBoosterは、OKX Venturesおよび他のトップ機関によって支援されているアジアのWeb3ベンチャースタジオであり、優れた起業家の信頼できるパートナーになることを目指しています。私たちは戦略的投資と深いインキュベーションを通じて、Web3プロジェクトと現実世界をつなぎ、質の高い起業プロジェクトの成長を支援します。

免責事項: 本文/ブログは参考のためのものであり、著者の個人的な見解を表しており、BlockBoosterの立場を代表するものではありません。本稿は意図的に提供するものではありません:(i) 投資アドバイスまたは投資推奨;(ii) デジタル資産の購入、販売、または保有のオファーまたは勧誘;または (iii) 財務、会計、法律、または税務アドバイス。デジタル資産、安定コイン、NFTを保有することは非常にリスクが高く、価格の変動が大きく、最終的には無価値になる可能性があります。あなたは自身の財務状況に基づいて、デジタル資産の取引または保有が適しているかどうかを慎重に考慮すべきです。具体的な状況に関する質問がある場合は、法律、税務、または投資の顧問に相談してください。本稿で提供される情報(市場データや統計情報を含む、あれば)は一般的な参考のためのものです。これらのデータや図表を作成する際には合理的な注意を払っていますが、表現された事実の誤りや省略については責任を負いません。

ChainCatcherは、広大な読者の皆様に対し、ブロックチェーンを理性的に見るよう呼びかけ、リスク意識を向上させ、各種仮想トークンの発行や投機に注意することを提唱します。当サイト内の全てのコンテンツは市場情報や関係者の見解であり、何らかの投資助言として扱われるものではありません。万が一不適切な内容が含まれていた場合は「通報」することができます。私たちは迅速に対処いたします。
チェーンキャッチャー イノベーターとともにWeb3の世界を構築する