巨頭が配置を争い、VCが狂ったように資金を投じて、「AIが心を読む」ためにこれらの企業が狂ったように競い合っている。

業界速報
2024-10-16 22:30:12
コレクション
AIが人類を覆す第一歩:人の心を読み解く。

著者:Lexie

編集:Lu

AIに関する大きな議論の中で、人々はその役割を、私たちの最も信頼できる効率的なアシスタントとするか、私たちを覆す「機械軍団」とするかのいずれかに位置づけています。敵か味方かにかかわらず、AIは人間が設定したタスクを完了するだけでなく、「人の心を読む」能力も求められています。この「読心」能力は、今年のAI分野の重要なテーマとなっています。

PitchBookが今年発表した企業SaaS新興技術研究報告書では、「感情AI」が大きな技術的ハイライトとなっています。これは、感情計算と人工知能技術を使用して人間の感情を感知、理解し、相互作用を行うことを指し、テキスト、顔の表情、声、その他の生理的信号を分析することで人間の感情を理解しようとしています。簡単に言えば、感情AIは機械が人間のように、あるいはそれ以上に「感情を読み取る」ことを目指しています。

その主な技術には以下が含まれます:

  • 顔の表情分析:カメラ、コンピュータビジョン、深層学習を通じて微表情と顔の筋肉の動きを検出します。

  • 音声分析:声紋、トーン、リズムを通じて感情状態を認識します。

  • テキスト分析:自然言語処理(NLP)技術を用いて文と文脈を解釈します。

  • 生理信号モニタリング:ウェアラブルデバイスを使用して心拍数、皮膚反応などを分析し、インタラクションの個別化と感情の豊かさを向上させます。

Emotion AI

感情AIの前身は感情分析技術で、主にテキストインタラクションを通じて分析を行います。例えば、ソーシャルメディア上でのテキストを通じてユーザーの感情を分析・抽出しますが、AIの支援を受けることで、視覚や音声などの多様な入力方法を統合し、感情AIはより正確で完全な感情分析を約束します。

01 VCが資金を提供、スタートアップが巨額の資金調達

硅兔君は、感情AIの潜在能力が多くの投資家の注目を集めていることを観察しています。この分野に特化したスタートアップ、UniphoreやMorphCastなどは、この分野で大量の投資を受けています。

カリフォルニアのUniphoreは2008年から企業向けの自動対話ソリューションを提供することを探求しており、U-Self Serve、U-Assist、U-Capture、U-Analyzeなどの複数の製品ラインを開発しています。これにより、顧客は音声、テキスト、視覚、感情AI技術を通じて、より個別化され、感情豊かなインタラクションを実現できます。U-Self Serveは、対話中の感情やトーンを正確に識別し、企業がより個別化されたサービスを提供し、ユーザーの参加満足度を向上させることを目指しています;

U-Self Serve

U-Assistは、リアルタイムのガイダンスとワークフローの自動化を通じてカスタマーサービスエージェントの作業効率を向上させます。U-Captureは、自動化された感情データの収集と分析を通じて、企業が顧客のニーズと満足度を深く洞察できるようにします。一方、U-Analyzeは、顧客がインタラクションの中での重要なトレンドや感情の変化を特定し、データに基づいた意思決定をサポートしてブランドの忠誠心を高める手助けをします。

Uniphoreの技術は、単に機械が言語を理解することを目指すのではなく、人間とのインタラクションの中で、トーンや表情の背後に隠された感情を捉え、解釈することを目指しています。この能力により、企業は顧客とのインタラクションにおいて、単なる機械的な対応ではなく、顧客の感情的なニーズをより良く満たすことができるようになります。Uniphoreを使用することで、企業のユーザー満足度は87%に達し、カスタマーサービスのパフォーマンスは30%向上します。

Uniphoreはこれまでに6.2億ドル以上の資金調達を完了しており、最近のラウンドでは2022年にNEAがリードした4億ドルの投資があり、March Capitalなどの既存の投資家も参加しました。このラウンド後の評価額は25億ドルに達しました。

Uniphore

Hume AIは、世界初の共感できる音声AIを発表しました。これは前Googleの科学者Alan Cowenによって設立され、彼は音声、顔、ジェスチャーの微妙な違いを明らかにすることで感情体験と表現を理解する「意味空間理論」を創出したことで知られています。Cowenの研究成果は「Nature」や「Cognitive Science Trends」などの多くのジャーナルに発表されており、これまでの研究範囲で最も広範で多様な感情サンプルを含んでいます。

この研究を基にHumeは対話型音声API - EVIを開発しました。これは大規模言語モデルと共感アルゴリズムを組み合わせており、人間の感情状態を深く理解し解析することができます。EVIは音声中の感情を認識するだけでなく、ユーザーとのインタラクションにおいてより繊細で個別化された反応を示すことができ、開発者は数行のコードでこれらの機能を使用し、任意のアプリケーションに組み込むことができます。

Hume AI

現在のほとんどのAIシステムの主な制約の一つは、その指示が主に人間から与えられることです。これらの指示やヒントは誤りやすく、人工知能の巨大な潜在能力を引き出すことができません。一方、Humeが開発した共感大型言語モデル(eLLM)は、文脈やユーザーの感情表現に応じて使用する言葉やトーンを調整することができます。人間の幸福を第一原則として機械の学習、調整、インタラクションを行うことで、心理的健康、教育訓練、緊急呼び出し、ブランド分析などのさまざまなシーンでユーザーにより自然でリアルな体験を提供します。

今年の3月、Hume AIはEQT Venturesがリードした5000万ドルのBラウンド資金調達を完了しました。投資者にはUnion Square Ventures、Nat Friedman & Daniel Gross、Metaplanet、Northwell Holdingsなどの機関が含まれています。

この分野には、消費者の認知と感情反応を測定することに特化したEntropikもあります。Decodeという機能を通じて、感情AI、行動AI、生成AI、予測AIの統合された力を活用し、消費者の行動や好みをよりよく理解し、より個別化されたマーケティング提案を提供します。Entropikは最近、2023年2月に2500万ドルのBラウンド資金調達を完了し、投資者にはSIG Venture CapitalやBessemer Venture Partnersが含まれています。

Entropik

02 巨頭の参入、混戦の様相

テクノロジー大手は自社の強みを活かし、感情AIの分野にも進出しています。

Microsoft Azureの認知サービスの感情APIは、顔の表情や感情を分析することで、画像や動画の中の喜び、怒り、悲しみ、驚きなどの多様な感情を識別できます。

IBM Watsonの自然言語理解APIは、大量のテキストデータを処理し、背後にある感情傾向(ポジティブ、ネガティブ、中立など)を識別することで、ユーザーの意図をより正確に解釈します。

Google Cloud AIのCloud Vision APIは強力な画像分析機能を持ち、画像中の感情表現を迅速に識別でき、文字認識や感情関連もサポートしています。

AWSのRekognitionも感情を検出し、顔の特徴を識別し、表情の変化を追跡できます。また、他のAWSサービスと組み合わせて使用することで、完全なソーシャルメディア分析や感情AI駆動のマーケティングアプリケーションを構築できます。

Cloud Vision API

一部のスタートアップは感情AIの研究開発をさらに加速させており、テクノロジー大手が「人材を引き抜く」ほどの状況に至っています。例えば、ユニコーン企業Inflection AIは、投資家のMicrosoftにAIチームとモデルが注目され、Bill Gates、Eric Schmidt、NVIDIAなどと共にInflection AIに13億ドルを投資した後、AIのリーダーでありInflection AIの共同創設者の一人であるMustafa Suleymanにオファーを出しました。その結果、Suleymanは70人以上の従業員と共にMicrosoftに移籍し、Microsoftはこれに対して約6.5億ドルを支払いました。

しかし、Inflection AIはすぐに体制を整え、Google翻訳、AIコンサルティング、ARなどのバックグラウンドを持つ新しいチームを結成し、コア製品であるPiに引き続き注力しています。Piはユーザーの感情を理解し応答することができる個人アシスタントで、従来のAIとは異なり、ユーザーとの感情的なつながりを重視しています。音声やテキストなどの入力を分析して感情を感知し、対話の中で共感を示します。Inflection AIはPiをコーチ、親友、傾聴者、創造的なパートナーと見なしており、単なるAIアシスタントではありません。さらに、Piは強力な記憶機能を持ち、ユーザーの複数の対話履歴を記憶し、インタラクションの連続性と個別化された体験を向上させます。

Inflection AI Pi

03 発展の道、関心と疑問が共存

感情AIは、より人間的なインタラクションの方法への期待を寄せていますが、すべてのAI技術と同様に、その普及には関心と疑問が伴います。まず、感情AIは本当に人間の感情を正確に解読できるのでしょうか?理論的には、この技術はサービス、デバイス、技術の体験をより豊かにすることができますが、現実的な観点から見ると、人間の感情は本質的に曖昧で主観的です。2019年には研究者がこの技術に疑問を呈し、顔の表情が人間の真の感情を信頼できる形で反映しないことを指摘しました。そのため、単に機械に人間の顔の表情、姿勢、トーンを模倣させて感情を理解させることには限界があります。

次に、厳格な規制もAIの発展の障害となっています。例えば、EUのAI法案は教育などの分野でコンピュータビジョンによる感情検出システムの使用を禁止しており、これが特定の感情AIソリューションの普及を制限する可能性があります。また、アメリカのイリノイ州などでは、許可なしに生体認識データを収集することを禁止する法律があり、これが感情AIの特定の技術使用の前提を直接制限しています。同時に、データのプライバシーと保護は重要な問題であり、感情AIは教育、健康、保険などデータプライバシーに特に厳しい分野で使用されることが多いため、感情データの安全かつ合法的な使用を確保することは、すべての感情AI企業が直面する課題です。

最後に、異なる文化や地域の人々の間でのコミュニケーションや感情の解釈は難題であり、AIにとっても試練です。例えば、異なる地域での感情の理解や表現方法は異なり、これが感情AIシステムの有効性や完全性に影響を与える可能性があります。また、感情AIは人種、性別、性自認に関する偏見を扱う際にも困難に直面することがあります。

感情AIは人手を減らす効率を約束するだけでなく、人の心を読む思いやりも持っていますが、それが本当に人間のインタラクションにおける万能の解決策となるのか、それともSiriと大差ないスマートアシスタントとなり、真の感情理解が必要なタスクにおいて平凡な結果を示すのかは疑問です。おそらく将来的には、AIの「読心術」が人間と機械、さらには人間同士のインタラクションを覆すことになるでしょうが、少なくとも今のところ、人間の感情を真に理解し応答するには、やはり人の関与と慎重さが必要です。

ChainCatcherは、広大な読者の皆様に対し、ブロックチェーンを理性的に見るよう呼びかけ、リスク意識を向上させ、各種仮想トークンの発行や投機に注意することを提唱します。当サイト内の全てのコンテンツは市場情報や関係者の見解であり、何らかの投資助言として扱われるものではありません。万が一不適切な内容が含まれていた場合は「通報」することができます。私たちは迅速に対処いたします。
チェーンキャッチャー イノベーターとともにWeb3の世界を構築する