QRコードをスキャンしてダウンロードしてください。
BTC $95,072.37 +0.03%
ETH $3,320.33 +0.81%
BNB $944.48 +0.38%
XRP $2.06 -0.20%
SOL $142.30 -1.10%
TRX $0.3172 +1.70%
DOGE $0.1371 -0.21%
ADA $0.3930 -0.69%
BCH $592.57 -0.34%
LINK $13.79 +0.58%
HYPE $26.00 +3.28%
AAVE $173.27 -0.79%
SUI $1.77 -1.01%
XLM $0.2266 -0.25%
ZEC $397.56 -1.94%
BTC $95,072.37 +0.03%
ETH $3,320.33 +0.81%
BNB $944.48 +0.38%
XRP $2.06 -0.20%
SOL $142.30 -1.10%
TRX $0.3172 +1.70%
DOGE $0.1371 -0.21%
ADA $0.3930 -0.69%
BCH $592.57 -0.34%
LINK $13.79 +0.58%
HYPE $26.00 +3.28%
AAVE $173.27 -0.79%
SUI $1.77 -1.01%
XLM $0.2266 -0.25%
ZEC $397.56 -1.94%

CZは中国系の大学3年生に1100万ドルのシードラウンド投資を行い、教育エージェントを設立しました。

Summary: 主打一句话で個人専用の教育/解説動画を生成できる、K12向けの教育エージェント製品VideoTutorは、本日1100万ドルのシードラウンド資金調達を完了したことを発表しました。
おすすめの読書
2025-10-30 23:24:26
コレクション
主打一句话で個人専用の教育/解説動画を生成できる、K12向けの教育エージェント製品VideoTutorは、本日1100万ドルのシードラウンド資金調達を完了したことを発表しました。

原文タイトル:《赵长鹏投了一个华人大三学生,1100 万美元种子轮,做教育 Agent

原文著者:極客公園傘下の起業家コミュニティ Founder Park

華人大学3年生、1100万ドルのシードラウンド、シリコンバレーの学生起業で現在の資金調達最高製品。

主打一句話で個人専用の教育/解説動画を生成する、K12向けの教育エージェント製品VideoTutorが、本日1100万ドルのシードラウンド資金調達を完了したことを発表した。このラウンドの資金調達はYZi Labsがリードし、百度ベンチャーキャピタル、錦秋基金、Amino Capital、BridgeOne Capital、そして多くの著名投資家が共同で参加した。

これはYZi Labsが投資した初のAI製品会社でもある。

創業者のKai Zhao(趙凱)は、VideoTutorがCZおよびYZi Labsの投資チームの認識と支持を得て、最終的にYZi Labsがこのラウンドのリードを務めたと述べた。彼らは10以上のTS(投資意向書)を受け取り、最終的にこれらの企業を選択した。

5月14日に初版製品をオンラインにし(Founder Park製品マーケットで初発表)、市場の認識とPMFの検証を得て、5ヶ月足らずでこの1100万ドルのシードラウンド資金調達を完了した。

Kaiにとって、彼らがこの資金調達を得られた核心的な理由は、正しい方向性の下で「小天才チーム」が可視化学習の方法でK12トラックのアメリカの大学入試学習の痛点を解決したことだ。

「この分野は若者が取り組むのに適しており、非常に優れたエンジニアリング能力を持ち、創業者自身も非常に良いインサイトと経験を持ち、実行力が非常に速い。」

彼らだけでなく、Cursor、Mercor、Pika、GPTZeroなど、シリコンバレーの大学生たちは、次々と資金調達の新記録を打ち立てるAI製品を使って、AI起業に対する認識を刷新している。

AI時代の起業は、本当に少し違ってきた。

私たちはVideoTutorの若者たちと話をし、なぜ彼らがこのシードラウンドの資金調達を得られたのか、現在のシリコンバレーの起業がどのように変化しているのか、そしてなぜ彼らが国内の大手企業の社員を採用したいのかを知りたかった。

インタビューゲスト:CEO Kai Zhao、CTO James Zhan。

インタビュー&編集 | 万戸

以下はインタビュー内容で、Founder Parkが編集整理したもの。

K12トラック、可視化学習が真の方向性

Founder Park:これほど多くの機関があなたたちを高く評価している中で、あなたの見解では、どの点が彼らを感動させたと思いますか?

Kai:まず第一に、方向性が正しいことです。AI教育というトラックは非常に潜在能力と展望があります。私たちが切り込んでいる教育分野はアメリカの大学入試SAT、APです。ターゲットユーザーはK12の高校生で、私たちとこのユーザー群とのギャップは非常に小さく、基本的に世代間のギャップはありません。私たちは全ての受験学習サイクルを経て、試験と受験の痛点がどこにあるのかを知っており、本当にこの人々の痛点を解決する製品を作ることができます。

次に、チームが非常に優秀です。JamesはGemini出身で、GoogleではAIエンジニアリングとアルゴリズムのコアエンジニアを務めていました。私自身は3回の教育起業経験があり、大学1年生の時から教育ソフトウェアを作って起業し、大学2年生の時にはMathGPTProの設立に参加し、そのプロジェクトは奇績創壇に選ばれました。教育製品を成功裏に構築した経験があります。

第三に、私たちが取り組んでいるAI教育分野の核心はアニメーションエンジンであり、私たちはVideoTutorのコア開発者であり、核心技術を最も理解しているチームで、アニメーションエンジンを非常に正確にレンダリングすることができます。

チーム自体には非常に良いマーケティングの遺伝子があり、どのように広めるかを知っています。

VideoTutorはアメリカの主流VCの投資コンセンサスに非常に合致しており、「小天才チーム」と呼ばれています。これはこの分野が若者に適していることを指し、非常に優れたエンジニアリング能力を持ち、創業者自身が非常に良いインサイトと経験を持ち、実行力が非常に速いことを意味します。私はこれが全ての投資家が評価できる共通の理由だと思います。

VideoTutorがYZi Labs EASY Residency Demo Dayでニューヨーク証券取引所に登場

Founder Park:あなたたちの製品は教育業界のどの核心的な問題を解決したいと考えていますか?

Kai:現在市場にある学習製品は、主に2つのカテゴリに分けられます:能動的学習製品と受動的学習製品。受動的学習製品、例えば字節のGauth、Chegg、AnswersAiなどは、私たちが「宿題解答」(Homework Help)と呼ぶシーンをカバーしており、学習の流れは非常に短く、主に学生が宿題解答のために支払います。

一方、VideoTutorは能動的学習シーンをカバーしており、学生の学習動機を考慮する必要はありません。なぜなら、彼らは学ぶ必要があり、試験を受ける必要があるからです。例えばアメリカの大学入試SAT、APです。このシーンでは、可視化の痛点ニーズが大量に存在します。アメリカの大学入試の80%の内容は関数、微積分などの複雑な画像レンダリングが必要な知識に関わっています。VideoTutorのアニメーションエンジンはこのシーンを非常によく解決できます。

さらに、この分野の客単価は非常に高いです。アメリカでは毎年260万人の学生がSAT試験を受ける必要があり、支払いニーズは非常に大きいです。オフラインのSATコースは非常に高額で、パッケージではなく時間単位で請求され、平均して1時間150ドルから始まり、大部分は230ドルで請求されます。多くの学生と親は支払って学ぶことを選びます。しかし、VideoTutorは教師のトレーニングをうまく平行移動または置き換えることができ、現段階ではAI生成の動画と教師のトレーニング内容はほぼ違いがありません。これにより、学生は最低のコストで自分専用のAIパーソナライズされた受験教師を持つことができます。

Founder Park:あなたたちがこの製品を作ることを決定したきっかけは何ですか?

Kai:実は私たちの前に、スタンフォードにGatekeep Aiというチームがありました。彼らも可視化学習を目指していました。その時、私はこの方向性の影響力に気づいていました。最初の数回の起業では、皆が教育製品を作る際に基本的にGPTのAPIを接続し、ChatGPT Wrapperのような製品を作っていました。しかし、私たちは、単にテキストのQ&Aに基づく製品には限界があることに気づきました。CheggやGauthのビジネスが下降しているのが見えます。多くのシーンがChatGPTに取って代わられ、学生は20ドルを支払ってChatGPTを使えば多くの宿題の問題を解決できるからです。

APIを使った最適化レイヤーの製品は限界に達しています。

しかし、多モーダル視覚生成には非常に大きな前景があります。なぜなら、アメリカの大学入試の分野には非常に多くの可視化学習のシーンが存在するからです。残念ながらGatekeepは良いスタートを切りましたが、続けることができませんでした。なぜなら、彼らは少し早くリリースし、当時の基礎モデルのプログラミング能力はまだ成熟しておらず、GPT-4もまだリリースされていませんでした。さらに、数学アニメーションエンジンはレンダリングとアルゴリズムに関わるため、彼らはこの問題を克服できませんでした。しかし、私たちのチームはアニメーションエンジンの全てのコア開発を掌握し、この問題を解決し、動画レンダリングを非常に正確にしました。

PMF:ユーザーの支払い意欲が非常に強い

Founder Park:あなたたちの製品がオンラインになった後、いくつかの学校と協力関係を結びました。あなたたちの見解では、いつ、またはどの機能が「この製品は正しい、痛点を見つけた」と感じさせ、PMFを見つけたと感じましたか?

Kai:3つの次元から説明できます。

まず、収益指標の次元から見て、現在までにVideoTutorは1000社の企業からAPIリクエストを受けており、アメリカのすべての著名な大規模教育機関を含んでいます。さらには多くの学校がサービスを購入したいと考えています。C端ユーザーの意向はより直接的で、ある学生の親は投資家でもあり、製品を体験した後、製品をすべての親戚や友人に試用させ、全員が支払う意欲を示しました。そして、彼は私の電話番号をどこからか入手し、私にメッセージを送り、私たちに投資したいと言いました。C端ユーザーには非常に強い支払い意欲があります。

第二点は、ユーザーのニーズの側面からです。なぜアメリカのオフラインの1対1の家庭教師教育がそれほど強いのでしょうか?それは親が1対1の教育効果が良いと考え、そのためにお金を支払うからです。現在、多モーダルAI技術は人間のように1対1の教育効果を実現でき、質問に対して即座に答えます。また、アメリカのオンライン1対1の教育教師が録画したビデオ講義は、実際にはAI生成のビデオと違いがありません。これは私が言う「ニーズの平行移動」です。学生が高額で購入する録画コースは、私のAI生成のものと違いがないので、なぜAIを使わないのでしょうか?コストが低く、教育効果が高いからです。

私たちは多くの学生から非常に前向きなフィードバックを受けており、多くの教師もこの製品を広めたいと考えています。初期の完了率と使用時間は特に良好です。現在選別された200人のシードユーザーは、すべて初期に蓄積されたものです。

第三点は、製品のテイストとセンスです。あなたが絶えず行うと、教育業界全体の進歩から、学生と親の支払いの核心ニーズ、そして製品自体の進化まで、逆に考えると、全体の論理は閉じています。したがって、これら3つの次元から見ると、PMFはすでに十分であると感じます。最も核心的なのは、支払い意欲が非常に強いことです。

FIZZとの協力関係を結びました

Founder Park:多くのユーザーが自発的に支払いを希望し、また投資を希望して連絡してきます。

Kai:そうです。SAT、APのこの分野では、支払い意欲がもともと非常に強いです。この分野の客単価は100ドルから200ドルに達し、オフラインの授業はさらに高額で、800ドルかかることもあります。アメリカには260万人の学生がSATを受ける必要があり、そのうち37%の学生が自発的に支払います。これは支払い意欲と需要が非常に強い市場です。私たちの製品は非常に良いニーズの平行移動を実現できます。

Founder Park:SATのこのトラックでは、受験生にとって、リアルな教師とAIのどちらを信頼するのでしょうか?

Kai:現在、AIはアメリカの大学入試SAT、APのレベルの問題に対して、基本的に事実上の誤りを起こすことはほとんどありません。この状況で、なぜAIがオフラインの家庭教師よりも優れているのでしょうか?一つは安価で、もう一つは学生がどんな問題でも何度でも質問できることです。愚かな質問をした場合、教師がどう思うか、または不耐性を示すことを心配する必要はなく、24時間いつでもどこでも学ぶことができます。

さらに、この市場は平行移動可能で、アメリカ市場を終えた後、カナダやイギリスのA-Level試験などに平行移動できます。支払いニーズは非常に大きいです。

Founder Park:支払いの部分について、現在どのように考えていますか?

Kai:私たちは月額サブスクリプションを提供しており、学習結果に基づいて支払うオプションもあります。私は現在、AIが結果に基づいて支払うことができると考えています。例えば799ドルを支払えば、あなたの子供がSAT数学で満点を取ることを保証します。

Founder Park:しかし、試験結果に基づいて支払う場合、学生の個人の能動性も考慮する必要がありますよね?

Kai:これは国内の大学入試では難しいかもしれません。なぜなら、大学入試の評価ポイントは非常に多く、千以上あります。しかし、アメリカの大学入試SATは62の評価ポイントしかなく、そのうち50は通常の評価ポイントで、大部分の学生には問題ありません。残りの12の評価ポイントも基本的に習得できます。学生の論理レベルに問題がない限り、基本的に学べないということはありません。また、AIの効率向上効果は非常に顕著です。

実際、多くのアメリカのオンライン家庭教師もこのサービスを提供しています。あなたが教師に1800ドルを支払えば、教師が子供を指導し、成功率は基本的に100%です。なぜなら、SATの評価ポイントは固定されているからです。学生の知能レベルが正常であれば、基本的に問題はありません。しかし、大学入試はそうではありません。大学入試では短期間で成績を上げることはできません。また、国内の大学入試では点数差を広げる必要があり、難問が出題されますが、アメリカの大学入試には絶対的な難問は存在しません。なぜなら、主に知識点の習得を評価しているからです。

結果に基づいて支払うことは、以前の教科書の教師がすでに使用しているモデルであり、この前提条件を備えています。

Founder Park:あなたたちの価格設定において、モデルコストは悩みの種ですか?割合は高いですか?

Kai:この分野の客単価は非常に高く、69ドルからの月額料金で始まります。モデルコストは現在非常に安価で、問題ありません。教育業界はコーディング分野とは異なり、皆が価格競争に陥っているわけではありません。なぜなら、コーディングは長い文脈をサポートする必要があるからです。

高校生向けの製品、ウェブ版が最も重要

Founder Park:前回、あなたが言ったように、初版のプロトタイプは約2ヶ月で完成しました。当時の開発サイクル、例えば分業、どの機能を実装するか、どの機能を実装しないかはどのように考えましたか?

Kai:私たちのチーム全員の共通認識は、イテレーションを迅速に行うことです。なぜなら、早く行動することで早期ユーザーのフィードバックを迅速に得ることができるからです。

最初のバージョンをTwitterで発表した後、大きな反響を呼び、多くのユーザーを獲得しました。しかし、これらのユーザーの多くはプログラマー、投資家、またはテクノロジー愛好者であり、私たちは彼らを「テクノロジーの先駆者」と呼ぶことができます。その段階では、彼らから得られるフィードバックは比較的分散しており、あまり価値がありませんでした。やはり、広範なユーザーの中から本当に核心的なシードユーザー、つまり質の高い高校生を選別し、コンサルティングの方法で有用なフィードバックを得る必要があります。

私たちが得た核心的なフィードバックは、動画レンダリングの精度が100%に達する必要があるということです。これは最も重要な最適化ポイントです。UIが美しいかどうか、または異なるTTSの声色選択をサポートするかどうかなどの機能はすべて削除されました。製品の核心に戻ると、私たちが行っているのは理科のシーンの知識学習であり、したがってグラフィックレンダリングの精度が核心です。

Founder Park:生成時間は当時どのように取捨選択しましたか?

Kai:その時の最高のピーク時間は約6分でした。当時の主要な考慮事項は、普通の問題の解説と知識点の解説は6分を超えてはならないということでした。しかし、その後のフィードバックで、学習能力があまり高くない学生が、内容をもう少しゆっくり、深く説明してほしいと希望していることが分かりました。私たちは、時間に制限を設けるべきではなく、むしろユーザーの学習能力に依存すべきだと認識しました。

Founder Park:現在、最長でどのくらいの時間になりますか?

Kai:最長で1時間以内に達するはずです。質問を続けることができます。リアルタイムで生成しながら交流しますが、この機能は最近追加されたもので、最初のバージョンにはありませんでした。

Founder Park:当時考えていたが、後に重要ではないと判断して先に進まなかった機能はありますか?

Kai:例えばアプリです。当時、アプリを迅速に開発すべきかどうかを考えましたが、後にアメリカの学生の大部分が基本的にLaptopやiPadを使って学んでいることが分かりました。アメリカのほとんどのK12学校は学生にChromebookを配布しており、コンピュータが高度に普及しています。高校生は基本的に一人一台のコンピュータを持っており、学習シーンにおけるスマートフォンの占有率は5%未満で、非常に低いです。

Founder Park:したがって、教育または学生向けの製品であれば、ウェブ版が最初に作成されるべきであり、アプリはそれほど重要ではないということですね。

Kai:はい、当時すでにこのデータを知っていました。結局、アメリカで何年も学んできたからです。その後、初期の数万ユーザーから100人の学生を選んで調査を行いましたが、その100人の学生の90人以上がコンピュータを持っていたため、私たちはこの点をさらに確信しました。

Founder Park:あなたたちが最初のバージョンをオンラインにした時、K12のグループをターゲットにしていたのですか?

Kai:はい、その後もこのグループをターゲットにしています。私たちはGauthとは競合ではなく、むしろ試験トレーニングシーンを作っています。アメリカの多くの高校生は、オフラインのトレーニングやオンライン学習プラットフォームを選択するため、VideoTutorはこのニーズをうまく平行移動させました。

Founder Park:K12は少なくとも今後2年間の核心ユーザー群になるのでしょうか?

Kai:おそらく2年以内の核心指標です。

大モデルを使用するが、大モデルに依存しない

Founder Park:あなたたちの現在の技術実現方案について簡単に紹介してください。VideoTutorはコースや図表の生成において、他の動画生成モデルよりもはるかに優れています。多くのモデルが文字さえ正確に生成できないとき、あなたたちの技術は驚くべきものです。

James:私たちが生成する動画には文字と図形の両方があります。大まかな生産プロセスは、大言語モデルに文字と対応するアニメーション指示を生成させ、その後アニメーション指示が私たちのアニメーションエンジンでレンダリングされ、最終的に動画として表示されます。

文字部分は比較的簡単で、大言語モデルにテキストを生成させ、それを直接レンダリングします。しかし、アニメーション部分は私たち自身の数学アニメーションレンダリングエンジンによって生成されます。その利点は、座標軸、幾何学的図形などの内容の精度が非常に高いことであり、これが私たちの核心技術です。

現在の大言語モデルはテキストだけを出力しますが、私たちが行っているこのエージェントは、大言語モデルに紙とペンを与え、彼らが想像する適切な教育アニメーションを描くことを可能にします。描かれた部分はすべて私たちの技術です。

Founder Park:動画の最終合成、音声と映像はどのように処理されていますか?

James:最初にユーザーはプロンプトを入力します。例えば「ピタゴラスの定理とは何か?」です。最初のステップでは、大言語モデルにすべてのシーンを推論させ、通常は3〜5のシーンを規定します。これは問題の難易度によります。次に、モデルは各シーンの大まかなスクリプトを生成します。その後、各シーンのスクリプトに基づいて2回目の推論を行い、シーン内の文字、対応する図形、人声のテキストを生成します。人声のテキストはTTSで合成されます。

最後に、すべてのシーンをつなぎ合わせて、完全な動画を構成します。

Founder Park:私は理解していますが、最初のバージョンはこのようなものでした。今、随時インタラクティブなプロセスが追加された後、生成プロセスにも変化がありましたか?

James:確かに変化がありました。現在、ユーザーが最初のシーンを最初に見ることができるように、最初のシーンを生成し、ユーザーが見ることができるようにします。後のシーンはバックグラウンドで引き続きレンダリングされます。ユーザーが質問をすると、彼の声をテキストに変換し、そのテキストを以前のすべてのシーンの内容と一緒に大言語モデルに渡して、次の教育シーンを計画させます。後続のシーンのレンダリングプロセスは以前と同じです。

Founder Park:もしユーザーが1分経った時に質問があった場合、彼は直接質問します。あなたたちはその質問を受け取った後、ユーザーの質問と以前に話した内容を一緒にモデルに処理させます。このプロセスで、ユーザーが質問を終えた後、アニメーションは続けて再生されるのか、それとも停止するのか?

James:現在の遅延は最初の20〜30秒から5秒以内に圧縮されています。インタラクションでは、ユーザーがこの5秒に過度に注意を払わないようにいくつかの移行を行います。全体のプロセスのつながりは非常にスムーズです。4〜5秒以内に、彼は彼の質問に基づいて新たに提示された内容を見ることができます。

現在の段階のデザインは、AI教師が「うん、考えてみます」と言い、黒板を一掃するような形です。あなたが講義に問題があると感じたら、私はそれを消して再度書き直すというプロセスは非常に自然に感じられます。

また、私たちはユーザーの質問を待つだけでなく、途中でクイズも行います。私たちはクイズのフィードバックとユーザーの質問に基づいて推論を行います。そして、私たちは完全に自由なマイクではなく、ユーザーがマイクを自発的にオンにする必要があります。オンとオフのアクションがあります。

Founder Park:したがって、このメカニズムに基づいて、最長で約1時間の解説を生成できるということですね。

James:正確には制限はありません。もし彼がずっと質問を持っているなら、ずっと質問し続けることができます。

Kai:はい、事前の制限はありません。実際、VideoTutorがこの方向に進むのは、多モーダルAIの進歩に伴うものであり、私たちはニーズを創造しているのではなく、既存のニーズをより良く満たすために努力しています。オフラインのリアル教育を見てください。なぜアメリカの親が高額なお金を支払うことを望むのでしょうか?アメリカの教育業界は主に1対1の教育であり、1時間100ドルから始まります。オフラインの教師はガイド式の質問を行うことができ、あなたがどこでつまずいているかを観察し、次に質問を続けます。VideoTutorもこのようなリアルな教師の教育効果を実現し、すべての子供がリアルタイムでインタラクションし、リアルタイムで教育を受けることができるようにしています。

Founder Park:学生が授業中にカメラをオンにすることを要求しますか?

Kai:あまりありません。学生がカメラをオンにするかどうかは、主にアメリカのプライバシー法に依存します。製品内では強制的にオンにする機能は設計されておらず、オンにするかどうかは学生の意志に依存します。主要なインタラクションは質問と音声フィードバックを通じて行われます。

Founder Park:技術的には、小さなモデルとクラウドの大モデルを組み合わせる戦略を採用していますか?それとも他の方法ですか?

Kai:それは組み合わせの一種です。私たちの内部にはデータセットがあり、現在10万以上の動画データがあります。これらのデータの中で良いものはすべて人工的に二次ラベリングされ、微調整モデルのトレーニングに使用されます。例えば、現在8000以上のSATサンプルトレーニングデータがあります。これらの微調整された小さなモデルは、クラウドの一般商用モデル(Claude、Geminiなど)と組み合わせて使用されます。

Founder Park:Claude、Gemini、またはGPTを使用することは、製品の核心性能に影響を与えますか?

Kai:私たちは主にK12分野に関与しており、基礎モデルのレベルはすでに十分です。しかし、100%の正確性を確保するために、2つのモデルを同時に呼び出して校正します。もし2つのモデルの答えが一致すれば、基本的に間違いはありません。コード生成に関しては、主にClaudeを使用しています。彼のコード能力は非常に優れています。

Founder Park:現在、製品の技術的なボトルネックはどこにありますか?モデル能力ですか、それともコード生成ですか?

Kai:モデル能力はその一環です。さらに、レンダリングもあります。現在、5秒以内に達することができ、GPUのさらなる展開により、さらに速くなります。もう一つは長期記憶能力です。私たちは学生の長期的な学習行動データを蓄積する必要があり、この学生がどの知識点を理解していないかを知る必要があります。例えば、1ヶ月前に学んだ知識点を忘れた場合、再度思い出させることができます。

James:私たちはレンダリング時間に多くの努力を注いでおり、技術的な突破を目指しています。最初の2分から1分、そして現在は10秒以内に達しました。私たちの最終目標は、基本的に遅延のないレンダリングを実現することです。ユーザーが質問をすると、推論が終了したらすぐに結果が出るようにしたいと考えています。これは私たちのチームが現在取り組んでいる課題ですが、新しい方向性を見つけました。

完了率を見ず、最終試験の点数を見る

Founder Park:現段階で製品の核心指標をどのように測定していますか?ユーザーにとって動画が有用であるかどうかをどう判断しますか?

Kai:最も核心的な指標は試験です。新しいバージョンでは、動画を見終わると、最後にクイズがあり、正解すれば理解したことを示し、間違えれば説明が不十分であることを示します。

学習効果は完了率だけでは測れません。ある学生は半分見ただけで理解するかもしれません。彼が半分見た時にテストを行い、合格すれば残りを見る必要はありません。私たちの製品の核心指標は、どれだけの学生がここで点数を上げたかを見ることです。

Founder Park:しかし、彼の最終試験は別のシーンで行われます。あなたたちは彼が合格したかどうかの結果をどう得るのですか?

Kai:これはアメリカの製品文化に関わります。ユーザーが製品を使用した後、良い結果を得ると、自発的にシェアする傾向があります。多くの学生がVideoTutorを使用した後、SATを受けた結果を自発的にシェアしに来ます。私たちは彼らをキャンパス大使にして、二次的な広報を行います。

私たちは20人の高校生からなるキャンパス大使を持っています。実際、Mercorは初期に非常に成功し、典型的な「ユーザー成功ストーリー」モデルを使用しました。Mercorは初期に多くのインドのプログラマーにアメリカでの仕事を見つける手助けをし、彼らはこれらのユーザーに連絡を取り、ユーザーストーリーを撮影して、どのようにMercorを使って仕事を見つけたかを語ります。これが良い口コミの広がりを生み出しました。VideoTutorも同様の理由で、私たちが求めているのは、より多くの学生が製品を使用した後、非常に良い結果を得て、その経験をユーザーストーリーとしてシェアすることです。

Founder Park:学生が主にシェアするチャネルはどこですか?

Kai:学生は主にTikTokで、親はFacebookのグループでシェアします。

Founder Park:もし時間を半年または1年の時間軸に置いた場合、あなたたちが計画している製品の成長方法はどのようなものですか?

Kai:本質的に、VideoTutorの核心はC端ユーザー製品であり、口コミの広がりが非常に重要です。多くの成功したAIアプリは初期にシードユーザーの口コミによって成り立っています。例えば、デザイナーが使って良いと感じたら、それが広がります。私たちにとっての核心指標は、どれだけのSAT受験生がこの製品を使用した後、高得点を取ったか、そしてそれを他の子供や親に広めるかです。親は主にFacebookやInstagramを使用し、学生はTikTokを使用します。私たちはこれらのプラットフォームで広めます。このような共通の口コミが形成されると、学校の教師も自然に気づくでしょう。私たちが初期にこれほど多くの学校に知られたのは、多くの教師が使って良いと感じ、学校の調達責任者に推薦したからです。したがって、最も核心的なのはC端ユーザーの口コミの広がりであり、どれだけの子供が使用した後に点数を上げたかが重要な指標です。

Founder Park:新バージョンの大まかな状態とリリースの時間計画はどのようなものですか?

Kai:私たちは最短で2ヶ月以内に正式にパブリックリリースを希望しています。その時、学生は非常に低い遅延で質問に対して即座に答えることができ、理科シーンのグラフィックレンダリングが100%の精度を達成できるようになります。もちろん、私たちは現時点では競技シーンや線形代数のような複雑な大学の知識をカバーするつもりはありません。主にK12分野をカバーします。

Founder Park:VideoTutorの現在の障壁や防御線は何ですか?

Kai:いくつかの点があると思います。第一はデータフライホイールです。動画の背後にはすべてコードがあり、ユーザーが生成した良い動画データは二次ラベリングを経て、再び微調整モデルのトレーニングに使用されます。データが多ければ多いほど、動画の効果は良くなります。次に、学習行動データです。私たちは異なる学生がどの知識点が弱いかを知ることができ、データフライホイールを構築できます。より多くの人が使用すればするほど、製品は学生をより理解します。第二は先進的な技術的優位性です。例えばアニメーションエンジンのアルゴリズム。アルゴリズム自体は最も核心的な優位性ではありませんが、私たちが迅速にイテレーションを行い、データが増えるにつれて、その優位性はより明確になります。

第三はブランドです。VideoTutorはすでに北米の親の間でAI教育分野のトップブランドとなっており、親の信頼度も無形の障壁となっています。

Founder Park:3年から5年後、あなたはVideoTutorが最終的にどのような製品に成長することを期待していますか?

Kai:私たちは将来的にVideoTutorがすべての人が理科の知識を学ぶAI教師になることを望んでいます。私たちは理科だけを扱います。私は将来的にそれがDuolingoを超えると考えています。Duolingoは世界的な言語学習製品ですが、STEM理科のシーンでは、過去に世界的な製品が登場したことはありません。なぜなら、理科には非常に多くのグラフィックレンダリングが必要だからです。現在、基礎モデルの技術はすでに準備が整っているので、理科のシーンで次の「Duolingo」が誕生すると思います。

人材募集、特に国内の大手企業からの人材を求めている

Founder Park:あなたは以前にいくつかの起業経験があり、主にどのようなことをしていましたか?

Kai:私は現在大学3年生です。大学1年生の時にJamesと一緒に教育製品を作り、20万ドルのエンジェル投資を受けました。その時は失敗しましたが、貴重な経験を得ました。それは、同質化競争に陥ってはいけないということです。当時私たちが作ったアプリは、市場に多くの同類製品があり、初期には流入競争に陥り、料金を取るのが非常に難しかったのです。

二回目の起業では、私は共同創業者として別のチームMathGPTProに参加し、数ヶ月間在籍しました。その段階で、私は製品指標の見方、製品の構築方法、ユーザー拡張の方法を学びました。その時、私は文字ベースの解答型教育製品はすでに限界に達しているという結論に達しました。なぜなら、それはChatGPTとほとんど変わらず、過去に宿題の助けを提供していた構造化知識の問題集も、大モデルの編集能力に取って代わられたからです。したがって、三回目の起業では、可視化が必然のトレンドであることを知っていました。

趙凱がハーバード大学でSam Altmanにピッチした時の写真

Founder Park:過去の2つの経験は、文字ベースの製品の限界を認識させるだけでなく、チームや他の面で、現在のVideoTutorにどのように役立っていますか?

Kai:非常に大きな助けになっています。

第一に、方向性と製品が未来を持つかどうかをより良く判断できるようになりました。私は競合製品のウェブサイトのトラフィックや収益を見て、製品の進化方向を判断します。

第二に、製品構築の面で、製品の開発ペース、製品デザイン、フロントエンドとバックエンドの接続、どの指標を見るべきかをより良く判断できるようになりました。

第三に、チーム管理と組織文化の能力です。私はより完全な管理制度を確立しました。各メンバーの役割、報酬、オプションの配布を含んでいます。また、資金調達の方法も学びました。このラウンドの1000万ドルの資金調達は、20日以内に完了しました。

Founder Park:あなたたちのチームは現在何人ですか?

Kai:6人で、皆一緒に住んでいます。

Founder Park:チームは最初にどのように構築されましたか?

Kai:私はJamesと2回起業しました。私たちは同じ学校を卒業し、大学1年生の時に一緒にアプリを作りました。大学2年生の時に、他の2人と一緒に起業し、皆お互いを知っていました。この技術が非常に大きな製品ビジョンをもたらすことに気づいた時、私たちは連絡を取り合い、この製品を作るためにチームを組みました。以前からの校友であり、チームのもう一人のパートナーNickも私の大学のルームメイトです。

Founder Park:あなたたちは現在も拡大を計画しており、どのような人材を求めていますか?

Kai:私たちは主にバックエンド、フロントエンド、大言語モデル、UI/UXの分野で経験のある人材を求めています。なぜなら、私たちはすでに試行錯誤の段階を超え、製品の迅速な構築の段階に入っており、成長を助けるために経験のある人が必要だからです。

Founder Park:経験豊富なエンジニア、プロダクトマネージャー、成長責任者が必要で、製品を1から10に、さらには10から100にする必要があります。

Kai:はい、まさにこの段階です。私たちはチームを9人から10人に拡大することを期待しており、核心はエンジニアの採用を優先します。

今回の採用は国内で行われる可能性があるため、対面とリモートの混合方式になります。

Founder Park:その人に求めるプロフィールは何ですか?

Kai:私たちは、ByteDanceやMeituanなどの大手企業での経験がある人をより望んでいます。なぜなら、ByteDanceは高速で競争の激しい組織文化を持ち、若者を重視しているからです。ByteDanceで訓練を受けた人は、比較的良い方法論と能力を持っており、私たちに参加すれば、これらの成功した経験を持ち込んで融合学習を行うことができるからです。

国内の大手企業で厳しい戦いを経験し、迅速なイテレーションの経験がある人を求めています。私たちはすでに学生起業の段階を超えており、新人を採用する必要はあまりなく、より経験のある人を採用する必要がありますが、完全な「業界のベテラン」ではない人が望ましいです。なぜなら、業界のベテランは家庭を気にかける必要があり、あまり競争できないからです。したがって、中間層の若くて競争心のある人が理想的です。

私たちは優秀な人材に豊富なオプションを提供することを望んでいます。私たちは1100万ドルを調達しましたが、なぜアメリカでエンジニアを採用しないのかというと、国内の製品力とエンジニアリング能力が本当に優れていると感じているからです。この波で100%華人が運営するチームが素晴らしい製品を作り出し、国際的に成功するでしょう。現在、多くのAIアプリケーションは華人によって作られており、国内のエンジニアリング能力は本当に素晴らしいです。これも私たちの強みであり、中米の両国の優位性を活用する必要があります。

シリコンバレーの大学生たちは、AI起業をしている

Founder Park:現在、特にシリコンバレーでは大学生起業のトレンドが非常に顕著ですが、あなたはどのような状況を見ていますか?

Kai:一つの事実を見てください。このラウンドで100億ドルの評価を受けた会社、AI採用を主打とするMercorは、すでに3億ドル以上の新たな資金調達を完了し、評価は100億ドルに達しています。また、Cursorはすでに100億ドルの評価が確定しています。これに対応するのはGPTZeroやPikaなどです。これらはすべて大学生の起業プロジェクトであり、特にCursorとMercorの創業者は大学3年生の中退生です。

この波の若者たちの起業には一つの特徴があります。それは高度に差別化された競争です。彼らは非常に狭い分野に集中して取り組み、汎用的なものを作っていません。例えば、MercorはAI採用を行い、最初からインドのプログラマーの採用だけを行っています。

第二のポイントは環境です。シリコンバレー全体の資本環境と基盤の革新、スタンフォード、YC、Peter Thielのファンドなどが、最初の段階で大学生の起業を支援しています。成熟したアイデアがあるかどうかに関わらず、彼らは支援を提供し、強力な人脈ネットワークを提供します。

第三のポイントは、これらの大学生の資質だと思います。私たちも、シリコンバレーから出てきた大学生たちも、非常に勇敢な冒険精神と強い学習能力を持っています。このような勇敢に挑戦する精神は、国内の多くの学生にはあまり見られません。なぜなら、シリコンバレーでは、同世代の成功事例が周囲に多く存在し、資本環境も若者を信じるからです。

私にとっても、当時はコストと利益を比較しました。もし大学を卒業してから仕事を探すことを選んだ場合、家族の留学コストを返済できるかどうかは不明であり、大きな利益も得られないかもしれません。しかし、起業を選べば、最も若い時に狂ったように学ぶことができ、私の人生には無限の可能性が生まれます。私は小さい頃から素晴らしい会社を創立したいと考えていました。

Founder Park:なぜ今日の大学生たちが100億ドルの会社を作ることができるのか、以前は一、二千万ドルの売上があれば素晴らしいとされていたのか?この中にはAIの熱潮やバブルの要素がありますか?

Kai:私はそれが完全にバブルではないと思います。Cursorは4.5億ドルの実際の収益を上げており、これは非常に信頼できるものです。この背後には、今の若いチームの方法論と認識のインサイトが非常に重要です。これらのチームを見てみると、背景が非常に優れており、彼らは非常に良い学習能力を持っています。

Cursorは初期に周囲の大学生プログラマーに依存しており、これらの人々はAIに対する受容度が高く、非常に強いフィードバックを提供しました。創業者自身も小天才エンジニアであり、ユーザーを深く理解し、エンジニアリングのイテレーション能力が高く、初期には4人で製品を作り上げました。彼らが製品を良くイテレーションした後、ユーザーの口コミが形成され、収益が上がり、投資家も次のMark Zuckerbergを逃したくないと思い、資本が再び助けに来ました。

最も基本的な条件は、AIのこの波には多くの新しい技術があり、若者は学習速度が速く、実用的で信頼でき、行動力があるため、極端なユーザー理解と超高速のイテレーション速度で伝統的な製品を打ち負かすことができるということです。例えばCursorの前には、GitHub Copilotも非常に良い製品を作っていましたが、なぜそれを超えられなかったのでしょうか?それはユーザー体験と実行速度の違いです。

Founder Park:新技術であるAIのため、多くの製品の認識も新しい視点で見る必要があると言えますか?

Kai:はい、若い世代は前の世代の起業家よりも深い認識を持ち、ユーザーに近づくことができます。現在の主流のAIユーザーは00年代生まれであり、彼らの学習とフィードバックのイテレーション速度、包容度は、前の世代の起業家よりも速いです。

したがって、認識のイテレーション速度が核心です。モバイルインターネット時代、技術のイテレーションは年単位または四半期単位で行われましたが、AI時代では技術のイテレーションは日単位で行われる可能性があります。創業者として、あなたは迅速に学ぶ必要があり、若者は夜更かしが得意で、より挑戦的です。

Founder Park:以前のメディアでは、シリコンバレーの多くの創業者も996を始めていると言われていますが、あなたたちはどう思いますか?

Kai:私の周りのいくつかの白人起業家の友人は、多くの資金を調達し、996をしています。彼らも私たちと同じように、大きな家を借りて、全員が一緒に生活し、働いています。私は996は環境によるものだと思います。現在のシリコンバレーは金鉱熱のようになっており、誰もが遅れたくないと思っているため、製品のイテレーション速度を競うしかありません。これは環境が人々を強制するものです。

Founder Park:シリコンバレーの大学生起業は、トラック選択にどのようなトレンドがありますか?

Kai:私は、私たちが教育を行うにせよ、他の人が行うにせよ、皆が一つのトレンドを持っていると思います。それは、自分の快適なゾーンで起業することです。快適なゾーンとは、その分野とユーザーについて十分に理解していることを指します。Cursorの創業者はコーディングについて非常に理解しており、私たちが教育を行うのも、この人々について十分に理解しているからです。現在の若者は、自分の既存の認識の快適なゾーンで起業することが多く、知らない分野に無謀に飛び込むことはありません。なぜなら、そうすれば得られるユーザーのフィードバックが十分に早く、正確だからです。

また、認識の重ね合わせもあります。私たちは3回とも教育を行っており、私の認識は絶えず重ねられています。これらの大学生は、自分が過去にやったことのないことを無謀に行うことはあまりなく、どうすればより良くできるかを考えています。彼らは新しい世代の思考方法を持ち、自分の認識の範囲内で絶えずイテレーションし、機会を創造することに勇気を持っています。

もう一つは、勇敢に挑戦する精神です。他人の否定によって自分を否定することはあまりなく、「あなたが私についてどう思おうと気にしない」という態度を持ち、自信に満ちています。これの背後には「高速実験」の文化があります。私は自分の製品がまだ準備が整っていないことを知っていますが、気にせず迅速に立ち上げ、迅速にイテレーションし、迅速にフィードバックを得ます。

Founder Park:この潮流はいつ頃から始まったのでしょうか?

Kai:私はそれが共通の成功の認識から始まったと思います。皆がGPTZeroのようなプロジェクトが寮から成長し、絶えずイテレーションを行い、資本の助けとユーザーの認識を得る成功事例を見ていると、このような迅速な試行錯誤と急成長の成功事例が増え、共通の認識が形成されます。

一言で言えば、「完璧よりも完成が重要」です。完成することは完璧であることよりも重要です。また、皆は競争をあまり心配していません。シリコンバレーの多くの創業者は、自分の製品の理念を話すことを望んでおり、あなたが模倣することを恐れていません。私はただ迅速にイテレーションすれば良いのです。この波の若者たちは、非常に良いストーリーテリング能力を持っています。このストーリーテリングは、空虚なものではなく、実用的で真実に基づいており、未来への展望を加えています。

Founder Park:まず自分をマーケティングすることが重要です。

Kai:はい、私は底辺の観念が冒険精神と極度の自信にあると思います。このような駆動力の下で、彼らは絶えず勇敢に試行錯誤し、間違ったことを言うことを恐れません。自分の製品理念を大胆に語り、大胆に実行し、間違ったらまた修正すれば良いのです。この試行錯誤を恐れない文化が、この波の大学生起業の熱潮と成功を促進しました。

アメリカのVCも大学生のプロジェクトを見ています。YCは毎期大学生のプロジェクトに投資しています。

資金調達はVideoTutorが今最も心配する必要のないこと

Founder Park:もしVideoTutorを始めたばかりの頃に戻れるとしたら、自分にどのようなアドバイスをしますか?何をもっと良くできたと思いますか?

Kai:私はもっと早いペースで進めるべきだったと思います。また、チームの構成についても。VideoTutorのチームは何度も磨かれた結果です。もし早く知っていれば、製品に必要なスキルセットに基づいて、より良くチームを構築していたでしょう。起業は最終的に組織能力が非常に重要だと思います。私は人を選び、見極め、良い人を使うことにもっと時間をかけるべきだと思います。

現在のチームは0から1の成長に適していますが、VideoTutorをさらに大きくするためには、より多くの実務経験を持つ人が参加し、彼らの優れた経験と能力をチームに持ち込んで、全体のチームが共に成長するのを助ける必要があります。

Founder Park:今後半年以内に、VideoTutorが直面する可能性のある製品や技術的な課題は何だと思いますか?

Kai:私は一つはレンダリングで、真のゼロ遅延に達するためには、エンジニアリングの突破が必要だと思います。第二のポイントは成長の面で、製品のテイストだと思います。これには多くの要素が含まれます。例えば、UI、インタラクションデザインがスムーズで完璧か、機能のインタラクションにバグがないか、視覚的なレイアウトが美しいかなどです。これらは私たちにとっての試練です。

James:私たちは最初にVideoTutorの位置づけをすべての科目に対する可視化教育補助と考えていましたが、後に非常に垂直的に、数学分野だけを対象にすることになりました。なぜなら、それが私たちが最も得意とする分野だからです。私たちの数学レンダリングエンジンは最も専門的です。今後の重点的な突破は、可視化の利点を文科系のシーンにどのように持ち込むかです。例えば、「锄禾日当午,汗滴禾下土」を説明することです。これは私たちが今後技術的に考慮すべきポイントです。

Founder Park:創業者のバックグラウンドが後の拡張において障害になることはありますか?

Kai:あまりないと思います。実際、多くの大手VCが私たちに接触してきました。例えばa16zなどは、あまり早期には手を出さず、チームに成功の兆しが見えた時に助けに来ます。そうすれば、彼らは投資が失敗しないことを知っています。私たちは多くの大手VCと良好な関係を維持しています。

資金調達はVideoTutorが今最も心配する必要のないことです。最も心配する必要があるのは、ユーザーエコシステムと製品に関することです。

ChainCatcherは、広大な読者の皆様に対し、ブロックチェーンを理性的に見るよう呼びかけ、リスク意識を向上させ、各種仮想トークンの発行や投機に注意することを提唱します。当サイト内の全てのコンテンツは市場情報や関係者の見解であり、何らかの投資助言として扱われるものではありません。万が一不適切な内容が含まれていた場合は「通報」することができます。私たちは迅速に対処いたします。
warnning リスク警告
app_icon
ChainCatcher Building the Web3 world with innovations.