分享至

对话获 4300 万美元融资的 Sahara 创始人：服务微软、亚马逊，Sahara 如何助力 AI 资产化？

ChainCatcher 精选

2024-08-15 13:10:00

去中心化AI网络的商业潜力。

采访者：西柚, ChainCatcher

嘉宾：Sean Ren、Tyler Zhou，Sahara 联创

编辑：Marco，ChainCatcher

自OpenAI发布文生视频AI大模型Sora后，AI再次成为当今市场上最大的风口赛道，投资浪潮一波接着一波，AI和Web3两个领域的融合创新项目如雨后春笋般涌出。根据加密数据平台Rootdata显示，“AI和Web3”板块收录的项目已接近240个，显然已成为独立赛道，去中心化AI网络Sahara就是该板块的明星项目之一。

Sahara由Sean Ren和Tyler Zhou于去年5月创建，是一个去中心化AI网络基础设施助力AI资产化，旨在帮助用户部署或构建自定义化、个性化的AI产品等。

Sean Ren是南加州大学的计算机系终身教授，在AI领域已经有15年的行业研究经验；Tyler Zhou曾在Binance Labs担任投资总监，并参与了多个项目投资及孵化。

今年3月，Sahara宣布，早在去年8月就完成由Polychain Capital领投的600万美元融资，参投方有红杉资本、Samsung Next、Nomad Capital等投资机构。

两位创始人对ChainCatcher表示，目前，Sahara已为30多家企业客户提供数据服务，包括Microsoft, Amazon, MIT, Snapchat,Character AI等知名企业，已经获得了数百万美元的营收。

在接受ChainCatcher专访时，Tyler Zhou透露，Sahara会在4-5月会推出C端用户产品；Q3会上线Sahara测试网Testnet，争取在Q4上线主网等。

4月4日，针对早期用户，Sahara在任务平台Galxe推出了首个积分活动Sahara Social，用户可以通过连接Sahara网络、注册候补名单等任务赚取早期积分奖励等。

创建Sahara的背后故事

1、ChainCatcher：请问Sean Ren个人经历有哪些，因何契机结缘Web3的？在Sahara负责什么工作？

Sean Ren：我个人的学习和工作经历都是比较偏工科背景的。

在创建Sahara前，我在南加州大学（简称USC）计算机系担任终身教授已有7年，主做AI和NLP两方面的学术研究。

我在美国伊利诺伊大学香槟分校攻读计算机系PhD时，创建了首个创业项目StylePuzzle（时尚达人穿衣推荐电商平台），并得到了Plug & Play Ventures的投资，一路从天使轮走到了C轮。

与Tyler已是6年的朋友，我们创业的契机应该是在2022年，那时一起讨论了很多Web2 AI产品本身的弊病，尤其是经济模型问题。

现在的AI经济模式只有小部分专业人员获益，数据的所有者、采集者、提供者及模型的反馈者等其它AI生态参与者，并没有得到合理的经济补偿，用户的数据隐私问题也没有解决，这不利于长期发展。

Sahara产品的第一原则就是解决现在传统AI行业的痛点，确保AI生态的所有参与者都可以根据自己的工作贡献获取恰当或合理的收益，不再局限于大模型的计算能力及落地场景上等。

目前，我在Sahara主要负责产品开发和BD等方面的工作。

ChainCatcher：Tyler Zhou此前曾在Binance Labs担任投资总监，为何要从币安离职，选择投身AI赛道创业？

Tyler Zhou：我本科从UC伯克利毕业后，做投行和PE私募股权投资，投的主要是基建、信息科技IT及地产科等。

2022年初加入Binance Labs，负责美国市场的投资工作，主要是做孵化、投资项目等，第一期MVB是由我主导推出的。

2023年初选择离开币安和Ren教授建立Sahara主要有几点考虑:首先整个AI生态的经济模式存在很多问题，区块链的加密技术和代币经济或许能用来解决这些问题。

我个人觉得Ren教授的背景、专业知识是做相关产品的最合适人选，市场上没有团队能像任教授那样懂AI系统的生态、技术和经济等整个闭环。

此外，Ren教授不是传统意义上只做研究的研究员，还有非常强的商业敏感度和嗅觉。

2、ChainCatcher：Sahara产品定位及目标是什么？除了AI的商业化问题，还想要用来解决哪些问题？

Sean Ren：目前，Sahara主要产品是一个去中心化网络基础设施，支持任何人构建或部署其个性化AI产品。

Sahara可以视为是由Execution Layer（执行层）、Transaction Layer（交易层）和Application Layer（应用层）组成的去中心化网络。

在应用层，Sahara提供了一个原生内置的去中心化数据市场（Decentralized Data Marketplace也称Sahara Data），并提供处理数据相关的工具包（如收集、标注、QA等）等配套设施，以供用户使用和访问，帮助训练其AI模型。

用户来到Sahara，大多也是为了构建自己的AI产品，Sahara Data可以先帮助解决数据的收集、标注和转化的问题。

另外，作为一个数据市场，Sahara是吸引数据供给方和需求方的一个重要链接平台，它不但可以为AI模型训练提供高价值的数据服务，也能够帮助有数据需求的用户发现更多的数据提供者，从而更顺畅地去构建自主化AI等。

Sahara Data去中心化数据市场是Sahara产品的一大优势，也是用来区分其与市场上的Web3 AI项目不同的关键。去年10月推出，截至目前已上线运行了约6个月，最初只服务一些企业客户，如Microsoft、Snapchat、MIT、Motherson Group、Amazon等，向其提供相关数据的服务，并处理业界最难的一些数据需求问题。

Sahara执行层支持数据加密和归因，即所有权证明，通过使用数字水印创新技术和公钥设施来实现，它类似一个所有权证明（proof of ownership），当用户创建出一个数据点、数据集、或模型时，可以把自己的Did植入到其数据或者模型里面，生成一个水印，证明对其的数据所有权，这个水印会随着用户的数据和模型流转一直存在，这样就可以给数据和模型做归因。

通过使用所有权证明机制，用户在训练自己的AI或做推理时，如果需要依托于某一个人或某一帮人构建的基础模型，该AI产品以后产生的收入就可以分给底层模型的持有人。

3、ChainCatcher：3月5日，Sahara公布完成了由Polychain Capital领投的600万美元种子轮融资，参投者还有红杉资本等。Sahara是如何接触这些投资人的？您认为Sahara为何会被他们看好？投资机构给予了哪些帮助？

Tyler Zhou：其实，种子轮融资并不是近期的一个融资，早在去年8月就已完成。与别的团队不同，Sahara并没有在融资完成时立刻公开，而是等待时机合适了、产品上市后再宣传。

之所以现在公布，是因为Sahara产品发展进入了新阶段，接下来会推出一系列新产品，包括生态相关的应用。

Sahara种子轮是超额认购的状态，可选择性非常多，但我们选择投资人非常有战略意义。这些投资人可以帮助Sahara看到AI全球公司的发展形势，AI不同阶段的初创企业在做什么，全球的AI经济趋势，以及不同国家的AI经济有什么不同，头部AI企业所做的事等。

Sahara的优势及开发进程

4、ChainCatcher：您认为Sahara与传统的ChatGPT等AI产品有何不同？

Sahara联创Sean Ren：可以从两个层面来看。

首先，Sahara不是做应用的，最后交付的产品不是某一个GPT产品。Sahara是一个去中心化网络基础设施提供者，其应用层也没定义开发者要构建的AI Agent产品样子，而是提供相关配套的API和SDK等工具包，让任何人都可以轻松构建自己的AI Agent。

第二，ChatGPT是一个一问一答形式的对话机器人，而Sahara上的Sahara Knowledge Agents（KA知识代理）是自定义人工智能程序，与传统的对话机器人有很大不同的，它会自主分析数据，针对特定需求提出可靠决策，会根据某些指令去行动或执行任务，以达到某一个目的。

例如，某个KOL的KA目的是希望它能帮助筛选其推特DM里面的打广告的邀请信息，每天生成一个精简报告，回复别人的DM等，无论何时KA都可以自动执行这些命令。

Sahara是一个基础设施建设者，并为构建自定义的Knowledge Agents（KA）提供了工具和平台等。

Tyler Zhou：与ChatGPT及市面上的AI项目相比，Sahara主打的是Personalized Agent（个性化代理），是一个自定义化的人工智能程序，能力不局限于聊天，还可以帮助用户去执行很多事情。

想要构建一个“Personalized Agent”需要两个前提，第一个是需要有自己的数据库，然后根据自己的数据去训练AI Agent，才能让其达到一些想要的能力；第二需要有去构建Agent的相关基础设施及工具。

Sahara不但提供了数据市场等数据相关的处理工具，其执行层还可保障用户数据能在隐私化保护的情况下训练自己的AI，并提供相关基础设施工具帮助用户更好地构建KA。

Sahara网络支持用户在不牺牲自己数据隐私的同时定制化自己的AI Agent，还提供了构建Agent的no-code（无代码）平台。

5、ChainCatcher：Sahara成立以来的数据如何？接下来的工作重点是什么？

Sean Ren：首先关于产品，Sahara一直在建设去中心化数据市场Sahara Data，去年10月推出产品。

截至目前，Sahara Data共合作了31个企业客户，打磨技术的同时增加了营收。

截至今年Q1结束，Sahara Data已积累了20万用户。

接下来Sahara会着重三方面，也是短期内的重要动作：

一是向公众开放去中心化数据市场，不管是个人还是商家都可以使用；

二是在Sahara Data基础上，构建或推出一些和执行层相关的C端用户产品，比如Knowledge Vault（知识库）、Knowledge Marketplace（知识市场）等。

三是Sahara测试网Testnet会在Q3推出。

6、ChainCatcher：公司目前面临的最大挑战是什么？

Sean Ren：公司团队扩张太快，已从最开始的十几个人团队扩展到40多个，在近期规划中，团队或会在未来的一两个月再增加30-40位。

Tyler Zhou：从市场和生态角度来看，我觉得比较大的挑战就是在初期阶段，Sahara定位是一个“Crypto for AI”产品（即用Crypto去赋能整个AI），触达的市场及生态都会比“AI for Crypto”更大。

关于“Crypto for AI”和“AI for Crypto”之间的区别，前者“Crypto for AI”是指使用Crypto和区块链的技术和AI做一个更好的结合，帮助提升和改进AI产品相关的问题等，这是一个更大的全球市场；后者“AI for Crypto”是指AI被用来改进加密产品比如用到智能合约里、或区块链的一些用途里等，在目前阶段这是一个相对比较小的市场，更多的是叙事。

但当前市场上主流炒作是“AI for Crypto”产品，忽略了整个AI生态的经济和整个AI的体系、全球经济的动向，导致了市场非常有噪音，尤其是过去半年，市场噪音特别大。

Sahara如何在众多噪音的环境下，依旧坚持初心的去做想做的事情、应该做的事情和对的事情，是一个比较大的挑战。

Sahara已服务微软、亚马逊等30+企业

7、ChainCatcher：自成立以来，Sahara已吸引了30多家企业客户，包括微软、Snapchat和麻省理工学院等。请问Sahara为他们提供了哪些服务，这些知名企业为何会选择与公司合作？

Sean Ren：Sahara最开始推出的产品是去中心化数据市场Sahara Data，在Web2也有同类竞品如Skill AI中心化数据服务商。和中心化数据服务商相比，Sahara Data更有优势。

首先，Sahara可通过各种各样的奖励Reward和经济激励机制，接触到大量的全球各个地区的AI数据收集和标注工作人员，现Sahara网络上已有约20万AI相关工作人员，且多是Web2 AI行业的原住民，之所以吸引他们，是因为Sahara能够让其从数据贡献中获得收益，比如Crypto作为Payment等。

关于合作的企业，他们有各种各样的数据需求，如Snapchat需要收集对话数据，微软则收集多模态数据，MIT需要各种各样的视频数据。

Sahara作为数据的供给方，在数据多样化方面非常有优势，它有一个非常多样化的候选者数据库可供客户选择，能够去适应不同的数据需求。

通过与30多家企业合作，Sahara不断打磨产品，让产品越来越成熟，以更好去适配全球各种企业及商家的数据需求，形成了正向循环。

8、ChainCatcher：目前，用户参与Sahara需要在官网候补名单，先产品开发进度进展如何让？用户参与Sahara的方式有哪些？对于早期参与用户会给予哪些奖励?

Tyler Zhou:4月至5月，Sahara会推出第一个C端产品，届时C端用户可在平台贡献他们的知识及技能等。

对于早期用户，Sahara也会有不同的奖励的机制，等到4或5月公开后会释放更多的信息，会在Q3或Q4上线Sahara Testnet测试网，并争取在Q4上线主网。

9、ChainCatcher：对于市场上流行的去中心化GPU、Agent等AI加密项目的看法？如何评断一个AI加密项目的可靠性？

Sean Ren：目前市面上的加密AI产品按照“AI for Crypto”和“Crypto for AI”可以划分为两个派系。

“Crypto for AI”是一个更大的市场，对于我们这种AI行业原住民来说，更关注如何借助区块链和Web3技术解决Web2 AI产品的一些诟病，尤其是经济模式、数据所有权等问题。

当前有很多项目借用区块链的经济模型去激励AI中的某些行为，但个人认为做的太浅，只看到了经济模型，没有考虑整个AI背后的生态，如训练数据的隐私和加密。

如站在整个AI的生态系统来看，最上游应是数据及数据处理板块，市场上也有数据相关的项目，但大多项目只有最吸引人的加密经济模型（如Label to earn标注赚钱），并没有去触及数据本身的问题如所有权、模型归因等，只是搭建了一个应用而已。

关于用分布式GPU方式训练大模型，个人觉得这个方向是非常有挑战的，需要看项目的去中心化程度。如果只是象征性地把在同一个机房或者是离得不远的几个机房跑绑在一起做，这是一个人工伪造的去中心化；如果想要把全世界空置的GPU捆绑在一起做去中心化训练，但由于不同网络之间的速度存在巨大差异，可实现难度有点远。