深入 Web3 数据领域:用户数据的景观、层次和未来

FC@SevenXVentures
2022年12月26日 14:07
收藏
个人产生的数据创造了价值,但这些数据并不属于个人。因此,创造的价值不会分配给个人。我们需要找到一种新的秩序和范式,才能在这个新世界中茁壮成长。

作者:FC@SevenX Ventures

编译:MetaCat

 

前言

2022 年,科技界的一大流行语是 Web3。跨平台和领域——从金融到社交媒体——它是对话的开端。

尽管每个人对 Web 3 都有不同的定义,但用户和爱好者一致认为它允许用户保持对其数据的所有权和自主权。随着我们的生活和工作更加彻底地数字化——即未来所有人类活动都将以数据流的形式呈现——数据权利的转移将变得越来越重要。

因此,我们认为 Web3 数据领域将对新秩序至关重要,并展现出巨大的发展潜力。从企业家的角度来看,去中心化网络是一个开放的、无需许可的分布式数据库。说到数据,还有很多场景需要服务。如果你选择其中之一,你将很可能能够在 Web3 的世界中发展和成长。

在今天的文章中,我将讨论 Web3 数据部门结构、现有 Web3 数据空间中的典型玩家以及未来的发展趋势。我也会分享 SevenX 团队的一些投资理念。

这篇文章的核心观点是:

1. Web3 打破数据孤岛,同时将数据权利还给个人用户。用户拥有自己的数据,允许他们在互联网上携带和使用这些数据。

2、Web3 数据领域的结构可以分为四个层次:1)数据来源 2)数据获取 3)数据查询与索引 4)数据分析与应用。每个级别的分散性、可扩展性、速度和准确性是无法比拟的。我们倾向于通过这些主要指标来判断一个项目的潜力。

3、随着数据市场参与者的逐渐增多和数据本身的积累,数据的价值将大幅增加。保护用户隐私,同时利用数据产生更大价值将继续成为重要的优先事项。

4. Web3 数据领域未来最重要的用例之一是建立去中心化的信誉系统。基于这套信誉体系,将有可能解锁信用借贷等多种金融场景。

 

什么是 Web3 数据

 

随着人类文明的进步,产生了越来越多的数据。这些数据要么消失在时间的长河中,要么凝固在我们已知的历史中。互联网的出现让后者——记录数据——变得更加容易。可以高效、大规模地实现共享。在此过程中,数据的价值得到了探索,其重要性已成为整个社会所必需的。在《经济学人》 2017 年 5 月号的封面故事中,数据被定义为「世界上最有价值的资源」。

然而,随着越来越多的数据被沉积在互联网上,一个根本性的问题开始显现:个人产生的数据创造了价值,但这些数据并不属于个人。因此,创造的价值不会分配给个人。人们一直渴望一种具有更高自主权的新秩序。Web3 数据领域就是答案。

那么 Web3 数据板块如何重塑数据价值呢?主要有以下三个方面:

它使数据透明和防篡改。

在 Web2 的世界中,应用程序通过提供免费服务获取用户数据,然后垄断这些数据以获取利润并建立自己的业务。数据存储在他们的中央服务器上,外界无法访问。无法知道存储了哪些数据,以及以何种方式和粒度存储。此外,如果这些应用程序受到攻击或主动终止其服务,用户的数据将在一夜之间丢失。但是,以区块链技术为底层 Web3 框架,链上数据公开、透明、不可篡改,实现了用户的独立性和安全性。

打破数据孤岛并提高互操作性。

使用 Web2,用户每次使用新应用程序时都必须完成注册过程。这是因为每个应用程序都有自己独立的数据库,无法连接到其他应用程序。用户数据是碎片化的,无法跨平台复用或整合。在 Web3 的世界里,用户只需要一个地址就可以访问和使用各种去中心化应用;该地址的每一笔链上交易都可以使用相应的数据。应用程序权限是不必要的。

通过代币经济更好地分配价值。

数据创造的价值如何分配给产生它的个人,是 Web3 需要回答的一个重要问题。目前看来,不断发展的通证经济才是实现价值再分配的核心路径。

加密市场的发展推动了 Web3 数据领域的发展。在供给侧,多链宇宙的形成,NFT 的蓬勃发展,新用户的涌入,导致用户数据呈指数级增长;在需求方面,多维需求围绕数据的获取和组织创造了无数机会。

 

Web3 数据结构图

Web3 数据轨的结构可以分为四个层次:1)数据源 2)数据获取 3)数据查询与索引 4)数据分析与应用。

 

第一层:数据源

 

数据来源分为链上数据和链下数据。链上数据包括与链相关的数据(如哈希和时间戳)、转账交易、钱包地址、智能合约事件和缓存中的数据(如在以太坊内存池中排队的数据)。数据由去中心化数据库维护,可靠性由区块链共识保证。此外,存储是链上数据的主要来源。目前主要集中在 IPFS、Arweave、Storj 等协议中。

链下数据主要包括中心化交易所数据、社交媒体数据、GitHub 数据和一些典型的 Web2 数据(如 PV、UV、DAU、MAU、下载量和搜索索引)。

在过去的两年里,数据的种类和数量呈指数级增长,但 Web3 的 layer 1 仍然存在三个主要问题:

1、部分公链,如 Solana,采用轻节点模式。这导致链上数据不完整。

2. 存储层数据拥塞。我的好朋友 REVA 曾经把她的 NFT 作品上传到 IPFS,但是当她要调用的时候,下载了一个几百兆的文件,用了 2 个小时。然而,市场上已经有一些项目正在致力于解决这个问题,例如 SevenX 的投资组合中的一个:介子网络。它是一个去中心化的 CDN 网络,通过挖矿聚合未使用的带宽资源,并在开放的市场中分配带宽。它加速文件和流媒体市场,如网站、视频、直播和区块链存储解决方案。目前,Menson 网络已经支持 AR 和 IPFS 等。

3. 无法验证链下数据的合法性。此外,有必要拓宽数据维度。

 

第二层:数据采集

 

这一层的主要参与者是节点服务商。如果选择通过自己搭建节点的方式来获取链上数据,将需要大量的时间、金钱和技术能力。在此过程中,您还可能面临内存泄漏和磁盘空间不足等问题。

节点服务商大大优化了这个过程。他们提供了整个数据领域的基础设施,因此是参与该系统的第一批也是最重要的参与者。

目前知名的服务商有 Infura、Quicknode、Alchemy、Pocket。在选择服务商时,开发者和创业者主要会考虑覆盖链的数量、商业模式、附加服务的多样性(是否有类似 CDN 的服务?是否可以访问 Mempool 数据?是否可以提供私有节点?)。他们还会考虑服务是否去中心化。

2020 年 11 月,Infura 没有运行最新版本的 Geth 客户端,客户端的一些特殊交易触发了错误;Infura 倒闭并引发了一系列连锁反应。比如主流交易平台无法充值 Mention ERC-20 Token,无法使用 MetaMask。四个节点服务商的简单对比如下:

今年 2 月 8 日,Alchemy 完成 2 亿美元融资,估值 102 亿美元;Infura 的母公司 ConsenSys 也在去年完成了 2 亿美元的融资,估值 32 亿美元;截至 2022 年 3 月,Pocket 流通市值达到 32.8 亿美元。

 

第三层:数据查询和索引

 

市场参与者提供数据查询和索引服务。它们通过解析和格式化原始数据使其更易于使用。

 

The Graph

The Graph 是一种去中心化的链上数据索引协议。主网于 2020 年 12 月上线,目前可支持 Ethereum、NEAR、Arbitrum、Optimism、Polygon、Avalanche、Celo、Fantom、Moonbeam、Arweave 等 30 多个不同网络的数据索引。

它类似于传统的基于云的服务 API,主要区别在于链上的数据索引由去中心化的索引节点组成。借助 GraphQL API,用户可以直接通过子图访问信息,快速高效。The Graph 设计了 GRT 代币机制来鼓励多方参与到自己的网络中,包括 Delegator、Indexer、Curator 和 Developer。业务流程可以概括为:用户提交查询需求,索引器操作 The Graph 节点,委托人将 GRT 抵押给索引器,策展人利用 GRT 确定哪些子图具有查询价值。业务流程总结:用户提出查询需求,索引器运行 The Graph 节点,客户端质押 GRT 代币给索引器。

 

Covalent

Covalent 提供了数据查询层,允许用户以 API 的形式快速调用数据。目前支持 Ethereum、BNB Chain、Avalanche、Ronin、Fantom、Moonbeam、Klayth、HECO、SHIDEN 等主流 Layer2 网络。

Covalent 不仅支持区块链上所有类型的数据查询——例如交易、余额和博客类型——还支持特定协议的数据查询。Covalent 最与众不同的特点是它为用户提供了进行跨链查询的能力。通过修改 Chain ID,无需重建索引即可获得与 Graph 子图相同的结果。该项目还有自己的代币 CQT,持有者可以使用它来对数据库更新等事件进行质押和投票。

 

SubQuery

SubQuery 为 Polkadot 和 Substrate 项目提供数据查询服务。这使开发人员可以专注于他们的核心用例和前端,而不是浪费时间构建用于数据处理的自定义后端。受 The Graph 的启发,SubQuery 也使用了 graphQL 语言,其代币经济学与 The Graph 类似:SubQuery 系统中存在三种类型的角色:1) Consumers 2) Indexers 3) Delegator。为了激励索引者更诚实地参与工作,消费者发布任务,索引者提供数据,委托人将他们闲置的 SQT 代币抵押给索引者。

 

Blocknative

Blocknative 专注于检索实时交易数据的功能,并为 mempool 数据提供浏览器,包括地址跟踪、内部交易跟踪、失败交易信息和替换交易(加速或取消)信息。由于内存池数据与最终区块数据不匹配,因此实时性要求很高。Blocknative 的现场查询更加即时和准确。

Blocknative 专注于实时交易数据的检索功能。它还提供内存池数据浏览器,例如地址跟踪、内部交易跟踪、不成功交易信息和替换交易(加速或取消)信息。由于 mempool 数据与最终区块数据一致,对实时性要求高。Blocknative 提供的字段查询更加直接和精确。

 

Koii

Koii 是一个面向创作者的去中心化生态系统,旨在帮助他们拥有内容并因此获得内容价值。任何人都可以使用 Koii 系统通过部署任务、运行节点或生产 / 注册内容来获得代币奖励。系统将根据经过真实流量证明处理的数据对参与者进行奖励,实现“注意力经济”的循环。此外,Koii 团队开发的 Atomic NFT 实现了 NFT 及其元信息在同一条链上的保存和确认。所以,Koii 平台上的所有内容都是按照相同的标准生成的。如果这种可扩展性能够成功鼓励内容积累,Koii 将成为重要的内容数据索引平台。

下面列出的项目不仅提供数据查询和索引服务,还提供分析图层产品。

 

Dune Analytics

Dune Analytics 是一个综合的 Web3 数据平台,可以查询、分析和可视化海量链上数据。它解析存储在键值数据库中的链上数据,然后将其输入到 PostgreSQQL 关系数据库中。用户无需编写脚本,只要能使用简单的 SQL 语句进行查询即可。

Dune Analytics 鼓励数据共享。默认情况下,所有查询和数据集都是公开的。用户可以直接复制别人的仪表盘作为参考。目前,Web3 领域最优秀的数据分析师云集于此。Dune Analytics 目前支持 Ethereum、Polygon、Binance Smart Chain、Optimism、Gnosis Chain 的数据查询。今年 2 月,以 10 亿美元估值完成 B 轮融资 6942 万美元,正式跨入独角兽行列。

 

Flipside

Flipside 和 Dune Analytics 一样,也使用可视化工具和自动生成的 API,让用户通过简单的 SQL 语句查询复杂的数据。用户还可以复制和编辑其他人生成的 SQL 查询。Flipside 积极与领先的加密项目合作,通过结构化的赏金计划和指导来激励按需分析,帮助项目快速获得他们发展所需的数据洞察力。

目前,Flipside 支持以太坊、Solana、Terra、Algorand 等公链网络。4 月 19 日,Flipside 宣布完成 5000 万美元融资。

 

DeBank

DeBank 是一个 DeFi 投资组合追踪器。通过 DeBank,用户可以在一个地方跟踪和管理他们交互过的 DeFi 应用程序。他们还可以跟踪地址余额和变化、资产分配、授权状态、将要收到的奖励、贷款头寸等等。目前,它们支持 27 个网络上的 1147 种协议。

去年 4 月,DeBank 正式推出了自己的 OpenAPI 计划。API 将包括对指定链上所有协议的访问,以及指定协议支持的所有链及其合约地址的列表。它还将包括针对指定协议的实时投资组合。拥有 28 个 API,所有机构和个人开发者都可以申请成为官方合作伙伴,实时访问 DeBank 的 DeFi 分析数据。目前 imToken、TokenPocket、麦子钱包、Mask、Hashkey Me、OneKey、Zerion 都在使用 DeBank 的 API。DeBank 已成功地将其市场从数据应用扩展到数据查询和索引。

 

CyberConnect

CyberConnect 是一种去中心化的社交图谱协议。它旨在创建可扩展和标准化的社交图模块,允许开发人员通过简单的代码将模块传输到新的应用程序,从而节省时间和金钱。该协议还使最终用户能够将他们的社交数据视为可轻松移动到新应用程序的便携式资产。通过这种方式,CyberConnect 消除了 Web2 通用平台之间的障碍。

 

RSS3

RSS3 是从 RSS 协议衍生而来的下一代数据索引和分发协议。它允许用户根据地址生成 RSS3 文件,并将他们的 Twitter、Mirror、Instagram 和其他社交平台与这些文件相关联。这些文件将实时同步用户的资产和内容。然后将数据存储在 RSS3 去中心化网络中。在用户同意的情况下,开发者可以通过各种 API 接口访问用户在众多平台上发布的内容,并根据程序的需要过滤和展示各种信息。

开发者可以通过不同的 API 接口调用用户,并在获得用户许可的情况下发布到不同的平台。

 

Go+

Go+ 致力于基于自身的“安全引擎”在 Web3 中构建「安全数据层」。用户通过输入代币合约地址,即可访问以太坊、BNB 链、Polygon、Avalance、Arbitrum 等主流网络的合约安全、交易安全、信息安全等 30 多项安全监控服务。

此外,开发者和下游应用程序还可以使用 Go+ 的安全 API 来创建更安全的加密生态系统。这些安全 API 包括代币检测、NFT 检测、实时风险预警、dApp 合约安全、交互安全等。

Go+ 的出现揭示了 Web3 数据栈的趋势:数据索引的垂直化。根据 SevenX 的研究,由于 Web3 项目的增加和用户行为的复杂性,市场拥有更多的数据场景。非通用数据和不断增长的用户需求——既是数据用户又是数据提供者的用户——是这些场景的特征。针对这些垂直场景,未来会有越来越多的数据索引、查询、分析服务。

 

Space and Time

Space and Time 是第一个采用名为 Proof of SQL™ 的专利新型加密技术的分散式数据仓库。它产生可验证的防篡改结果,允许开发人员以简单的 SQL 格式加入无需信任的链上和链下数据,并将结果直接加载到智能合约中。因此,开发人员可以利用 Space and Time 连接链上和链下数据、使用 SQL 转换数据、向 API 发布查询并将去信任数据发送到智能合约。

 

Kwil

Kwil 正在 Arweave permaweb 之上为去中心化互联网构建第一个无需许可的 SQL 数据库。Kwil Social 和 Kwil DB 提供了一种新颖的架构来管理社交图谱以及分散的关系数据库系统。Web3 社交、去中心化科学、去中心化分析和无需许可的数据生态系统都可以从它们的基础设施中受益。

 

第四层:数据分析与应用

 

该层直接面向面向消费者的用户(广义面向消费者,不仅仅是个人用户),交付即用型数据产品。他们使用自己的数据方法论向用户呈现数据价值。这一层的参与者大致可以按照数据类型来划分,包括链上交易、代币价格、DEFI 协议、DAO、NFT、安全、社交等等。当然,越来越多的项目部门专注于某一类数据,旨在成为一个专门的数据分析平台。

 

区块链浏览器

这可能是最早的数据应用层产品,允许用户通过网站直接搜索链上信息。可访问的数据包括链上数据、区块数据、交易数据、智能合约数据、地址数据等。

 

Glassnode & Messari & CoinMetrics.io

区块链数据和信息提供商使投资者能够从不同角度访问链上数据和交易情报。他们还创建市场分析见解和研究报告。

 

CoinGecko 和 CoinMarketCap

这是一个代币分析工具,用于观察和跟踪代币价格、交易量、市值等。

 

Token Terminal

该项目允许用户使用传统的财务指标,如 P/S 比率、P/E 比率和协议收入来分析 DeFi 项目。目前还支持对 NFT 交易市场的分析。

 

DeFiLlama

DeFi TVL 数据分析平台支持 107 个一二层网络,近千个 DeFi 协议 TVL。可以通过不同指标和时期的镜头来查看网络和协议。目前,DeFiLlama 还支持对 NFT 的分析,重点分析不同链上不同交易市场的交易量和收藏类型。

 

NFTSCan & NFTGO

专注于 NFT 市场的数据平台,提供数据分析、巨鲸钱包监控等服务。它旨在帮助用户更好地评估 NFT 项目和资产的价值,使他们能够做出明智的投资决策。

 

Nansen

标签可能是最能描述 Nansen 的词。为了让用户更容易发现信号和新的投资机会,Nansen 已经检查了超过 5000 万个以太坊钱包地址的行为。该分析将链上数据与包含数百万个标签的数据库相结合。目前 Web3 数据分析和应用层中最著名的项目之一是 Nansen。去年 12 月,它以 7.5 亿美元的估值完成了 7500 万美元的融资。

Nansen 分析了超过 5000 万个以太坊钱包地址,将链上数据与包含数百万个标签的数据库相结合。这使用户能够找到有用的模式和新的投资机会。南森是目前在数据分析和应用层最有前途的项目之一。去年 12 月,其以 7.5 亿的估值完成了 7500 万美元的一轮融资。 

 

Chainalysis

Chainalysis,被称为「链上 FBI」,成立于 2014 年,是一家企业数据解决方案公司,监控和分析链上数据,帮助客户——如政府、加密货币交易所、国际执法机构和银行——遵守法规、评估风险并识别非法活动。去年 6 月,Chainalysis 宣布获得 1 亿美元的 E 轮融资,估值为 42 亿美元。

Footprint

Footprint 是一个用于发现和可视化区块链数据的综合数据分析平台。与其他应用程序相比,Footprint 对新手用户来说直观且友好。平台提供丰富的数据分析模板,支持一键分叉,帮助用户轻松创建和管理个性化仪表盘。同时,足迹标记钱包地址及其在链上的活动。用户可以访问具有丰富维度的数据指标,并可以利用它们做出投资决策。

 

Zerion 和 Zapper

最早的 DeFi 投资组合追踪器和管理器,这些项目也加入了对 NFT 资产的支持。

 

DeepDao

DeepDAO 是一个专注于各种 DAO 组织的综合数据平台。用户可以轻松查看国库数量和变化、国库代币分布、治理代币持有量、活跃成员、提案、投票状态等。DeepDAO 还提供了许多用于创建和管理 DAO 的工具。

这一层还有很多其他的应用,这里就不一一列举了。

事实上,SevenX 长期关注数据领域,先后投资了 Debank、Zerion、Footprint、Koii、DeepDao、RSS3、CyberConnect、Go+ 等。在筛选项目的过程中,我们收获了一些智慧,在此简单分享一下。

总的来说,应用层流量不再是核心壁垒。由于易用性和更新速度的改进,用户可以随时快速迁移。具有数据提供能力和闭环数据通道的产品比以往任何时候都更加强大和具有竞争力。

 

我们如何评估一个项目?

 

这是 5 个关键因素。

1.场景

(1)是否有需求,需求的成熟度是否足够?

对于新项目,分析用户需求的成熟度是必不可少的。以 GoPlus 为例。在 DeFi 世界里,“安全感”是必不可少的。各种安全事件后,这种担忧被激活并逐渐成熟。所以现在大家宁愿多一个步骤或者花钱换取更安全的体验。这是一个成熟的、值得一个项目来回答的需求。

(2) 是先构建终端用户端还是先构建协议?

我们认为,在场景需求没有被充分激发的情况下,首先要设计面向消费者的产品,找到消费者的痛点。比如 GoPlus 最开始做了 Go Pocket 钱包,类似样板间。由于模型室,其他合作伙伴理解产品正在解决的问题的能力。当将来需要改进产品时,这些经验将是有益的。

 

2、数据能力

数据获取和结构化是基本技能,但具有基于行业知识的数据能力是关键。

 

3、终端用户产品能力

面向消费者的产品的能力主要取决于 1)是否满足了受众的迫切需求,2)项目对用户来说是否直观。

 

4、业务拓展能力

业务发展的扩张是一个复杂的决策过程。我们会根据产品定位来考虑你能不能获取标杆用户或者长尾用户。

 

五、团队背景

一个成功的团队应该具备以下几点:
(1) vertical track web2 领域的一个背景
(2) 独立运作项目的能力
(3) 开源社区经历
(4) 快速且无偏见地学习的能力

释放 Web3 数据的可能性

随着链上分析的增多,区块链的匿名性逐渐瓦解。比如可以根据南森标签追踪大户的交易地址和行为;还可以通过链上地址识别某个地址参与的活动和组织。南森最近表示,它已经标记了超过 1 亿个钱包,这强调了对用户隐私的需求。

目前隐私解决方案主要包括隐私币、隐私计算协议、隐私交易网络、隐私应用等。

如果我们想要保护我们的链上交易或者选择性的活动发现,我们可以选择隐私计算协议,比如 Oasis Network。常用的技术包括零知识证明、安全多方计算、基于现代密码学的联邦学习、可信执行元(TEE)等。

然而,当前隐私协议的可用性相对有限,而且大多数仍处于开发阶段。最流行的例子是秘密网络。公链上线了跨链桥 Secret Bridge、隐私 DeFi 协议 Sienna Network、隐私交易协议 Secret Swap、比特币免信任隐私解决方案——Shinobi Protocol 等应用。

从 2021 年下半年开始,众多头部 VC 和开发者开始涌入隐私赛道。相信随着这个市场的逐步发展,用户将能够遵循区块链的基本原理,利用数据产生更大的价值。通过这种方式,用户可以在匿名和隐私之间找到平衡点。

最后简单说一下我们对一个市场趋势的判断:通过多维数据向量构建去中心化的信誉体系。它是 Web3 数据领域最重要的用例之一。基于信誉体系,信用等各种金融场景成为可能。

借贷一直是 DeFi 生态系统的重要组成部分。目前市场上的主要产品有按揭贷款(通常是超额抵押)和闪电贷。不(完全)依赖抵押品的信用贷款是该领域未来最重要的方向,因为它们将创造一个更自由的交易市场。

然而,在 DeFi 中引入信用借贷的最大障碍是贷方只面对一个地址,无法验证借款人的信用记录。解决这个问题的一种方法是在链上引入链下信用数据。但是如何在链上过程中保证链下数据的真实性,这个问题一直没有得到解答。

得益于链上身份体系的逐步完善,以及可供分析的数据和数据分析工具的增多,用户在链上的创造、贡献、赚取、拥有,都可以逐渐积累到用户的身份中。这可用于确认地址的信用评估是否有效。例如,由 AAVE 支持的 Lens Protocol 正在利用 NFT 来处理数据并为链上无抵押信用贷款奠定基础。

随着链上身份系统和数据分析工具的改进,用户的创造和资产将能够在他们的声誉中积累。因此,贷方可能会验证借款人的信用评估。AAVE 背书的 Lens 协议就是这样做的——使用 NFT 来管理数据,并在链上为无抵押信用贷款奠定基础。

 

结语

 

虽然已经为独角兽项目筹集了数百亿美元,但 Web3 数据领域仍处于起步阶段。当你站在链上的应用程序洪流中时,请记住每一点和每一字节都定义了你是哪种 Web3 公民。我们需要找到一种新的秩序和范式,才能在这个新世界中茁壮成长。

参考

https://www.theblockresearch.com/a-data-dive-into-pocket-network-123733

https://www.theblockresearch.com/alchemy-company-intelligence-115930

https://ath.mirror.xyz/w2cxg5OP1OEcqvSgsEjSSyKRJhPmam0w-fXGogiG-8

链捕手ChainCatcher提醒,请广大读者理性看待区块链,切实提高风险意识,警惕各类虚拟代币发行与炒作, 站内所有内容仅系市场信息或相关方观点,不构成任何形式投资建议。如发现站内内容含敏感信息,可点击 “举报”,我们会及时处理。
ChainCatcher 与创新者共建Web3世界