Chutes: Web3와 AI 추론의 탈중앙화 서버리스 인프라 재구성

2026-05-18 15:21:51

수집

1.핵심 요약

Chutes (SN64)는 Bittensor 네트워크 위에 구축된 분산형 서버리스 AI 컴퓨팅 플랫폼입니다. Web3의 AI 컴퓨팅 분야에서 그 핵심 위치는 "택시 호출 플랫폼"과 모델 PaaS(서비스로서의 플랫폼)와 유사합니다. 이 플랫폼은 전 세계 분산된 유휴 GPU 컴퓨팅 파워를 통합하고 고급 컨테이너 오케스트레이션 기술을 결합하여 개발자에게 즉시 사용 가능하고 필요에 따라 지불하는 AI 추론 API를 제공합니다.

기초 아키텍처에서 Chutes는 고전적인 이중 역할 게임 메커니즘을 채택합니다: 채굴자(Miners)가 기본 하드웨어를 제공하여 외부 요청에 즉시 응답하고, 검증자(Validators)가 품질을 실시간으로 평가하고 가중치를 할당하여 저비용과 높은 동시 처리 능력을 갖춘 산업급 추론 네트워크를 형성합니다. 현재 Chutes는 분산형 컴퓨팅 분야에서 실제 상업적 폐쇄 루프를 최초로 실현하였으며, 누적 9.1조 개 이상의 토큰을 처리하고 40만 명 이상의 활성 사용자를 보유하고 있으며, Bittensor 생태계에서 스스로 보고한 가치가 1억 달러를 돌파한 현상적인 서브넷이 되었습니다. 실제 비즈니스 수익을 토큰 가치에 반영함으로써 Chutes는 장기적으로 분산형 AI 분야의 유니콘급 인프라로 발전할 잠재력을 가지고 있습니다.

2.산업 배경: AI 추론의 부상과 Web2 모델의 어려움

2.1 모델 추론이란? 사전 훈련과의 본질적 차이

컴퓨팅 플랫폼을 깊이 이해하기 전에, 우리는 AI 모델 생애 주기에서 두 가지 핵심 단계인 사전 훈련(Training)과 추론(Inference)을 명확히 해야 합니다.

모델 사전 훈련: 이것은 AI 모델의 "학습 단계"입니다. 연구자들은 방대한 데이터(예: 전체 인터넷의 텍스트 자료)를 신경망에 입력하여 대규모 행렬 곱셈을 통해 모델 내부의 수십억 또는 수천억 개의 매개변수를 지속적으로 조정해야 합니다. 이 과정은 매우 시간이 많이 소요되며, 클러스터 컴퓨팅의 상호 연결 대역폭(NVLink 등)에 대한 요구가 매우 높아 "집중적으로 힘을 모아 큰 일을 하는" 중량 자산 투자의 범주에 속합니다.

모델 추론: 이것은 AI 모델의 "응용 단계"입니다. 모델 훈련이 완료되면 매개변수가 고정됩니다. 이때 사용자가 한 줄의 프롬프트(Prompt)를 입력하면 모델은 전방 전파 계산(Forward Pass)을 통해 가장 높은 확률의 다음 단어를 생성합니다. 훈련에 비해 추론에 필요한 단일 컴퓨팅 파워는 적지만, 높은 동시 처리 능력, 매우 낮은 지연 응답(Latency) 및 24/7 시스템 안정성이 요구됩니다.

2.2 컴퓨팅 분야의 발전 논리와 산업 중심의 이동

전체 컴퓨팅 분야의 발전을 되돌아보면, 우리는 명확한 진화의 주선을 볼 수 있습니다: 초기의 CPU 범용 컴퓨팅에서 GPU의 병렬 컴퓨팅의 부상(CUDA 생태계의 구축), 그리고 현재 AI 전용 TPU 및 ASIC 칩의 다채로운 발전에 이르기까지. 지난 몇 년 동안 자본과 기술의 초점은 거의 모두 "더 똑똑한 모델을 훈련시키는 방법"에 집중되었습니다. 그러나 Llama 시리즈 및 DeepSeek와 같은 오픈 소스 대모델의 능력 비약으로 인해 오픈 소스 모델과 폐쇄형 대기업(GPT-4 등) 간의 지능 격차가 빠르게 해소되었습니다. AI 산업의 가치 포착 중심은 "모델 사전 훈련"에서 "모델 추론(Inference)"으로 되돌릴 수 없는 방향으로 이동하고 있습니다. 그 이유는 대모델이 진정한 대규모 상업화와 다양한 산업에 대한 역량을 실현하려면 24/7의 높은 가용성과 낮은 지연 응답 능력을 갖추어야 하기 때문입니다. 이때 "모델을 저렴하고 안정적이며 빠르게 운영하는 방법"이 산업의 가장 큰 고통점이 되었습니다.

2.3 Web2 시대의 AI 추론 참여자 및 핵심 한계

현재의 Web2 추론 분야는 다음과 같은 몇 가지 유형의 참여자에 의해 주도되고 있습니다:

폐쇄형 모델 API 제공업체: OpenAI (ChatGPT), Anthropic (Claude), Google (Gemini)와 같은 업체들이 있습니다. 이들은 매우 사용하기 쉬운 API를 제공하지만 블랙박스 방식으로 운영되며, 가격이 비싸고 생태계에 강한 결속력이 있습니다.

전통적인 클라우드 서비스 대기업: AWS (아마존 클라우드), Microsoft Azure, Google Cloud와 같은 업체들이 있습니다. 이들은 기본 가상 머신 또는 GPU 리스 서비스를 제공하며 유연성이 높지만 운영 비용이 매우 큽니다.

수직형 추론 서비스(MaaS) 플랫폼: Together AI, Anyscale, HuggingFace Inference Endpoints와 같은 업체들이 있습니다. 이들은 오픈 소스 모델을 위한 추론 호스팅 서비스를 전문으로 제공합니다.

그러나 개발자들이 이러한 Web2 대기업(OpenAI API, AWS 또는 Together AI)의 서비스를 사용할 때 여전히 세 가지 극복하기 어려운 장애물에 직면하게 됩니다: 높은 "컴퓨팅 세금"과 결제 세분화의 거칠음: 중앙 집중식 데이터 센터의 하드웨어 및 소프트웨어 감가상각(장소 임대료, 냉각 시스템, 비싼 서버 구매) 및 유지 관리 비용이 매우 높아 최종적으로 개발자에게 전가되는 API 호출 비용이 높습니다. 또한 전통적인 클라우드 컴퓨팅은 종종 "시간" 또는 "전체 머신" 단위로 요금이 청구되며, 이러한 전통적인 요금 모델은 대규모 애플리케이션의 대량 순간 동시 처리 요구에 적합하지 않으며 비수기에는 심각한 자원 낭비가 발생하는 경우가 많습니다.

복잡한 "인프라 함정": 클라우드 공급업체 API를 건너뛰고 오픈 소스 대모델을 직접 배포하려는 스타트업 팀은 매우 가파른 학습 곡선에 직면해야 합니다. 그들은 복잡한 그래픽 카드 선택, 기본 드라이버 구성, 추론 가속 프레임워크(vLLM, TensorRT 등) 조정, 노드 유지 관리 및 컨테이너화 클러스터 오케스트레이션 등의 문제를 해결해야 하며, 공학적 장벽이 매우 높습니다.

공급업체 잠금 및 데이터 프라이버시 위험: 기업이 특정 클라우드 공급업체의 API 서비스에 깊이 결합되면, 향후 기술 경로 확장 및 비용 구조가 완전히 제약을 받게 됩니다. 더욱 치명적인 것은 의료, 금융, 법률 등 고도로 민감한 산업에서 핵심 비즈니스의 비밀 데이터를 중앙 집중식 API 서버로 전송하여 처리하는 경우, 데이터 유출 위험과 규정 준수 위험이 매우 높습니다.

3.해결책: Chutes가 "네트워크"를 통해 AI 추론을 재구성하다

3.1 핵심 위치: AI 생태계의 "택시 호출 플랫폼"과 분산형 PaaS

방대하고 분업이 명확한 Bittensor 생태계에서 각 서브넷은 각자의 역할을 수행합니다. 예를 들어, Templar (SN3)는 "자동차 제조 공장"의 역할을 하며, 그 핵심 임무는 처음부터 시작하여 컴퓨팅 파워를 집합하여 지능이 뛰어난 오픈 소스 모델을 훈련시키는 것입니다. 반면 Chutes (SN64)의 위치는 전혀 다르며, "운영 서비스"에 집중하여 Web3 시대의 "택시 호출 플랫폼" 역할을 수행합니다.

Chutes는 모델을 생산하는 것이 아니라, 네트워크 프로토콜을 통해 전 세계에 분산된 "차량"(즉, 세계 각지의 유휴 GPU 컴퓨팅 파워)을 효율적으로 통합하여 기존의 최상급 오픈 소스 모델이 이러한 노드에서 효율적으로 운영되도록 하여 외부 개발자에게 원활한 추론 서비스를 제공합니다. 본질적으로 Chutes는 블록체인 위에 분산형, 오픈 소스 친화적이며 고도로 표준화된 기본 PaaS(서비스로서의 플랫폼) 시설을 구축하였습니다.

3.2 진정한 서버리스 경험과 극대화된 비용 이점

Chutes가 개발자에게 가져다주는 핵심 혁신은 진정한 서버리스(Serverless) 경험을 실현한 것입니다. Chutes를 사용할 때 개발자는 기본 하드웨어 선택, 환경 구성 및 클러스터 유지 관리에 대해 전혀 걱정할 필요가 없으며, 몇 줄의 코드만 수정하면 OpenAI 형식과 완벽하게 호환되는 API를 통해 네트워크에 원활하게 접속할 수 있습니다. 비용 통제 측면에서, 블록체인 원주율의 암호화 마이크로 결제(Micropayments) 메커니즘을 기반으로 Chutes는 업계에서 드문 "단일 토큰 단위로 요금 청구"하는 슈퍼 세분화된 결제를 실현하였습니다. 이러한 혁신적인 결제 방식은 전통적인 클라우드 호스팅의 시간 단위 요금으로 인한 자원 낭비를 완전히 제거하였습니다. 실제 응용에서 이러한 이점은 전통적인 클라우드 서비스(AWS 등)보다 약 85% 저렴하고, 시장의 대부분 중앙 집중식 API 플랫폼보다 최소 40%의 비용을 절감합니다.

3.3 프라이버시 업그레이드: TEE 아키텍처로 신뢰의 순환 구축

분산형 네트워크에서 사용자가 익명 노드에 입력하는 프롬프트(프롬프트)와 비즈니스 데이터를 보호하는 방법은 항상 가장 큰 문제였습니다. 기업 고객의 프라이버시에 대한 깊은 우려를 해결하기 위해 Chutes는 현재 네트워크 내에서 TEE(신뢰 실행 환경, Trusted Execution Environments)의 배포를 전면적으로 추진하고 있습니다. TEE 기술은 하드웨어 수준의 암호화 수단을 활용하여 CPU/GPU 내부에 엄격하게 보호된 메모리 영역을 격리합니다. 이는 분산형 노드가 암호화된 "블랙박스" 내에서 추론 요청을 처리할 수 있음을 의미하며, 계산 과정 전반에 걸쳐 채굴자조차도 사용자의 민감한 입력 데이터를 엿볼 수 없습니다. 이러한 기본 기술의 도입은 분산형 네트워크가 기업 상용 배치에 대한 규정 준수 및 프라이버시 문제를 근본적으로 해결하여 Web2 기업의 대규모 채택을 위한 장애물을 제거합니다.

4.핵심 아키텍처: AI 추론이 네트워크에서 어떻게 이루어지는가

Chutes의 기본 분산 아키텍처에서 시스템은 복잡한 라우팅 및 부하 분산 메커니즘을 통해 대량의 추론 작업을 전 세계 네트워크에 분배합니다. 그 핵심 참여자는 두 가지로 명확히 구분되며, 정교한 암호학 및 경제 시장 게임을 통해 최종 서비스 품질을 보장합니다:

채굴자(서비스 제공자): 전 세계의 컴퓨팅 노드는 스테이킹을 통해 시스템에 접속한 후, 네트워크 지침에 따라 시스템이 지정한 "상주 열 모델"(Permanently Hot Models)을 로드해야 합니다. "열 모델"은 모델의 대량 매개변수가 이미 GPU의 비디오 메모리(VRAM)에 미리 로드되어 있음을 의미합니다. 고급 컨테이너 오케스트레이션 기술을 기반으로 이러한 컴퓨팅 노드는 항상 높은 시스템 가용성을 유지해야 하며, 즉시 유입되는 고동시 API 요청을 매우 낮은 콜드 스타트 지연으로 수용할 수 있어야 합니다.

검증자(품질 검사원): 분산형 네트워크에서는 중앙 기관이 감독할 수 없으므로 검증 노드(Validators)에 의존해야 합니다. 검증자는 지속적으로 채굴자에게 무작위로 생성된 테스트 요청을 보내고 실제 비즈니스 요청을 라우팅하며, 응답 지연(첫 단어 생성 시간 TTFT), 처리 능력(초당 생성되는 토큰 수) 및 출력 정확도 등 여러 핵심 차원에서 채굴자의 서비스를 엄격하게 평가합니다. 우수한 성과를 보인 채굴자는 풍부한 네트워크 토큰 보상을 받으며, 성과가 좋지 않거나 악의적인 행동을 시도하는 채굴자는 시스템에 의해 무자비하게 퇴출되거나 심지어 스테이킹 금액이 몰수됩니다.

이러한 Bittensor 기반의 분산형 게임 아키텍처는 이익 동기를 서비스 품질 보장으로巧妙하게 전환하여 느슨한 분산형 네트워크조차도 중앙 집중식 최고 데이터 센터에 필적하는 산업급 시스템 안정성을 지속적으로 출력할 수 있도록 보장합니다.

5.경제 엔진: "인플레이션 주도"에서 "실제 자생"으로의 전환

암호화 세계의 과거 주기에서 많은 초기 Web3 컴퓨팅 프로젝트는 사망의 나선에 빠졌습니다: 이들은 토큰의 악성 인플레이션 방출에 과도하게 의존하여 컴퓨팅 파워를 보조하고(소위 "채굴"), 일단 2차 시장의 성과가 좋지 않으면 컴퓨팅 파워가 빠르게 유출됩니다. 반면 Chutes의 가장 핵심적인 경쟁력은 건강한 분산형 상업적 폐쇄 루프를 성공적으로 실현한 것입니다.

현재 Chutes 네트워크는 매일 안정적으로 대량의 실제 B2B(기업) 및 B2C(최종 소비자) API 요청을 처리할 수 있습니다. 토큰 시스템을 통해 네트워크는 이러한 사용자에게 실제 서비스 요금을 부과합니다. 더 중요한 것은 시스템 기본 내장 자동 스테이킹(Auto-Staking) 및 결제 메커니즘에 의존하여 외부 실제 세계에서 발생한 비즈니스 수익(법정 통화 결제에서 시작될 수 있음)이 최종적으로 네트워크 생태 자산(토큰)에 대한 강력한 구매 수요로 직접 전환된다는 것입니다. 이 메커니즘은 토큰 보유자 및 네트워크 유지에 참여하는 모든 세력에 지속적으로 반영되어 "돈을 태워서 컴퓨팅 파워를 사는" 폰지 모델에서 "실제 비즈니스 자생"의 지속 가능한 경제 모델로의 전환을 실현합니다.

6.생태 현황 및 눈에 띄는 데이터 성과

최근의 체인 및 비즈니스 데이터 추적에 따르면, Chutes 네트워크는 실제 고동시 비즈니스 시나리오에서 매우 강력한 처리 한계와 깊은 시장 침투율을 보여주었습니다.

핵심 비즈니스량의 폭발적 증가: Chutes 네트워크는 누적 9.1조 개 이상의 토큰을 처리하였으며, 이는 Web3 및 많은 Web2 중형 플랫폼에서 매우 중요한 숫자입니다. 일일 피크 처리량은 최대 500억 회에 달하며, 40만 명 이상의 최종 사용자 및 개발자에게 서비스를 제공하였습니다.

절대적인 시장 지위: 탄탄한 비즈니스 데이터를 바탕으로 Chutes는 Bittensor 생태계 내에서 스스로 보고한 가치가 1억 달러를 초과한 최초의 현상적인 서브넷이 되었습니다.

깊은 생태 통합 및 "전기, 물, 가스" 속성: 외부적으로 Chutes는 많은 인기 있는 애플리케이션에 성공적으로 서비스를 제공하였습니다. 내부적으로 Chutes는 Bittensor 생태계 내 다른 서브넷(각종 수직 애플리케이션 및 데이터 처리에 집중하는 서브넷)의 핵심 컴퓨팅 제공자로 점차 자리 잡고 있으며, 전체 분산형 AI 생태계의 기본 "전기, 물, 가스"의 중요한 역할을 하고 있습니다.

안정적인 토큰 경제 지표: 2026년 5월 12일 기준으로 Chutes의 서브넷 토큰 Alpha (alpha token) 가격은 약 0.0877 TAO입니다. 네트워크는 약 13666개의 지갑 주소를 유치하였으며, 244개의 활성 채굴자 노드와 12개의 검증자 노드를 보유하고 있습니다. 네트워크 배출 비율은 8.77%입니다. 동시에 DEX 유동성 풀에서 기본 자산 TAO 비율은 7.88%, Alpha 비율은 92.12%입니다. 컴퓨팅 규모나 자본 규모 모두에서 Chutes는 TAO 생태계에서 절대적인 선두 프로젝트에 해당합니다. 이러한 데이터는 그 실제 시장 열기를 명확히 반영합니다:

(데이터 출처: https://bittensormarketcap.com/subnets/64)

7.경쟁 구도, 잠재적 도전 및 최종 전망

7.1 핵심 강점 및 분야 방어벽

현재의 분산형 컴퓨팅(DePIN + AI) 분야는 "개념을 이야기하고 백서를 작성하는" 황무지 시대를 완전히 벗어나 "배달, 비용, 안정성"을 겨루는 심수구로 들어섰습니다. 맨몸의 기계 임대만 제공하는 플랫폼에 비해 Chutes의 가장 강력한 방어벽은 방대한 비즈니스 데이터에 의해 엄격하게 검증된 상업적 추론 제공 능력과 전통적인 Web2 대기업에 대한 절대적인 비용 압도적 우위입니다. 향후 전면적으로 출시될 TEE 프라이버시 암호화 아키텍처와 결합하여 Chutes는 실리콘밸리 대기업의 생태 독점과 데이터 패권을 두려워하는 개발자들에게 완전히 허가가 필요 없는(무허가) 매우 비용 효율적인 이상적인 인프라를 제공합니다.

7.2 잠재적 도전 및 해결의 난관

현재의 비즈니스 데이터와 모델 흐름이 매우 눈부시지만, Chutes가 Web3에서 더 넓은 주류 세계로 나아가려면 앞으로 몇 가지 하드코어 난관을 극복해야 합니다. 극단적인 동시 처리에서의 여유 탄력성 시험: 미래에 진정한 "킬러급" 수천만 일일 활성 AI 애플리케이션이 등장하고 매우 짧은 시간 내에 네트워크에 접속할 경우, 분산형 네트워크가 컴퓨팅 수요가 급증하는 상황에서도 여전히 밀리초 수준의 낮은 지연 응답을 유지하고 다운타임이 발생하지 않도록 보장할 수 있는지는 스케줄링 알고리즘에 대한 궁극적인 시험입니다. 기업 시장의 인식 전환: TEE 기술의 지원에도 불구하고, 전통적인 Web2 기업의 고정관념을 깨고 더 많은 규제 준수 기업이 분산형 API 프로토콜을 신뢰하고 대규모로 채택하도록 하는 것은 여전히 긴 시간과 지속적인 시장 교육 및 육성이 필요합니다.

7.3 최종 전망

요약하자면, 다중 모달 대모델과 AI 에이전트(AI Agents)의 고빈도 자율 상호작용 시대가 본격적으로 도래함에 따라 기계 간의 대화는 기하급수적으로 증가하는 추론 수요를 발생시킬 것입니다. 이때 저비용, 무제한, 필요에 따른 마이크로 결제를 지원하는 분산형 추론 계층은 차세대 인터넷의 필수 인프라가 될 것입니다. Chutes가 대표하는 것은 단순히 기본 컴퓨팅 자원 분배 방식의 분산화가 아니라 인류 사회의 오픈 소스 지식 자원의 보편적 분배입니다. 만약 Chutes가 트래픽 수용의 높은 장벽과 전통 기업의 채택에 대한 신뢰의 간극을 성공적으로 넘길 수 있다면, 향후 몇 년 내에 분산형 AI 분야에서 장기적인 가치 포착 능력을 갖춘 슈퍼 기반 및 유니콘 플랫폼으로 성장할 가능성이 매우 높습니다.

Join ChainCatcher Official

Telegram Feed: @chaincatcher

X (Twitter): @ChainCatcher_

위험 경고