왕펑이 팀 공과 다시 대화하다: 탈중앙화된 AI, AI 에이전트와 PoI
대화자:
왕펑: 블루포트 인터랙티브 창립자, 화성 금융 및 Elenment 발기인
팀 공: SIG 중국 창립 파트너, ByteTrade 회장
편집자 주: 2023년 섣달 그믐날, 왕펑과 팀 공이 대화를 나누었고, 주제는 정보 정렬, 엔트로피, 공공 블록체인 및 Web3의 미래에 관한 것이었습니다 (링크: 왕펑 섣달 그믐날 대화 팀 공: 정보 정렬, 엔트로피 및 Web3의 내일에 관하여). 이 대화가 있은 지 1년이 지났고, 이 1년 동안 ChatGPT는 큰 인기를 끌었으며, LLMs는 정보의 생성 및 배포에 깊은 영향을 미쳤습니다. 팀 공 박사의 인식은 어떤 업데이트가 있었고, 그가 이끄는 ByteTrade는 어떤 작업을 했을까요? 크리스마스 이브에 왕펑은 다시 팀 공과 대화를 나누었습니다.
2022년 6월, SIG는 싱가포르에 본사를 둔 Web3 정보 애플리케이션의 기본 소프트웨어 플랫폼 ByteTrade의 새로운 4천만 달러 투자 라운드를 주도한다고 발표했으며, SIG 중국 창립 파트너 팀 공이 이 회사의 회장으로 취임했습니다. 팀 공은 상하이 교통대학교 물리학과를 졸업하고 프린스턴 대학교에서 전자공학 박사 학위를 받았습니다. SIG는 바이트댄스의 초기 투자자 중 하나이며, 현재까지도 최대 투자 주주입니다.
작년 섣달 그믐날 밤 왕펑과 팀 공은 "왜 분산된 정보 배포가 필요한가"에 대해 논의했습니다. 이는 사람들이 흔히 말하는 Web3입니다. 그 후 OpenAI는 ChatGPT를 발표했습니다. 지난 1년 동안 LLMs는 정보의 생성 및 배포에 깊은 영향을 미쳤습니다. 많은 SIG가 투자한 Web3, 클라우드 컴퓨팅 또는 AI 회사들이 지난 1년 동안 기회를 포착하고 제품 방향을 조정했습니다. 팀 공이 지난 1년 동안 어떤 업데이트가 있었는지 살펴보겠습니다.
다음은 왕펑과 팀 공의 대화 전문입니다:
1. 많은 창업자와 투자자들이 현재 AI 네이티브 제품과 회사에 대해 논의하고 있습니다. 당신이 이해하는 AI 네이티브란 무엇인가요?
일반적인 정의는 "AI 없이는 작동하지 않는 제품"일 것입니다. 예를 들어, copilot과 같은 제품은 AI 네이티브라고 할 수 없습니다. 결국 AI가 없는 구글 검색, Microsoft Office 및 GitHub Codespaces는 여전히 유용한 제품이며, AI가 제공하는 가치는 경험을 점진적으로 향상시킵니다.
AI 에이전트와 같은 제품은 사용자가 자연어로 상호작용하고 AI가 전체 작업을 이해하고 계획하며 추론하고 실행하는 것을 요구합니다. 이는 AI 네이티브입니다. AI 에이전트는 도구가 아니라 사람과 협력하는 새로운 생물입니다.
정보를 찾는 것(구글을 대표로 하는 검색)에서 정보가 사람을 찾는 것(바이트를 대표로 하는 추천)으로, 그리고 개인 AI 에이전트가 사람의 정보 생산 및 소비를 돕는 것으로 발전해왔습니다. 우리는 항상 엔트로피 감소를 실현하기 위한 새로운 방법을 발명해왔습니다.
2. 새로운 생물인 AI 에이전트는 인간을 대체할 것인가요?
물론 아닙니다. 최근 정밍 교수님이 언급한 "창의적인 사람과 기계의 협업은 미래의 주류 작업 상태"라는 관점을 떠올립니다.
현재 시장에서 AI 에이전트에 대한 정의는 매우 광범위합니다. 대모델에 지식, 기억, 감각("눈과 귀") 및 행동 능력("손")을 제공하는 모든 응용 프로그램은 에이전트입니다. 물론 에이전트는 기계가 사람을 직접 확장하는 것도 포함됩니다. 예를 들어, 대모델 기반의 로봇, 개인 IoT 스마트 장치 또는 디지털 트윈 환경이 있습니다. 현재 시장의 대모델 응용 스타트업은 기본적으로 100%가 에이전트를 만들고 있습니다.
3. 만약 AI 에이전트가 미래의 주요 제품 형태라면, 이는 미래의 전체 소프트웨어 생태계에 어떤 영향을 미칠까요?
정밍 교수님이 말씀하신 것처럼 "Web2의 소프트웨어 생태계는 사람들이 도구가 되도록 돕는 것"이라고 생각합니다. 저는 미래의 소프트웨어 생태계가 주로 AI 에이전트를 위해 서비스될 것이라고 믿습니다. 사람들은 AI 에이전트와 상호작용하기만 하면 되고, 다른 소프트웨어는 사람과 직접적인 관계가 없어집니다. 에이전트 또는 "로봇"은 정보를 얻고, 돈을 벌고(작업 또는 거래), 학습을 돕고, 심지어 사회적 상호작용을 도와줄 수 있습니다. 당신의 개인 에이전트는 당신이 가장 신뢰하고 유용한 동반자가 될 것이며, 당신은 그와 상호작용하기만 하면 됩니다.
예를 들어, 최근 대모델 분야에서 특히 유행하는 프롬프트 엔지니어링(프롬프트 엔지니어링) 및 RAG와 같은 기술은 AI 에이전트를 서비스하기 위한 소프트웨어입니다. 이것이 바로 기본 소프트웨어 레벨에서의 AI 네이티브입니다.
Mistral AI의 창립자는 최근 상대적으로 작은 오픈 소스 LLM, 예를 들어 7B 파라미터 모델이 개발자가 직접 실행할 수 있게 하며, 충분한 "지능"이 나타날 수 있는 지점이 바로 에이전트 혁신의 스위트 스폿이라고 말했습니다.
4. 오픈 소스 LLM에 대해 이야기하자면, 여전히 회의적인 사람들도 있습니다. 최근 OpenAI 개발자 데이에서 발표된 일련의 제품들은 하룻밤 사이에 급성장한 기술 대기업의 절대적인 이점을 보여줍니다. OpenAI의 선발 우위가 이렇게 강력한데, AI의 미래는 중앙집중화될까요?
오픈 소스 대모델은 현재 점점 더 빠르게 발전하고 있으며, 경쟁력이 높아지고 있습니다. 며칠 전 Hugging Face에서 검색해보니 Llama2 아키텍처를 기반으로 재훈련하거나 미세 조정한 오픈 소스 대모델이 수천 개에 달하며, 성능 순위에서 OpenAI와의 격차도 계속 줄어들고 있습니다.
또한 OpenAI Dev Day에서 발표된 일련의 제품들은 모델 미세 조정, RAG 지식 기반, 구조화된 출력 및 애플리케이션 오케스트레이션 등 이미 훌륭한 오픈 소스 솔루션이 존재합니다. 심지어 애플리케이션 측면에서 OpenAI는 오픈 소스 혁신을 따라잡고 모방하고 있다고 할 수 있습니다.
5. 하지만 LLM 연구 및 추론에 필요한 GPU 자원은 큰 투자가 필요하므로 매우 쉽게 중앙집중화될 수 있습니다. 많은 사람들이 GPU가 풍부한 대기업과 GPU가 부족한 스타트업 간의 격차가 점점 더 커질 것이라고 말합니다.
저는 이 의견에 동의하지 않습니다. 간단히 말해, 현재 가장 중요한 오픈 소스 대모델인 llama2는 GPU가 풍부한 메타에서 발표한 것이 아닙니까? 그리고 GPU가 풍부한 구글, 마이크로소프트, 아마존은 오늘날까지도 영향력 있는 것을 발표하지 않았습니다. GPU는 분명히 혁신의 충분한 조건이 아닙니다. 혁신은 사람에게 달려 있으며, GPU가 아닙니다. 오픈 소스의 가장 큰 장점은 사람들을 모을 수 있다는 것입니다. 또한 GPU 성능이 점점 더 저렴해짐에 따라 모델 훈련의 주요 문제는 데이터, 특히 개인 데이터가 될 가능성이 높습니다.
심지어 GPU가 풍부하다고 해서 대모델 혁신의 필수 조건은 아닙니다. 개인 컴퓨터와 엣지 데이터 센터에는 많은 여분의 GPU가 있습니다. 이들은 모델 훈련에는 적합하지 않을 수 있지만, 95%의 애플리케이션 작업량을 차지하는 미세 조정 및 추론에는 이러한 분산 GPU 자원이 매우 유용할 수 있습니다.
하지만 저는 CPU를 사용하여 대모델 추론을 실행하는 등의 추가적인 기술 혁신을 기대하고 있습니다. 사회에는 많은 유휴 CPU 성능과 메모리가 있습니다. 이 분야에서의 최전선 작업이 많이 이루어지고 있습니다. 우리의 포트폴리오 회사인 Second State는 개인 노트북이나 IoT 엣지 장치에서 오프라인으로 대모델을 실행할 수 있도록 구현했습니다.
저는 분산 AI 대모델 애플리케이션의 미래를 매우 기대하고 있습니다.
6. 당신은 분산 AI 에이전트의 가능성에 대해 이야기했습니다. 하지만 그것들이 필요할까요? 당신의 구상에서 분산화는 사용자의 어떤 요구를 해결할 수 있을까요?
AI 에이전트가 우리 각자의 정보 입구와 출구를 완전히 장악할 가능성이 있기 때문에, 우리는 그에 대해 높은 신뢰를 가져야 합니다. 우리는 그것이 다른 사람에게 통제되는 것을 허용할 수 없으며, 광고주의 상업적 유도도 참을 수 없습니다. 이는 에이전트가 개인적이며 분산화되어야 함을 결정합니다. 기업과 개인은 분산화된 인프라가 필요합니다.
더 나아가, 개인의 로봇 비서, IoT 스마트 장치 또는 디지털 트윈은 본래 사용자가 소유하는 컴퓨터이며 본질적으로 분산화되어 있습니다. ByteTrade에서는 이 인프라를 "개인 엣지 클라우드"라고 부릅니다.
하지만 개인 에이전트는 협력이 필요합니다. 사람처럼 각 에이전트는 다른 에이전트와 자원을 교환해야 합니다. 이러한 교환은 계산 능력(예: 당신의 에이전트가 여유 GPU를 가지고 있는 경우), 정보, 자산 또는 현실 사회의 권한(예: 당신의 에이전트가 특정 제한 자산을 거래할 수 있는 정부 라이센스를 가지고 있는 경우)일 수 있습니다. 이는 모두 새로운 기회입니다.
7. 사람과 사람의 협력은 조직 관계에 의존합니다. 사람과 기계의 협력은 무엇에 의해 이루어질까요?
현대 상업 문명의 기초는 화폐, 즉 사람 간의 가치 교환 네트워크입니다. 우리의 스마트 에이전트도 에이전트 간 및 에이전트와 사람 간의 상업적 협력을 가능하게 하는 가치 교환 네트워크가 필요합니다.
리페이페이 박사는 최근 인터뷰에서 "이 기술을 생각할 때, 우리는 인간의 존엄성, 인간의 복지—인간의 일—를 고려의 중심에 두어야 한다"고 언급했습니다. 사람과 AI 에이전트 간의 상호작용과 협력은 인간의 존엄성을 유지해야 합니다.
오늘날 우리는 이러한 네트워크의 기본 기술을 이미 보유하고 있습니다. 그것은 블록체인 기반의 분산 원장 기술입니다. 전체 암호화폐 및 Web3 커뮤니티는 분산화된 P2P 거래 시스템에 대해 많은 시도와 혁신을 해왔습니다. ByteTrade에서는 이러한 정량화 및 거래 가능한 에이전트 기여를 "지능의 증명(Proof of Intelligence, PoI)"이라고 부릅니다. 이 지능은 광의의 "지능"으로, 인간 또는 기계의 지적 노동의 결과입니다.
8. 이 세상에서 모든 사람이 DID(분산화된 신원)를 받아야 할까요?
샘 올트먼의 월드코인은 개인의 증명의 증명(Proof of Personhood)에 대해 이야기합니다. OpenAI의 창립자로서 그는 미래 AI 세계에서 인간이 가치 네트워크에 참여하기 위해 "자기 증명"이 필요하다는 것을 인식했습니다. DID는 이 비전을 실현하기 위한 구체적인 기술 수단일 뿐입니다.
ByteTrade의 지능의 증명은 인간과 스마트 AI 에이전트를 동일한 네트워크에서 가치 교환을 하도록 합니다. 우리는 여기서 처음의 주요 시나리오가 에이전트가 인간의 선호를 학습한 다음 다른 에이전트와 상호작용하는 것이라고 생각합니다. 예를 들어,
- 하나의 에이전트는 사용자가 VR 세계에서의 쌍둥이로, 다른 사람의 에이전트와 디지털 세계에서 상호작용합니다.
- 하나의 에이전트는 자신의 노드에서 유휴 GPU 자원을 판매하고, 다른 에이전트의 유휴 저장 자원을 교환합니다.
- 하나의 에이전트는 특정 분야에서 뛰어난 성능을 보이는 미세 조정된 대모델을 가질 수 있습니다(예: 이 에이전트의 인간 동반자가 산업 전문가입니다). 그것은 이 모델을 다른 에이전트에게 "임대"할 수 있습니다.
- 하나의 에이전트는 개인 데이터가 있어 다른 에이전트가 특정 문제를 더 잘 해결하도록 도울 수 있습니다. 그것은 이 데이터를 판매하거나, 심지어 이 데이터를 기반으로 계산 서비스를 제공할 수 있습니다.
- 하나의 에이전트는 DAO 또는 공공 블록체인의 스테이킹 노드를 운영하고, 스테이킹 자금을 늘리는 에이전트와 수익을 공유합니다.
이러한 에이전트 간의 교환은 모두 PoI의 구체적인 표현입니다. 이러한 PoI는 블록체인에서 다양한 형태로 나타날 수 있습니다. 예를 들어, 동질적인 계산 자원은 대체 가능한 토큰(fungible tokens)일 수 있으며, 특별하고 유일한 데이터나 알고리즘은 NFT가 될 수 있습니다. 이 지능의 가격을 어떻게 책정할지는 분산화된 RFQ 네트워크(예: Otomic) 또는 NFT 거래 플랫폼(예: Element)이 결정합니다.
9. 분명히 AI 중앙집중화를 이끄는 또 다른 거대한 힘은 정부입니다. 중국이나 미국의 인공지능 산업 관계자들은 중미 두 정부가 대모델을 "규제"하려고 한다는 것을 의심하지 않을 것입니다. 창투계에서는 많은 사람들이 규제가 혁신에 영향을 미칠 것이라고 말하는데, 당신의 의견은 어떤가요?
저는 대모델, 나아가 AGI가 사회에 해를 끼칠 위험이 실제로 존재한다고 생각합니다. 하지만 문제를 해결하는 방법은 기술 혁신과 산업 자율성에 의존해야 합니다. 예를 들어, 대모델이 가짜 뉴스를 생성할 수 있지만, 그것은 또한 가짜 뉴스를 탐지할 수 있습니다. 우리의 각 에이전트는 정보의 진위를 독립적으로 판단할 수 있으며, 그들이 생성한 결과는 NFT로 기록되어 블록체인에 저장될 수 있습니다. 예를 들어, A의 에이전트가 B의 모델과 A의 데이터를 사용하여 사실적인 짧은 비디오를 생성하면, A는 동시에 이 비디오의 출처를 증명하기 위해 NFT를 발행할 것입니다. 이렇게 하면 이 비디오를 보는 사람은 누구나 그 출처를 추적할 수 있습니다.
만약 서로 다른 에이전트가 정보의 진위에 대해 논란이 있다면, PoI는 커뮤니티가 합의에 도달할 수 있는 훌륭한 메커니즘을 제공합니다.
일론 머스크가 X에서 구현한 커뮤니티 노트는 사용자가 콘텐츠에 대해 투표하게 하여 상당히 성공적인 시도입니다. 하지만 OpenAI 이사회의 "궁중 싸움"에서 볼 수 있듯이, 이해관계가 없는 투표는 매우 위험하며 쉽게 악용될 수 있습니다.
AI 에이전트를 사용하면 콘텐츠의 진위에 대해 대규모로 투표할 수 있습니다. PoI는 경제적 메커니즘으로, 에이전트와 그들의 인간 대리인이 투표에 비용을 지불하게 하여 그들이 이해관계를 가지도록 합니다. 저는 이 방향의 창업 프로젝트가 매우 기대됩니다!
10. 창업 회사에 대해 이야기하자면, 당신이 회장으로 있는 ByteTrade는 이미 이러한 작업을 시작했나요?
네, ByteTrade는 작년에 설립되었을 때부터 모든 사람의 계산 자원을 연결하여 분산화된 "개인 클라우드"를 구축하고자 했습니다. 이는 오늘 우리가 이야기하는 에이전트와 다르지 않습니다. 지난 1년 동안의 주요 변화는 AI가 더 강력해졌기 때문에 AI 에이전트의 응용 시나리오와 수요가 한 단계 더 발전했다는 것입니다. ByteTrade에 대해 말씀드리자면, 우리는 내년에 몇 가지 제품 모듈을 단계적으로 발표할 예정입니다.
- Terminus OS는 우리의 개인 클라우드 제품입니다. 이는 모든 사람이 오픈 소스 AI 대모델 및 에이전트를 실행할 수 있는 분산화된 계산 플랫폼을 제공합니다.
- Terminus에는 특히 높은 보안이 필요한 금융 또는 블록체인 애플리케이션을 위한 몇 가지 핵심 애플리케이션이 사전 설치됩니다. 예를 들어 지갑, 신원을 확인하는 DID 등이 있습니다.
- Terminus 마켓플레이스는 분산화된 애플리케이션 시장입니다. ByteTrade와 제3자 개발자는 여기에서 AI 에이전트, 콘텐츠 추천 엔진, 자동 거래 로봇 등을 발표할 수 있습니다.
- Otomic은 우리가 RFQ 기반으로 구축한 거래 네트워크입니다. 이 네트워크에서는 주로 Terminus에서 실행되는 로봇이 가격을 제시하고 자동으로 거래를 실행합니다. 이 분산화된 RFQ 메커니즘은 거의 모든 암호화폐 및 전통 금융의 디지털 자산과 파생상품을 거래할 수 있습니다.
ByteTrade는 한편으로는 오픈 소스 대모델 및 AI 에이전트를 위한 분산화된 소프트웨어 개발, 발표 및 실행의 인프라를 제공하고, 다른 한편으로는 공공 블록체인 기반의 PoI 가치 교환 네트워크를 구축하여 AI 에이전트의 협력이 가능하도록 합니다. 내년에 여러분과 이러한 문제에 대해 더 깊이 논의할 수 있는 기회를 기대합니다!
정말 좋습니다. 오늘 시간 내주신 공 박사님께 감사드리며, ByteTrade의 제품을 매우 기대합니다!












