코인베이스 엔지니어 줄리 시와의 대화: AI 에이전트는 지능이 부족한 것이 아니라 모두가 사용할 수 있는 IAM이 부족하다
저자: ChainCatcher 특별 기자
20세에 Julie Shi는 자율주행 회사 Pony.ai 알고리즘 팀의 첫 여성 엔지니어가 되었습니다. 5년 후인 오늘, 그녀의 정체성은 AI와 Crypto 두 세계를 아우르고 있습니다------Coinbase 소프트웨어 엔지니어, Satoshi Inc 창립자, Berkeley Sky Computing Lab rLLM 프레임워크 핵심 기여자, ENS DAO 역사상 단 5명의 Fellow 중 한 명이며, MIT GenAI Competition 챔피언이자 ETHGlobal 여러 차례 결선 진출자입니다.
많은 Web2에서 Web3로 "전환"한 종사자들과는 달리, Julie는 결코 "전환"한 적이 없습니다. AI와 Crypto는 그녀에게 항상 두 개의 평행선이었습니다------Pony.ai에서 Meta, 그리고 Coinbase와 Satoshi Inc에 이르기까지, 그녀는 항상 이 두 길을 동시에 걸어왔습니다.
이번 대화에서 Julie는 낙관적인 AI × Crypto 서사를 제시하지 않았습니다. 반대로, 그녀는 기술적으로 체인 상의 신원 관리가 Web2보다 우수한 이유와 현실에서 왜 통하지 않을 수 있는지------그리고 어떤 조건에서 이 일이 실제로 발생할 가능성이 있는지를 솔직하게 이야기했습니다.
1. AI와 Crypto는 결코 이분법이 아니다
기자: 당신의 경험은 매우 흥미롭습니다------Pony.ai, Meta, Coinbase, ENS DAO, Berkeley의 rLLM 프로젝트, 순수 AI와 순수 Crypto가 모두 포함되어 있습니다. 많은 사람들이 이를 "AI에서 Crypto로 전환"한 것으로 이해할 수 있지만, 당신은 그렇게 보지 않는 것 같습니다?
Julie Shi: 맞아요, 전환이 전혀 아닙니다. 제가 20세에 Pony.ai 알고리즘 팀에 있을 때 이미 Crypto에 접촉하고 있었고, 두 가지는 항상 평행했습니다.
저는 AI와 Crypto가 반드시 겹쳐야 한다고 생각하지 않습니다. 많은 경우, 그들이 해결하는 문제는 완전히 다른 차원의 문제이며, 억지로 결합할 필요는 없습니다. 제가 이 두 분야를 좋아하는 이유는------이 두 분야 모두 세상을 변화시킬 수 있는 거대한 레버리지를 가지고 있기 때문입니다. Crypto의 레버리지는 permissionless의 글로벌 금융으로, 자본과 가치의 흐름이 더 이상 접근을 필요로 하지 않게 합니다; AI의 레버리지는 생산성의 기하급수적 도약입니다. 그리고 이들 모두 매우 열정적이고 똑똑한 커뮤니티를 가지고 있습니다. 빌더에게는 이 두 커뮤니티에 동시에 서 있는 것이 매우 행운입니다.
기자: 이 두 커뮤니티의 사람들 사이에 공통점이 있다고 생각하나요?
Julie Shi: 매우 높은 중첩이 있습니다. AI의 초기 채택자와 Crypto의 초기 채택자는 기본적으로 같은 사람들입니다------OpenClaw와 같은 프로젝트에 참여하는 사람들은 종종 이 두 분야 모두에 깊이 관여하고 있습니다. 이는 우연이 아닙니다. 이들은 본질적으로 새로운 패러다임에 극도로 민감하며, 그들이 추구하는 것은 특정 경로가 아니라 기술의 최전선 자체입니다.
기자: 하지만 시장에는 AI와 Crypto를 억지로 결합하는 프로젝트가 많습니다. 이런 조합에 대해 어떻게 생각하나요?
Julie Shi: 대부분의 "AI × Crypto" 프로젝트는 Web2 논리를 다른 껍데기로 바꾼 것입니다------토큰을 발행하고 AI 개념을 덧씌우거나, 추론을 체인에 올려놓고 AI × Crypto라고 말하는 것입니다. 저는 이런 것들에 대해 특별히 동의하지 않습니다.
하지만 이것이 두 가지가 진정한 교차점이 없다는 것을 의미하지는 않습니다. 빌더의 관점에서 볼 때, AI 에이전트가 자율적으로 행동하기 시작할 때, 그것은 신원, 지불 능력, 권한 관리가 필요합니다------이것은 개념이 아니라 엔지니어링 문제입니다. 그리고 이 엔지니어링 문제는 Crypto의 원주율 기술 스택이 더 잘 해결할 수 있는 것입니다. 이러한 교차는 자연스럽게 발생하며, 억지로 결합된 것이 아닙니다.
2. 해커톤에서 바이브 코딩으로: 왜 지금 에이전트 신원에 대해 이야기하는가
기자: 당신은 ETHGlobal, ETHDenver에서 여러 차례 결선 진출자로, 해커톤 커뮤니티에서 매우 활발한 빌더로 알려져 있습니다. 하지만 최근에는 참여가 줄어들었다고 들었습니다?
Julie Shi: 확실히 줄어들었습니다. 바이브 코딩이 등장한 이후 해커톤 생태계가 변했습니다------짧은 시간 안에 실행 가능한 데모를 만드는 것이 더 이상 희소한 능력이 아닙니다. 소프트웨어 엔지니어에게 이런 단기 스프린트의 의미는 오히려 감소하고, 핵심 경쟁력은 모델 능력 자체로 돌아갔습니다. 바이브 코딩은 비엔지니어에게 더 큰 가치를 제공합니다. 그것은 본래 코드를 작성할 수 없는 사람들에게 진정한 힘을 부여했습니다.
저 자신에게 있어 해커톤의 가치는 "새로운 아이디어로 누군가를 감동시키는 것"이 아니라, 장기적으로 빌드하는 데 있다고 점점 더 느끼고 있습니다. 창작의 문턱이 낮아진 후, 희소한 것은 "할 수 있느냐"가 아니라 "해낸 후 실제 세계에서 작동할 수 있느냐"입니다.
기자: 이 관찰이 당신이 다음에 이야기할 에이전트 신원과 어떻게 연결되나요?
Julie Shi: 바로 바이브 코딩이 에이전트의 "제작"을 극도로 쉽게 만들었기 때문에, 우리는 에이전트 수가 폭발적으로 증가하는 세상에 직면하게 될 것입니다------모든 사람이 주말에 바이브 코딩으로 세 개에서 다섯 개의 에이전트를 만들 수 있습니다. 이때 진정한 병목은 에이전트가 일을 할 수 있느냐가 아니라, 이 에이전트들이 실제 세계에서 신뢰받고, 권한을 부여받고, 지불받을 수 있느냐입니다.
공급 측의 폭발은 인프라의 격차를 드러냈습니다. 이것이 x402와 에이전트 신원이 갑자기 중요해진 이유입니다.
3. 에이전트 신원: Web2 인증 모델의 패러다임 전환
기자: 당신은 AI 에이전트가 신원과 권한 관리가 필요하다고 언급했습니다. 이것은 구체적으로 무엇을 의미하나요? 기존의 Web2 시스템이 해결할 수 없나요?
Julie Shi: Web2의 전체 인증 모델------OAuth, 세션, API 키------는 인간 사용자를 위해 설계되었습니다. 그것은 누군가가 조작하고, 로그인하고, 권한 요청 팝업을 클릭하고, 비밀번호를 기억할 것이라고 가정합니다.
하지만 AI 에이전트는 사람이 아닙니다. 그것은 자율적으로 지불, 서명, 신원 인증을 완료해야 하며, 7×24 연속적으로 이루어져야 합니다. 에이전트가 매번 작업을 수행하기 전에 OAuth 창을 띄워 사람에게 "허용"을 클릭하게 할 수는 없습니다.
x402 프로토콜은 이 문제를 해결하려고 시도하는 부분입니다------에이전트가 자율적으로 체인 상의 지불을 완료할 수 있도록 하는 것입니다. 하지만 지불은 빙산의 일각일 뿐이며, 더 근본적인 문제는 신원입니다. 에이전트는 원주율의, 기계가 읽을 수 있는, 인간의 조작에 의존하지 않는 신원 계층이 필요합니다.
기자: 당신은 ENS DAO에서 서브도메인 신원 관리 작업을 하고 있는데, 이것이 이와 관련이 있나요?
Julie Shi: 맞습니다. 제가 ENS에서 하는 일은 대규모 조직이 체인 상의 서브도메인 신원을 관리하도록 돕는 것입니다------예를 들어 .cb.id, .uni.eth와 같은 것입니다. 당시의 사용 사례는 주로 조직 차원에서의 것이었습니다: DAO나 기업이 그 구성원에게 통일된 체인 상의 신원을 할당해야 했습니다.
하지만 이 논리를 한 단계 더 나아가면, 그것은 에이전트에도 동일하게 적용됩니다. 조직은 그 AI 에이전트에게 체인 상의 신원을 할당할 수 있으며, 서브도메인을 사용하여 이 에이전트의 역할, 권한 범위, 행동 경계를 정의할 수 있습니다. 이는 현재 Web2에서 각 에이전트에 대해 API 키 세트를 만들고 그것이 유출되지 않기를 기도하는 것보다 훨씬 우아합니다.
4. 왜 이 길이 통하지 않을 가능성이 있는가
기자: 기술적으로 체인 상의 신원이 더 나은 솔루션처럼 들리지만, 당신은 이전에 그것이 "성공하지 않을 수 있다"고도 말했습니다. 왜 그런가요?
Julie Shi: 현실적인 문제 하나가 있습니다: 프라이버시.
대기업은 내부의 권한 관리 구조를 퍼블릭 체인에 올리지 않을 것입니다. 어떤 기업도 자신의 IAM 구조가 공개적으로 읽히기를 원하지 않습니다------누가 어떤 권한을 가지고 있는지, 어떤 에이전트가 어떤 작업을 수행하고 있는지, 조직 내부의 계층 구조가 어떤지, 이러한 정보는 극도로 민감합니다. 이러한 것들을 체인에 올리면, 회사의 운영 논리를 전 세계에 투명하게 드러내는 것입니다.
ENS는 소매 측면에서 많은 사용자가 있지만, 도메인을 구매하고, 아바타를 설정하고, 프로필을 만드는 것들은 높은 유용성의 장면이 아닙니다. 진정한 높은 유용성의 장면------기업 수준의 신원 관리, 에이전트 권한 제어------는 오히려 프라이버시 문제가 가장 심각한 곳입니다.
그래서 솔직히 말하자면, 현재 조건에서는 이 길이 통하지 않을 가능성이 있습니다.
기자: 그럼 왜 여전히 이 방향에 주목하고 있나요?
Julie Shi: 저는 이 일을 직접 하고 있지는 않지만, 계속 주목하고 있습니다. 왜냐하면 이 방향은 기술적으로 옳지만, 한 조각의 퍼즐이 부족하기 때문입니다. 그리고 그 퍼즐 조각은 이미 누군가가 보완하고 있습니다.
5. 체인 상의 프라이버시가 전체 방정식을 변화시킨다
기자: 당신이 말하는 "부족한 퍼즐 조각"은 무엇인가요?
Julie Shi: 프라이버시 계산입니다. 구체적으로는, FHE(전동형 암호화), TEE(신뢰 실행 환경), 또는 체인 상에서 "계산 가능하지만 읽을 수 없는" 기술입니다.
만약 체인 상의 데이터가 검증되고 계산될 수 있지만, 어떤 제3자도 읽을 수 없다면, 이전의 모든 문제는 존재하지 않게 됩니다. 기업의 IAM 구조가 체인에 올라가지만, 아무도 그 구체적인 내용을 볼 수 없습니다. 에이전트의 권한이 체인 상에서 검증되지만, 에이전트 자체는 키와 자격 증명에 전혀 접촉하지 않습니다------그것은 자신이 어떤 권한을 가지고 있는지 "알 필요가 없으며", 체인 상에서 암호화된 상태에서 그것이 실제로 특정 작업을 수행할 수 있도록 증명할 수 있습니다.
이것은 모든 사람이 사용할 수 있는 IAM 역할과 같습니다.
기자: "모든 사람이 사용할 수 있는 IAM 역할"이 무엇을 의미하는지 자세히 설명해 주실 수 있나요?
Julie Shi: 현재 Web2의 IAM은 어떤 모습인가요? AWS의 IAM을 사용하려면 AWS 계정이 필요합니다; Google의 권한 관리를 사용하려면 Google 생태계에 있어야 합니다. 각 플랫폼의 IAM은 폐쇄적이며, 상호 운용되지 않으며, 당신은 반드시 자격 증명을 플랫폼에 맡겨야 합니다.
만약 체인 상의 신원에 프라이버시 계산이 추가된다면, 당신은 개방적이고 허가가 필요 없는 권한 관리 계층을 갖게 됩니다. 누구나, 어떤 에이전트도 접속할 수 있으며, 특정 중앙화 서비스 제공자가 계정을 만들어 줄 필요가 없습니다. 에이전트는 어떤 키와 자격 증명도 접촉하거나 저장하지 않으며, 권한 검증은 완전히 암호화된 상태에서 발생합니다------그것은 자신의 키를 "볼 필요가 없으며", 단지 체인 상에서 그것이 실제로 키를 가지고 있다는 것을 증명받으면 됩니다.
이것은 전체적인 보안 위험을 제거합니다. 현재 Web2에서 가장 골치 아픈 문제 중 하나는 자격 증명 유출입니다------에이전트가 주입 공격을 받거나, API 키가 평문으로 로그에 기록되거나, 토큰이 만료되어 권한을 초과하는 경우입니다. 만약 에이전트가 처음부터 끝까지 자격 증명에 접촉하지 않는다면, 이러한 문제는 존재하지 않게 됩니다.
기자: 당신은 이전에 체인 상의 FHE 포커 게임을 진행했는데, 이는 이 방향에서의 실천으로 볼 수 있나요?
Julie Shi: 맞습니다. 그것은 FHE 기반의 첫 체인 상 포커 게임으로, fhEVM 위에서 실행되었습니다. 포커는 훌륭한 테스트 시나리오입니다------각 플레이어는 자신의 손패를 가지고 있으며, 다른 사람은 볼 수 없지만, 체인 상에서 카드의 합법성을 검증해야 합니다. 이것은 에이전트 권한 관리의 논리와 사실상 동일합니다: 특정 작업이 합법적이라는 것을 증명해야 하지만, 어떤 비밀 정보도 노출하지 않아야 합니다.
제 판단은: 방향은 맞지만, 현재 단계에서 프라이버시 계산의 성능 병목이 매우 크다는 것입니다. FHE의 계산 비용, TEE의 하드웨어 의존성, 이러한 것들은 실질적인 엔지니어링 도전입니다. 하지만 추세적으로 보면, 이러한 문제들이 빠르게 추진되고 있으며, 저는 이것이 영구적인 장애물이라고 생각하지 않습니다.
6. 지능이 병목이 아니라, 인프라가 병목이다
기자: 당신은 Berkeley Sky Computing Lab에서 rLLM 프로젝트를 진행하고 있으며, 이 프레임워크로 훈련된 모델이 여러 벤치마크에서 GPT-4 수준의 성과를 초과했습니다. 당신의 관점에서 AI 에이전트의 능력은 현재 어떤 단계에 있나요?
Julie Shi: rLLM은 강화 학습을 사용하여 LLM 후 훈련을 하는 오픈 소스 프레임워크입니다. 우리가 훈련한 모델------DeepSWE는 SWEBench-Verified에서 59%를 기록했고, DeepCoder는 LiveCodeBench에서 60.6%를 기록했습니다------이 숫자는 한 가지 사실을 말해줍니다: 에이전트의 "지능"은 더 이상 병목이 아닙니다.
현재 AI 에이전트는 코드를 작성하고, API를 조정하며, 복잡한 다단계 추론을 수행할 수 있습니다. 하지만 그것이 현실 세계에서 할 수 있는 일은 인프라에 의해 제한됩니다------그것은 원주율의 신원이 없고, 안전한 지불 경로가 없으며, 프라이버시 보호의 권한 관리가 없습니다.
이것은 마치 성능이 매우 좋은 차를 만들었지만 도로가 없고, 주유소가 없으며, 교통 규칙이 없는 것과 같습니다. 차 자체는 문제가 아니지만, 도로가 문제입니다.
기자: 그래서 당신은 다음에 가장 주목할 만한 방향이 무엇이라고 생각하나요?
Julie Shi: 에이전트의 인프라 층입니다. 누가 에이전트가 안전하게 신원을 소유하고, 권한을 관리하며, 지불을 완료할 수 있도록 할 수 있는지가 다음 세대 인터넷의 기본 프로토콜을 정의하는 것입니다.
이 일은 어렵고, 여러 번 실패할 수 있습니다. 하지만 방향은 명확하며, 가장 똑똑한 사람들이 시도할 가치가 있습니다.
Julie Shi는 현재 Coinbase 소프트웨어 엔지니어이자 Satoshi Inc의 창립자 겸 CEO로, 후자는 500만 달러의 가치를 지니고 있습니다. 그녀는 ENS DAO 역사상 단 5명의 Fellow 중 한 명이며, Berkeley Sky Computing Lab rLLM 프로젝트의 핵심 기여자, MIT GenAI Competition 챔피언, 그리고 ETHGlobal SF, ETHDenver, ETHGlobal Superhack의 여러 차례 결선 진출자입니다. 그녀는 Tim Draper의 Draper University 전액 장학금을 받았으며, MiraclePlus(구 YC 중국)에 입학했습니다.














