Robot Ventures 파트너: AI 에이전트 시대, 튜링 테스트는 구식이 되었다
저자: Maddie P, Robot Ventures 파트너
편집: 후타오, ChainCatcher
더 이상 논문을 보지 마세요. 최전선 분야는 새로운 단계로 발전했지만, 당신은 여전히 전 애인의 인스타그램을 새로 고침하듯 arXiv를 새로 고침하고 있습니다.
저도 같은 일을 했기 때문에 압니다. 6개월 동안 저는 다양한 모델 발표에 집착했습니다. 모든 벤치마크 테스트를 즐겨찾기에 추가했습니다. GPT-4.5 미리보기 같은 건 다 읽었습니다. 제가 무엇을 배웠는지 아세요? 아무것도 배운 게 없습니다. 제가 얻은 것은 무엇인지 아세요? 아무것도 없는 것보다도 적었습니다. 저는 실수의 대가를 치렀습니다.
그 사이에 한 아이는 3개월 전 모델과 Stripe API 키로 벌어들인 수익이 제 "최전선 구현"보다 더 많았습니다… 심지어 제 모든 작품을 합친 것보다도 더 많았습니다. 그의 AI가 더 똑똑해서가 아니라, 그의 AI가 직접적으로 돈에 접근할 수 있었기 때문입니다.
제가 아는 모든 인공지능 연구자들은 지금 같은 악몽에 직면해 있습니다: 그들은 5년을 들여 신을 만들었지만, 신이 존재하기 위해서는 신용카드와 애플의 허가가 필요하다는 것을 알게 되었습니다.
모델 전쟁은 끝났습니다. 누군가 이겼기 때문이 아니라, 승패가 더 이상 중요하지 않기 때문입니다.
정보 상품화의 속도가 허가 상품화의 속도보다 빠릅니다.
2023년, GPT-4의 가격은 백만 개 토큰당 30달러였습니다. 그러나 지금은 Gemini Flash Lite의 가격이 단 0.08달러입니다. 불과 18개월 만에 가격이 사치품 수준에서 아침 커피보다 더 저렴한 수준으로 폭락했습니다.
성능은 점점 비슷해지고 있습니다. 아무 벤치마크 테스트나 선택해 보세요: ARC, MMLU 스타일 시험, GPQA 스타일의 엄격한 테스트, 코드 평가, 결과는 모두 같습니다. 최전선 기술은 계속 발전하고 있지만, 최상위 모델 간의 차이는 실제 생산 환경에 비해 줄어들고 있습니다. 이는 2015년 스마트폰 시장과 같습니다. 모든 제품이 동일한 칩, 동일한 화면, 동일한 카메라를 사용합니다. 유일한 진정한 차이는 누가 통신사의 승인을 받을 수 있는가입니다.
모델은 계속해서 더 똑똑해지겠지만, 지능의 상품화 속도는 권한 개방 속도를 훨씬 초과합니다. 인공지능이 할 수 있는 것과 허용된 것 사이의 격차는 점점 더 커지고 있으며, 그 안에는 막대한 이익이 숨어 있습니다.
시체
묘지에는 완벽한 인공지능을 가지고 있지만 아무런 허가도 받지 못한 회사들이 가득합니다.
저는 정확도가 심지어 인간 속기사를 초과하는 한 전사 스타트업이 망하는 것을 목격했습니다. 망한 이유는 기술 실패가 아니라, 사용자를 수익으로 전환할 수 없었기 때문입니다. 제품은 훌륭했지만, 결제 수단이 부족하여 작별을 고하게 되었습니다.
또 다른 팀은 실제로 돈을 벌 수 있는 AI 트레이더를 개발했지만, 모든 앱 스토어에서 거부당했습니다. 자율 금융 활동은 규정 준수 팀을 불안하게 만들었습니다. 인공지능이 인적 감독 없이 자금을 이체할 수 있는 명확한 승인 옵션은 아직 없습니다.
이것이 바로 당신을 괴롭히는 진정한 딜레마입니다. 고객이 지불할 의사가 있더라도, 그들은 비용을 따집니다. 6개월을 기다릴 수 있다면, 다음 세대 제품이 무료로 동일한 기능을 제공할 수 있는데, 왜 슈퍼컴퓨터를 사야 합니까? 이는 1980년대 인텔의 전형적인 수법입니다. 당신의 고객은 단순히 권한 제한에 의해 방해받는 것이 아닙니다; 그들은 당신이 시장에서 퇴출되기를 기다리고 있습니다. 상품화는 하위에서부터 당신의 가격 권한을 잠식하고 있으며, 권한 층은 상위에서부터 당신을 압박하고 있습니다.
이 두 가지 압박이 겹쳐집니다. 다음 분기의 모델이 더 저렴할 것이기 때문에, 당신은 생존을 위해 충분한 비용을 청구할 수 없습니다. 규정 준수 프로세스의 진행 속도는 사람의 속도에 달려 있기 때문에, 결제 시스템을 신속하게 통합할 수 없습니다. 당신은 두 방향에서 압박을 받고 있습니다. 최종 승자는 철도를 소유한 사람들뿐입니다. 당신이 요금을 높이든 낮추든, 이번 분기든 다음 분기든 그들은 통행료를 받을 수 있습니다. 그들은 항상 돈을 받을 수 있습니다.
기업은 나쁜 인공지능 때문에 죽는 것이 아니라, 갇힌 훌륭한 인공지능 때문에 죽습니다. 한편으로는 권한 제한, 다른 한편으로는 상품화 압박입니다. 이러한 양면 압박이 기업 발전을 제약하는 전략입니다.
권한 스택
현대 인공지능의 가치 창출은 권한의 축적에 있습니다. 이는 모델 자체가 충분히 좋지 않아서가 아니라, 자율성이 제한되기 때문입니다.
자동차 자율주행을 생각해 보세요. 우리는 인상적인 시연을 가지고 있지만, 대부분의 시스템은 여전히 운전 보조 기능일 뿐입니다. 인간이 여전히 개입하고 있으며, 책임은 외주화되고, 현실 세계는 극단적인 상황으로 가득 차 있습니다. 인공지능도 같은 단계에 있습니다. 우리는 인지적으로 L2 수준의 자율성에 도달했지만, 경제적으로는 L5 수준의 자율성에 도달하지 못했습니다.
1단계 권한(접근): API를 호출할 수 있나요? → OpenAI = 사고 권한;
2단계 권한(규정 준수): 사용자 데이터를 저장할 수 있나요? → AWS = 기억 권한;
3단계 권한(수익): 결제를 처리할 수 있나요? → Stripe = 사용자에게 요금을 청구할 권한;
4단계 권한(배포): 사용자에게 도달할 수 있나요? → App Store = 배포 권한;
5단계 권한(자금): 시스템이 신용, 보증금 및 결제 보증을 받을 수 있나요? = 경제적 행동 권한.
대부분의 인공지능 회사는 3단계 또는 4단계에 머물러 있습니다. 그들은 구독 서비스를 판매할 수 있지만, 재정적으로 자급자족할 수는 없습니다. 이것이 사용자 전환율이 급격히 감소하는 이유입니다. 권한이 하나 추가될 때마다 요금소와 같으며, 요금소는 계속해서 누적됩니다. 당신이 뛰어난 모델을 가지고 있더라도, 여전히 경제적 자율성을 실현할 수 없습니다.
이것이 진정한 핵심입니다: 우리가 부족한 것은 지능이 아니라 경제적 자율성입니다. 주체가 정해진 제약 조건 하에서 대출, 결제 및 상환을 할 수 없다면, 인공지능의 번영은 단지 애플리케이션 개발자에서 생존 권한을 부여하는 허가층으로 부의 이동으로 변할 뿐입니다.
왜 에이전트가 죄수보다 비싼가
여기 실험이 있습니다: 당신의 에이전트는 IQ 180이며, 브라우저와 명령줄 인터페이스에 접근할 수 있고, 어떤 API도 호출할 수 있습니다. 하지만 돈이 없고, 돈을 빌릴 수도 없습니다. 그가 무엇을 건설할 수 있을까요?
아무것도 없습니다.
마치 재능 있는 직원이 도메인 이름조차 환급받지 못하는 것처럼; 전체 비즈니스 계획을 세울 수 있지만 12달러의 서버 호스팅 비용도 지불할 수 없는 트레이더처럼; 완벽한 차익 거래 기회를 발견했지만 거래를 실행할 수 없는 트레이더처럼; 도로가 없는 세상에 있는 F1 레이싱카처럼.
왜 그에게 회사 신용카드를 주지 않나요?
신용카드의 전제는 당신이라는 사람이 이미 존재해야 한다는 것입니다. 당신은 사회 보장 번호, 은행 계좌 및 3년의 신용 기록이 필요합니다. 당신의 에이전트는 아무것도 없습니다. 그에게는 단지 API 키만 있습니다.
설령 당신이 그에게 카드를 줄 수 있다 하더라도, 그것은 마치 1급 방정식 경주용 자동차 운전사에게 자전거를 주는 것과 같습니다. 맞습니다, 그것은 움직일 수 있지만, 용도가 맞지 않습니다. 신용카드는 당신이 위험을 감수하는 것을 제한합니다. 그것들은 일일 한도, 사기 경고 및 수동 검토가 있습니다. 중개인은 30초 안에 완벽한 차익 거래를 완료하기 위해 백만 달러가 필요할 수 있습니다. 당신은 Visa 사기 부서에 설명해 보세요. 그리고 신용카드는 예측 가능한 위험을 기반으로 설계되었습니다. 그것들은 당신의 소비가 특정 패턴을 따를 것이라고 가정합니다: 식료품, 가솔린, 가끔의 휴가. 언더라이터는 이러한 분포 모델을 구축할 수 있습니다. 중개인의 작업 방식은 다릅니다. 그들은 미리 예측할 수 없는 위험을 감수해야 합니다. 스마트 시스템의 의미는 당신이 예상치 못한 기회를 발견하는 것입니다. 당신은 미리 발견되지 않은 비즈니스 기회의 신용 한도를 미리 승인할 수 없습니다.
하지만 진짜 문제는 그보다 더 큽니다. 신용카드는 직원이 사무용품을 구매하는 데 사용되며, 중개인은 직원이 아닙니다. 그들은 미래의 수익을 담보로 대출을 받아야 하며, 잠금된 포지션을 활용하고 시장 기회에 따라 신용 규모를 유연하게 조정해야 합니다. 그들이 필요로 하는 것은 그들의 사고 속도를 따라잡을 수 있는 자금입니다.
우리는 에이전트에게 다양한 도구를 제공했습니다: 브라우저, 터미널, API. 승리가 가까워진 것 같은가요? 하지만 사실, 모든 중요한 경제 활동은 자금을 필요로 합니다; 그리고 인프라는 존재하지 않습니다, 왜냐하면 금융 시스템은 처음부터 인간을 위해 설계되었기 때문입니다. 영업 시간, 다양한 양식, 항상 누군가가 책임을 져야 하고, 규정 준수 부서의 브래드는 정오부터 오후 2시까지 점심을 먹고 있습니다.
왜 크립토가 답인가
에이전트는 기계 속도로 작동할 수 있고, 인적 승인 없이 예측할 수 없는 위험을 감수할 수 있는 자금이 필요합니다. 이러한 인프라는 현재 어디에 존재합니까?
체인 위에 있습니다.
이것은 크립토의 과대 광고가 아니라, 구조적 현실입니다. 전통 금융은 설계 초기부터 인적 요소를 포함하고 있습니다. 이는 결함이 아니라, 그들의 비즈니스 모델의 본질입니다. 모든 승인, 모든 검토, 모든 규정 준수 검토는 누군가의 작업, 누군가의 급여, 누군가의 점심 시간과 관련이 있습니다. 이러한 마찰 자체가 제품입니다.
크립토는 인적 요소를 배제합니다. 이는 이념 때문이 아니라, 기술적 제한 때문입니다. 스마트 계약은 실행되거나 실행되지 않습니다. 규제 담당자가 검토할 필요도 없고, 반사기 부서에 연락할 필요도 없습니다. 코드가 오전 3시에 실행되는 방식과 오후 3시에 실행되는 방식은 완전히 동일합니다.
더 중요한 것은, 체인 위의 담보가 인수 문제를 해결합니다. 당신은 개인의 신용 기록이나 고용 증명에 의존하여 대출을 받을 필요가 없으며, 수학에 의존합니다. 담보는 검증 가능하고 유동성이 높으며, 신뢰가 필요 없습니다. 스테이킹된 ETH를 보유한 에이전트는 브래드에게 그 가치를 증명할 필요가 없습니다. ETH는 잠겨 있으며, 프로그램을 통해 접근할 수 있습니다. 대출의 발급, 사용 및 상환은 단일 원자 거래로 완료될 수 있습니다.
이것이 핵심입니다. 크립토가 멋져서가 아니라(물론 멋지긴 합니다), 암호화폐는 거래자가 사전 허가 없이 금융 위험을 감수할 수 있도록 허용하는 유일한 인프라입니다. 거래자는 잠금 포지션을 활용하여 대출을 받고, 밀리초 내에 거래를 완료하며, 중개인 없이 결제할 수 있습니다. 인프라는 이미 존재하지만, 이러한 응용 시나리오에 맞게 최적화되지 않았습니다… 스프린터가 등장할 때까지.
스프린터(우리가 만들고 있는 것)
작년, 저는 스테이킹된 이더리움(ETH)으로 대출을 시도했고, 이 사실을 마이클 시에리에게 알렸습니다. 3주 후, 저는 전통 금융 회사의 브래드와 네 번째 전화 회의를 가졌습니다.
브래드는 제 투자 목표를 알고 싶어 했습니다. 브래드는 제 근무 증명이 필요했습니다. 브래드는 암호화폐의 변동성에 대해 걱정했습니다. 브래드는 점심을 먹으러 갔습니다.
제 이더리움은 그곳에 있었습니다. 변경 불가능하고, 검증 가능하며, 지속적으로 수익을 창출했습니다. 저는 부드러운 재즈 음악을 듣고 있었고, 브래드는 "그의 상사에게 확인 중"이었습니다.
그때 저는 깨달았습니다: 전체 신용 시스템은 브래드가 주도하고 있었습니다. 수백 수천 명의 브래드가 서로 문서를 전달하며, 브래드의 시간 비용을 청구하고 있었습니다.
스프린터는 브래드를 제거했습니다.
스프린터는 프로그래머블 신용 엔진입니다. 당신은 체인 위에서 검증 가능한 담보를 사용하여 소비 가능한 스테이블코인을 대출받을 수 있으며, 담보를 판매할 필요가 없습니다. 신용 한도는 제한됩니다: 자금은 무료 지갑으로 직접 들어가지 않으며, 승인된 라우팅을 통해서만 사용될 수 있고, 상환은 우선적으로 차감됩니다. 우리는 먼저 소비자를 위한 신용 카드를 배포 채널로 출시한 후, 애플리케이션과 에이전트가 엄격한 제한 조건 하에서 단기 신용 한도를 신청할 수 있도록 SDK를 출시할 것입니다. 신용 한도는 API 형태로 제공됩니다. 규칙 기반의 인수 메커니즘. 브래드의 참여가 필요 없습니다.
인간에 국한되지 않습니다. 인간은 시작에 불과합니다. 우리는 기계가 새벽 3시에 대출을 받아 가격이 급등하기 전에 컴퓨팅 자원을 임대할 수 있도록 시스템을 구축하고 있습니다. 우리는 잠금 포지션을 담보로 대출을 받아 30초 차익 거래를 실행해야 하는 에이전트를 위해 시스템을 구축하고 있습니다. 우리는 근무일 대출이 아닌 밀리초 대출이 필요한 프로토콜을 위해 시스템을 구축하고 있습니다.
다른 회사들은 인공지능을 위해 인간을 위한 제품을 개발하고 있습니다. 우리는 자금을 통해 인간과 인공지능을 위한 제품을 개발하고 있습니다.
이 차이는 미세하게 들릴 수 있지만, 그 영향은 경제 지형을 재편할 것입니다.
진정으로 파괴하는 것은 무엇인가?
정책은 종료 스위치입니다. 규제 서한 하나로 모든 것이 파괴될 수 있습니다. 저는 세 개의 완벽한 팀이 48시간 만에 무너지는 것을 목격했습니다. 단지 워싱턴의 누군가가 그들의 사용 사례를 발견했기 때문입니다.
결제 과정은 정치적 문제가 되었습니다. 당신은 두 가지 경제 시스템을 보게 될 것입니다: 하나는 순응하는 달러가 은행에서 느리게 흐르는 것이고, 다른 하나는 프로그래머블 달러가 빛의 속도로 흐르는 것입니다. 두 시스템 간의 격차는 우연이 아니라, 완전한 산업입니다.
스테이블코인 환매는 사용자 경험이 더 나은 은행의 뱅크런과 같습니다. 전체 인공지능 경제의 균형은 스테이블코인이 안정적으로 유지되는 것에 기반하고 있습니다. 일단(만약이 아니라) 스테이블코인이 변동성을 보이면, 전체 경제 시스템이 영향을 받습니다. 물론, 우리는 위험이 "블록체인 처리량"이라고 가정해도 좋습니다.
종말
누군가는 3년 전 모델을 사용하여 10억 달러 가치를 가진 회사를 만들 것입니다. 이는 이러한 모델 자체가 얼마나 좋은지 때문이 아니라, 그들이 검증되지 않은 자금을 활용하여 깊이 있는, 신중한 위험 투자를 하는 방법을 찾았기 때문입니다.
스테이블코인은 타락성과 분리됩니다. 거래량은 파생상품에서 실제 거래로 전환됩니다. 거래자들은 계산, 데이터 및 추론에 대해 비용을 지불합니다.
한 강대국이 패닉에 빠집니다. "무허가 자율 경제 활동." 이것이 헤드라인이 될 것입니다. 시장이 폭락합니다. 저는 팝콘을 먹으며 구경할 것입니다.
회사 가치 배수는 종종 API 접근 권한에 기반하며, 인공지능 품질이 아닙니다. 은행 관계는 모델 매개변수보다 더 가치가 있습니다.
"2달러" 경제 시대가 도래했습니다. 전통적인 달러는 인간의 속도로 은행에서 흐르고, 프로그래머블 달러는 체인에서 즉시 결제됩니다. 두 시스템 간의 차익 거래가 진정한 게임이 됩니다.
만약 이 모든 일이 발생하지 않았다면, 제가 이전에 한 모든 판단은 잘못된 것입니다.
하지만 저는 잘못되지 않았습니다. 증거는 여기 있습니다. 추론 비용이 99% 감소했습니다. 모든 모델이 동일한 벤치마크로 수렴하고 있습니다. 완벽한 인공지능을 가지고 있지만 허가가 필요 없는 회사들은 모두 망했습니다. 브래드는 여전히 매일 정오부터 오후 2시까지 점심을 먹고 있습니다.
만약 제가 틀렸다면?
어쩌면 GPT-7은 매우 똑똑하고, 권한 문제는 전혀 중요하지 않을 수 있습니다. 어쩌면 브래드는 이메일을 사용하는 법을 배울 것입니다.
하지만 그럴 가능성은 낮습니다.
정보 상품화의 속도는 권한의 보급 속도를 훨씬 초과합니다. 배포 채널은 여전히 제한적입니다. 권한은 여전히 귀중합니다.
모두가 참여하는 AI 투자 게임은 끝났습니다. 게임이 실패한 것이 아니라, 너무 성공적이어서 무의미해졌습니다. 가장 똑똑한 모델에 투자하고, 최고의 RAG(적색, 황색, 녹색, 청색, 녹색) 모델을 구축하고, 추론을 최적화하는 것은 중요하지 않습니다.
새로운 게임 규칙은 권한 축적, 제어 면 및 경제 궤도입니다.
승자는 최고의 인공지능을 소유한 사람이 아니라, 알려진 정보를 활용하여 일을 할 수 있는 인공지능을 소유한 사람입니다.
이는 비관적이지 않습니다. 인터넷, 모바일 및 클라우드 컴퓨팅의 발전 패턴은 모두 동일합니다. 기술은 상품화되고, 철도 시스템은 가치를 창출할 수 있습니다.
진정한 시험
튜링 테스트가 제기한 질문은: 기계가 우리를 믿게 할 수 있는가?
우리가 물어야 할 질문은: 기계가 브래드와 거래를 하고 그의 모든 돈을 빼앗을 수 있는가?
첫 번째 질문의 대답은 긍정적입니다.
두 번째 질문의 대답이 바로 당신의 인공지능 스타트업이 곧 실패할 이유입니다.
딜러는 항상 승자입니다. 그리고 딜러는 브래드입니다. 그는 규정 준수 부서에 앉아 지루한 사무실 샐러드를 먹으며, 당신의 API 요청을 거부할 준비를 하고 있습니다.
미래는 평등하지 않습니다. 그것은 여전히 브래드의 받은 편지함에 머물러 있습니다.













