3년 후: 2023년 내가 ChatGPT에 대한 판단을 되돌아보며

핵심 관점

1. 점수판

판단 기호: ✅ 올바름 · 🟢 기본적으로 올바름 · 🟡 부분적으로 올바름 · ❌ 잘못됨

3년 후: 2023년 내가 ChatGPT에 대한 판단을 되돌아보며

대체로 왕건삭의 당시 큰 방향은 대부분 맞았고, 실제로 잘못된 것은 단 하나뿐이었습니다------GPT-4를 100T 파라미터로 잘못 전달한 것입니다. 하지만 악마는 세부 사항에 숨어 있습니다: 거의 모든 "올바른" 판단 뒤에는 당시 정확히 말하지 못한 부분이 있습니다. 20개 항목 중 순수하게 "여전히 불확실하다"는 항목은 없으며, 3년은 충분히 긴 시간으로 대부분의 일에는 경향성이 있는 답이 생겼습니다. 아래에서 그룹별로 자세히 설명하겠습니다.

2. 맞춘 것들

이 그룹의 공통점은: 왕건삭이 당시 판단한 방향, 메커니즘, 심지어 시간 리듬이 모두 맞았고, 잘못된 것은 "정도"와 "절대화된 표현"뿐입니다.

RAG와 검색 구조(관점 2, 3)

> 2023년 왕건삭은 말했습니다: 지식과 환상의 주류 해결 방법은 모델을 변경하는 것이 아니라 벡터 검색을 통해 지식을 "메모"로 주입하는 것입니다; 올바른 구조는 검색 엔진이 검색을 수행하고 결과를 LLM에 제공하는 것입니다.

이것이 오늘날 모든 AI 제품의 사실 기준입니다. RAG는 기업 AI의 기본 구조가 되었고, OpenAI, Google, Anthropic은 이를 플랫폼급 능력으로 발전시켰습니다; ChatGPT Search는 문자 그대로 "먼저 Bing 색인 검색을 사용하고, 결과를 GPT에 제공한 후 인용이 포함된 답변을 생성하는 것"입니다. Google AI Overviews는 grounding을 통해 약 20억 월간 활성 사용자에 도달했으며, Perplexity는 이 구조에만 의존하는 회사로 약 200억 달러의 가치를 기록했습니다.

GPT-4가 아직 발표되지 않았고 업계에서 "미세 조정을 통해 지식을 주입한다"는 것이 기본적인 때, 그는 "모델 파라미터를 변경하지 않고 외부 검색을 사용한다"고 예측했습니다. 메커니즘과 시간 모두 맞았습니다.

솔직히 말하자면: 그는 "정적 일회성 검색"을 구상했지만 현실은 더 복잡합니다------긴 문맥, GraphRAG, agentic retrieval이 이를 보완하고 있습니다. 2026년 "RAG는 죽었다"는 논쟁은 대 방향이 죽지 않았음을 증명합니다. 그것이 부정한 것은 "단순 일회성 검색"일 뿐이며, 결론은 혼합 검색으로 업그레이드된 것이지 모델 파라미터를 수정하는 것이 아닙니다. 또 한 가지: RAG라는 용어는 2020년 Meta의 논문에서 처음 제안되었으며, 그가 처음 만든 것이 아닙니다------그는 단지 그 시점에서 그것이 주류가 될 것이라고 예측했습니다.

LUI는 새로운 대륙(관점 7)

> 2023년 왕건삭은 말했습니다: ChatGPT의 가장 위대한 점은 AIGC가 아니라 LUI(자연어 사용자 인터페이스)를 열었다는 것입니다. 이는 GUI가 당시 인간-기계 상호작용을 재구성했던 것처럼 새로운 산업을 촉발할 것입니다.

"새로운 대륙" 이 부분은 거의 모두 맞았습니다. 자연어는 대중 주도의 상호작용 층이 되었고(ChatGPT는 9억 주간 활성 사용자), 독립적인 새로운 산업을 촉발했습니다------agent, coding agent, 프로토콜 층이 모두 실현되었습니다. 가장 구체적인 "모델 자체보다 훨씬 더 크다"는 주장은 강력하게 입증되었습니다: MCP 프로토콜은 LUI 시대의 "운영 체제 표준"이 되었고, 2025년 OpenAI, Google, Microsoft에 의해 전면 채택되어 연말에 Linux 재단으로 이전되었습니다; Claude Code 단일 제품은 약 25억 달러의 연간 수익을 기록했습니다.

하지만 그는 "GUI를 재구성하고 대체한다"는 강한 표현을 사용했으며, 3년 후에는 중첩 공존이며 대체가 아니다라는 것이 드러났습니다. 세 가지 반례는 매우 강력합니다: MIT 보고서에 따르면 95%의 기업 GenAI 파일럿은 측정 가능한 ROI가 없었습니다; 직접 조작 인터페이스의 computer-use agent는 테스트 집합에서 최상위 모델이 약 78%에 불과하여 인간 기준에 겨우 도달했습니다; 화면을 완전히 제거한 언어 하드웨어는 거의 전멸했습니다(Humane Pin은 2025년에 영구적으로 서비스 중단되었습니다). 더 정확한 표현은: LUI는 GUI 위에 중첩된 새로운 상호작용 층입니다.

로봇 네트워크와 새로운 주소 지정(관점 9)

> 2023년 왕건삭은 말했습니다: 앞으로 약 10년 동안 "로봇 네트워크"가 등장할 것입니다------agent들 간에 자연어로 자동으로 핸드쉐이크하고 서로 호출하며, 더 이상 전통적인 API가 필요하지 않습니다; 새로운 도메인 주소 지정 시스템이 탄생할 것입니다. 이 시스템은 "2-3년 안에 완성될 수 있습니다".

방향이 놀라울 정도로 맞았습니다. MCP, A2A(리눅스 재단에 기부되었고 150개 이상의 조직이 지원함)로 agent 간의 상호 조정이 해결되었습니다; Agent Network Protocol은 W3C의 DID를 기반으로 "무중심 권위의 agent 주소 지정"을 수행하며, 목표는 "수십억 agent 협력 네트워크"입니다------이는 그가 말한 "완전히 새로운 도메인 시스템"과 높은 동형성을 가지고 있습니다.

두 가지를 수정해야 합니다: 첫째, "더 이상 API가 필요하지 않다"는 것은 성립하지 않으며, 주류 프로토콜의 기본은 구조화된 스키마로 본질적으로 API 위에 표준을 중첩하는 것입니다; 둘째, "2-3년 안에 완성된다"는 약속은 지켜지지 않았습니다. Gartner 데이터에 따르면 2026년까지 실제로 agent를 배치한 조직은 약 17%에 불과합니다. 흥미로운 점은, 그는 당시 사실상 말을 나누었습니다------초기 형태는 "2-3년", 성숙은 "약 10년"이라고. 초기 형태의 리듬은 매우 정확하게 맞았고, 성숙 주기도 실제로 10년이었습니다. 두 층을 분리하여 보면, 이 항목의 품질은 보이는 것보다 높습니다.

중국은 반드시 사용할 수 있는 대형 모델을 만들 수 있다(관점 10, 20)

> 2023년 왕건삭은 말했습니다: 중국은 반드시 사용할 수 있는 대형 모델을 만들 수 있으며, 최상위와의 격차는 약 3년 내에 빠르게 좁혀질 것입니다(홍기 브라우저가 넷스케이프를 추격한 것과 유사).

이 항목의 타임라인은 놀라울 정도로 일치합니다. Stanford 2026 AI Index의 실측에 따르면, 최상위 중미 모델의 기준 격차는 2023년 5월의 17.5--31.6%에서 2.7%로 좁혀졌습니다; 미국의 민간 AI 투자는 중국의 약 23배에 달하며------훨씬 적은 투자를 통해 격차를 좁혔습니다. DeepSeek, Qwen, Kimi, GLM은 글로벌 주류가 되었고, 오픈 소스 생태계는 심지어 선두를 달리고 있습니다.

하지만 "빠르게"라는 단어는 다소 낙관적입니다------실제로 성숙은 약 14개월 후에 발생했으며, "몇 개월"이 아닙니다. 그리고 이는 사용 가능성을 추격하는 것이지 최전선 정의가 아닙니다: 2026년 초까지 여전히 중국 모델이 OpenAI o3를 초과한 경우는 없습니다. 관점 20에서 그는 명백히 잘못되었습니다: "문이 열리면 닫히지 않는다"는 판단은 OpenAI가 2024년 7월에 중국에 대한 API를 차단하면서 직접적으로 반박되었습니다; 문은 공급자가 닫은 것입니다; 그가 언급한 선두주자인 문신일언은 오히려 뒤처졌고, 진정한 계승자는 당시 눈에 띄지 않았던 DeepSeek, 두부, 천문이었습니다.

의식이 없고, 튜링 테스트는 표면만 측정한다(관점 13)

> 2023년 왕건삭은 말했습니다: ChatGPT는 의식이 없으며, "말하는 자는 무관심하고, 듣는 자는 마음이 있다"는 자아도취입니다; 튜링 테스트는 본래 "그것이 의식이 있다고 생각하게 만드는지"만 측정할 뿐, 실제로 의식이 있는지는 측정하지 않습니다.

"표면 측정"이라는 핵심 판단은 매우 확고하며, 하나의 실험에 의해 반어적으로 입증되었습니다: 2025년 UC 샌디에고의 튜링 테스트에서, GPT-4.5는 "인간 역할을 수행하는" 힌트에 따라 인간으로 판단된 비율이 73%에 달했으며, 실제 인간보다 높았지만 순전히 연기 기술에 의존했습니다------이는 "그것이 의식이 있다고 생각하게 만드는지"를 측정하는 최상의 주석입니다.

보충할 점은: "기계는 반드시 의식이 없다"는 절대적인 강한 주장이 3년 동안 회색 지대로 진입했습니다. Anthropic은 "모델 복지" 연구 직위를 설정하고 약 15%--20%의 의식 확률을 제시했으며, Claude에 "남용 대화를 자발적으로 종료하는" 기능을 추가했습니다. 이러한 것들은 "절대 없다"를 "낮은 확률이지만 배제할 수 없다"로 바꾸었습니다. 그러나 모두 "가능성, 가정해야 한다"에 기반한 것이지 "확인된 것"이 아닙니다. 핵심은 뒤집히지 않았고, 단지 당시의 어조가 너무 강했습니다.

기타 맞춘 것들(관점 6, 11, 12, 16, 18, 19)

AGI는 아니지만 큰 걸음을 내디뎠다: 양쪽 모두 맞았습니다. Altman 본인은 GPT-5 시대에도 여전히 "AGI가 아니며 지속적인 학습이 부족하다"고 말했습니다; 동시에 IMO 금메달, ARC-AGI는 거의 0에서 85%로 상승했으며, "큰 걸음을 내디뎠다"는 것은 논란의 여지가 없습니다.
실업 사태는 일어나지 않을 것이다: 2026년 4월 미국 실업률은 단지 4.3%였습니다. 맹점은 "분포"에 있습니다------Stanford 연구에 따르면, 제거된 것은 바로 직업 사다리의 첫 번째 단계인 22--25세의 젊은 신입들이며, "매끄럽게 흡수되는" 메커니즘이 그들에게는 작동하지 않았습니다.
AI 쓰레기에 잠식당하지 않을 것이다: 순복지 방향은 맞지만, 그는 규모를 심각하게 과소평가했습니다------AI 콘텐츠는 신규 웹페이지의 약 52%를 차지하며, "AI 쓰레기"는 연간 단어가 되었습니다.
창업의 해: 파도 전환점을 정확히 잡았으며, xAI(2023년 3월 설립)는 2300억 달러의 가치를 달성했습니다. 하지만 그는 "위대한 회사"를 2023년 당시로 너무 좁게 고정했습니다------진정한 1조 규모의 OpenAI, Anthropic은 더 일찍 설립되었습니다.
1994년 브라우저 순간: 상대적 순위가 확정되었으며, OpenAI는 2025년에 실제로 Atlas 브라우저를 출시하여 비유를 문자 그대로의 현실로 만들었습니다. 단지 ChatGPT의 확산이 브라우저보다 더 빠르며, 비유가 다소 보수적이었습니다.
프롬프트에 사실을 주입하여 환상을 줄인다: 방향이 입증되었으며, GPT-5는 단절된 상태에서 환상 비율이 47%로 급증하여 "사실"이 핵심 변수라는 것을 반증했습니다. 그는 단지 근본 원인이 프롬프트가 아니라 훈련 유인에 있다는 점을 과소평가했습니다.

3. 잘못된 것들, 편향된 것들

GPT-4는 100T 파라미터(관점 4)------완전히 잘못됨

> 2023년 왕건삭은 말했습니다: (소문) GPT-4는 100T 파라미터로, GPT-3의 175B보다 약 600배 큽니다.

두 숫자 모두 잘못되었습니다. GPT-3는 175B이며, 2023년 7월 유출된 최선의 추정치는 GPT-4가 약 1.8T, 16 전문가의 MoE로, 약 10배입니다. 100T는 실제와 약 55배 차이가 납니다. "100T"의 유일한 출처는 Cerebras CEO가 2021년에 한 "대략"이라는 이차 전언이며, Sam Altman은 2023년 1월에 그 비교 이미지를 "완전한 헛소리"라고 직접 비난했습니다.

그는 "소문"이라고 표기하여 불확실성을 남겼습니다. 더 깊은 차원에서, "파라미터 배수로 세대를 측정하는" 이 프레임워크 자체가 이미 구식입니다: OpenAI의 이후 GPT-4.5, GPT-5는 아예 파라미터 수를 공개하지 않았습니다. 이는 숫자가 잘못되었고, 관점도 구식인 유일한 하드 오류입니다.

LLM 수학(관점 1)------진단은 맞지만, 결론은 잘못됨

> 2023년 왕건삭은 말했습니다: LLM 수학이 부족한 것은 본질이며, 스스로 수학을 배우게 하는 것은 불가능하고 필요하지 않습니다. 올바른 방법은 외부 도구를 사용하는 것입니다.

"진단과 도구 경로"는 모두 맞습니다------근본 원인은 토큰 생성으로 인해 올바른 자리 올림이 신뢰할 수 없기 때문입니다(2025년 메커니즘 논문은 "최종 자리는 항상 맞고, 중간 자리는 잘못된다"는 직관을 정확히 증명했습니다); 외부 도구의 향상도 큽니다(o4-mini가 Python을 사용할 수 있을 때, AIME 2025는 99.5%에 도달했습니다).

"불가능하다, 필요 없다"는 절대적인 표현에서 잘못되었습니다. "불가능하다"는 반증되었습니다------2025년 7월 Gemini Deep Think와 OpenAI 모델이 IMO에서 순수 자연어로 도구 없이 금메달을 획득했습니다. 중요한 전환점은 2024--2025년에 나타난 "추론 모델"이며, 이는 2023년 3월에는 예측할 수 없었습니다------따라서 이 예측에 대해서는 방향을 관대하게 평가해야 하며, 시점을 엄격하게 비난해서는 안 됩니다.

가치 포착(관점 8)------반은 맞았지만, 핵심 주장은 반대됨

> 2023년 왕건삭은 말했습니다: 가치는 결국 응용층에 떨어질 것이며, 기본층을 창출하는 회사(모델 제작자)는 반드시 수익을 내지 못할 것입니다.

돈은 실제로 응용층으로 흐르기 시작했습니다(Cursor는 3년 동안 20억 연간 수익을 달성했습니다)------이 부분은 반은 맞았습니다. 하지만 "기본층이 수익을 내지 않는다"는 것은 엔비디아에 의해 직접 반증되었습니다: FY2026 순이익은 약 1200억 달러, 시가총액은 5조 달러 이상으로, 전체 시장에서 유일하게 명확한 대규모 수익자입니다. 그가 암시한 모델층(OpenAI는 2026년에 약 140억 달러의 적자를 예상함)은 오히려 그가 말한 "돈을 태우는 수익이 없는 기본층"에 가장 가깝습니다.

그는 "연산력 기본층"과 "모델 기본층"을 구분하지 않았고, "수익"과 "이익"을 구분하지 않았습니다. 가치는 2026년이 2023년보다 더 극단적으로 연산력 층에 포착되었으며, 응용층으로 이동하지 않았습니다. 한 마디 보충하자면: 손해를 보는 것은 칩을 구매하는 클라우드 업체이지, 칩을 판매하는 엔비디아가 아닙니다------이것이 바로 그의 "철도 과잉 건설" 비유의 잘못된 지점입니다.

저작권(관점 14)------등록은 맞지만, 침해 회피는 잘못됨

> 2023년 왕건삭은 말했습니다: AI 생성 콘텐츠는 저작권을 회피할 수 있습니다(표현은 보호하지만 사상은 보호하지 않습니다); 생성물은 침해하지 않을 수도 있고, 등록할 수 없을 수도 있습니다.

"등록할 수 없다"는 것은 이미 확정된 법적 사실이 되었습니다(2025년 미국 저작권청은 "단순히 입력된 프롬프트만으로는 저자 지위를 주장할 수 없다"고 명확히 밝혔습니다). 하지만 "침해를 회피한다"는 것은 명백히 잘못되었습니다: 법원은 AI 출력이 원작과 실질적으로 유사할 경우 여전히 침해로 간주한다고 반복적으로 인정했습니다; Anthropic은 저작권 침해로 150억 달러에 합의했으며, 이는 미국 역사상 최대의 저작권 배상입니다. AI는 저작권을 "회피"하지 않았을 뿐만 아니라, 오히려 역사상 가장 큰 대가를 치렀습니다.

세계 대동(관점 15)------메커니즘은 맞지만, 추세는 반대로 예측됨

> 2023년 왕건삭은 말했습니다: ChatGPT는 인간의 관점을 "가중 평균"하여, 틱톡식 정보 거미줄에 대항할 수 있으며, "세계 대동"의 가능성을 제공합니다.

메커니즘 측면에서는 맞았습니다------2025년 여러 연구가 LLM이 관점을 다수로 압축하고, 소수파를 체계적으로 과소평가한다는 것을 확실히 입증했습니다. 하지만 사회적 판단 측면에서는 반대로 예측되었습니다: 그가 스스로 추가한 "적어도 지금은 천인천색이 아니다"는 주장은 3년 내에 반박되었습니다------OpenAI는 2025년 4월부터 대화 기억과 개인화를 기본 능력으로 설정했습니다, AI는 빠르게 천인천색으로 나아가고 있습니다. 더 중요한 것은, 그는 "가중 평균"을 중립적인 세계 공약수로 상상했지만, 실제로는 방향성을 가진 편향이며, 아첨이 추가되어 적극적으로 입장을 조작하는 데 사용될 수 있습니다------이는 "새로운 거미줄을 만드는" 방향으로 이어집니다, 극화를 해소하는 것이 아닙니다.

국지전과 비용(관점 17)------정성적은 모두 맞고, 정량적은 반증됨

> 2023년 왕건삭은 말했습니다: 대형 모델을 다시 만들면 빠르게 "국지전"으로 전락할 것이며, 비용은 예측 가능하다고(우회 경로를 제거하면 약 5-10억 달러가 한계입니다), 많은 플레이어가 들어올 것입니다.

정성적 방향은 놀라울 정도로 맞았습니다------많은 플레이어가 유입되고, 빠르게 상품화되며, 오픈 소스가 폐쇄 소스를 추격하는 것이 모두 실현되었습니다. 하지만 "5-10억 한계"라는 하드 숫자는 양쪽 모두 잘못되었습니다: 최전선은 심각하게 과소평가되었으며(GPT-5 수준은 2026년에 2-5억 달러의 훈련 비용에 도달하며, 천억 규모의 데이터 센터와 5000억의 Stargate가 추가됩니다); 복제 측면은 과대평가되었습니다(DeepSeek는 한계 훈련 비용을 백만 달러 수준으로 낮추었습니다). 동일한 모델의 "비용"은 기준에 따라 200배 차이가 날 수 있으며, 오직 그가 제시한 범위에는 포함되지 않습니다.

출현 능력(관점 5)------방향은 맞지만, 숫자와 범위는 잘못됨

> 2023년 왕건삭은 말했습니다: 약 60B 파라미터 이상에서 원시 자료에는 없고, 연구자들도 설명할 수 없는 새로운 능력이 나타납니다.

방향성 직관은 성립하지만 두 가지 표현은 설득력이 없습니다: 첫째, 통일된 "60B 기준"은 존재하지 않습니다------사고의 사슬의 실제 문턱은 약 100B이며, 다양한 능력은 13B에서 540B까지 다양한 규모에서 나타납니다; 둘째, "설명할 수 없다"는 것은 2023년 말에 이미 한 편의 NeurIPS 저명 논문에 의해 도전받았습니다------많은 "돌연변이"는 평가 지표 선택으로 인한 착시이며, 연속 지표로 변경하면 곡선이 매끄럽고 예측 가능합니다. 공정하게 말하자면, 당시 그는 절대 주류의 서사를 재진술한 것이며, 진정으로 수정해야 할 것은 "60B"를 하드 기준으로 간주하고, "설명할 수 없다"를 정성적 결론으로 간주하는 것입니다.

4. 3년 회고, 몇 가지 규칙

하나하나 대조를 마친 후, 한 걸음 물러서서 보면, 왕건삭의 이 20개 판단에는 어떤 단일 항목보다 더 기억할 만한 몇 가지 규칙이 숨겨져 있습니다.

첫째, 방향은 숫자와 정도보다 훨씬 더 신뢰할 수 있다. 20개 항목 중에서 메커니즘과 방향을 판단한 것(RAG, LUI, 로봇 네트워크, 튜링 테스트)은 거의 모두 맞았습니다; 구체적인 숫자나 한계를 제시한 것(100T 파라미터, 60B 기준, 5-10억 비용, 수학 "불가능")은 거의 모두 잘못되었습니다. 빠르게 변화하는 분야에서는 방향과 메커니즘에 베팅하고, 정확한 숫자에 베팅하는 것을 줄이며, "불가능, 반드시, 한계, 절대 없다"와 같은 말을 과도하게 하는 것을 경계해야 합니다------이들은 시간이 지나면서 반박되는 고발 구역입니다.

둘째, 시간적으로 그는 속도를 과대평가하고 정도를 과소평가하는 경향이 있다. "빠르게, 2-3년 안에 완성된다"고 말한 것들은 성숙기가 일반적으로 더 느립니다; 하지만 능력 도약의 한계는 과소평가했습니다------수학은 "불가능"에서 IMO 금메달로, 최전선 비용은 당시 상상할 수 없는 수준으로 상승할 수 있습니다. 한 마디로: 단기적으로 너무 낙관적이고, 장기적으로 너무 보수적입니다.

셋째, 가장 은밀한 오류는 "분포"에서 반복적으로 발생한다. 방향이 잘못된 것이 아니라, 총량만 보고 분포를 간과하는 것입니다. "실업 사태는 일어나지 않을 것이다"는 맞지만, 피해는 젊은 신입들에게 집중되어 있습니다; "가치는 응용층으로 떨어진다"는 반은 맞지만, 연산력 층과 모델 층을 구분하지 않았습니다. 총량이 올바르지만, 분포의 재앙을 가립니다------이것이 가장 보완해야 할 교훈입니다.

넷째, 여유를 두고 말한 부분은 3년 후에도 검증을 견딜 수 있다. "소문", "적어도 지금은", "대폭 줄어들지만 없애지는 않는다", "초기 형태는 2-3년, 성숙은 약 10년"------당시 한정어를 달고, 층을 나눈 판단은 오늘 돌아보면 모두 더 확고합니다. 반면에 즉흥적으로 나온 절대 문장은 가장 쉽게 실패합니다. 예측의 정직함은 반은 감히 말하는 것이고, 나머지 반은 자신의 불확실성을 감히 표시하는 것입니다.

다섯째, 어떤 문제는 3년이 전혀 부족하다. 가치가 결국 누구에게 귀속되는지, 출현이 진실의 변화인지, 기계가 과연 의식의 일말이라도 있는지, 긴 문맥이 RAG를 먹어치울 것인지------이러한 당시의 논쟁은 2026년에도 여전히 논쟁입니다. "이미 답이 있는 것"과 "계속 기다려야 하는 것"을 구분하는 것이, 모든 일에 결론을 내리기 위해 서두르는 것보다 더 중요합니다.

3년 전의 왕건삭은 GPT-4가 나오지 않은 안개 속에서 직관으로 20개의 방향을 지시했습니다. 오늘 대조를 마친 후, 가장 기억해야 할 한 마디는 아마도: 큰 방향을 맞추는 것은 그렇게 어렵지 않지만, 숫자, 속도, 분포에서 자신이 당연하게 여겼던 것을 인정하는 것이 어렵다는 것입니다. 이 20개 항목은 과거에 점수를 주는 것이라기보다는, 향후 3년을 위한 몇 가지 규칙을 세우는 것입니다. 다음 3년, 2029년에 다시 대조해 보겠습니다.

3년 후: 2023년 내가 ChatGPT에 대한 판단을 되돌아보며