ChatGPT에게 어떤 책의 핵심 주장을 물으면, AI는 마치 책을 읽은 것처럼 답합니다. RAG 기반 시스템은 실제로 도서 원문을 검색해 응답에 포함시키기도 합니다. 이때 저작권은 어떻게 적용될까요. AI의 도서 인용은 학습 데이터 문제와는 별개의 법적 질문을 낳습니다. 출판사와 저자가 이 차이를 이해하지 못하면, 권리를 지킬 기회 자체를 놓치게 됩니다.
AI의 도서 활용은 크게 두 단계로 나뉩니다. 첫째는 모델 학습(training) 단계로, 대규모 도서 텍스트를 파라미터에 압축하는 과정입니다. 둘째는 추론(inference) 단계로, 학습된 모델이 실제 응답을 생성하거나 RAG 방식으로 원문을 직접 검색해 인용하는 과정입니다. 학습 단계의 저작권 분쟁은 현재 미국과 유럽 법원에서 한창 진행 중입니다. 그러나 추론 단계, 특히 RAG 방식의 실시간 인용은 훨씬 명확한 저작권 침해 가능성을 내포합니다. 원문 텍스트가 그대로 복사되어 사용자에게 전달되기 때문입니다.
빅테크 기업들이 가장 많이 내세우는 방어 논리는 공정이용(fair use)입니다. 미국 저작권법 107조는 비평, 논평, 교육, 연구 목적의 제한적 사용을 허용합니다. 그러나 법원은 공정이용 판단에 네 가지 요소를 종합적으로 검토합니다. ① 사용의 목적과 성격(상업적 여부, 변형적 사용 여부), ② 저작물의 성격, ③ 사용된 양과 실질성, ④ 잠재적 시장에 미치는 영향. RAG 시스템이 도서 원문 단락을 그대로 추출해 유료 서비스에 제공한다면, 네 가지 요소 중 세 가지가 저작권자에게 유리하게 작동합니다. 특히 ④번 시장 대체 효과는 결정적입니다. 사용자가 AI를 통해 책 내용을 무료로 얻는다면, 해당 책의 판매에 직접적인 타격을 줍니다.
Thomson Reuters 대 Ross Intelligence 사건은 이 흐름을 잘 보여줍니다. 미국 법원은 2025년 AI 회사가 법률 데이터베이스를 학습에 활용한 것이 공정이용에 해당하지 않는다고 판결했습니다. 핵심 이유는 시장 대체였습니다. 법률 정보 서비스 시장에서 AI가 원본 데이터베이스의 고객을 직접 빼앗는다는 논리가 인정된 것입니다. 도서 시장에도 동일한 논리가 적용될 수 있습니다.
AI가 책 내용을 요약해서 제공한다면, 독자는 책을 살 이유가 없어집니다. 이것이 바로 '시장 대체'이며, 공정이용 방어가 가장 취약해지는 지점입니다.
법적 불확실성이 해소될 때까지 기다리는 것은 전략이 아닙니다. 현실적으로 출판사가 취할 수 있는 행동은 세 가지입니다. 첫째, 자사 도서가 RAG 시스템에 사용되고 있는지 모니터링합니다. AI 서비스에 책 제목과 고유 문장을 직접 입력해보는 것이 출발점입니다. 둘째, 저작권 등록과 라이선싱 정책을 명문화합니다. 묵시적 허락은 법정에서 불리하게 작용합니다. 셋째, 소송이 아닌 라이선싱을 통해 수익을 확보하는 경로를 검토합니다. 법원 판결이 어느 쪽으로 나더라도, 라이선싱 계약은 출판사에게 즉각적인 수익과 통제권을 동시에 제공합니다. 멘탯의 출판사 서비스는 출판사가 자사 도서의 AI 활용 범위를 정의하고, 적절한 라이선싱 조건으로 AI 기업과 연결될 수 있도록 설계되었습니다. 저작권 분쟁보다 라이선싱 수익이 먼저입니다.