블로그
시장 동향2026. 2. 23.·전병욱

수백만 권을 스캔하고 폐기한다 — AI 스타트업의 계획이 드러냈다

최근 워싱턴 포스트가 보도한 내용은 출판 업계에 적지 않은 충격을 안겼습니다. 한 AI 스타트업이 수백만 권의 도서를 스캔한 뒤 원본을 폐기하는 방식으로 학습 데이터를 확보하려 한다는 계획이 워싱턴 포스트 보도를 통해 공개된 것입니다. 저작권자의 동의 없이, 보상도 없이 진행되는 이 방식은 출판사와 저자 모두에게 직접적인 위협이 됩니다.

스캔 후 폐기 — 무엇이 문제인가

이 스타트업의 접근 방식은 단순히 불법 복제의 차원을 넘어섭니다. 책을 물리적으로 구매한 뒤 스캔하고 원본을 없앤다는 논리는 '소진 원칙(First Sale Doctrine)'을 악용하는 구조입니다. 그러나 저작권법 전문가들은 디지털 복제본 생성과 AI 학습 활용이 소진 원칙의 적용 범위를 벗어난다고 지적합니다. 책을 구매했다고 해서 그 내용을 AI 모델에 학습시킬 권리까지 얻는 것은 아니기 때문입니다.

  • 저작권자 동의 없는 디지털 복제 — 저작권법 위반 소지
  • AI 학습 목적의 활용 — 별도 라이선스 필요
  • 원본 폐기 후 디지털본만 보유 — 소진 원칙 남용 논란
  • 출판사·저자에 대한 수익 배분 없음

'딸깍 출판'과 무단 스캔 — 한국도 예외가 아니다

비슷한 시기, 국내에서도 출판 생태계를 흔드는 소식이 나왔습니다. 이로운뉴스 보도에 따르면, AI가 자동으로 생성한 이른바 '딸깍 출판' 도서가 급증하면서 국립중앙도서관이 AI 도서 납본을 처음으로 거절하는 사태가 벌어졌습니다. 저자 없는 책이 쏟아지는 상황과 저자의 책이 무단으로 AI 학습에 쓰이는 상황이 동시에 진행되고 있는 것입니다. 출판 생태계의 양쪽이 동시에 흔들리고 있다고 볼 수 있습니다.

AI는 책으로 학습하고, 책은 AI로 찍어낸다. 출판사가 이 순환 구조 밖에 머무른다면 가치는 점점 희석될 수밖에 없습니다.

무단 스캔 사태가 시사하는 핵심은 분명합니다. AI 기업들은 도서 콘텐츠에 대한 수요가 크고, 합법적인 경로가 없으면 회색 지대를 찾아 나선다는 것입니다. 역설적으로 이는 출판사에게 기회이기도 합니다. 수요가 있는 곳에 라이선싱 시장이 형성될 수 있기 때문입니다. 실제로 HarperCollins, Wiley 등 선도 출판사들은 이미 AI 기업과 정식 데이터 라이선싱 계약을 체결하며 새로운 수익원을 만들어가고 있습니다.

출판사가 지금 해야 할 일

  • 자사 도서 목록이 무단으로 학습 데이터에 포함되었는지 모니터링
  • AI 기업의 데이터 수요에 맞는 라이선싱 조건 사전 정의
  • 단순 판권 계약이 아닌 AI 학습 전용 라이선스 조항 별도 구성
  • 저자와 AI 학습 수익 배분 방식 사전 합의

멘탯은 바로 이 지점에서 출판사의 파트너가 됩니다. 무단 스캔이나 소송이 아닌, 정식 라이선싱 채널을 통해 출판사가 AI 기업과 협상하고 수익을 나눌 수 있도록 연결하는 것이 멘탯의 역할입니다. 도서 콘텐츠에 대한 AI의 수요는 계속 커지고 있습니다. 그 수요를 무단 사용이 아닌 공정한 거래로 전환하는 것, 지금이 출판사가 행동해야 할 시점입니다.

멘탯과 함께 시작하세요

AI 시대, 도서 콘텐츠의 새로운 가능성을 열어보세요

제휴가 궁금해요