RAG란 무엇인가 — AI가 책을 인용하는 원리와 라이선싱

최근 AI 서비스들은 단순히 학습된 지식으로 답변하는 것을 넘어, 외부 문서를 실시간으로 참조하여 답변하는 방식을 채택하고 있습니다. 이것이 RAG(Retrieval-Augmented Generation)입니다.

RAG의 작동 원리

RAG는 두 단계로 작동합니다. 먼저 사용자의 질문과 관련된 문서를 데이터베이스에서 검색(Retrieval)하고, 그 문서를 참고하여 AI가 답변을 생성(Generation)합니다. 검색 엔진과 AI의 결합이라고 볼 수 있습니다.

학습 데이터 라이선싱: AI 모델 자체를 학습시키기 위해 도서 전체를 일괄 제공
참조/인용 라이선싱(RAG): AI가 답변할 때 도서를 실시간으로 참조하고, 인용 횟수 기반으로 과금

학습 데이터 라이선싱이 '도서를 통째로 파는 것'이라면, RAG 라이선싱은 '도서를 빌려 읽게 하고 읽은 만큼 받는 것'에 가깝습니다.

Perplexity 소송: 인용도 라이선싱이 필요하다

2025년 12월, 뉴욕타임스가 AI 검색엔진 Perplexity를 저작권 침해로 고소했습니다. 시카고 트리뷴, 브리태니커 백과사전, 일본의 닛케이와 아사히신문도 소송에 동참했습니다. Perplexity는 스스로를 '출처를 인용하는 AI 검색엔진'이라고 포지셔닝하지만, 정작 그 출처의 콘텐츠를 무단으로 크롤링하고 있었습니다.

또한 2025년 2월, Thomson Reuters v. Ross Intelligence 사건에서 법원은 AI가 원본 콘텐츠와 경쟁하는 제품을 만들 경우 공정이용이 아니라고 판결했습니다. AI가 책의 내용을 참조해서 답변한다면, 그것은 책과 경쟁하는 것일 수 있습니다.

멘탯의 참조/인용 라이선싱 모델

멘탯의 참조/인용 라이선싱은 이 문제의 합법적 해결책입니다. AI 기업이 도서를 참조할 때마다 인용 횟수가 기록되고, 그에 따라 저자와 출판사에게 수익이 배분됩니다. 인용할 때는 도서 제목, 저자명과 함께 관련 문단이 제공되어 AI 답변의 신뢰성도 높아집니다.

Perplexity가 무단으로 하고 있는 것을, 멘탯은 합법적이고 투명하게 제공합니다.

RAG란 무엇인가 — AI가 책을 인용하는 원리와 라이선싱

RAG의 작동 원리

Perplexity 소송: 인용도 라이선싱이 필요하다

멘탯의 참조/인용 라이선싱 모델

관련 글

멘탯(Mentat)이란? — AI 도서 라이선싱 플랫폼 소개

AI 도서 라이선싱은 어떻게 작동하나? — 학습 데이터 vs 참조/인용(RAG)

멘탯과 함께 시작하세요