주메뉴바로가기 본문바로가기
전체메뉴
HOME > Target@Biz > 비즈

미국 '실물도서 스캔' AI 학습에 "합법", 한국 출판계 '발칵'

저작권법 '변형적 이용'으로 판단…"책 한 권 값으로 데이터 얻는다면 지식 생태계 붕괴"

2026.02.13(금) 15:59:59

[비즈한국] 인공지능(AI) 챗봇 ‘클로드’의 개발사 앤트로픽이 수백만 권의 중고책을 스캔해 학습에 활용한 행위가 미국 법원으로부터 합법 판결을 받았다. 이번 판결은 AI 기업이 실물 도서를 구매해 디지털화하는 방식이 저작권법상 ‘공정 이용(Fair Use)’에 해당할 수 있다는 선례를 남겼다. 이에 따라 저작권 보호와 적절한 데이터 가치 보상을 주장하는 국내 출판 시장에도 적지 않은 파장이 예상된다.

 

미국 법원은 앤트로픽이 수백만 권의 책을 스캔해 AI 학습에 활용한 행위가 ‘변형적 이용’에 해당되어 합법이라고 판결했다. 사진=생성형 AI

 

#앤트로픽, 중고책 스캔해 학습 자료로 사용

 

1월 27일(현지 시각) 워싱턴포스트 보도를 통해 앤트로픽의 ‘프로젝트 파나마(Project Panama)’ 전모가 드러났다. 앤트로픽은 2023년부터 생성형 AI 모델의 성능을 높이기 위해 고품질 데이터인 ‘책’ 학습이 필수적이라고 판단했다. 그러나 출판사와 작가 개개인에게 동의를 구하는 것이 현실적으로 불가능하다고 보고, 중고책을 대량 구매해 이를 디지털화하는 우회 전략을 세웠다.

 

이들은 중고 서점과 적자에 시달리는 도서관 등을 통해 수백만 권의 책을 확보했다. 이후 외부 업체를 고용해 유압식 절단기로 책을 분리하고 고속 스캐너로 디지털화한 뒤 AI 학습에 투입했다. 학습을 마친 도서는 재활용 업체에 넘겼다.

 

미국 캘리포니아주 북부지방법원은 지난해 6월 앤트로픽의 이러한 행위가 법적으로 문제가 없다고 판결했다. 재판부는 앤트로픽이 도서를 학습에 활용한 것을 ‘본질적으로 혁신적인 일’이라고 평가했다. 특히 작가가 되고 싶어 책을 읽는 독자처럼, AI 모델 역시 새로운 무언가를 창조하기 위해 학습한 것이므로 이는 저작권법상 보호되는 ‘변형적 이용(Transformative use)’에 해당한다고 판단했다.

 

재판부는 앤트로픽이 실물 도서를 직접 구매함으로써 출판 시장에 직접적인 수익을 제공했다는 점에 주목했다. 이는 공정 이용의 핵심 판단 기준 중 하나인 ‘원저작물의 시장 가치에 미치는 부정적 영향’을 최소화했다고 본 것이다.

 

다만 법원이 앤트로픽의 모든 학습 과정을 용인한 것은 아니다. 앤트로픽이 ‘리브젠(LibGen)’이나 ‘해적 도서관 미러’와 같은 불법 해적 사이트에서 수백만 권의 콘텐츠를 무단 다운로드해 학습에 활용한 것은 저작권 침해로 규정했다. 앤트로픽은 작가와 출판사들에게 15억 달러(약 2조 1000억 원)의 합의금을 지급하며 소송을 종결했다.

 

#국내엔 아직 판례 없어…지상파 3사 vs 네이버 소송에 주목

 

이번 판결로 인해 저작권자가 AI 기업에 ‘학습 자체를 하지 마라’고 요구하기가 법적으로 더 어려워졌다는 우려가 나온다. 국내 출판계는 긴장하는 모양새다. 일부 출판사는 해외 판권 수출 계약 시 ‘기계학습 사용 금지’ 조항을 삽입하는 등 개별 대응에 나서고 있으나, 기술적·법률적 강제성을 두고 의문이 제기된다.​

 

국내 출판계는 창작자들이 정당한 보상을 받지 못하는 구조가 고착화될 경우 지식생태계가 붕괴될 것을 우려한다. 사진은 서울 중구 ‘내 친구 서울 서울갤러리’ 안에 있는 서울책방. 사진=최준필 기자


대한출판문화협회(출협)는 지난해 9월 회원사들에 공문을 보내 공동 대응을 요청한 바 있다. 출협은 개별 출판사가 AI 기업과 불리한 조건으로 계약하는 것을 경계하며, 데이터 자산 가치를 지키기 위해 협회에 협상권을 위임하는 양해각서(MOU) 체결을 추진 중이다. 출협은 현재 상당수 출판사에게서 위임을 받았다고 밝혔다.

 

현재 한국 AI 기업 대부분은 학습 데이터를 확보하기 위해 출판사와 계약을 맺는다. 그러나 협상 과정에서 데이터의 가치를 두고 인식차가 큰 상황이다. 그 때문에 이번 판결이 출판사가 보유한 지적 재산 가치를 훼손하고 출판 산업 전체의 데이터 자산 가치를 저평가하는 결과를 초래할 수 있다는 우려가 나온다.

 

특히 창작자들이 정당하게 보상받지 못하는 구조가 고착화될 경우, 창작 의욕이 꺾이고 양질의 도서가 생산되지 못하는 ‘지식 생태계 붕괴’로 이어질 수 있다는 점이 가장 우려된다. 앤트로픽의 사례처럼 실물 도서를 구매했다는 이유만으로 스캔과 학습이 정당화된다면 창작자 권익은 보호받을 길이 막막해진다는 비판이다.

 

김시열 출협 저작권정책 담당 상무이사는 “책의 데이터가 한 권 값으로 사용할 수 있는 AI의 저렴한 저수지가 된다면 누가 자신의 지식 결과물을 책으로 내려고 할지 의문”이라며 “지식 생태계가 무너진다면 양질의 데이터가 중요한 AI도 정체될 수 있다”고 우려했다.

 

국내법에선 아직 AI 학습을 위한 ‘변형적 이용’에 대해 명확한 법리나 판례가 확립되지 않은 상태다. 이와 관련해 현재 진행 중인 지상파 3사와 네이버의 생성형 AI 저작권 소송이 중요한 이정표가 될 전망이다. 방송사들은 뉴스 콘텐츠가 포털 노출용이지, AI 학습용이 아니라고 주장한다. 반면 네이버는 AI 학습용 데이터로 뉴스 콘텐츠를 활용했더라도 약관상 ‘새로운 서비스 연구 개발’에 해당한다고 주장했다. 사실 전달 보도는 저작권 보호 대상이 아니라고도 맞서고 있다.

 

김경환 법무법인 민후 대표변호사는 “국내법에는 변형적 이용에 대한 판례가 없어서 한국에서 (미국과) 똑같이 적용될지는 관련 소송을 지켜봐야 한다”며 “산업 발전이라는 측면만 고려하다 보면 창작자 권리가 죽을 수 있으니 걸맞은 보상이 필요하다”고 말했다.

김민호 기자

goldmino@bizhankook.com

[핫클릭]

· [데스크칼럼] 초등학생 조카 세뱃돈 "5만 원은 너무 많다"
· [밀덕텔링] [단독] KF-21, 무장 탑재 능력 공개 "라팔보다 낫네"
· 대기업 밀가루·설탕 담합 앞에 '성심당' 다시 빛난 까닭
· "계약서 전부 다시 써야할 판" TTS 저작권 침해 판결 파장 '일파만파'
· [단독] '딸깍 출판' AI 양산형 도서, 공공도서관에 최소 150종 이상 등록


<저작권자 ⓒ 비즈한국 무단전재 및 재배포 금지>