브리태니커 백과사전과 자회사인 메리엄-웹스터가 오픈AI를 상대로 저작권 침해 소송을 제기했다.

16일(현지시간) 테크크런치에 따르면 브리태니커는 소장에서 오픈AI가 자사 온라인 기사 약 10만건을 허가 없이 수집해 대규모언어모델(LLM) 훈련에 사용했다고 주장했다.

브리태니커는 오픈AI가 자사 콘텐츠의 '전부 또는 일부를 그대로 복제'한 결과물을 생성하는 행위도 저작권법 위반이라고 지적했다. 또한 챗GPT가 최신 정보를 웹에서 검색해 답변을 생성하는 검색증강생성(RAG) 과정에서 자사 기사를 사용하는 것도 문제 삼았다.

더 나아가 오픈AI가 허위 정보를 생성하고 이를 브리태니커의 정보인 것처럼 표시하는 행위는 상표법을 위반하는 것이라고도 주장했다.

소송장에는 "챗GPT는 이용자 질의에 대한 답변을 생성함으로써 브리태니커와 같은 웹 퍼블리셔의 콘텐츠를 대체하고 직접 경쟁해 수익을 빼앗는다"는 내용이 담겼다. 이어 챗GPT의 환각 현상이 "대중이 고품질의 신뢰할 수 있는 온라인 정보에 접근하는 것을 위협한다"고 덧붙였다.

브리태니커의 이번 소송은 오픈AI를 상대로 한 언론사들의 법적 대응이 이어지는 가운데 나왔다. 앞서 뉴욕타임스(NYT), 지프 데이비스, 시카고 트리뷴, 토론토 스타 등 다수의 언론사가 저작권 침해를 이유로 오픈AI에 소송을 제기한 바 있다.

AI 모델 훈련에 저작권 있는 콘텐츠를 사용하는 것이 저작권 침해인지에 대한 명확한 법적 선례는 아직 없다. 다만 앤트로픽 관련 소송에서 연방 판사는 훈련 데이터로 콘텐츠를 사용하는 것 자체는 '전환적 이용'으로 합법일 수 있다고 판단했다. 그러나 앤트로픽이 비용을 지불하지 않고 불법적으로 책 수백만 권을 내려받은 것은 위법이라고 판결한 바 있다.

오픈AI는 테크크런치의 논평 요청에 응답하지 않았다.