생성형 인공지능의 데이터 수집 및 학습 과정에서 발생하는 지적재산권법 쟁점 검토 : 플랫폼 내 학습 데이터 이용을 중심으로
A Study on Legal Issues of Intellectual Property Rights Arising from Data Collection and Training Processes of Generative Artificial Intelligence : Focusing on the Use of Training Data within Online Platforms
- 주제(키워드) 생성형인공지능 , 생성형AI , 플랫폼 데이터 , 공정이용 , 투명성 , 확대된 라이선스(ECL) , 옵트아웃 , 저작권 , generative artificial intelligence , generative AI , platform data , fair use , transparency , extended collective licensing (ECL) , opt-out , copyright
- 발행기관 고려대학교 법무대학원
- 지도교수 조영선
- 발행년도 2026
- 학위수여년월 2026. 2
- 학위명 석사
- 학과 및 전공 법무대학원 지적재산권법학과
- 원문페이지 130 p
- 실제URI http://www.dcollection.net/handler/korea/000000309126
- UCI I804:11009-000000309126
- DOI 10.23186/korea.000000309126.11009.0302418
- 본문언어 한국어
초록/요약
생성형 인공지능의 대중화로 인해 새로운 지적재산권법 쟁점이 발생하고 있다. 특히, 생성형 인공지능의 학습 데이터에 인간의 고유 창작물이 포함되는 경우 발생하는 법적 쟁점은 현행 지적재산권법 체계에서 다루기에 한계가 존재한다. 생성형 인공지능은 비생성형 인공지능과 달리 인간의 창작물과 직접 경쟁 관계에 놓이게 되는 결과물을 출력하는 것을 목표한다. 이러한 특수성으로 인해 생성형 인공지능의 학습 데이터를 수집하고 학습하는 과정에서부터 결과물의 출력 및 활용에 이르기까지 다양한 지적재산권법 쟁점이 발생한다. 본 논문은 생성형 인공지능 학습 데이터 이용에 대한 지적재산권법상의 권리와 해외 입법 동향을 살펴보고, 관련 지적재산권법 쟁점을 ‘플랫폼 데이터’로 한정하여 이용 객체와 주체로 유형화하여 검토하였다. 특히 생성형 인공지능-플랫폼 라이선스 계약이 활발해지고 있는 현황을 바탕으로 플랫폼 사업자, 플랫폼 이용자 그리고 생성형 인공지능 사업자 간의 이익과 권리의 균형을 도모할 수 있는 법제화 방향성을 제시하였다. 그 방향성은 (1) 적절한 보상, (2) 권리자 동의 확보 및 옵트아웃 권리 보장, (3) 투명성 확보 세 가지를 핵심으로 한다. 구체적으로 유럽연합의 (1) CDSM 제17조 OCSSP 저작권 관리 의무, (2) CDSM 제12조 확대된 집단 라이선스 제도, (3) AI Act 제53조(1)(c),(d) 투명성 의무를 바탕으로 플랫폼 한정 제도 법제화 방향을 제시하였다.
more초록/요약
The widespread use of generative artificial intelligence has raised new legal issues in the field of intellectual property law. In particular, when human creative works are included in the training data sets of generative AI models, the resulting legal disputes reveal the limitations of the current intellectual property framework. Unlike non-generative AI, generative AI aims to produce outputs that may directly compete with human creative works. This feature generates IP-related issues at both the output stage and throughout the training data pipeline, from collection and preprocessing to model training. This study examines the recent legislative developments abroad concerning the use of training data by generative AI and focuses on “platform data” as the main subject of analysis within the context of existing IP law. By classifying the issues in terms of the objects and actors involved in data use, the study investigates the legal relationships among platform operators, platform users, and generative AI developers. Based on the growing trend of licensing agreements between generative AI companies and online platforms, this paper proposes directions for legal reform that can ensure a fair balance of rights and interests among stakeholders. The proposed legislative framework rests on three key principles: (1) fair compensation, (2) rights-holder consent and opt-out guarantees, and (3) mandatory transparency. Specifically, it explores potential institutional reforms limited to platform contexts, drawing upon the European Union’s (1) Article 17 ot the CDSM Directive on OCSSP copyright management obligations, (2) Article 12 of the CDSM Directive on extended collective licensing schemes, and (3) Article 53(1) (c)–(d) of the AI Act on transparency obligations.
more목차
제1장 서론 1
제2장 생성형 인공지능의 데이터 이용 일반 4
제1절 생성형 인공지능의 개념 및 데이터 이용 특성 4
1. 생성형 인공지능의 정의 및 현황 4
2. 생성형 인공지능의 특수성 7
(1) 목적의 특수성 7
(2) 과정의 특수성 7
(3) 결과물의 특수성 8
(4) 소결 9
3. 생성형 인공지능의 데이터 수집 및 학습 과정 11
(1) 데이터 수집 단계 12
(2) 데이터 세트 구성 단계 13
(3) 데이터 전처리 단계 14
(4) 모델 학습 단계 14
제2절 생성형 인공지능의 데이터 이용에 대한 해외 입법 동향 15
1. 일본 16
2. 유럽연합 19
(1) 종례의 규범 19
(2) 인공지능 관련 최근 규범 24
3. 미국 27
4. 한국 31
제3절 생성형 인공지능의 데이터 이용과 법적 동향 39
1. 소송 동향 39
(1) 소송 주체의 변화 39
(2) 소송 범위의 변화 41
2. 면책 규정에 의한 항변 42
(1) 적법한 접근 43
(2) TDM 면책 44
(3) 공정이용 46
(4) 소결 50
3. 판결 사례(GEMA v. OpenAI) 51
(1) GEMA v. OpenAI 판결 52
(2) 소결 54
제3장 생성형 인공지능의 플랫폼 데이터 이용과 지적재산권법 쟁점 55
제1절 생성형 인공지능의 플랫폼 데이터 이용 현황 55
1. 생성형 인공지능 사업자가 공개한 플랫폼 데이터 이용 56
2. 소송 사례로 드러난 플랫폼 데이터 이용 60
(1) The New York Times Co. v. Microsoft Corp. 60
(2) Microsoft와 OpenAI를 상대로 한 유사 소송 병합 62
3. 플랫폼 사업자의 자사 데이터 이용(네이버의 사례) 63
(1) 네이버의 자사 데이터 이용 현황 63
(2) 네이버의 약관 기반 데이터 이용과 관련 분쟁 64
4. 생성형 인공지능-플랫폼 라이선스 계약 68
(1) 뉴스 플랫폼 라이선스 계약 사례 68
(2) 소셜 플랫폼 라이선스 계약 사례 72
(3) 오픈 국제 라이선스 가이드라인 78
제2절 이용 객체별 지적재산권법 쟁점 80
1. 비저작물 데이터 81
(1) 원시 데이터(raw data) 81
(2) 정제 데이터(cleaned data) 82
2. 저작물 데이터 84
(1) 보호 필요성과 강한 권리 구조 84
(2) 다수의 권리 주체 및 추적의 어려움 85
3. 소결 86
제3절 이용 주체별 저작권법 쟁점 86
1. 권리 주체 87
(1) 플랫폼 이용자(저작권자) 87
(2) 플랫폼 사업자(데이터베이스 권리자) 89
2. 침해 주체 90
(1) 생성형 인공지능 사업자의 직접침해 90
(2) 생성형 인공지능 사용자의 직접침해와 사업자의 간접책임 90
(3) 생성형 인공지능 서비스 약관상 사용자 면책 92
제4장 생성형 인공지능의 플랫폼 데이터 이용에 대한 법제화 방향 검토 95
제1절 법제화 방향성 95
1. 적절한 보상 97
2. 권리자 동의 확보 및 옵트아웃 권리 보장 98
3. 투명성 의무 99
제2절 플랫폼 한정 제도 법제화 검토 100
1. OCSSP 저작권 관리 의무 - CDSM 제17조 101
2. 확대된 집단 라이선스 제도 - CDSM 제12조 103
3. 투명성 의무 - AI Act 제53조(1)(c) 및 (d) 109
제5장 결론 110
참고문헌 112

