검색 상세

기계학습을 이용한 시놉시스 기반 영화 장르 분류

Synopsis-Based Classfication of Movie Genres using Machine Learning Techniques

초록/요약

최근 문화산업에 대한 인식 전환과 IT 기술의 발전은 많은 분야에서 새로운 연구와 시도들을 불러왔다. 영화산업 분야에서도 고객의 다양한 기호와 요구에 부합하는 서비스는 중요해졌으며, 출연배우와 더불어 장르는 고객 선택의 가장 중요한 요소로 알려져 있다. 이러한 중요성에도 불구하고 기존의 장르분류는 영화대본 등을 분석해서 수작업으로 구분해 주는 방식이 사용되고 있으며, 이 경우에는 사람의 노력, 비용, 시간 등에서 심각한 어려움을 초래할 뿐만 아니라 각각의 매체마다 서로 다른 분류 기준을 가지고 있어 동일한 영화가 매체마다 서로 다른 장르로 구분되는 경우가 발생되어 신뢰성 있는 서비스를 제공하는데 한계를 가지고 있다. 본 논문에서는 시놉시스(synopsis) 데이터를 이용하여 장르별 단어사전을 구축하고 이를 기반으로 한 사전기반의 장르 분류 실험을 실행하였고, 이와 비교하여 기계학습 기반 분류 실험을 통해 최초로 시놉시스 기반의 장르 분류라는 하나의 정형화된 방법을 제시하였다. 기계학습을 통해 보다 좋은 분류 결과를 도출하기 위해서는 유용한 자질의 선택이 중요하다는 사실을 확인할 수 있었고, 사전기반의 분류방식과 비교할 때 기계학습 기법을 이용한 장르 분류는 그 결과에서 우수한 성능이 도출되었다. 아울러 장르 분류를 위한 시간과 비용 등을 감안할 때 그 효용성에서 기계학습을 이용한 장르 분류는 충분히 가치가 있음이 실험 결과로 나타났다.

more

초록/요약

Due to recent understanding transition in culture industry and development in IT technologies has brought out new researches and trials from various fields. Providing services that meets with various customers’ preferences and demands became also important in movie industries. Together with featured actor, genre is known to be the most important factor in customer’s choice. Regardless of this importance, existing genre categories are classified manually by analyzing movie script etc… and in this case, it causes serious problems from human efforts, costs, and time etc. Also because each medium has different categorizing methods, it can cause identical movie to be classified as different genre, which puts limits on providing confidential services. In this paper, dictionary based genre classification experiment was performed by constructing word dictionary based on using synopsis data and comparing it, a single standardized method that uses genre classification based on machine learning synopsis was presented. It was confirmed to derive better classification result from machine learning, it is important to select useful qualifications. Compared to dictionary based classification method, genre classification performed by machine learning method produced much more superior results. In addition, considering the time, cost, and etc… when classifying genre, it is shown in the experiment result that machine learning to classify genre has sufficient value in its effectiveness.

more

목차

요 약 4
ABSTRACT 5
그림 목차 8
표 목차 9
1. 서론 10
1.1. 연구의 배경 및 목적 10
1.2. 논문의 구성…………………………………………………………………………………………………12
2. 관련연구 13
2.1 영화장르의 분류………………………………………………………………………………………….13
2.1.1 영화장르의 분류 ………………………………………………………………………………..13
2.1.2 서비스 별 영화장르 분류 현황…………………………………………………………..14
2.2 기존 연구 16
2.2.1 기존 사례 연구 16
2.2.2 기존 연구의 문제점 17
2.3 영화장르 분류를 위한 기법 18
2.3.1 사전에 의한 방법 18
2.3.2 신경망 학습 기법 19
2.3.3 Meta 분석 Algorithm 21
2.4 실험도구(WEKA) 24
3. 시놉시스 기반 영화장르 분류 26
3.1. 전처리 작업 27
3.2. 자질 선택 28
3.3. 문서 표현 및 가중치 부여…………………………………………………………………………..29
4. 실험 및 평가…………………………………………………………………………………….31
4.1. 실험 환경…………………………………………………………………………………………………….31
4.2. 실험 결과 32
4.2.1 사전기반 장르 분류 실험 결과………………………………..………………………...32
4.2.2 자질 선택 실험 결과 34
4.2.3 내용어 품사비교 실험 결과 35
4.2.4 기계학습 Algorithm별/장르별 성능평가 36
4.2.5 사전기반과 기계학습기반 장르 분류 비교분석 38
5. 결론 및 향후 연구 40
5.1. 결론 40
5.2. 향후 연구 40
참고문헌 42

more