중국어 리뷰 데이터 분석을 통한 한국 인기 관광지 평가 체계 연구
An Evaluation System for Popular Korean Tourist Destinations : A Study Based on the Analysis of Chinese Language Review Data
초록/요약
중국에서 "인터넷+관광" 전략이 빠르게 도입되고 중국의 출입국 규제를 완화됨에 따라, 중국인의 관광 소비는 문화 생활 분야에서 점점 더 중요한 부분으로 자리잡고 있다. 중국인들의 한국 관광 수요를 늘리기 위해 한국의 대표 관광지에 대한 리뷰를 심도 있게 분석하여 관광객의 잠재적인 요구와 관광지 특성을 이해하는 것이 중요하다. 본 연구에서는 중국의 주요 여행 정보 플랫폼인 씨트립(Ctrip)에 게시된 한국의 인기 관광지에 대한 온라인 리뷰를 종합적으로 분석하였다. 데이터 전처리 후 LDA 모델로 리뷰에서 토픽을 추출하였고, 이를 통해 객관적인 관광지 평가 지표를 도출하였다. 이 지표들을 활용하여 한국의 8대 인기 관광지에 대한 종합적인 평가를 실시하였으며, 관광지의 만족도와 부정적, 긍정적 리뷰 트렌드를 분석하여 관광객의 만족도를 높이기 위한 방안을 제시하였다. 본 연구의 독창성은 LDA 토픽 모델링을 활용하여 관광지 종합 평가 지표를 정의했다는 것이다. 모델을 사용하여 리뷰에서 관광객들이 공통적인 관심 사항과 감정을 추출함으로써 기존 지표 선정 방법보다 객관적인 관광지 종합 평가 체계를 마련하였다. 본 연구의 결론은 다음과 같다: (1) LDA 모델을 활용해 토픽을 추출함으로써 관광지 평가 체계를 객관적으로 구축하였다. 지표는 이국적 체험, 영화/문화 체험, 미식 체험, 쇼핑 체험, 공연 문화 체험 및 서비스 인식 6개로 구성되어 있으며, 이국적 체험과 영화/문화 체험은 관광객의 목적지 선정에 중요한 지표이다. (2) 한국 주요 관광지의 종합 점수를 측정한 결과, 서울 남산 타워가 가장 높은 점수를 받았으며, 이어서 성산일출봉, 명동, 경복궁, 우도, 그래피티쇼, 제주 테디베어 박물관, 용두암 순으로 나타났다. (3) 관광지 감성 분석을 통해 지난 5년간 부정적인 리뷰에서 ‘소비’, ‘상인’, ‘서비스’와 같은 단어가 자주 언급되었다. 이는 관광객 경험 최적화의 핵심 방향임을 시사한다. 또한, 자연 풍경 관광지에 비해 인문 및 영화/문화 관련 관광지가 일반적으로 더 높은 평가를 받았다.
more초록/요약
As the fusion of "Internet + Tourism" gains increasing prominence in China and the Chinese government relaxes immigration policies, tourism consumption has become a pivotal aspect of cultural and recreational life. The resurgence of Chinese tourists visiting South Korea appears imminent. Despite being a favored destination, South Korea isn't their top choice. Therefore, it is crucial to conduct a meticulous analysis of online reviews for popular Korean tourist sites, establish an evaluation system, and quantitatively assess these sites to comprehend tourist needs and destination characteristics. This study delves into the online review data of popular South Korean tourist sites, sourced from Ctrip, a major Chinese travel information platform. The data underwent preprocessing to transform reviews into structured data suitable for the Latent Dirichlet Allocation (LDA) model. Through LDA modeling, latent topics were extracted, refined, and labeled with topic-specific keywords, forming objective metrics for evaluating tourism sites. Furthermore, topic scores were measured to comprehensively evaluate South Korea's eight major tourist destinations. The study dynamically analyzed satisfaction levels, annual trends in negative review topics, positive review ratios, and provided practical suggestions based on the findings to enhance tourist satisfaction. The innovation in this research lies in the extraction of comprehensive evaluation metrics for tourist sites using LDA topic modeling. By objectively establishing a comprehensive evaluation system based on common characteristics and emotional attitudes from online reviews, this approach addresses the subjectivity issue in selecting evaluation metrics. The key findings of this paper are as follows: (1) The LDA model, applied to extract topics, objectively constructed a tourism site evaluation system, deviating from traditional generic metrics. It includes six key indicators: exotic experiences, movie/cultural experiences, culinary experiences, shopping experiences, performance culture experiences, and service perceptions. Exotic experiences and movie/cultural experiences notably influence destination choices. (2) Namsan Tower in Seoul scored the highest overall, followed by Seongsan Ilchulbong, Myeong-dong, Gyeongbokgung, Udo, Graffiti Show, Jeju Teddy Bear Museum, and Yongduam. (3) Dynamic emotion analysis revealed prevalent negative mentions of "consumption," "merchants," and "service" over the past five years, guiding improvements in tourist experiences. Cultural and movie/cultural sites generally received higher evaluations compared to natural scenic spots.
more목차
1. 서론 1
1.1 연구 배경 및 의의 1
1.1.1 연구 배경 1
1.1.2 연구 의의 2
1.2 선행연구 3
1.2.1 LDA(Latent Dirichlet Allocation) 토픽 모델 관련 연구 4
1.2.2 온라인 리뷰 관련 연구 5
1.2.3 관광지 평가 체계 관련 연구 6
1.3 연구 내용 및 방법 7
1.3.1 데이터 수집 및 전처리 7
1.3.2 LDA 토픽 모델 기반 관광지 평가 체계 구축 8
1.4 논문의 기본 구조 8
2. 관련 기초 이론 및 기술 소개 11
2.1 LDA 토픽 모델 관련 이론 11
2.1.1 LDA 토픽 모델 기본 이론 11
2.1.2 하이퍼파라미터 결정 방법 13
3. LDA 토픽 모델을 이용한 텍스트 토픽 탐색 15
3.1 온라인 리뷰 데이터 출처 기술 16
3.2 데이터 수집 및 전처리 16
3.2.1 데이터 수집 16
3.2.2 데이터 전처리 18
3.2.3 텍스트 전처리: 단어 분할 및 불용어 제거 19
3.3 온라인 리뷰의 토픽 특성 추출 및 명명 21
4. 한국 주요 관광지의 종합 평가 체계 및 점수 분석 25
4.1 관광지 종합 평가 지표 선택 25
4.1.1 지표 선택 원칙 25
4.1.2 종합 평가 체계의 지표 및 가중치 설정 26
5.1 연도별 관광지에 대한 부정적 토픽 변화 34
5.1.1 연도별 긍정적 리뷰의 비율 상황 34
5.1.2 연도별 부정적 고빈도어 변화 추세 35
5.2 한국 주요 관광지 긍정적 리뷰 비율 분석 38
6. 결론 및 전망 40
6.1 결론 및 제언 40
6.2 향후 연구 주제 43
참고문헌 45
부록 48
A. 분석 대상 관광지 선정에 대한 상세 방법론 48

