자영업자의 업종별 매출 영향요인 분석을 위한 머신러닝 기법 활용에 관한 연구
A Study on Machine Learning Techniques to Analyze the Factors Affecting Sales of the Self-Employed
- 주제(키워드) 자영업자 , 단위면적당 매출액 , 머신러닝 , 빅데이터 , 최적화 , Self-Employed , Sales Per Unit Area , Machine Learning , Bigdata , Optimization
- 발행기관 조선대학교 지식경영연구원
- 발행년도 2022
- 총서유형 Journal
- DOI http://dx.doi.org/10.22778/jci.2022.45.2.53
- KCI ID ART002851052
- 본문언어 한국어
초록/요약
본 연구는 국내 자영업자의 ‘단위면적당 매출액’ 에 유의미한 영향을 미치는 주요 요인들과 그 영향력의 크기를 살펴보기 위한 방법론으로 머신러닝 기법의 활용을 제안한다. 이를 위해 경기도 전역의 읍·면·동 단위의 자영업자 세부업종을 대상으로, ‘단위면적당 매출액’, ‘인구특성(주거인구, 직장인구, 유동인구 등)’, ‘업종 특성별 매출 데이터’ 등의 자료를 활용하였다. 본 연구는 머신러닝 분석방법론으로, 예측의 해석 가능성과 정확성을 높이기 위해 트리 기반의 앙상블 머신러닝 모델을 활용하고, LightGBM 알고리즘을 선택하였다. 그리고 데이터 구조의 한계에 따른 발생 가능한 과대적합 문제를 해결하기 위해 교차 검증 및 반복 수행을 활용하여 해당 문제를 통제하였고, LightGBM의 Hyper Parameter Tuning은 Bayesian Optimization를 활용하여 최적화를 시도하였다. 또한 1차 모델의 예측 정확성을 높이기 위해 이상치를 제거하고, 최적 모델이 도출되지 않은 업종에 대한 상관계수 기반의 보간법을 적용하여 최적 모델을 도출하고자 하였다. 그리고 활용한 알고리즘의 해석을 위해 Shapley Value를 시각화하고, Summary Bar Plot, Dependence Plot 등을 통한 모델 결과를 간접적으로 해석하였다.
more

