SVM과 PLS를 활용한 세분화예측모형 개발 및 비교연구
- 주제(키워드) 세분화 , 예측모형 , PLS , SVM
- 발행기관 고려대학교 대학원
- 지도교수 최종후
- 발행년도 2013
- 학위수여년월 2013. 2
- 학위구분 석사
- 학과 일반대학원 경제통계학과
- 원문페이지 56 p
- 실제URI http://www.dcollection.net/handler/korea/000000038076
- 본문언어 한국어
- 제출원본 000045745549
초록/요약
기업 간의 경쟁이 심화된 오늘날 기업의 성공에 가장 중요한 요인은 고객가치의 파악과 서비스의 차별화에 있다. 시간이 지날수록 고객의 수준과 개성이 다양해지는 가운데 자사고객으로의 유치를 위해서는 그 고객의 니즈를 파악하고 충족시켜 줄 수 있어야 한다. 또한 기업은 개별 소비자에 대하여 일대일 관계를 맺고, 고객의 입장에서 그 고객을 이해하고 개별 고객에 대한 차별적인 대응을 통하여 고객과의 신뢰를 형성할 수 있게 된다. 즉, 기업경영에 있어 고객세분화와 타겟마케팅의 필요성이 점점 커지고 있는 것이다. 이를 위해서는 고객의 니즈를 파악할 수 있는 예측모형의 개발이 필수적인데 종래 기업에서 일반적으로 적용되고 있는 하나의 예측모형으로 다양한 니즈를 가진 고객집단을 설명하는 데는 한계가 따른다. 따라서 본 논문에서는 반응/미반응 목표변수를 갖는 모집단에 대해 군집분석을 통하여 세분화 과정을 거친 후, 세분화 마트별로 예측모형을 각각 개발함으로써 다양한 고객층을 세분화된 예측모형으로 설명하고자 한다. 또한 본 논문에서는 교차타당성(cross validation)을 이용한 반복실험을 통해 분석결과의 신뢰도 향상뿐만 아니라 일반화까지도 고려한다. 그리고 예측모형은 의사결정나무와 로지스틱회귀분석과 나아가 서포트벡터머신과 부분최소제곱법모형을 적용함으로써 최적의 세분화 모형 제시를 시도한다. 교차타당성을 이용한 10회의 반복실험을 한 결과 동일기준하의 단일모형과 세분화모형의 비교실험에서는 4가지의 모든 모형에서 세분화모형이 오분류율, 민감도, 특이도 측면에서 대부분 우수하였다. 그리고 동일기준이 아닌 각 모형별로 분류기준값과 모형방법을 적절하게 적용하여 개발한 최적의 모형에서는 단일모형에 비해 모든 세분화모형에서 높게 나타남을 확인하였다. 결과적으로 예측모형 개발 시 고객정보를 바탕으로 고객을 세분화하여 모형을 개발한다면 예측력 향상뿐만 아니라 모형의 효과적인 활용까지 기대할 수 있음을 알게 되었다.
more목차
제1장 서 론 1
제2장 예측모형에 대한 이해 3
2.1 군집분석과 k-평균 군집화 3
2.2 서포트벡터머신 8
2.3 부분최소제곱법 10
2.3.1 부분최소제곱모형 11
2.3.2 부분최소제곱법의 종류 13
제3장 모형평가방법 15
3.1 모형평가의 개념 15
3.2 분리표본 타당성 16
3.2 교차타당성 16
제4장 실증분석 1 : 모형개발을 위한 자료 준비 17
4.1 분석자료 17
4.2 데이터마트 구성 17
4.2.1 결측값 처리 18
4.2.2 군집분석을 위한 변수변환 19
4.2.3 데이터 정제 후 마트 구성 21
4.2.4 교차타당성 검토를 위한 데이터분할 22
4.2.5 세분화 과정 24
4.3 변수선택 25
4.4 모형 구축 28
4.5 모형 성능 비교 실험 29
제5장 실증분석 2 : 단일모형과 세분화모형 비교 30
5.1 부분최소제곱법 모형개발 30
5.2 서포트벡터머신 모형개발 30
5.3 단일모형과 세분화모형 비교(동일 기준) 30
5.3.1 로지스틱회귀분석 31
5.3.2 의사결정나무 33
5.3.3 서포트벡터머신 34
5.3.4 부분최소제곱법 37
5.3.5 동일 기준의 모형비교 결과 39
5.4 최적 모형선정 후 비교 40
5.4.1 최적 단일모형 선정 40
5.4.2 최적 세분화모형 선정 41
5.4.3 최종 모형비교 결과 43
제6장 결론 및 토의 45
참고문헌 47

