Random Forests의 비교연구
- 주제(키워드) Random Forests
- 발행기관 고려대학교 대학원
- 지도교수 조형준
- 발행년도 2011
- 학위수여년월 2011. 2
- 학위구분 석사
- 학과 일반대학원 통계학과
- 세부전공 응용통계학 전공
- 원문페이지 45 p
- 실제URI http://www.dcollection.net/handler/korea/000000025639
- 본문언어 한국어
- 제출원본 000045640576
초록/요약
데이터 마이닝 기법 중 많은 나무모형의 알고리즘이 존재하고 더 좋은 예측력과 정확성을 갖는 모형을 위해 앙상블(ensemble) 기법의 다양한 방법론이 제안되었다. 앙상블(ensemble)이란 단일모형들보다 더 나은 예측모형을 얻기 위해 여러 모형들을 사용하는 기법으로 더 좋은 예측력과 정확성을 갖는다. 앙상블 기법에 부스팅(boosting)과 배깅(bagging)과 같은 대표적인 방법이 있다. 그러나, 데이터에 따라 배깅이 더 나은 예측력을 갖기도 하고, 부스팅이 더 나은 예측력을 갖는 경우도 있다. 이러한 앙상블 기법에 맞서는 Random Forests는 배깅을 수정한 앙상블기법으로서 나무들 사이의 상관관계를 감소시킴으로써 분산의 감소를 향상시키기 위한 방법이다. 이는 입력변수를 랜덤하게 선택하면서 나무를 성장시킴으로써 이루어진다. 기존에 제안된 Random Forests는 가장 대표적인 나무모형인 CART 알고리즘을 기반으로 연구되었지만 본 논문에서는 다른 나무모형 알고리즘에 Random Forests를 적합 시키고자 하였다. 즉, CART 알고리즘과 PARTY 알고리즘을 사용하여 다른 나무모형에서도 Random Forests를 적합 시켜 더 나은 예측력과 정확성을 갖는지 알아보고자 하였고 Random Forests에서의 선택변수의 개수를 다양하게 적합 시켜 선택변수의 개수의 변화에 따라 오분류율을 살펴보고자 하였다.
more목차
1.서론 1
2.배경 설명 3
2.1 의사결정나무 3
2.2 Random Forests 10
3. 데이터 실험 비교 14
3.1 데이터 소개 14
3.2 알고리즘 비교 기준 15
3.3 데이터 실험 16
3.4 알고리즘 성능 비교 결과 18
4. 결론 37
<참고문헌> 40

