검색 상세

Sequential Adaptive Nearest Neighbors 를 활용한 결측치 대치 방법

초록/요약

결측/무응답은 사회과학과 자연과학 등의 전반적인 분야의 관측 또는 실험에서 다양한 이유로 종종 나타나는 현상이다. 예를 들어 어떤 화학 실험에서 예기치 못한 기계의 오류로 인해 결측값이 발생하는 경우, 혹은 설문조사에서 사적인 질문에 응답자가 응답하지 않는 경우가 있다. 하지만 완전한 자료를 얻기 위해서 자료수집을 다시 한다는 것은 비용적인 문제 때문에 현실적으로 거의 불가능하기 때문에 결측값을 처리하는 방법에 대한 연구가 활발히 이루어지고 있다. 본 논문에서는 결측값을 비모수적인 대치 방법인 Adaptive Nearest Neighbor Imputation (ANNimpute) 방법과 Sequential Adaptive Nearest Neighbor Imputation (SKNNimpute) 방법의 장점을 결합한 Sequential Adaptive Nearest Neighbor Imputation (SANNimpute)방법을 제안하고자 한다. 이 방법은 ANNimpute 방법의 장점인 자료의 국소적 특징을 반영한다는 것과 SKNNimpute 방법의 장점인 결측값 대치가 이루어진 개체를 다음 결측값을 대치할 때 사용한다는 것을 모두 이용하는 방법으로, 결측값이 자료의 밀도가 낮은 지역에서 발생했을 때나 결측비율이 높을 때 더욱 효율적으로 기대한다.

more

목차

1. 서론 1
2. SANNimpute 방법 4
2.1 알고리즘 7
2.2 모수의 선택12
2.3 사례분석 12
3. 모의 실험 15
4. 결론 19
참고문헌 20

more