A Model-free Feature Screening Via Fused Quantile Utility
A Model-free Feature Screening Via Fused Quantile Utility
- 주제(키워드) Feature screening , Kernel quantile regression , Ultra-high dimensional data , 변수 스크리닝 , 커널 분위수 회귀분석 , 초고차원 데이터
- 발행기관 고려대학교 대학원
- 지도교수 신승준
- 발행년도 2019
- 학위수여년월 2019. 2
- 학위구분 석사
- 학과 대학원 통계학과
- 세부전공 응용통계학 전공
- 원문페이지 31 p
- 실제URI http://www.dcollection.net/handler/korea/000000083852
- UCI I804:11009-000000083852
- DOI 10.23186/korea.000000083852.11009.0000827
- 본문언어 영어
- 제출원본 000045977217
초록/요약
In this paper, we propose fused quantile screening (FQS), a new model-free feature screening method for ultra-high dimensional data. In particular, we first estimate the conditional quantiles at different levels via kernel quantile regression (KQR). Then, we combine the quantile information to capture the marginal association between the response and each predictors. The FQS is fully nonparametric and particularly efficient for handling heteroscedasticity due to the use of the KQR. The KQR solutions enjoy the piecewise-linearity which drastically facilitates the computation. Our numerical investigation demonstrates promising performance of the proposed FQS compared to other existing screening methods.
more초록/요약
본 논문은 초 고차원 데이터에서 model-free 변수 스크리닝(feature screening) 방법으로 fused quantile screening(FQS) 방법론을 제안한다. 이 방법론은 분위수를 사용하여, 이분산성 데이터를 분석하는데 기존의 변수 스크리닝 방법들보다 더 용이하다. 우리는 커널 분위수 회귀(kernel quantile regression) 모수의 선형적 특성을 이용하여 모든 분위수에 대해서 조건부 분위수 함수를 추정한 후, 모든 분위수의 정보를 결합하는 방법론을 제안하였다. 특히, 가중치의 형태에 따라 fused quantile screening(FQS)과 weighted fused quantile screening(wFQS)을 제안하였다. 더 나아가, 모의 실험과 실제 데이터 분석에서 기존의 변수 스크리닝 방법들과 본 논문에서 제시한 방법들간의 성능 비교를 통해 우수성을 입증하였다.
more목차
1 Introduction 1
2 Proposed Method 6
2.1 Fused quantile utility 6
2.2 Simple example 10
3 Simulation 12
3.1 Simulation design 12
3.2 Simulation results and conclusions 14
4 Real data analysis 17
4.1 Hitters data 17
4.2 Real data results and conclusions 18
5 Conclusion 20

