검색 상세

Pointwise Estimation for Generalized Linear Models in High-Dimensional Data

고차원 데이터에서 일반화 선형 모형의 점별 추정

초록/요약

In high-dimensional data analysis, the Pointwise Estimator (PWE), which directly estimates the linear transformation of regression coefficients was extended to Generalized Linear Models (GLMs) and compared with the performance of the conventional plug-in method. PWE was proposed to address the limitations of existing methods that suffer performance degradation in high-dimensional settings due to strong correlations among predictors or the non-sparsity of β. By directly estimating the linear transformation, PWE achieves more stable results. This study evaluates the performance of PWE through simulations and real data analyses. The results show that in linear regression, PWE outperforms LASSO as β becomes less sparse, while in GLMs, the performance varies depending on the data characteristics. These findings suggest that PWE can flexibly adapt to the properties of the data, particularly the sparsity of β and the correlation structure among predictors. This study demonstrates the utility of PWE in high-dimensional data analysis and highlights the need for further research on its application to various GLMs and real-world datasets.

more

초록/요약

고차원 데이터 분석에서 회귀 계수의 선형 변환을 직접 추정하는 Pointwise Estimator (PWE) 방법론을 일반화 선형 모형에 확장하고, 기존 플러그인 방식과의 성능을 비교하였다. PWE는 고차원 환경에서 예측 변수 간의 강한 상관성이나 β의 비희소성으로 인해 성능이 저하되는 기존 방법의 한계를 극복하기 위해 제안된 방법으로, 선형 변환을 직접 추정함으로써 더욱 안정적인 결과를 얻을 수 있다. 본 연구에서는 시뮬레이션과 실제 데이터 분석을 통해 PWE의 성능을 평가하였다. 그 결과, 선형 회귀 모형에서는 β가 비희소할수록 PWE가 LASSO보다 우수한 성능을 보였으며, 일반화 선형 모형에서는 데이터의 특성에 따라 성능이 달라지는 것을 확인하였다. 이는 PWE가 데이터의 특성, 특히 β의 희소성 및 데이터 간 상관 구조에 따라 유연하게 대응할 수 있음을 시사한다. 본 연구는 고차원 데이터 분석에서 PWE의 유용성을 보여주었으며, 향후 다양한 일반화 선형 모형 및 실제 데이터에 대한 추가적인 연구가 필요하다.

more

목차

Abstract i
국문초록 iii
Table of Contents iii
List of Tables vi
List of Figures vii
1 Introduction 1
2 Existing Method 3
2.1 The Transformed Model 3
2.2 Construct of Γ 4
2.3 Pointwise Estimator 6
3 Extension to GLM 8
4 Numerical Studies 11
4.1 Simulation Study 11
4.2 Real Data Analysis 12
4.2.1 Linear Regression 13
4.2.2 Logistic Regression 14
5 Discussion 15
Reference 17

more