검색 상세

Penalized Logspline Density Estimation

초록/요약

본 학위논문의 주제는 스플라인을 이용한 확률밀도함수추정이다. 주어진 랜 덤표본을 이용하여 확률변수의 확률밀도함수를 추정하는 것이 밀도함수추정의 목표이다. 이를 위해 밀도함수의 특정한 형태를 가정하지 않는 비모수적 함수 추정을 고려할 수 있으며, 본 학위논문에서는 스플라인 기저를 이용한 기저함수 방법론을 사용하였다. 추정 대상의 로그 함수를 스플라인 기저의 선형결합으로 근사하는 로그스플라인 모형을 도입하였고, 이를 통해 정의된 추정량은 양수이 면서 적분하면 1 이 되는 밀도함수의 성질을 갖도록 하였다. 스플라인을 이용한 함수추정에서는 데이터 적응적 매듭점 선택을 통해 추정량의 평활정도를 결정하 게 되는데, 본 연구에서는 스플라인의 도함수의 총변동을 벌점항으로 한 벌점화 방법을 적용하였다. 본 학위논문에서는 총변동 기반 벌점화 로그스플라인 밀도함수 추정량의 구 현을 위해 좌표하강 알고리즘을 도입하였고, 모의실험을 통해 추정량의 성능을 평가하였다. 또한 은하 데이터 분석에 제안한 방법을 적용하여 그 응용성을 확인 하였다. 이론적으로, 볼록 최적화 관점에서 좌표하강 알고리즘의 수렴성을 규명 하였고, 신탁부등식을 이용하여 쿨벡-라이블러 손실함수에 대한 추정량의 최소 최대성을 규명하였다

more

목차

1 Introduction 1

2 Logspline density estimation 6

2.1 The logspline density basis and models 7

2.1.1 Logspline density basis 7

2.1.2 Logspline density models 9

2.2 The penalized logspline density estimator 10

2.2.1 Total variation penalty 10

2.2.2 Description of the estimator 12

2.3 Implementation 13

2.3.1 A coordinate-wise update formula 13

2.3.2 Model selection 15

2.3.3 Tail integration 16

2.3.4 Algorithm for the penalized logspline density estimator 18

2.3.5 Fitting logspline density via coordinate descent method 19

2.3.6 Other details 19

2.4 Numerical studies 21

2.4.1 Simulation studies 21

2.4.2 An application to Galaxies data 24

3. Convergence of a coordinate descent algorithm in penalized logspline density estimation 28

3.1 Preliminary results on optimization problems 29

3.1.1 Optimality conditions for unconstrained problems 30

3.1.2 Properties of sublevel sets and level sets 33

3.2 Convergence of coordinate descent method with a differentiable objective function 39

3.3 Convex optimization in penalized logspline model 42

3.3.1 Penalization: primal and dual problem 44

3.3.2 Strong duality and Karush-Kuhn-Tucker conditions 47

3.4 From constrained to unconstrained problems 48

3.5 Convergence of a coordinate descent method in penalized logspline density estimation 53

4. Rate of convergence of penalized logspline density estimators 55

4.1 Description of models and estimators 56

4.2 An oracle inequality and rate of convergence 58

4.2.1 Notations 58

4.2.2 An oracle inequality 59

4.2.3 Optimal rate of convergence for penalized logspline density estimators 60

4.3 Proofs of the main results 61

4.3.1 Proof of Theorem 3 61

4.3.2 Proof of Theorem 4 66

5 Appendix 76

5.1 Construction of logspline density basis functions 76

5.2 Tail integration 78

5.3 R package for penalized logspline density estimation : PLSDE 80

more