식품별 잔류물질허용기준에 의한 군집화 연구
- 주제(키워드) 군집화 , 계층적 군집분석 , 바이클러스터링 , 이단계 군집화 , 식품의약품안전처 , 식품별 잔류물질허용기준
- 발행기관 고려대학교 대학원
- 지도교수 김기환
- 지도교수 진서훈
- 발행년도 2021
- 학위수여년월 2021. 2
- 학위구분 석사
- 학과 대학원 경제통계학과
- 세부전공 국가통계전공
- 원문페이지 33 p
- UCI I804:11009-000000235205
- DOI 10.23186/korea.000000235205.11009.0001163
- 본문언어 한국어
- 제출원본 000046074057
초록/요약
현대 사회에서 건강에 대한 관심이 커지며, 식품 농약에 대한 우려가 증대하고 있으나, 농산물 수확 시에는 사라질 것이라는 기대와 달리 일부 식품에 잔존하는 경우가 있다. 식품의약품안전처에서는 인간이 섭취하는 식품에 대한 농의약품의 잔류 허용 기준치를 제공하고 있는데, 다양한 식품에 대해 많은 잔류물질 정보를 제공하려다 보니 사용자의 활용에 어려움이 있다. 본 논문에서는 그러한 어려움에 대하여 식품별 잔류물질 허용기준에 대해 군집화를 시도하여 식품 간 군집 및 허용기준 간 군집을 생성하고 그러한 군집 결과를 통하여, 보다 용이한 정보의 관리 및 이해에 대한 도움을 주고자 하였다. 분석에 사용된 데이터는 식품별 잔류물질 허용기준으로, 식품별로 잔류물질 허용기준이 서로 상이하여, 데이터에 결측이 다수 존재한다. 하지만 허용기준의 특성상 결측 처리에 어려움이 있다. 이 문제를 해결하기 위해 본 논문에서는 이단계 군집화를 진행한다. 1차적으로 각 식품별 잔류물질 허용기준의 존재 여부를 사용하여 계층적 군집분석을 수행하고, 1차 군집화 결과에서 크기가 큰 군집을 사용하여 biclustering 기법을 사용하여 식품별 군집화와 잔류물질 허용기준별 군집화를 수행한다. 1차 군집화 결과, 군집 간 거리 0.8을 기준으로 군집을 생성하였으며, 550개 식품들에 대해 125개 군집이 생성되었다. 생성된 군집 중 단일 군집은 12개, 가장 큰 군집은 77개의 식품이 포함되었다. 2차 군집화 결과, 77개 식품이 8개 군집으로 분리되었고, 532개 잔류물질 허용기준이 23개 군집으로 분리되었다. 군집 결과 동일 군집에 속하는 식품들을 대체로 유사한 패턴을 가지고 있다고 할 수 있었으며, 이는 잔류물질별 군집에서도 그와 같은 양상을 가지고 있었다. 이러한 군집 방법을 통해 식품별 잔류물질 허용기준의 관리가 보다 원활해진다면, 데이터 관리 및 잔류물질 분석에 소요되는 비용 시간 감소에 대한 도움 혹은 식품별 잔류물질 허용기준을 사용하고자 하는 대상에 대한 도움을 줄 수 있을 것이라 기대된다.
more목차
제 1 장 서론 1
1.1 식품의약품 안전처의 잔류물질정보 2
제 2 장 연구 프로세스 및 방법론 4
2.1 연구 프로세스 4
2.2 군집분석(Clustering) 5
2.3 코사인 유사도(Cosine Similarity) 6
2.4 계층적 군집분석(Hierarchical Clustering) 6
2.4.1 최단 연결법 7
2.4.2 완전 연결법 7
2.4.3 평균 연결법 8
2.4.4 중심 연결법 8
2.4.5 Ward 방법 8
2.5 바이클러스터링(Biclustering) 9
2.6 결측이 존재하는 경우의 바이클러스터링 10
2.6.1 표기법 10
2.6.2 결측치가 존재하는 경우의 바이클러스터링 알고리즘 11
제 3 장 연구 내용 및 결과 15
3.1 사용데이터 15
3.2 데이터 전처리 결과 16
3.3 1차 군집화 결과 17
3.4 2차 군집화 결과 19
제 4 장 연구 내용 및 결과 24
참고문헌 26

