빅데이터 분석을 위한 슈퍼컴퓨터 환경에서 R의 병렬처리
Parallel Computing environment for R with on Supercomputer systems
- 주제(키워드) Supercomputer , Parallel Programming , R , MPI , OpenMP , Hadoop
- 발행기관 고려대학교 대학원
- 지도교수 백준걸
- 발행년도 2015
- 학위수여년월 2015. 2
- 학위구분 석사
- 학과 일반대학원 산업경영공학과
- 세부전공 산업시스템공학 전공
- 원문페이지 48 p
- 실제URI http://www.dcollection.net/handler/korea/000000057577
- 본문언어 한국어
- 제출원본 000045827233
초록/요약
We study parallel processing techniques for the R programming language of high performance computing technology. In this study, we used massively parallel computing system which has 25,408 cpu cores. We conducted a performance evaluation of a distributed memory system using MPI and of a the shared memory system using OpenMP. Our findings are summarized as follows. First, For some particular algorithms, parallel processing is about 150 times faster than serial processing in R. Second, the distributed memory system gets faster as the number of nodes increases while shared memory system is limited in the improvement of performance, due to the limit of the number of cpus in a single system.
more목차
제 1 장 서 론 1
1.1 연구 배경 1
1.2 기존 연구 2
제 2 장 고성능컴퓨팅기술 4
2.1 병렬컴퓨팅기술 4
2.2 공유메모리시스템 4
2.3 분산메모리시스템 5
2.4 병렬프로그래밍 예제 6
제 3 장 고성능컴퓨팅을 위한 R패키지 9
3.1 분산메모리 시스템용 R패키지 9
3.2 공유메모리 시스템용 R패키지 12
3.3 대용량처리 패키지 R패키지 12
제 4 장 컴퓨팅 실험 15
4.1 사용 방법 15
4.2 분산메모리에서의 성능 평가 17
4.3 공유메모리에서의 성능 평가 25
4.4 하둡에서의 성능 평가 29
제 5 장 결론 35
[참고 문헌] 36