검색 상세

주가 예측을 지원하기 위한 SVM 기반 뉴스 분류 시스템

  • 주제(키워드) SVM , 주가예측
  • 발행기관 고려대학교 대학원
  • 지도교수 정순영
  • 발행년도 2008
  • 제출일 2008-07-08
  • 학위수여년월 2008. 8
  • 학위명 석사
  • 학과 일반대학원 컴퓨터교육학과
  • 세부전공 컴퓨터교육전공
  • 원문페이지 41 p
  • 본문언어 한국어

초록/요약

주가를 예측하는 기존의 연구들은 일반적으로 구조화된 데이터의 각종 지표 또는 과거의 주가 흐름을 통계적으로 분석하여 미래의 주가를 예측하는 것이다. 과거의 수치 데이터를 이용한 통계적인 방법은 특별한 사건이나 주가 변동의 원인 정보를 포함하고 있지 않지만 텍스트는 부가적인 정보를 포함하므로 정확한 주가 예측을 위한 방법이 될 수 있다. 본 연구는 텍스트마이닝 기법을 통하여 실시간으로 기업 정보를 제공하는 인터넷 뉴스 기사를 기계 학습을 통한 분류 시스템으로 분류함으로써 주가 예측을 지원하고자 한다. 본 연구에서는 거래소 업종을 대상으로 하며, 기업 정보를 실시간으로 공시하는 인터넷 뉴스 기사에 따라 투자자들이 매매가 이루어지고, 그 결과 기업의 주가가 변동됨을 가정으로 한다. 시스템을 통해 기업의 주가 상승에 영향을 주는 뉴스를 GOOD으로, 반대로 주가 하락에 영향을 주는 뉴스를 BAD로 분류된다. 입력 데이터인 뉴스 기사를 텍스트 전처리 과정을 거쳐 형태소 단위로 토큰화 하고, 벡터공간모델로 변환한 후 TFIDF 값으로 단어별 가중치를 두어 다양한 학습 알고리즘으로 기계학습 시킨 후 실험을 통하여 각 알고리즘의 정확도를 비교하였다. 그 결과, 본 연구의 방법이 기존의 이동평균선을 이용한 통계적 주가 예측 모델보다 높은 정확도를 보이는 것으로 확인되었다. SVM 분류기를 사용했을 때와 문서표현에 있어서 TFIDF로 가중치를 계산하는 것이 불리안 표현 방식보다 성능이 높았다. 속성의 차원 수에 따른 정확도를 비교한 결과, 속성값의 개수가 많으면 성능을 저하시켜 특정 시점까지 속성의 개수를 줄였을 때 성능 향상을 보였다. 이것은 뉴스 기사의 일부 핵심 단어가 향후 주가 변동에 영향을 주는 뉴스 분류의 정확도를 높여준다는 사실을 알 수 있다. 본 시스템은 기업의 실시간 뉴스 기사에 따라 투자 의사 결정을 제공해주는 모델이라는 점에 큰 의의가 있으며, 향후 연구과제로 과거 지표에 근거한 통계적인 모델에 본 시스템을 접목함으로써 주가 예측의 정확도 개선에 기여한다.

more

목차

1. 서론 1

2. 관련연구 4
2.1. 시계열 분석 기법 4
2.2. Support Vector Machine 6
2.3. 기존연구 7

3. 인터넷 뉴스 기사 분류 시스템 10
3.1. 시스템 개요 10
3.2. 시스템 상세내역 11
3.2.1. 시스템 구성도 11
3.2.2. 인터넷 뉴스 기사 수집 13
3.2.3. 텍스트 전처리과정 14
3.2.4. 속성 선택 17
3.2.5. 문서 가중치 작업 19
3.2.6. 문서 분류 20

4. 실험 및 성능분석 23
4.1. 실험 23
4.2. 제안된 시스템의 성능 분석 27
4.2.1. 시스템 실험 결과 분석 27
4.2.2. 시계열 분석 방법과 제안된 시스템의 성능 비교 29

5. 결론 및 향후 과제 31

6. 참 고 문 헌 32

more