Text Mining 기반의 특허등록 예측을 위한 특허 문서 분석 방법
Analysis method of patent document based Text Mining to Forecast Patent Registration
- 주제(키워드) 특허 , 텍스트마이닝 , 예측
- 발행기관 고려대학교 정보경영공학전문대학원
- 지도교수 장동식
- 발행년도 2010
- 학위수여년월 2010. 8
- 학위구분 석사
- 학과 정보경영공학전문대학원 정보경영공학과
- 세부전공 경영공학과
- 원문페이지 49 p
- 실제URI http://www.dcollection.net/handler/korea/000000022806
- 본문언어 한국어
- 제출원본 000045608252
초록/요약
Recently, imitation and infringement rights of an intellectual property are being recognized as impediments to nation's industrial growth. To prevent the huge loss which comes from theses impediments, many researchers are studying protection and efficient management of an intellectual property in various ways. Especially, the prediction of patent registration is very important part to protect and assert intellectual property rights. In this study, we propose the patent document analysis method by using text mining to predict whether the patent is registered or rejected. In the first instance, the proposed method builds the database by using the word frequencies of the rejected patent documents. And comparing the builded database with another patent documents draws the similarity value between each patent document and the database. In this study, we used Perceptron, RDA and k-means which are classification algorithm and partitioning clustering algorithm to select criteria value of patent rejection. In result, we found conclusion that some patent which similar to rejected patent have strong possibility of rejection. We used U.S.A patent documents about bluetooth technology, solar battery technology and display technology for experiment data.
more목차
제 1 장 서론 1
1.1 연구의 배경 및 목적 1
1.2 논문의 구성 2
제 2 장 관련연구 3
2.1 텍스트 마이닝을 이용한 연구 3
2.2 분류 알고리즘 5
2.2.1 Perceptron 5
2.2.2 RDA(Relational Discriminant Analysis 6
2.2.3 K-means 7
제 3 장 특허의 등록 요건 7
제 4 장 제안된 방법 9
4.1 가중치 선정 13
4.1.1 단어별 빈도수 정렬 13
4.1.2 불필요한 단어 제거 14
4.1.3 단어별 출현률 및 핵심단어 추출 16
4.1.4 핵심단어통합DB 생성 18
4.2 거절기준값 선정 20
4.2.1 유사치 선정 알고리즘 21
4.2.2 거절기준값 선정 23
4.3 예측 24
제 5 장 실험 및 결과 27
제 6 장 결론 및 향후 과제 35
6.1 결론 35
6.2 향후 과제 36
참고 문헌 37

