HSV스케일링을 이용한 한국어 욕설 탐지
초록/요약
이 논문에서는 텍스트를 HSV 이미지로 변환하여 한국어 텍스트 데이터에서 욕설을 탐지하는 새로운 접근 방식을 살펴본다. 기존의 자연어 처리(NLP) 방식은 온라인 커뮤니케이션에서 문맥상의 뉘앙스와 비표준 언어 사용으로 인해 어려움을 겪는 경우가 많다. 이 연구는 기존의 악성코드 탐지에 사용된 이미지 시각화 기반 분석을 채택함으로써 표준 텍스트 기반 분류기가 간과하는 욕설과 관련된 구조적 및 시각적 패턴을 발견하는 것을 목표로 한다. HSV 스케일 이미지로 변환된 한국어 문장 데이터 세트에 대해 다양한 이미지 분류 인공지능 아키텍처들을 활용하여, 자동화된 콘텐츠 조정 시스템에서 기존 텍스트 분석을 보완할 수 있는 이미지 기반 분석의 가능성을 보여주는 것을 목표로 한다. 실험 결과 제안된 모델은 97.42%의 정확도를 달성했습니다
more초록/요약
This paper explores a novel approach to detect profanity in Korean textual data by converting text to HSV scale images. Traditional natural language processing (NLP) methods often struggle with contextual nuances and the use of non-standard language in online communication. By adopting image visualization-based analysis used in traditional malware detection, this research aims to discover structural and visual patterns associated with profanity that are overlooked by standard text-based classifiers. By utilizing different image classification artificial intelligence architectures on a dataset of Korean sentences converted to HSV scale images, we aim to demonstrate the potential of image-based analysis to complement traditional text analysis in automated content moderation systems. Experimental results show that the proposed model achieves 97.42% accuracy.
more목차
국문초록 i
ABSTRACT iii
서문 iv
목차 v
표 목차 vi
그림 목차 vii
1장. 서론 1
2장. 관련 연구 4
3장. 연구 8
3.1 데이터 전 처리 8
3.2 모델 훈련 11
4장. 연구 결과 13
4.1 데이터 준비 13
4.2 실험 환경 14
4.3 실험 결과 15
5장. 논의 18
6장. 결론 20
참고문헌 22

