경량화 데이터와 딥러닝 모델을 적용한 효율적인 네트워크 트래픽 분류 방법
Efficient Network Traffic Classification Method Using Lightweight Data and Deep Learning Model
- 주제(키워드) Encrypted Network Traffic Classification , BERT , Knowledge Distillation , Efficiency
- 발행기관 한국통신학회
- 발행년도 2022
- 총서유형 Journal
- KCI ID ART002915243
- 본문언어 한국어
초록/요약
트래픽 분류는 컴퓨터 네트워크 영역에서 서비스관리 및 보안 등의 분야에서 그 역할이 점점 더 중요해지고 있다. 초기에는 포트넘버, DPI, 통계정보 등을 활용해 트래픽 분류가 가능했다. 그러나 정보보호 측면에서 트래픽의 페이로드가 암호화되면서 분류가 제한되었지만 머신러닝기법이 추가 활용되면서 문제점이 해결됐다. 이후 딥러닝 모델들이 활용되고 성능은 향상되었으나, 많은 변수를 입력으로 넣어도 트래픽 분류가 가능해 짐에 따라 모델과 데이터가 점점 무거워져서 자원과 시간이 많이 소모되었다. 부담스럽고 성가시게 된 모델과 데이터 경량화 활용에 본 연구의 목적을 두고, KD(Knowledge distillation) 기법을 바탕으로 BERT가 경량화된 DistilBERT를 선정했고, 경량화한 데이터를 적용했다. 첫 번째 패킷 1개 중 앞 100bytes 크기의 입력데이터(패킷 단위)와 이러한 5개의 패킷이 연결된 입력데이터(플로우 단위)로 정확도 / F1-score가 각각 0.9707 / 0.9731과 0.9703 / 0.9706로 매우 우수한 성능을 보였다.
more

