[논문 리뷰] Data Augmentation for Deep Learning-Based Radio Modulation Classification - 1편

이우준·2021년 9월 10일
0
post-thumbnail

Abstract

최근 deep learning은 수신한 radio signal의 modulation category를 자동으로 분류하도록 적용되고 있다. 하지만 deep learning model을 학습하기 위해서는 매우 많은 data를 필요로 하는데, 충분치 못한 학습 data는 심각한 overfitting을 야기하여 classification 정확도 성능을 저하시킬 수 있다.

이러한 적은 dataset 문제를 해결하기 위해 image processing 분야에서 data augmentation은 널리 사용되어왔는데, 이를 통해 dataset을 늘리고 deep learning model의 robustness를 개선하는 것이 가능하다.

그런데 무선통신 영역에서는 radio modulation classification task에 data augmentation method를 적용시키는 것이 어떤 효과를 주는지에 대한 연구가 진행된 적이 없었다. 따라서 본 논문에서는 SOTA deep learning 기반 modulation classifier를 이용하여 다양한 data augmentation method를 평가한다.

Augmentation method로는 modulated signal의 특성을 고려하여 세 가지 방법을 제안하는데, 이들은 각각 rotation / flip / Gaussian noise 이다. 또한 이런 방법들은 deep learning을 기반으로한 classifier의 training, test phase에 모두 사용할 수 있다.

수치 값을 통해 세 가지 방법 모두 classification 정확도를 높일 수 있다는 사실을 확인할 수 있었는데, 이들을 비교하면 rotation / flip / Gaussian noise 의 순서로 성능이 개선되었다.

한편 12.5%의 학습 dataset 만을 이용하여 rotation과 flip method를 joint하게 적용시킨 결과, augmentation 없이 학습 dataset을 모두 (100%) 사용한 baseline 보다 classification accuracy가 더 잘 나왔다.

게다가 augmentation을 사용하면 더 짧은 radio sample을 사용하여 modulation category를 성공적으로 분류할 수 있었는데, 이는 보다 간단한 deep learning model과 더 짧은 classification response time으로 이어진다.

Introduction

Computing power와 big data의 발전으로 deep learning은 다양한 분야에서 많은 발전을 도왔다. 그 중에서도 무선 통신 영역에서는 특히 modulation classification, symbol detection, end to end communication, mobile edge computing 등에서 발전이 있었다.

Deep learning을 기반으로 한 modulation classification은 prior knowledge 없이 수신한 신호를 효과적으로 잘 분류하는데, 해당 classification task는 무선 통신 system에서 사용하는 많은 application의 기본이 되는 단계이다.
(이때, 적용할 수 있는 application에는 cognitive communication system에서의 spectrum 관리, secure communication에서 미허가 신호 감지 등이 있음)

한편, 기존에 사용하던 modulation classification method에서는 높은 computational complexity가 요구되거나 manual operation에 상당히 의존한다는 문제점이 있었다.

이에 반해, 최근 deep learning은 raw signal data나 그것의 transform을 deep neural network의 input으로 넣어 modulation category를 바로 output으로 얻는 방식으로 신호 분류를 위한 성공적인 방식으로 소개된다. 수학적 방식으로 feature를 얻어내 분류하던 기존의 방법과 성능을 비교해보면, 비록 computational overhead를 계산하는 시간이 더 필요하지만, 높은 분류 정확도를 얻을 수 있다는 것을 확인했다.

그러나 deep learning을 사용하는만큼 매우 많은 (large volume of) 학습 radio sample들을 필요로 하는데, 실제로 high quality의 reliable training radio sample을 얻는 것은 종종 높은 cost를 필요로 하고 또 어려운 일이다. 따라서 data의 양을 늘릴 수 있는 augmentation 기술은 꼭 필요한 기술이라고 말할 수 있는데, 아래의 그림을 보자.

Image와 modulated signal에 적용한 다양한 data augmentation methods.
왼쪽부터 순서대로 원본, 회전, 반전, Gaussian noise를 적용시킨 결과이다.

Modulated radio signal을 augmenting 하는 것은 image를 augment 하는 것과 비슷하다. 그 중에서도 논문에서는 3가지 augmentation method를 선택했는데 그림에서 확인할 수 있듯이 이들은 각각 rotation, flip, Gaussian noise method이다. 아래 줄(QPSK modulated signal)에 대해 더 자세히 설명해보면 검은색 점은 4개의 이상적인 reference point를 나타내지만 빨간색 cross(X 자)는 수신한 symbol을 의미하는데, 이들이 shift 되어 있는 이유는 transmitter/receiver hardware의 imperfection(불완전함)과 wireless channel 때문이다.
(무선 통신에서 각각의 수신 symbol은 demodulate 되어, 전송된 내용을 바탕으로 reference points 중 하나에 mapping 된다.)

그림에서 고려한 received symbol은 2개이다: (1,1), (-1,1) with positive phase shift (positive phase shift = reference point 기준 반시계 방향 shift) 각각의 augmentation을 통해 이 2개의 symbol은 새로운 symbol로 바뀌게 되는데, 각 방식에 따른 특징들이 존재한다.

Rotation augmentation를 적용하면 똑같이 positively phase shifted 된 2개의 새로운 symbol (-1,1), (-1,-1)이 생성된다. 그러므로 본 논문에서 다루고 있는 classification task에 대해 modulated signal을 회전시키는 것은 classification을 위한 feature를 잃어버리지 않고, 사진을 회전시키는 것과 비슷하다.

하지만 flipping augmentation은 새로운 QPSK modulated symbol을 2개 생성하는데, 위의 그림을 보면 시계 방향으로 negative shifted 되었음을 확인할 수 있다.

이러한 rotation 및 flip augmentation method는 image classification에 대해 비슷한 성능 개선을 보이지만, radio modulation classification을 위해 무엇이 더 나은지는 open question이다.

마지막으로 Gaussian noise augmentation을 적용하면 image 입장에서는 'snow'가 가득차고 (잡음이 생긴다는 의미인듯), radio signal은 위 그림의 (d)와 같은 형태로 변형된다.

그렇다면 이 세 개의 method는 radio classification task를 얼마나 개선시킬 수 있을까? (저자는 자기가 아는 한, classification에 대한 여러 augmentation method의 효과가 평가된 적은 아직 없다고 주장함)

논문의 contribution 은 다음과 같다.

  • Deel learning의 training, test 단계에서 모두 적용할 수 있는 radio signal augmentation 알고리즘을 제안함. 이는 classification 정확도의 측면에서 baseline 대비 약 2.5%의 성능 향상을 보였음.
  • Rotation augmentation methodflip method 보다 더 좋은 성능을 보인다는 것을 발견함. 하지만 두 방법 모두 Gaussian noise method에 비해 높은 classification accuracy를 얻을 수 있었음.
  • Training dataset이 충분하지 않을 때 적용할 수 있는 joint augmentation policy 를 제안함. 이때 해당 policy는 rotation과 flip method로 구성되어 있음. Training dataset이 12.5%만 주어졌을 때, joint augmentation method를 통해 dataset을 초기 size의 75% 까지 확장할 수 있었고, 또 augmentation을 사용하지 않고 training dataset을 모두 (100%) 사용한 baseline model 보다 더 높은 classification 정확도를 얻을 수 있었음.

  • Data augmentation을 이용하여 sampling point의 절반만 사용해 radio sample들을 성공적으로 분류함. 따라서 deep learning model은 inference 복잡도가 상당히 감소하여 단순화 될 수 있음. 또한 앞으로 실제 적용될 상황에서, radio sampling point의 절반만 수신해도 modulation category는 성공적으로 분류될 수 있을 것이고, 이를 통해 classification response time을 상당히 줄일 수 있을 것.

Related Work

Deep Learning in Radio Modulation Classification

Modulation classification의 정확도는 modulated in-phase (I) 와 quadrature phase (Q) 신호를 입력 받은 ResNet으로 인해 훨씬 발전되었다. Channel interference를 고려해도, CNN 구조는 상당한 정확도를 보였다.

이러한 CNN 기반 model 외에도 time-dependent amplitude와 phase information을 지니는 LSTM 구조를 사용하여 SOTA accuracy를 얻을 수 있다.

한편 deep learning model이 학습하는 시간을 줄이기 위해 input signal의 dimension을 줄이는 다양한 subsampling 기술들도 연구되고 있다.

Data Augmentation in Deep Learning

Deep learning에서 data augmentation을 사용하는 기법은 image, text, speech 분야마다 다양하게 존재하지만 (이 부분은 논문을 직접 읽는 것을 추천), radio modulation classification 에서의 augmentation을 다룬 related work는 거의 존재하지 않는다.

그 중에서 그나마 가장 related work로 불릴 만한 연구는 GAN을 기반으로 한 data augmentation method를 제안한 것인데, 저자는 해당 논문에서 처음으로 signal sample 들을 Contour Stellar Images (dataset)으로 변환했다. (새로운 signal training sample을 만들어 낼 수 있을 정도로 GAN network를 학습하기 위해 추가로 사용하는 dataset 인듯)

GAN을 기반으로 한 augmentation을 사용하면 modulation 분류 정확도는 (겨우) 6% 이하로 개선되는데, 심지어 GAN network를 학습할 때 수렴성을 보장하기 위해서는 충분한 signal sample 들이 필요하다. 게다가 위의 논문에 적혀있는 내용을 읽어보면 같은 양의 signal sample을 사용했을 때, real dataset을 사용한 경우와 비교하여 augmented dataset을 기반으로 한 분류 정확도가 더 낮다. 따라서 부족한 radio signal dataset을 위한 효과적인 augmentation method는 아직 없는 상태라고 말할 수 있다.

Reference

Huang, Liang, et al. "Data augmentation for deep learning-based radio modulation classification." IEEE Access 8 (2019): 1498-1506.

0개의 댓글