요즘 신경계 질환에 대한 이슈가 많다. 신경계 질환에는 대표적으로 간질, 조현병, 우울증, 불면증 등이 있는데 관련 논문을 읽어보면서 EEG signal을 이용하여 정상인지 정상이 아닌지 분류하는 과정이 있었다. 이때 딥러닝, 머신러닝 모델을 사용하는데 모든 논문을 읽지는 못하고 3개만 읽었다. 오늘은 조현병관련 모델만 리뷰하도록 하겠다.
Deep Convolutional Neural Network Model for Automated Diagnosis of Schizophrenia Using EEG Signals
(Shu Lih Oh , Jahmunah Vicnesh , Edward J Ciaccio , Rajamanickam Yuvaraj and U Rajendra Acharya) 이논문을 중점적으로 읽었다.
이 조현병에 대한 분류를 가장 꼼꼼히 들여나 보았다. 가장 사회적으로 이슈가 많고 EEG 신호에 대한 연구가 아직까지는 그렇게 많지 않아서 오픈데이터셋으로 모델을 구축해서 직접 짜보면 흥미있고 도움이 많이 될거 같다.
이 논문 요약 - 14명의 건강한 대상자와 14명의 조현병을 가지고 있는 환자로부터 EEG 신호 수집
CNN은 이상한 EEG 신호를 식별하고 이러한 신호를 질병 진단에 활용하기 위해 가장 널리 사용되는 아키텍처이다. (ex depression, seizure, 주의력 결핍 장애, autism)
11층짜리 CNN layer 모델 개발하였고 딥러닝 알고리즘으로 중요한 특징들을 자동적으로 추출하고 분류할수 있습니다. 정상 ,SZ을 구분하기 위해 사용
모델구조를 두가지로 분류했는데 non-subject based testing 와 subject based testing 이다.
non subject based testing : 참가자의 정보를 고려하지 않고 전체 집단에서 수집된 데이터를 분석
subject based testing : 참가자의 정보를 고려하고 특정 집단에서 수집된 데이터를 분석


이 네트워크에는 컨볼루션 layer, max pooling layer, fully connected layer로 크게 3개의 층으로 구성되어있다.
convolution layer : 다양한 크기의 kernel을 사용하여 입력 신호의 특징을 추출하고 다음 계층에다가 feature maps를 전달한다.
batch normaliztion layer : 층 중간에서 training data를 정규화하는데 사용하며 과정을 boosting 하고 expedite하는데 사용된다.
max pooling layer : 각 커널에서 가장 높은 값만 선택하여 feature map의 크기를 줄인다.
fully connected layer : training data에 기반하여 정상인지 SZ인지 클래스를 구분하고 입력신호의 결과를 예상한다.
네트워크 깊이가 길어질수록 성능은 좋아지지만 시간이 오래걸린다는 단점이 있다. 하지만 이 논문의 연구에서는 보다 빠르게 수행할 수 있도록 CNN 네트워크 설계를 하였다.

non subject와 subject의 차이점을 표로 나타냈다.






| accuracy | sensitivity | spectificity | positive predicitve | |
|---|---|---|---|---|
| non-subject based testing | 98.07% | 97.32% | 98.17% | 98.45% |
| subject based testing | 81.26% | 75.42% | 87.59% | 87.59% |
10 fold를 사용하는 non subject based testing이 14 fold를 사용하는 subject based testing보다 정확도가 높았다.
→ non에서 학습과 테스트에 사용되는 세그먼트가 임의로 분할되고 이경우엔 대상이 실제로 구분되지 않아 subject based testing보다 더 정확한 결과를 보여주었다,
사용한 모델의 특징
1) 조현병 환자를 분류하기 위해 11층의 CNN 모델을 구성
2) extraction, selection, classification 과정이 자동으로 수행
3) 10 fold의 교차 검증 기법 사용
4) 작은 데이터의 양으로도 높은 정확도를 보여주었다.
모델의 한계점
1) 건강한 사람 14명 SZ 14명으로 데이터 풀이 작다. → 더 큰 데이터셋을 이용하는것이 필요함
2) 전통적인 머신러닝에 비해 CNN 계산 비용이 높다.

조현병 관련 연구들이 table 5에 적혀 있습니다. 전처리 방법과 사용한 모델 그리고 정확도까지 표에 나와있습니다.
CNN 딥러닝을 이용한 SZ 분류가 높은 정확도를 보여주고 있습니다.
이 모델은 알츠하이머, 파킨슨, 간질 등 다른 신경계 질환의 진단에서도 사용할 수 있을 것입니다.
CNN 모델말고도 LSTM이나 autoencoder같은 딥러닝 모델을 써서 SZ를 진단할 수 있을 것입니다.