[Aiffel] 아이펠 74일차 정리 및 회고

Gongsam·2022년 4월 21일
0

1. 아이펠톤

1) 데이터셋

Respiratory Sound Database

wheezes+ cackles

  • wheezing sound: COPD(chronic obstructive pulmonary disease), asthma, pneumonia, bronchiolitis 등 호흡기 질환 확인 가능
  1. Content

    • crackles: 1864
    • wheezes: 886
    • crackles + wheezes: 506
    • demographic info colums
     The demographic info file has 6 columns:
      - Patient number
      - Age
      - Sex
      - Adult BMI (kg/m2)
      - Child Weight (kg)
      - Child Height (cm)
    • annotation text files columns
    The annotation text files have four columns:
     - Beginning of respiratory cycle(s)
     - End of respiratory cycle(s)
     - Presence/absence of crackles (presence=1, absence=0)
     - Presence/absence of wheezes (presence=1, absence=0)
  2. 특징

  • clean respiratory sound + noisy recordings(for simulating real life condition)
  • all age groups
  1. 관련 kaggle
    CNN: Detection of wheezes and crackles

2) 참조 소스

Respiratory Disease Detection

  1. Preprocessing

    • 환자의 호흡 주기를 구성하는 오디오 파일의 일부를 추출(??)
    • 파일 길이 조정: 10-90초로 이루어져 있기 때문에 평균 값을 기준으로 조정, Librosa, Soundfile 모듈 사용
  2. Balancing (??) the dataset will be imbalanced towards one or more classes

    • 전처리 후 불균형한 상태를 맞추기 위해 train_test_split을 사용
  3. Feature Extraction

    • 3rd parties libraries
    • Liborsa: MFCC, CHROMA STFT, MEL SPECTROGRAM
  4. Modeling

    • Keras, Batch Normalization, ReLU activation

2. 회고

팀빌딩이 완료되고 계획서를 새로 써야해서 기업 측에서 공개한 자료를 바탕으로 내용을 정리했다. 캐글이랑 깃헙 링크랑 모두 이미 공개되어 있는 거라 정리한 걸 올려도 상관없을 거 같아서 일단 업로드.. 안되면 내려야지 팀원분들도 모두 좋은 거 같아서 더 열심히 해야겠다는 생각이 들었다. 끝까지 분열과 싸움없이 잘 마무리 됐으면 좋겠다.

profile
🐬 파이썬 / 인공지능 / 머신러닝

0개의 댓글