감정분석(분류 모델) 프로젝트 #1 준비

Luuuuucy·2024년 12월 4일

TOY PROJECTS

목록 보기
3/11
post-thumbnail

토이 프로젝트 작성법 written by 김민수 강사님

1. 발표 일정

2024년 12월 05일 목요일

준비기간: 12월 03일 ~ 12월 04일 (2일간)

2. 데이터 수집처 탐색

Roboflow - 웃긴 데이터가 많음, 약간 러시아 감성
Ai hub - 공공데이터, 데이터 품질이 좋음
Kaggle - 데이터 분석 콘테스트 사이트

3. 문제 정의

목표

'(비NCS)영상처리 딥러닝 모델 설계' 수업에서 배운 분류 모델을 활용하여 데이터를 학습시키는 일련의 과정을 직접 수행하고, 수업에서 배운 내용을 익히는 것을 목표로 한다.
프로젝트 주제는 '사람의 표정을 기반으로 감정을 분석'이며, 다양한 표정 데이터를 수집하고, 분류 모델로 학습시켜 감정 분류 모델을 구현하고자 한다.

과제

데이터 증강, 축소의 중요성 파악

여러 차례 학습 모델을 통해 전처리 과정을 점진적으로 수정하며, 데이터 증강 및 축소가 모델 성능에 미치는 영향을 분석하고 그 중요성을 이해하고자 한다.

파인튜닝으로 모델 학습의 중요성 파악

기존 사전 학습된 모델을 파인튜닝하여 학습을 진행함으로써, 파인튜닝이 모델 성능에 어떤 역할을 하는지 탐구하고자 한다.

4. 데이터 수집

수집 데이터

데이터 소개

원천 데이터 예시


5. 전처리 계획

이미 적용된 전처리 내용

  • 이미지 색상: 모든 이미지 데이터는 흑백으로 구성
  • 이미지 사이즈: 모든 이미지 크기는 48*48(pixel)로 구성

앞으로 적용할 전처리 항목

  • 데이터 증강: 클래스 별로 사진 개수 차이가 있기 때문에, 가장 적은 'disgusted'에 대해서 데이터 증강 필요
  • valid data: train/test로 구성되어 있기 때문에, train 데이터를 적절한 비율로 분할하여 valid data 구성 필요

6. 모델 선택

EfficientNet

Google AI에서 제안한 딥러닝 기반의 CNN 아키텍처이다.
이미지 분류, 객체 탐지, 세그멘테이션 등 다양한 작업에 사용 가능하다.

7. 학습 계획

데이터 수집 및 전처리

  • 적합한 데이터셋을 선정하고 전처리 계획 수립
  • 수집한 데이터를 감정별로 라벨링하고, DataFrame 형식으로 변환하여 분석 및 학습에 적합한 형태로 준비.

모델 설계 및 학습

  • 분류 문제에 적합한 기존 모델(EfficientNet 등)을 탐색 및 선정
  • 선정한 모델을 현재 데이터셋에 맞게 파인튜닝하여 학습 진행
  • 과적합 방지와 성능 개선을 위해 하이퍼파라미터를 조정하고, Early Stopping 등 기법을 활용.

모델 평가 및 테스트

  • 테스트 데이터를 활용하여 모델 성능 평가
  • 실제 감정 분석 상황을 시뮬레이션 하여 결과 검증 및 오차 분석

결과 해석 및 시각화

  • 모델이 감정을 올바르게 분류한 사례와 실패한 사례 분석
  • 감정별 분류 결과 시각화
  • 각 단계에서 얻은 성능 평가 결과를 분석하고, 필요에 따라 모델 및 데이터 전처리 방법 조정

결론 및 개선 방향 제안

  • 프로젝트 과정에서 도출한 주요 결과 정리
  • 한계점과 개선 방향 제안

최종 보고서 작성: 각 단계의 결과와 분석을 포함한 최종 보고서를 작성하여 학습 과정을 정리

profile
Hi, I am Lucy. Welcome to Moon in the Room. 🌝

0개의 댓글