[ AI&ML_Eng : [AI + ML + DL] + [DA+DS] ] 만들면서 배우자.

0
post-thumbnail

[ AI&ML_Eng : [AI + ML + DL] + [DA+DS] ] 만들면서 배우자.

▽ [ AI&ML_Eng : [AI + ML + DL] + [DA+DS] ] 만들면서 배우자.

프로젝트도메인활용 AI 기술데이터셋 출처
1. 폐렴 X-ray 분류의료Vision CNN + Transfer Learning + Grad-CAMKaggle Chest X-ray Pneumonia
2. RNA 유전자 발현 분석바이오/제약ML/딥러닝 (RandomForest, MLP) + PCA/t-SNEGEO 데이터베이스
3. PubMed 논문 주제 분류바이오/제약NLP: BERT/Transformer + 텍스트 분류PubMed Open Access
4. 스마트팜 작물 질병 판별농업/스마트팜Vision CNN + Transfer LearningCassava Leaf Disease
5. 작물 수확량 시계열 예측농업/스마트팜시계열 분석: ARIMA, Prophet, LSTMFAO 농업 데이터
6. GIS 기반 스마트팜 분석GIS/스마트팜공간 분석 + 시각화 (버퍼링, 공간 조인, 지도 시각화)Kaggle Crop Mapping GIS / 공공 GIS 오픈 데이터

🔹 프로젝트별 기술 적용 요약.

Vision AI

폐렴 X-ray 분류, 작물 질병 판별

CNN, Transfer Learning, Grad-CAM

이미지 전처리, 데이터 증강, 모델 시각화

NLP

PubMed 논문 주제 분류

BERT/Transformer 기반 텍스트 분류

토큰화, 불용어 제거, Fine-tuning

시계열 분석

작물 수확량 예측

ARIMA, Prophet, LSTM

결측치 처리, 이상치 제거, 미래 예측

GIS/공간 분석

스마트팜 위치 기반 분석

공간 데이터 처리, 지도 시각화, 공간 조인

Folium, Geopandas 등 라이브러리 활용


1. 폐렴 X-ray 분류 (Vision AI)

  • 도메인: 의료 영상

  • 기술: CNN, Transfer Learning (ResNet50, EfficientNet), Grad-CAM, 이미지 증강

  • 데이터셋: Kaggle Chest X-ray Pneumonia

  • 실습 단계

      1. 데이터 로드, 라벨 확인, 클래스 균형 확인
      1. 이미지 전처리(Resize, Normalize, Augmentation)
      1. CNN 모델 학습 (간단 MLP → CNN)
      1. Transfer Learning 적용 (ResNet50, EfficientNet)
      1. 모델 평가 (Accuracy, Confusion Matrix, ROC Curve)
      1. Grad-CAM 시각화 (모델이 어디를 보고 판단했는지)
      1. Streamlit 대시보드로 예측 서비스 구현
  • 결과물

    • GitHub: 학습 코드 + 모델 저장

    • 블로그: 데이터 전처리, 모델링 과정, Grad-CAM 시각화

    • Streamlit 배포 링크

  • Colab 예제: Chest X-ray Classification Colab

2. RNA 유전자 발현 분석 (Bioinformatics AI)

  • 도메인: 바이오/제약

  • 기술: RandomForest, MLP, PCA, t-SNE 시각화

  • 데이터셋: GEO 데이터베이스

  • 실습 단계

      1. RNA-Seq 데이터 다운로드, 결측치 확인
      1. 데이터 정규화 (Log 변환, Min-Max 스케일)
      1. PCA/t-SNE 차원 축소 시각화
      1. ML 모델 학습: RandomForest, MLP
      1. 모델 평가 (Accuracy, ROC, F1-score)
      1. 결과 분석 및 시각화
  • 결과물

    • GitHub: 데이터 전처리 + 모델 학습 코드

    • 블로그: 차원 축소 시각화 + ML 성능 비교

    • 분석 리포트(PDF) 첨부 가능

  • Colab 예제: RNA-Seq Analysis Colab

3. PubMed 논문 주제 분류 (NLP)

  • 도메인: 바이오/제약

  • 기술: NLP, BERT, Transformer, 텍스트 분류, 토큰화, Fine-tuning

  • 데이터셋: PubMed Open Access

  • 실습 단계

      1. Abstract 데이터 수집
      1. 텍스트 전처리 (불용어 제거, 토큰화)
      1. BERT 기반 Fine-tuning (논문 주제 분류)
      1. 모델 평가 (Accuracy, Confusion Matrix)
      1. 키워드 추출 및 텍스트 요약
  • 결과물

    • GitHub: 전처리 + Fine-tuning 코드

    • 블로그: 모델 구조 + 성능 + 요약 결과

    • 예측 웹 앱(Optional, Streamlit)

  • Colab 예제: PubMed NLP Classification Colab

4. 스마트팜 작물 질병 판별 (Vision AI)

  • 도메인: 농업/스마트팜

  • 기술: CNN, Transfer Learning, 이미지 증강

  • 데이터셋: Cassava Leaf Disease

  • 실습 단계

      1. 데이터 확인 및 클래스 분포 시각화
      1. 이미지 전처리 및 Augmentation
      1. CNN 모델 학습 (ResNet50/EfficientNet Transfer Learning)
      1. 모델 평가 및 시각화
      1. Streamlit 대시보드 제작
  • 결과물

    • GitHub: 코드 + 모델 저장

    • 블로그: 모델 학습 과정 + 성능 분석

    • Streamlit 웹 대시보드 배포

  • Colab 예제: Cassava Disease Classification Colab

5. 작물 수확량 시계열 예측 (시계열 분석)

  • 도메인: 스마트팜

  • 기술: ARIMA, Prophet, LSTM

  • 데이터셋: FAO 농업 데이터

  • 실습 단계

      1. 작물 수확량 데이터 수집 및 결측치 처리
      1. 시계열 시각화 (추세, 계절성 분석)
      1. ARIMA, Prophet 모델 학습
      1. LSTM 모델 학습 (심화)
      1. 미래 수확량 예측 및 시각화
  • 결과물

    • GitHub: 시계열 모델링 코드 + 데이터 전처리

    • 블로그: 모델 비교 + 예측 결과 시각화

    • 예측 웹 앱(Optional, Streamlit)

6. GIS 기반 스마트팜 분석 (공간 분석)

  • 도메인: GIS / 스마트팜

  • 기술: 공간 데이터 처리, 지도 시각화, 공간 분석 (버퍼링, 공간 조인)

  • 데이터셋: Kaggle Crop Mapping GIS / 공공 GIS 오픈 데이터

  • 실습 단계

      1. 공간 데이터 로드 및 좌표계 확인
      1. Geopandas/Folium 활용 지도 시각화
      1. 공간 분석: 버퍼링, 공간 조인
      1. 농장/작물 위치 기반 데이터 분석
  • 결과물

    • GitHub: 코드 + 분석 데이터

    • 블로그: 분석 과정 + 지도 시각화

    • Folium 지도 시각화 웹 앱

0개의 댓글