[Data Science] 녹조 발생지역 예측 분석 Project

지유경·2023년 8월 11일
2

Data Science Project

목록 보기
1/1
post-thumbnail

녹조(algal bloom)란?

강이나 호수에 남조류가 과도하게 성장하여 물의 색깔이 짙은 녹색으로 변하는 현상을 말한다.
이와같이, 남조류 과잉 발생이 녹조의 주된 원인이기 때문에 머신러닝과 딥러닝을 통해 유해 남조류 발생 예측을 한다면 녹조 발생지역 예측 분석이 가능할 것 이다.
✅ KNN, SVM, ANN 사용 예정
✅ Data Set: 물 환경 정보 시스템 과거수질자료 -> 낙동강, 한강, 금강, 영산강.csv
📌Data Set 컬럼: 분류 / 지점명 / 채수위치 / 조사년도 / 수온 / pH / DO / 투명도 / 탁도 / Chi-a / 유해남조류 세포수 / Microcystis / Anbaena / Oscillatoria / Aphanizomenon / 지오스민 / 2MIB / Microcystin-LR
📌사용 예정 컬럼: 유해남조류 세포수 / Microcystis / Anbaena / Oscillatoria / Aphanizomenon / 수온 / 지오스민 / 2MIB / PH / Microcystin-LR

ANN(Artifical Neural Network)이란?

인공 신경망이라고 불리는 ANN은 사람의 신경망 원리와 구조를 모방하여 만든 기계학습 알고리즘이다.
ann ANN의 구조
이는 은닉 계층을 포함하는 인공신경망 기술이며, 동작 단계는 다음과 같이 4 단계로 이루어져 있다.
1단계: 입력 계층에서 입력된 데이터에 대해 가충치 행렬을 곱하여 은닉 계층으로 보냄
2단계: 은닉 계층 내부에서 활성화 함수를 통해 데이터 가공
3단계: 은닉 계층에서 나온 데이터를 새로운 가중치 행렬을 곱해 출력 계층으로 보냄
4단계: 출력을 위한 활성화 함수를 반영하여 결과를 출력

활성화 함수

1. 계단 함수(Step Function) : 0보다 작은 수는 0으로, 0보다 큰 수는 1로 출력
2. 시그모이드 함수(Sigmoid Function): 미세한 변화에 대한 값도 반영하기 위해 사용
3. ReLU 함수(Rectified Linear Unit Function): 입력이 0을 넘으면 입력 그대로 출력, 0 이하일 땐 0을 출력
4. 소프트맥스 함수(Softmax Function): 입력받은 값을 0~1 사이의 값으로 정규화하며 총합이 항상 1이 되는 특성을 가진 함수, N개 이상의 class 확률 분포를 계산할 때 사용

[Reference]
Kim Sang-Hoon(2021), Prediction of cyanobacteria harmful algal blooms in reservoir using machine learning and deep learning
https://ebbnflow.tistory.com/119
profile
M. Sc in Computer Science and Engineering, Mar 2024 to present / B. Sc in Computer Engineering, Mar 2020 to Feb 2024

1개의 댓글

comment-user-thumbnail
2023년 8월 11일

유익한 자료 감사합니다.

답글 달기