AI 빅데이터 인력양성(고급반) 수상

정강훈·2021년 12월 21일
0

AI 빅데이터 인력양성(고급반)

2020년 7월 ~ 9월 진행된 AI 빅데이터 인력양성(고급반) 과정에서 2등의 성적으로 입상하였다.

이 교육을 계기로 인공지능에 빠졌다.
160시간을 교수님 5명에서 32시간씩 나눠 진행하였는데
각각 인공지능 기본, 머신러닝과 딥러닝기본, AutoML, CNN, RNN 파트로 진행하였다.

인공지능기본

인공지능 기본에서는 기본적인 데이터 전처리와, 인공지능 수학, 데이터 시각화등을 배웠고

머신러닝과 딥러닝기본

머신러닝과 딥러닝 기본 파트에서는 간단한 MNIST를 사용한 분류문제 등을 실습하였고 프로젝트로는 물고기 데이터를 분류하는 프로젝트를 진행하였다. 그 당시 성능을 85% 까지 올리는 과제였는데, 엄청 오랜 시간을 들였는데도 성공하지 못했던 기억이 남는다.

AutoML

이 때 오토케라스를 처음 접하게 되었다. 처음 날 오토케라스를 배우자 마자 전 강의에서 진행하였던 물고기 데이터 분류하는 프로젝트에 적용해보았는데, 바로 97% 성능이 나와서 엄청 허탈하고, 신기했다. 이 강의의 프로젝트로 kaggle의 아보카도 데이터를 사용하여 아보카도의 가격을 예측하는 회귀모델과 아보카도의 유형(conventional, organic)을 분류하는 모델을 만들었다.

결과로 회귀모델은 AutoGluon을 사용해 r2 scroe가 92.36 정도 나왔고

분류모델은 TPOT, AutoGluon 모두 99.7% 정도로 아주 좋은 성능을 보였다.

CNN

CNN 파트에서는 Yolo를 사용한 산불 탐지 모델을 만들었다.
목적은 산불 이미지를 학습시켜, 산불 객체를 탐지하게 만들어, 소방 관제 센터의 관제를 자동화 시키는게 목적이었다.
데이터는 Roboflow의 산불 데이터를 사용하였는데, 처음 모델이 완성되고 보니 화면에서 작은 비중을 차지하는 산불은 잘 탐지하였는데, 큰 비중을 차지하는 산불은 잘 탐지하지 못하였다. 그렇게 원인을 찾던 중 훈련데이터에 있는 산불 이미지들이 모두 화면의 작은 비중을 차지하는 것을 발견하였고, 큰 비중을 차지하는 산불데이터를 추가하니 직관적으로 더 잘 탐지하는것을 알게되었다.

그렇게 해도 좋은 성능은 아니었지만, 처음 CNN을 다뤄본것에 의미를 두었다.

RNN

이 강의에서 처음 데이콘을 접하고 경진대회에 나가 보았다.

뉴스 토픽 분류 AI 경진대회 였는데 처음에 강사님의 점수가 82점 이었다.
맨 처음 초기 모델로 제출하니 최종점수가 75점이 나왔는데, 몇점 차이 안나서 따라잡을 수 있을 줄 알았는데, 결국 못따라 잡았다.

프로젝트로 비트코인 가격 예측모델을 만들었다.
주제 선정이유는 그 당시 여러 코인에 투자를 하였다가 손해를 많이 봐서 복구 하고 싶어서 였다.

성능이 들쭉날쭉했다.
그 원인을 그 당시 생각하기에 비트코인에 가격은 너무 변수가 많이 작용해서 라고 생각했다.
지금도 뭐 생각은 크게 다르지 않지만 저 당시보다는 비교적 성능이 좋은 모델을 만들 수 있을 것 같다.

기사 링크
링크텍스트

0개의 댓글