AICE - Basic / 3일차

이율곡·2023년 6월 8일
0

AI

목록 보기
3/4
post-thumbnail

3일차

시험이 다음 주 토요일로 이제 9일 정도 남았다. 주말 동안에 연습시험을 보기 위해 꾸준히 준비를 해야 한다. 오늘도 Kaggle에서 데이터셋을 다운받아 공부했다.

https://www.kaggle.com/datasets/varpit94/uber-stock-data

이 링크에서 다운을 받아서 공부를 했다. 이번 주제는 우버 주식 데이터로 모델링하여 주식을 시뮬레이션 해보고자 한다.


우버 주식 데이터

기본 정보 분석

총 데이터 수는 725개고, 유형은 총 7개이다. 결측치는 존재하지 않기 때문에 따로 데이터를 가공하지 않아도 된다.

컬림은 날짜, 시가, 종가, 고가, 저가, 조정가, 거래량 이렇게 7가지로 나뉜다.

히트맵

우버 주가 데이터 히트맵이다. 거래량 컬럼을 제외한 나머지 칼럼끼리는 양의 상관관계를 가진다. 이를 통해 알 수 있는 사실을 주가는 거래량을 제외한 나머지 컬럼은 모든 영향을 준다는 걸 알 수 있다.

AI모델링

따로 데이터 가공을 할 것이 없기 때문에 바로 AI 모델링으로 넘어갔다.

날짜는 중요하지 않는 데이터기 때문에 제외하고, 알고 싶은 것은 조정가로 설정해서 학습을 돌렸다. 그 결과 epoch 100회를 다 마치고 오차율도 아래 사진처럼 학습을 할수록 낮아졌다.

영향을 주는 변수

사진처럼 변수 영향도를 보면 시가가 가장 변수의 영향을 주는 것을 알 수 있다. 그 밑으로는 거래량과 종가가 변수에 영향을 준다는 걸 알 수 있다.

시뮬레이션

사진과 같이 데이터를 입력하면 주가 예측 결과를 알 수 있다.


정리하기

스스로 해보기.

이번 공부를 통해 깨달은 점이 있다면, 스스로 해봐도 가능하겠다. 공부뿐만이 아니라 스스로 데이터를 습득해서 주가 예측 같은 것도 가능할 거 같다. 물론 데이터를 모으는 과정이 쉽지는 않겠지만, 노력해서 안되는 것은 없기 때문에 한 번 해보고 싶은 것 중에 하나로 점 찍어두어야겠다.

profile
음악을 좋아하는 사람이 음악을 만들 듯, 개발을 좋아하게 될 사람이 쓰는 개발이야기

0개의 댓글