One Hot Encoding

asdf·2021년 5월 31일
0
post-thumbnail

기상청 해양자료를 학습데이터로 사용하고 있는 중인데 학습이 제대로 안된다

이유는 수백가지이겠지만.. 일단 데이터가 충분치않아서 생긴일인것 같다

Multivariable Autoencoder 관련 선행연구들은 기본적으로 변수의 수가 20개는 넘는거 같은데

내가 사용하는 기상청데이터는 해봤자 6개어서 그런게 아닌가..

일단, 이것저것 시도해보고 있다

그중 하나로 날짜데이터를 원핫인코딩하여 넣어보고자 한다

사실 별거 없었다

step1 : datetime형 데이터를 년, 월, 일, 시간 각각의 문자형 데이터로 분리 [1]

step2 : pandas의 get_dummies 함수 사용 [2]



근데 이걸 그대로 갖다쓰면 date관련 변수들이 너무 많아서 학습결과에 악형향을 미치지 않을까 라는 걱정이 든다..

일단 해본다. 결과가 좋았으면 좋겠다

끝.

Reference :
[1] https://gonigoni.kr/posts/python-datetime-string-formatting/
[2] http://growthj.link/python-%EC%9B%90-%ED%95%AB-%EC%9D%B8%EC%BD%94%EB%94%A9one-hot-encoding-%EC%A0%95%EB%A6%AC-get_dummies/

profile
인공지능 초보

0개의 댓글