[TIL] 2021.03.29

hyelimchoi1223·2021년 3월 29일
0

[TIL] 2021년

목록 보기
34/44
post-thumbnail

✏️ 오늘 공부한 내용

  • 랜덤포레스트에 대해서

랜덤 포레스트란

  • classification은 물론 linear 문제도 예측이 가능하다.
  • 일반적으로 과적합이 잘 일어나지 않는다. (아예 안 일어나는 것은 아님)
  • 검증용 데이터셋이 필요하지 않다.
  • 일반화의 정도를 쉽게 확인할 수 있다.

발생하는 문제 종류

curse of dimensionality

  • 컬럼의 수가 많아지면 빈 공간이 많아진다.
  • 차원의 수가 커지면 더 많은 점들이 그 공간에 놓일 수 있어 점들이 퍼져있을 것이다.
  • 필요한 컬럼만 추리지 않으면 문제가 생긴다.
    (https://bioinformaticsandme.tistory.com/197)

no free lunch theorem

  • 모든 데이터셋에 다 작동하는 모델은 존재하지 않는다.

RandomForest 함수

from sklearn.ensemble import RandomForestRegressor, RandomForestClassifier

RandomForestRegressor

회귀 : 특정한 연속형 결과물을 예측하는 학습 모델을 의미. => 연속형 종속 변수를 가지고 있다.

RandomForestClassifier

분류

📆 오늘 하루 돌아보기

오늘 내가 그동안 삽질한 원인에 대해서 알게 되었다. 공부하게 된 강의는 fast ai v1을 이용했고, 검색은 v2를 했기 때문에 계속 뭔가가 안맞았던 것이다. 아나콘다를 이용해 jupyter notebook에서 공부하려고 했지만 계속 세팅만 하다 공부도 못할 것 같아서 colab을 이용했다. 그래서 겨우 실습 성공!!!

0개의 댓글