[TIL] Logistic Regression 로지스틱 회귀모델

lena_log·2021년 12월 19일
0

Codestates Section2

목록 보기
4/12
post-thumbnail

Training, Validation, Testing sets

데이터 훈련(train)/검증(validation)/테스트(test)로 나누는게 매우 중요함

  • 훈련(train): 모델을 핏팅/학습하는데 사용함
  • 검증(validation): 모델이 너무 훈련데이터에 잘맞아서 테스트 데이터의 성능이 안나오기때문에 과적합 확인 후 다시 모델링 또는 모델 수정할 때 사용하는 검증 데이터
    즉, 평가 > 하이퍼파라미터를 조절, 과대/소적합확인, 모델비교선택 > 최종모델 선택
  • 테스트: 마지막으로 사용, 즉 검증까지 완료하고 모델을 테스트하기 위한 것
    주의할 점) 테스트에서 훈련/검증에서 사용되면 안됨

시계열 데이터는 데이터를 어떻게 분리시킬까요?
시계열 데이터 분리 시 시간축 유지시켜야합니다.

  • 훈련셋(Training set): 과거의 데이터
  • 검증셋(Validation set): 현재의 데이터
  • 테스트셋(Test set): 미래의 데이터

Validation 검증

  • 언제 필요한가요?
    모델링 중 성능테스트를 할때 validation이 필요하다

캐글에서는 훈련/테스트 분리해서 제공하고 테스트는 레이블이 없는 상태로 받음
그래서 테스트 예측치는 캐글사이트에 올려야 성능을 알 수 있는데 예측성능을 다 안보여준다. 결국은 우리가 따로 validation하고 완전히 일반화 된 모델을 캐글에 올려야 한다.

logistic regression 로지스틱 회귀

선형회귀와 로지스틱 회귀가 다른점

(자료가 영어였어서 그대로 가져옴, 내가 읽기 편하게 일부 수정함)

  • (1) logistic regression predicts whether something is True or False, instead of predicting something continuous like size(linear)
  • (2) instead of fitting a line to the data like linear, logistic regression fits an "s"shaped "logistic function"

1. 로지스틱 회귀(분류)

  • true, false로(0,1) 나누고 그래프가 S shape(시그모이드 함수 그래프)모양이다.
  • 최대가능도 추정량(MLE)을 이용한다.
  • 분류문제를 풀때 사용하는 지도학습이다.
  • 분류: 클래스 예측(1,0이진분류, abc다중분류)
    ex) 별점1~10인것도 왜냐면 회귀로 풀면 1.234, 3.245 이렇게 소수로 표시되기때문에
  • 분류문제 기준모델: 타겟변수에서 가장 빈번하게 나타나는 변수
  • 분류문제 평가표: 정확도(accuracy)

2. 선형회귀(회귀)

  • X,Y과 관계가 선으로 그려지고 독립변수에 따라 종속변수를 예측
  • 회귀: 연속형, 연속적인 값= 집값
  • 오즈
    확률이 1이면 오즈무한대
    확률이 0이면 오즈 영

  • standard scaler
    범위가 큰 칼럼과 범위가 작은 컬럼과 비교가 어려움 그래서 특성의 척도를 맞춰서 비교를 하려고

  • 로지스틱 회귀 계수 분석
    x 한 단위가 커질 수록 오즈가 변한다.

https://www.finereport.com/kr/%eb%8d%b0%ec%9d%b4%ed%84%b0-%eb%b6%84%ec%84%9d%ec%97%90-%ed%95%84%ec%9a%94%ed%95%9c-%ec%98%a4%ed%94%88-%ea%b3%b5%ea%b3%b5%eb%8d%b0%ec%9d%b4%ed%84%b0-%ec%86%8c%ec%8a%a4-%ed%8f%ac%ed%84%b8-20%ea%b0%80/?utm_source=media&utm_medium=facebook&utm_campaign=1&utm_term=1&fbclid=IwAR0w2jhUwJIPsj9mlSCwp9o30pm4cjld7GvZjepRdtrljBFsqLzQE8VWqzc

profile
안녕하세요. 기억보다 기록을 믿는 레나입니다!

0개의 댓글