통계학에서 결정계수(決定係數, 영어: coefficient of determination)는 추정한 선형 모형이 주어진 자료에 적합한 정도를 재는 척도이다. 반응 변수의 변동량 중에서 적용한 모형으로 설명가능한 부분의 비율을 가리킨다. 결정계수의 통상적인 기호는 표본에
매일 데이터가 들어오기 때문에 전체 데이터(모집단)를 가져올 수 없다그래서 일부 데이터를 가져오는데 그것을 샘플링이라고한다 - 표본집단잔차 - 일부 데이터의 평균을 일부데이터로 뺀값모분산표본분산 - 표본집단 개수 - 1분산의 제곱근으로 표준편차를 구할 수 있다
특성과 타깃 사이의 관계를 선형 방정식을 구한다특성이 하나면 직선 방정식이 된다$$y = a \\times x + b$$기울기와 절편이 있어야 한다( a = 기울기 / b = 절편)LinearRegression에서 기울기는 coef 절편은 intercept머신러닝에서
테스트 세트는 훈련 세트의 통계(평균과 표준편차)로 변환(전처리) 해야한다.그렇지 않을 경우 데이터의 스케일이 달라지므로 훈련한 모델이 쓸모 없게 된다.쉽게 말해서 같은 기준으로 데이터를 가공하지 않으면 비교가 불가능 하다는 뜻이다.예를들어 훈련 세트에서는 70점을 0
- 지도학습 알고리즘이다. - 이름은 회귀이지만 분류 모델이다. - 선형 회귀와 동일하게 선형 방정식을 학습한다. - 이진분류와 다중분류 - 반복적 알고리즘 - 릿지 회귀와 같이 계수의 제곱을 규제한다. - 이진분류 시 시그모이드 함수(로지스틱 함수)로 결과값을 확률로
회귀와 분류는 지도학습의 종류들이다.인간인 관여자가 문제에 대한 답을 알고 있고, 인공지능(AI)이 그것을 알아낼 수 있도록 훈련시키고자 할 때 사용한다. 마치 교사의 도움을 받아 알고리즘을 ‘정답’으로 안내하면서 학습시키는 것과 같다. 따라서 아이가 스스로 실험하고
경사 하강법 키워드 배치 경사 하강법 확률적 경사 하강법 미니배치 경사 하강법 점진적 학습 + 온라인 학습 에포크 손실 함수 미분 로지스틱 손실 함수 이진 크로스엔트로피 손실 함수 크로스엔트로피 손실 함수 에포크와 과대/과소적합 조기 종료 힌지 손실 서포트 벡터 머신
time + probabilistic시간에 따라 랜덤하게 변해간다는 의미Stochastic은 영어에서는 random으로 표시되는 경우가 더 많긴합니다. 그런데, 이게 그냥 "임의의"라는 뜻이기 보다는 '확률론적인(probabilistic)'에 해당되는 의미라는 것을 기
데이터를 샘플링한다(키, 몸무게, BMI 결과값을 리스트로 만듬)특성을 선정한다(키, 몸무게)조건들을 설정한다.(기본 가중치, 학습률, 미니 배치 크기 등)경사하강법을 실행한다.(아래에서 코드로 설명)특성과 조건을 계산하여 결과값에 대한 가설을 세운다.가설에 실제 결과