# machine learning

229개의 포스트

Overfitting(과적합)이란

Machine learning을 공부하다 보면 overfitting이란 용어를 굉장히 자주 접하게 된다. 이 포스트에서는 overfitting이 무엇인지 알아보고 overfitting을 어떻게 줄일 수 있는지 소개하겠다.

약 16시간 전
·
0개의 댓글
post-thumbnail

[Python] 백신 접종 여부 예측 모델

Prediction of H1N1 vaccination

4일 전
·
0개의 댓글

분류모델의 검증

1. 정확도 (Accuracy) 2. 정밀도 (Precision) 3. 재현율 (Recall) 4. F beta score 5. 임계값 (Threshold) 6. ROC Curve, AUC

6일 전
·
0개의 댓글

랜덤 포레스트 (Random Forest)

랜덤 포레스트는 결정트리의 과적합의 단점을 회피할 수 있는 방법이다.기본적인 구조는 조금씩 다른 여러 결정 트리의 묶음이다.랜덤 포레스트는 각 트리는 비교적 예측을 잘 할 수 있지만 일부 데이터에 과대적합하는 경향을 가진다는데 기초한다.서로 다른 방향으로 과대적합된 트

2021년 6월 16일
·
0개의 댓글
post-thumbnail

결정트리 (Decision Tree)

결정트리는 결정에 다다르기 위해 예 / 아니오 질문을 이어나가면서 학습한다.이 질문은 스무고개 놀이의 질문과 비슷하다.위 그림에서 트리의 노드는 질문이나 정답을 담은 네모 상자다.마지막 노드는 리프(leaf)라고도 한다.질문이나 말단의 정답을 노드(node)노드를 연결

2021년 6월 15일
·
0개의 댓글
post-thumbnail

[ML][Automation]보안문자(Captcha) 우회하기

1. Captcha란 > CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart / CAPTured CHAracter)는 사용자가 컴퓨터인지 사람인지 판별하기 위한 튜링테스트이

2021년 6월 14일
·
0개의 댓글

로지스틱 회귀 (Logistic Regression)

분류의 로지스틱 회귀

2021년 6월 11일
·
0개의 댓글

코드스테이츠 AI 부트캠프 29일차

크로스밸리데이션과 하이퍼파라미터 튜닝

2021년 6월 11일
·
0개의 댓글

범주형 변수, 릿지 회귀 (Ridge regression)

범주형 변수 이항 변수화와 릿지회귀의 정의

2021년 6월 10일
·
0개의 댓글
post-thumbnail

코드스테이츠 AI 부트캠프 28일차

릿지 회귀 모델 "수식"L2 Norm선형회귀모델의 식과 릿지 회귀 모델의 식이 무엇이 다른가

2021년 6월 10일
·
0개의 댓글

다중 선형 회귀 (Multiple Linear Regression)

단순선형회귀의 목적은 하나의 독립변수를 가지고 종속변수를 예측하기 위한 회귀모델을 만드는 것이었다면, 다중선형회귀는 n개의 독립변수를 가지고 종속변수를 예측하기 위한 회귀모델을 만드는 것이다.$$Y_i = \\beta + \\alpha_1x_1 + \\alpha_2x_

2021년 6월 9일
·
0개의 댓글
post-thumbnail

코드스테이츠 AI 부트캠프 27일차

머신러닝모델을 만들 때 학습과 테스트 데이터를 분리 해야 하는 이유다중선형회귀과적합/과소적합을 일반화 관점에서 설명편향/분산의 트레이트오프 개념을 이해하고 일반화 관점에서 설명예측 모델을 만들기 전에 간단하게 최소한의 성능을 나타내는 기준이 되는 모델관찰된 연속형 변수

2021년 6월 9일
·
0개의 댓글

단순 선형 회귀 (Simple Linear Regression)

예측 모델을 구체적으로 만들기 전에 가장 간단하면서 직관적이고, 최소한의 성능을 나타내는 기준이 되는 모델분류문제 : 타겟의 최빈 클래스회귀문제 : 타겟의 평균값시계열회귀문제 : 이전 타임스탬프의 값산점도에 가장 잘 맞는(best fit) 직선을 그려주면 그것이 선형

2021년 6월 8일
·
0개의 댓글
post-thumbnail

코드스테이츠 AI 부트캠프 26일차

선형회귀모델지도학습(Supervised Learning)회귀모델에 기준모델을 설정Scikit-learn을 이용해 선형 회귀 모델을 만들어 사용하고 해석

2021년 6월 8일
·
0개의 댓글
post-thumbnail

[Python] Kaggle 데이터 소개 및 분석

Kaggle 데이터를 활용하여 최신 머신러닝 모델에 대해서 배워보자!

2021년 6월 2일
·
0개의 댓글
post-thumbnail

k - 최근접 이웃 알고리즘(2) - test/train set

앞서 우리가 짠 머신러닝(k - 최근접 이웃 알고리즘 -1-)에는 문제점이 있다. 도미 35마리와 14마리를 학습시켜 모델을 만들고 학습시킨 데이터를 가지고 kn.score()를 통해 모델을 테스트 하였기 때문에 정확하다고 말할 수 없다. 그렇다면 어떻게 해야 할까?

2021년 6월 2일
·
0개의 댓글
post-thumbnail

k - 최근접 이웃 알고리즘 -1-

어떤 데이터에 대한 답을 구할 때 주위의 다른 데이터를 보고 다수를 차지하는 것을 정답으로 사용한다. 즉, 초록색 세모와 거리가 가까운 주위의 데이터는 파란색 = 도미 이므로 따라서 초록색 세모는 도미로 예측하는 것이다. k-최근접 이웃 알고리즘(knn)

2021년 6월 2일
·
0개의 댓글
post-thumbnail

[Computer Vision] Super Light FSRCNN

Computer Vision 분야 중 하나인 Super Resolution에서 기존 FSRCNN과 FSRCNN-s 모델을 설명하고, 더욱 경량화된 FSRCNN-x 모델을 제안함

2021년 6월 2일
·
1개의 댓글