mecab = Mecab()에서 Tagging 에러 발생 시 아래 코드 사용
a - TP(True Positive)b - FN(False Negative)c - FP(False Positive)d - TN(True Negative)a+b - Posc+d - Negtpr(True Positive Rate) = TP/Pos : Sensitivity

가능한 클래스가 2개인 이진 분류를 위한 모델선형 회귀 모델에 시그모이드 함수 적용
회귀, 분류, 이상치 탐지 등에 사용되는 지도학습클래스 사이의 경계에 위치한 데이터 포인트를 서포트 벡터라 부름각 서포트 벡터가 클래스 사이의 결정 경계를 구분하는데 얼마나 중요한지 학습서포트 벡터와 결정 경계의 마진이 가장 큰 방향으로 학습
베이즈 정리를 적용한 확률적 분류 알고리즘모든 특성이 독립임을 가정입력 특성에 따라 3개의 분류기로 구분가우시안 나이브 베이즈 분류기베르누이 나이브 베이즈 분류기다항 나이브 베이즈 분류기tf-idf를 이용하면 정확도 향상된다.
분류와 회귀에 사용되는 지도 학습 방법데이터 특성으로부터 추론된 결정 규칙을 통해 값 예측if-then-else 결정 규칙을 통해 데이터 학습트리 깊이가 깊을 수록 복잡한 모델
트리 기반의 앙상블 기법

사회 연결망 분석 기법을 텍스트 내 단어의 관계에 적용한 것동시 출현은 두 개 이상의 어휘가 일정한 범위나 거리 내에서 함게 출현하는 것단어간 동시 출현 관계를 분석하면 두 단어가 유사한 의미를 가졌는지 등의 추상화된 정보 얻는다token의 노드와 엣지는 다음과 같이