arXiv:1611.06639 Text Classification Improved by Integrating Bidirectional LSTM with Two-dimensional Max Pooling 논문 리뷰입니다.RNN(Recurrent Neural Network
대규모인 유튜브 환경에서 추천을 진행하기 위해 two stage information retrieval을 이용해 추천시스템을 구성하였다.이 과정에서 딥러닝을 적용하였고 성능이 dramatic하게 향상됐다.Two-stage information retrieval dich
인공신경망 : 인간 두뇌 신경의 연결 구조를 모방해 데이터를 네트워크 구조를 거쳐서 처리하도록 만든 시스템PE(Processing Element) : 인공 신경 세포를 노드 혹은 유닛으로 나타내는 단노드(Node)자신에게 입력되는
예측값과 실제값의 차이를 비교하기 위한 함수. 최적화를 하기 위해서 최소화를 하는 것이 목적인 함수. 목적함수(Object Function), 비용함수(Cost Function) 이라고도 부름손실함수를 통해서 모델 학습 중에 loss가 잘 줄어들지 않는다면 학습이 잘
overfitting을 막기 위해 위해 사용하는 방법: 벡터의 크기를 측정하는 방법 (두 벡터 사이의 거리를 측정하는 방법): 벡터 p, q의 각 원소들의 차이의 절대값의 합: q가 원점이라고 했을 때, 벡터 p, q의 원소들의 원점으로부터의 직선거리: 모델 복잡도에
: 입력 데이터의 분포가 학습할 때와 테스트 할 때 다르게 나타나는 현상학습 데이터를 이용해 만든 모델이 테스트 데이터셋을 가지고 추론할 때 성능에 영향을 미칠 수 있음: Covariate Shift가 Neural Network 내부에서 일어나는 현상 → 매 스텝마다
9. 군집 분석 9-1. 군집 분석 군집 : 데이터 집합 내에 존재하는 의미 있거나 유용성 있는, 또는 의미도 있고 유용성도 있는 그룹 군집 분석 : 레코드들로 이루어진 데이터 집합을 그 레코드를 구성하는 속성 정보만 사용해 그룹으로 나누는 기법 클러스터링 (Clu
행동에는 어떠한 패턴이 있고 이런 행동을 100% 완벽하게 예측할 수는 없을지라도 그 행동에서 특정한 패턴 또는 정규성을 발견함으로써 가능한 한 매우 비슷하게 예측할 수 있을 것작업 T, 측정된 성능을 P
인공지능(Artificial Intelligence : AI) : 컴퓨터가 인간의 지능적 행동을 모사하여 복잡한 일을 할 수 있도록 하는 연구인간에 대한 연구와 관련되어있음ex) 경영학, 경제학, 인문학,
정보를 표현하는 데 필요한 최소 평균 자원량 흔하게 일어나는 일일수록 정보량이 적고, 적게 일어나는 일일수록 정보량이 많다는 아이디어로 출발하여 아래 그림과 같이 정보량 표현
데이터 정규화 (Normalization) : 데이터를 특정 구간으로 바꾸는 척도법서로 다른 feature의 크기를 통일하기 위해서 크기를 변환
머신러닝 평가지표 회귀 MAE, MSE, RMSE, MSLE, MAPE, MPE, R^2 분류 accuracy, precision, recall f1 score, mcc, roc-auc 클러스터링 silhouette coeffiicient
RFECV : 자동적으로 최선의 특성을 선택하고 싶을 때 사용할 수 있는 feature selection 방법.