퍼셉트론 : 다수의 입력신호를 받아서 하나의 출력신호를 내는것을 말한다. 가중치 : Weight(W)라고 영어로 표기하며, 입력신호가 뉴런에 보내질때 가중치를 곱해준다. 편향 : bias라고 표기하며, 입력신호가 가중치와 곱해지고 bias와 더해져서 뉴런으로 보내진
말뭉치(Corpus) : 특정한 목적을 가지고 수집한 텍스트 데이터 문서(Document) : 문장(Sentence)들의 집합 문장(Sentence) : 여러 개의 토큰(단어, 형태소)으로 구성된 문자열, 마침표, 느낌표 등의 기호로 구분 어휘집합(Vocabulary)
문서들간의 유사도를 측정하는 방법에 대해 알아보겠습니다.코사인 유사도는 가장 많이 쓰이는 유사도 측정방법입니다. 수식으로 표현하면 아래와 같습니다.$\\Large \\text{cosine similarity} = cos (\\theta)=\\frac{A⋅B}{\\Ver
이전에는 텍스트를 벡터화 시키는 방법중 등장횟수 기반의 단어표현(Count-based Representation) 으로 벡터화 하는것을 알아보았습니다. 이번에는 분포기반의 단어표현(Distributed Representation)에 대해서 학습해보겠습니다. Dist
순환 신경망(RNN, Recurrent Neural Network) 연속형 데이터(Sequential Data) 어떤 순서로 오느냐에 따라서 단위의 의미가 달라지는 데이터(Ex.시계열데이터, 문장) RNN의 구조 RNN은 연속형(Sequential)데이터를 잘 처리