머신러닝에서 모델이 나타내는 확률 분포 Q(x)와 데이터가 따르는 실제 확률 분포 P(x) 사이의 차이를 나타내는 함수를 손실 함수(loss function)라고 한다.모델의 확률 분포는 파라미터에 따라 달라지기 때문에 손실 함수 역시 파라미터에 따라 바뀐다.분류(cl
Normalization Regularization: 오버피팅(과적합) 문제를 해결하기 위한 방법 중 하나. L1 Regularization, L2 Regularization, Dropout, Batch Normalization 등의 방법이 있다. *오버피팅? tra
추천 시스템이란? 사용자(user)에게 관련된 아이템(item)을 추천해 주는 것 범주형 데이터를 다룬다. (숫자 벡터로 변환한 뒤) 유사도를 계산한다. 이 숫자 벡터의 유사도를 계산하여 유사도가 가까운 (혹은 높은) 제품을 추천해 줍니다. 코사인 유사도 두 벡터
2014년 이미지넷 챌린지 준우승간결한 구조로 많은 활용이전에 우승한 네트워크들이 10개가 안 되는 CNN층을 가진 반면, VGG16과 VGG19라는 이름 뒤의 숫자로 볼 수 있듯이, VGG는 16개, 19개의 층CNN을 만들 때 커널 크기(kernel size)를 조
패스트캠퍼스
프로그래밍 언어에서 가장 중요하게 고려돼야 할 것을 꼽으면 바로 '퍼포먼스'와 '생산성' 퍼포먼스: 어떤 언어든 코드를 짜서 실행을 시켰을 때 얼마나 빨리 처리가 되는가 파이썬은 하위권. 생산성: 똑같은 기능을 하는 프로그램을 얼마나 빨리 작성할 수 있는가
분류: 예측해야할 데이터가 범주형(categorical) 변수일때 회귀: 예측해야할 데이터가 연속적인 값 일때예측: 과거 및 현재 데이터를 기반으로 미래를 예측하는 과정 예를 들어 올해와 전년도 매출을 기반으로 내년도 매출을 추산하는 것.클러스터링 : 특정 기준에 따라
빠르고 메모리를 효율적으로 사용하여 벡터의 산술 연산과 브로드캐스팅 연산을 지원하는 다차원 배열 ndarray 데이터 타입을 지원반복문을 작성할 필요 없이 전체 데이터 배열에 대해 빠른 연산을 제공하는 다양한 표준 수학 함수를 제공배열 데이터를 디스크에 쓰거나 읽을 수
fig = plt.figure(): figure 객체를 선언해 도화지를 펼친다.ax1 = fig.add_subplot(1,1,1) : 축을 그린다.ax1.bar(x, y) 축안에 어떤 그래프를 그릴지 메서드를 선택한 다음, 인자로 데이터를 넣는다.그래프 타이틀 축의 레
"데이터 분석의 8할은 데이터 전처리이다."결측치가 있는 데이터를 제거한다.결측치를 어떤 값으로 대체한다\-결측치를 대체하는 방법은 다양한데 데이터마다 특성을 반영하여 해결해야 함.같은 값을 가진 데이터 없이 행(row)별로 값이 유일해야 한다면 중복된 데이터를 제거해
바이트(byte) : 컴퓨터의 기본 저장 단위1바이트(1byte)는 8비트(8bit)1바이트에는 2의 8승, 256개의 고유한 값을 저장할 수 있음인코딩 (encoding): 문자열을 바이트로 변환하는 과정디코딩 (decoding) : 바이트를 문자열로 변환하는 과정u
딥러닝을 'Representation Learning'이라고 칭하기도 함. 데이터의 표현을 학습한다는 것, 특히 사람이 가공하지 않은, 이미지나 자연어 같은 '날 것의' 데이터를 입력하면 알아서 그 안에 내재된 표현을 추출한다는 것, 이것이 바로 딥러닝이 추구하는 목표
딥러닝은 y = Wx + by=Wx+b 에서 최적의 WW(weight)와 bb(bias)를 찾는 과정!Linear 레이어는 선형 변환을 활용해 데이터를 특정 차원으로 변환하는 기능을 합니다. 100차원의 데이터를 300차원으로 변환한다면 데이터를 더 풍부하게 표현하는
유사한 맥락에서 나타나는 단어는 그 의미도 비슷하다: 분포 가설(distribution hypothesis) 분산 표현을 사용하면 희소 표현과는 다르게 단어 간의 유사도 를 계산으로 구할수 있음.Embedding 레이어는 단어의 분산 표현을 구현하기 위한 레이어컴퓨터용
딥러닝: 깊게 구성된 신경망연구자들이 더 좋은 성능을 내는 딥네트워크를 만들기 위해서 다양한 방법을 적용 \-> 사전학습된 네트워크(Pre-trained network)들은 Tensorflow나 PyTorch 등 프레임워크 차원에서 지원2010년 ILSVRC2010를
신경망(Neural Network): 뇌에는 1000억 개에 가까운 신경계 뉴런들이 있음. 이 뉴런들은 서로 매우 복잡하게 얽혀 있고, 조금 물러서서 보면 하나의 거대한 그물망과 같은 형태를 이루고 있음. 그것을 신경망이라 함.머신러닝/딥러닝 과학자들이 자연에서 답을