1. NumPy 주요 기능 ndarray만들기 ndarray 객체는 arange()와 array([])로 만들 수 있습니다. 크기 (size, shape, ndim) ndarray.size :행렬 내 원소의 개수 ndarray.shape : 행렬의 모양 ndarr
결측값을 제거결측값을 다른 값으로 대체(새로운 범주내 특정값, 최빈값, 예측값,... ) 행별로 값이 유일해야 한다면 중복된 데이터를 제거대부분 값의 범위에서 벗어나 극단적으로 크거나 작은 값이상치 삭제이상치를 다른 값으로 대체(최댓값, 최솟값, ...)예측값 활용수치
Seaborn의 load_dataset() 메서드를 이용결측값 확인수치형, 범주형 데이터인지 확인주로 막대그래프Pandas와 Matplotlib를 활용Seaborn과 Matplotlib을 활용산점도선 그래프히스토그램데이터와 현상을 수치에 따라 색상으로 나타냄2차원으로
관찰된 여러 데이터를 각 연속형 변수 간의 관계를 모델링하고 이에 대한 적합도를 측정하는 분석 방법부모와 자식의 키 관계부동산 가격 예측1인당 국민 총소득과 배기가스 배출량 사이의 관계 예측(1) 선형성 : 예측하고자 하는 종속변수 y와 독립변수 x간에 선형성을 만족하
지도학습과 다르게 training data로 정답(label)이 없는 데이터가 주어지는 학습방법주어진 데이터가 어떻게 구성되어 있는지 스스로 알아내는 방법아무도 정답을 알려주지 않은 채 오로지 데이터셋의 특징이나 패턴을 기반으로 모델 스스로가 판단군집화(clusteri
입력 1가지, 출력 1가지 방식 -> 입출력이 여러 개인 경우 적합하지 않은 모델keras.Model을 사용입력과 출력을 규정함으로써 모델 전체를 규정 -> 더 자유로운 모델링 진행 가능다중 입력, 출력을 가지는 모델을 구성keras.Model을 상속받은 모델 클래스
Red 채널, Green 채널, 그리고 Blue 채널까지 총 3개의 채널을 가짐표기 방법 : Channel, Width, Height의 이니셜로 (C, W, H), (W, H, C)하나의 물체가 여러 개의 논리적인 객체들로 구성되어 있는 경우, 이러한 각각의 객체를 하
분포 가설과 분산 표현 1. 희소 표현(Sparse Representation) 벡터의 특정 차원에 단어 혹은 의미를 직접 매핑하는 방식 2. 분포 가설 유사한 맥락에서 나타나는 단어는 그 의미도 비슷하다 3. 분산 표현 유사한 맥락에 나타난 단어들끼리는 두 단어
데이터의 형태를 좀 더 의미 있게, 혹은 트레이닝에 적합하게 전처리하는 과정데이터를 z-score로 바꾸거나 minmax scaler를 사용하여 0과 1사이의 값으로 분포를 조정하는 것들이 해당모든 피처의 범위 분포를 동일하게 하여 모델이 풀어야 하는 문제를 좀 더 간
사용자(user)에게 관련된 아이템(item)을 추천해 주는 것ex) 영화추천<간단한 추천 로직>1\. 범주형, 이산적인 데이터를 숫자 벡터로 변환2\. 계산한 숫자 벡터의 유사도를 계산해서 유사도가 가까운 (혹은 높은) 제품을 추천해줌유사도를 계산하는 방법 중
하나의 processor가 여러 가지 task를 동시에 수행하는 개념다른 task를 수행할 수 있는 시간에는 task를 전환해서 효율적으로 여러 개의 task를 동시에 수행하는 것처럼 보임유사한 task를 여러 processor가 동시에 수행하는 것동기 : 어떤 일이