ndarray : 1가지 type의 값들로 구성, axis = 차원속성ndarray.ndim : 차원수ndarray.shape : 데이터 모양ndarray.size : 전체 값 개수ndarray.dtype : 값의 typendarray.itemsize : 각 값의 크기
pandasiloc행,열df.iloc\[ 1,2,4, 0, 2]loc행, "열 이름"isin
nominal 순서가 의미있는 Numeric 세는게 의미 x = 수치데이터deck 순서 있음출발도시 nfare age 빼고는 nominal.사망자의 숫자가 중요할때는 바 그래프사망자가 훨 많다라는걸 보여줄 때는 파이 그래프sample링 시드를 같은걸 주면 랜덤하지 않게
coef 저기 수식에서 앞에 있는 계수임.상관계수와 달라.
샘플 사이즈가 작을때 쓰기 유리해. => 정규분포를 가성비 있게 만드는법.카이가 표준정규분포라고 할 때카이 스퀘어 값의 크고 작음을 알려주는분산의 분포'X_train'은 일반적으로 교육 데이터의 기능을 포함하는 2D 배열 또는 DataFramen_samples는 데이터
예측 변수(독립 변수)와 결과 변수(종속 변수) 사이의 관계를 모델링결과 변수가 연속적일때 사용.특정 범위 내 모든 값을 가질 수 있음. ex) 온도, 주택가격예측 변수와 결과 변수 사이의 선형 관계를 모델링 해 가장 적합한 선을 찾는것연속 결과 변수와 예측 변수 사이
K-means clustering