
Numerical Python https://numpy.org/수치적 연산을 위해 최적화된 모듈기본 타입: ndarray (n-dimensional array) 다차원 배열 표현numpy 사용하는 이유 (파이썬에 list가 있는데도)성능적으로 빠르다훨씬 적은

리스트의 경우array 연산은 리스트와 달리 기본적으로 ‘원소’끼리의 연산이다array 와 스칼라 값 연산 가능단일값만 갖고 있는 객체와는 shape 관계없이, scalar 연산 수행그러나numpy의 많은 함수들은 axis= 파라미터를 가진다.axis(축)은 각 ‘차원

‼️pandas 는 데이터 분석 라이브러리행,열 형태의 정형 데이터 객체를 다룬다.2차원 데이터엑셀의 시트, RDB의 테이블과 같은 형태대표적인 객체DataFrameSeriespandas 의 기본 객체 중 하나numpy의 ndarray를 기반으로 인덱싱 기능이 추가된

boolean Series 가 \[]와 함께 사용되면 True 값에 해당하는 값만 새로 반환되는 Series 객체에 포함됨다중조건의 경우, & | 를 사용하여 연결 가능dtype: bool dtype: int64 dtype: int64index 를 사용한 필터링도

Series 가 1차원이라면 DataFrame은 2차원으로 확대된 버전Excel spreadsheet 라고 생각하면 쉬움2차언이기 때문에 인덱스가 row,column로 구성됨row는 각 개별 데이터를 column은 개별 속성을 의미Data Analysis, Machin

범주형 데이터 전처리범주형 데이터는 분석단계에서 계산이 어렵기 때문에 숫자형으로 변경이 필요범주형 데이터의 각 범주를 column레벨로 변경해당 범주에 해당하면 1, 아니면 0으로 채우는 인코딩 기법pandas.get_dummies 함수 사용columns= 파라미터로

파이썬의 자료(DataFrame, Series..)을 차트나 플롯으로 시각화하는 모듈Matplotlib는 정형화된 차트나 플롯 이외에도 저수준 api를 사용한 다양한 시각화 기능을 제공한다.라인 플롯스캐터 플롯컨투어 플롯서피스 플롯바 차트히스토그램박스 플롯……..선을

컴퓨터가 데이터를 학습하는 알고리즘과 기술을 통칭입력 데이터X 와 타겟값y 를 알고 있는 데이터를 학습하여 이들의 관계를 모델링하는 학습 방법새로운 데이터에 대한 타겟값을 예측하는 데에 사용EX> 컴퓨터에게 개와 고양이를 분류하는 법을 가르치기 위해 필요한 것개,고양이

여러개의 종류(class) 중 하나를 구별해 내는 문제2 개의 클래스 중 하나를 고르는 문제 ⇒ 이진분류 (binary classification)생선 데이터 셋데이터 불러오기info 확인하기<class 'pandas.core.frame.DataFrame'>Ran