
1. pandas python data analysis library

데이터 프로파일링을 통한 EDA 1. 탐색적 데이터 분석(EDA) 📌 1. 탐색적 데이터 분석(EDA) EDA : Exploratory Data Analysis, 탐색적 데이터 분석 데이터를 다양한 각도에서 관찰하고 이해하는 일련의 과정을 말한다. 데이터 분석

결측치 처리

...

스케일링 1. Scikit-Learn 📌 1. Scikit-Learn python을 대표하는 머신러닝 라이브러리 매우 다양한 전처리 도구와 알고리즘을 제공하고 있어 머신러닝 기법을 배우는 데 적합 분류, 회귀, 클러스터링, 차원 축소 등을 포함한 광범위한

인코딩과 범주화 1. 인코딩 📌 1. 인코딩(Encoding) 실제 데이터셋은 수치형(numerical)과 범주형(categorial) 변수가 혼재한다 인코딩은 컴퓨터가 처리하기 용이하도록 기존의 데이터를 변경하는 것 범주형 데이터 : 일반적으로 문자열(s

피쳐 엔지니어링 1. 피쳐 엔지니어링(Feature Engineering) 📌 1. 피쳐(Feature) 데이터 모델(특히 인공지능)에서 예측을 수행하는 데 사용되는 입력변수 피쳐의 유형 속성에 따라 범주형(categorical) : 범주나 순위가
여러 개의 데이터 처리 과정을 하나의 처리과정(pipneline, sequence)으로 만들어 데이터를 일괄 처리해주는 기능