# Data Preprocessing

13개의 포스트
post-thumbnail

[머신러닝] Data Scaling 데이터 스케일링

(주절주절) 열심히 정리하다가 ctrl+s를 눌렀어야 했는데 w를 눌렀나... 그러니 창이 꺼졌다. 임시저장도 안되어 있고... 어제는 서버에서 폴더명 바꾸려고 뒤에 ~ 붙이고 엔터치니 폴더가 숨겨져서 다른 분이 도와주셨다... 무튼 나중에 나중에... -2022.06

약 17시간 전
·
0개의 댓글
post-thumbnail

데이터 기반 학습 - 1

안녕하세요. Perfitt에서 AI 업무를 담당하고 있는 케빈입니다. 알고리즘 모형을 이용해 데이터를 학습하는 경우 데이터 학습에 대한 전반적인 절차와 각 단계에서 고려해야 할 사항, 필요한 도구들에 대해서 설명해 보도록 하겠습니다.

2022년 4월 21일
·
0개의 댓글
post-thumbnail

R-Data Preprocessing

오늘은 필요성을 느껴 입문하게된 R언어로 Data preprocessing을 블로깅 하려 한다. <span style='background-color: =R언어를 배우게 되면서 R studio도 같이 설치를 해보았는데 ui자체가 다소 난해하다는 느낌이 들지만 이또

2022년 4월 19일
·
0개의 댓글

Feature Engineering

Feature = Column or a Dimension of a DataFrameFeature Engineering = Combining/Restructuring the existing datasets to create a new featureScreen Shot 2

2022년 4월 13일
·
0개의 댓글

4/11 개발일지

data preprocessing (데이터 전처리)DATA를 분석하기 용이하게 고치는 모든 작업결측치:중요 데이터 빠짐데이터 오류 : 잘못된 데이터 입력이상치 : 일반적 범위 벗어남데이터 형식 : 분석하기 적합x범주형 데이터 : 다른 형태로 되어있다.scaling(변수

2022년 4월 11일
·
0개의 댓글

[AIB]Note113~4 Data Manipulation, Basic Derivative

ㅁData는 무슨 뜻인지 알고 있을거고, Manipulation은 조종하다는 뜻으로 이해하면 좋다. 데이터를 분석하기 좋도록 조종, 즉 조작, 수정 등으로 이해하면 좋을 듯하다.내가 원하는 데이터들이 우리가 보는 엑셀 파일 등에 하나로 다 들어가 있을 수가 없다. 왜냐

2022년 3월 3일
·
0개의 댓글
post-thumbnail

모두를 위한 딥러닝 시즌 1 ML lec 7

저번 시간에 Cost 함수에 대해 배우고 Gradient descent은 못하고 지나쳤는데 이번 강의는 이에 대해 배운다. 우리는 Gradient descent 함수를 Cost 함수를 정의하고 값을 최소화하기 위해 사용한다.

2021년 12월 29일
·
0개의 댓글
post-thumbnail

EDA

EDA, pre-processing

2021년 12월 18일
·
0개의 댓글
post-thumbnail

형변환 (python)

데이터 분석을 위하여 작업하기 좋기 위하여 전처리가 필요하다raw data를 가져오다보면 "5,562" 와 같은 문자열 형태로 저장된 데이터가 존재하다이를 자료형을 변환하려고 해도 쉼표","가 존재하여 곤란한 경우가 있다아래와 같은 솔루션으로 이를 해결해보자

2021년 7월 14일
·
0개의 댓글
post-thumbnail

Feature Scaling in Scikit Learn

Data Preprocessing is not just about encoding the data and converting the data type within the dataset. It also requires arduous steps to adjust the w

2021년 1월 6일
·
0개의 댓글
post-thumbnail

Data Preprocessing in Scikit-Learn

Until now, we have learned about various machine learning techniques to enhance the performance of the model. However, handling and managing the data

2021년 1월 6일
·
0개의 댓글