# outlier

5개의 포스트

Novelty and Outlier Detection

scikit-learn의 user guide를 번역했습니다. https://scikit-learn.org/stable/modules/outlier_detection.html 많은 응용프로그램은 새로운 관측값(observation)이 기존 관측값과 같은 분포에 있는지(

2022년 2월 16일
·
0개의 댓글
·

Data Cleansing

결측치 이상치

2021년 12월 26일
·
0개의 댓글
·

Preprocessing - Dealing with Outliers, Missing values

outliers, missing values

2021년 11월 2일
·
0개의 댓글
·
post-thumbnail

형변환 (python)

데이터 분석을 위하여 작업하기 좋기 위하여 전처리가 필요하다raw data를 가져오다보면 "5,562" 와 같은 문자열 형태로 저장된 데이터가 존재하다이를 자료형을 변환하려고 해도 쉼표","가 존재하여 곤란한 경우가 있다아래와 같은 솔루션으로 이를 해결해보자

2021년 7월 14일
·
0개의 댓글
·

Outlier(이상치)

이상치란 대부분 값의 범위에서 벗어나 극단적으로 크거나 작은 값을 의미합니다. 이상치를 판단한 뒤 어떻게 해야 할까요? 가장 간단한 방법으로 이상치를 삭제할 수 있습니다. 이상치를 원래 데이터에서 삭제하고, 이상치끼리 따로 분석하는 방안도 있습니다. 이상치를 다른

2021년 7월 8일
·
0개의 댓글
·