과기부 AI 수업20 머신러닝[데이터정제]

욱이·2024년 5월 22일
0

과기부 AI 수업 정리

목록 보기
20/20
post-thumbnail

데이터정제 (Data Cleaning)

결측치(Missing Values)처리

  • Simplelmputer : 평균, 중앙값, 최빈값 등으로 대체

    결측치가 있는 데이터 생성

결측치를 처리하기 위해 SimpleImputer객체 생성

누락된 값을 평균으로 대체(mean)

누락된 값을 중앙값으로 대체한 데이터(midian)

누락된 값을 최빈값으로 대체한 데이터(most_frequent)

누락된 값을 상수값으로 대체한 데이터(constant// fill_value=)

이상치(Outlier) 제거

  • IsolationForest 등의 모델 활용

이상치가 있는 데이터 생성

IsolationForest 객체 생성

이상치 데이터 제거

profile
개발자 기록 끄적

0개의 댓글