Day33

김재현·2023년 7월 5일

JUPYTER/DL/ML

목록 보기
13/73

연습문제 풀이

category로 dtypes 전처리
빈도 그래프의 내부 기능에서 전처리를 행하기 때문에 category 전처리는 본인의 선택

데이터 프레임 연산

더 다양한 데이터 생성

파생 변수

원본 유지를 위해 데이터 프레임을 담을 변수를 생성, 내부에 데이터프레임을 담는다
축을 설정하는 axis를 사용해 행 또는 열을 연산할지 선택 axis = 1은 행
iloc : index-location (인덱스번호 기반)-행
loc : location (이름기반)
iloc을 사용한 슬라이싱도 가능(index location)

if/else문을 사용한 조건부 파생변수

기술통계 - 기초통계량

표본평균 : 전체 합
모평균(추론) : 가장 큰 수와 가장 작은 값을 제외하고 계산
평균값은 신뢰도가 낮기 때문에 주로 중앙값을 사용

사분위수 : 이상치를 구하는 기본
사분위수의 중심 위치 : 중앙 값

데이터 집계

0개의 댓글