[pandas] 데이터 변형하기

Bpius·2023년 5월 20일
0
post-thumbnail

대/소문자 변형하기

upper(): 대문자로 변형
lower(): 소문자로 변형
대/소문자로 변형은 '뷰'만 보여준다. 원본의 copy가 일어나지 않는다.

함수와 map 사용

data에 food가 어떤 종류의 육류인지 확인하기 위해 animal이라는 컬럼을 새로 만들어보자.
원본 data에 meat_to_animal의 사전을 가져와서 매핑시켜보자

data에 animal이라는 컬럼을 새로 생성할 것인데, lowercase에 meat_to_animal을 맵핑하여 만든다.
lowercase는 data의 food를 소문자로 만든 것이기에 data의 인덱스 순서와 일치한다.

함수를 사용해도 된다.

replace: 값 바꾸기

replace(교체할 값, 교체한 후의 값)
replace도 '뷰'만 제공하고 copy는 일어나지 않는다.

리스트로 던져서 한 번에 바꿀 수도 있다.

리스트의 길이를 맞춰 1:1로 바꿀 수도 있다.

dict(사전)으로 던져서 매핑해서 바꿀 수도 있다.

dict를 변수에 담아서 변수를 넘겨도 된다.

인덱스(로우)/컬럼 이름 바꾸기

아래의 인덱스와 컬럼은 copy가 생성되어 원본이 바뀐다.

인덱스 이름 바꾸기

컬럼 이름 바꾸기

rename 사용하기
rename은 '뷰'를 제공하고 copy는 일어나지 않는다.
index, columns에 데이터 형식을 직접 던져줘도 되고,
사전 형식으로 매핑시켜도 된다.

인덱스(로우)/컬럼 순서 바꾸기

아래와 같이 순서를 바꿔도 '뷰'만 보여주고 원본은 그대로다. 그래서 바뀐 순서를 적용하려면, take 그리고 컬럼을 원하는 순서로 바꾼 후에 새로운 변수를 선언하던가 아니면 원래의 변수명을 주어서 덮어씌우기를 한다.

인덱스 순서 바꾸기
take() 사용: take의 인자로 던지는 수는 파이썬과 같이 정수로 색인하여 순서를 바꾼다. 그래서 인덱스의 첫 번째는 파이썬과 같이 0부터 시작한다.

컬럼 순서 바꾸기

profile
데이터 굽는 타자기

0개의 댓글