Pandas (5)

Tino-Kim·2022년 1월 4일

🥴 Pandas (5)

📌 Copy

원본 데이터를 유지시키고, 새로운 변수에 복사할 때 반드시 copy를 적어주기. 사용하지 않는다면, 둘다 같은 메모리 주소를 갖기 때문에 원본 데이터가 손상된다.
new_df = df.copy()
new_df
# hex(id(df)) ≠ hex(id(new_df))
# 메모리 주소가 다르기 때문에, 원본 데이터가 유지된다

📌 row, column 추가하기

💛 row 추가하기

dictionary 형태로 append 메소드를 이용해서 추가시켜주기.

ignore_index = True를 반드시 달아주기.

새로운 변수에 새롭게 할당해주기.

💛 column 추가하기

훨씬 쉽다. 원하는 칼럼을 만들어주고, 추가해주면 된다.

df["원하는 새로운 칼럼"] = "추가하고 싶은 값"
df
# 원하는 새로운 칼럼이 생기고, 그곳에 추가하고 싶은 값들이 들어간다
# 바꾸고 싶은 경우에는 행과 열을 잘 지정해서 값 변경한다
df[바꾸고 싶은 행, 바꾸고 싶은 열] = 바꾸고 싶은 값
df

📌 통계값 다루기

📌 데이터 프레임의 전반적인 모습을 알아보는 메소드들

df.info()
# 결측치 값이 몇 개인지 알 수 있다
df.describe()
# 산술적인 계산이 되는 경우만 출력된다
# std : 평균 값에서 얼마만큼 떨어져 있는지 알려주는 지표

📌 자주 쓰이는 통계값 메소드들

1. df["원하는 칼럼"].min()
2. df["원하는 칼럼"].max()
3. df["원하는 칼럼"].sum()
4. df["원하는 칼럼"].mean()
5. df["원하는 칼럼"].var()
6. df["원하는 칼럼"].std()
# 평균에서 얼마 만큼 떨어져 있는지 알려주는 지표이다
7. df["원하는 칼럼"].count()
8. df["원하는 칼럼"].median() # 중앙값
9. df["원하는 칼럼"].mode() # 최빈값

😀 마무리...

원본을 지키는 copy와 새로운 열과 행을 추가하는 방법, 그리고 통계값 다루는 방법을 알아봤다.
새로운 열을 추가하는 경우에는 3가지 순서가 있다.

1. append 메소드 + dictionary 이용하기.
2. ignore_index = True 를 꼭 적어주기.
3. 새로운 변수에 할당시켜주기.

Tino-Kim

알고리즘과 데이터 과학과 웹 개발을 공부하는 대학생

이전 포스트

Pandas (4)

다음 포스트