원본 데이터를 유지시키고, 새로운 변수에 복사할 때 반드시 copy를 적어주기. 사용하지 않는다면, 둘다 같은 메모리 주소를 갖기 때문에 원본 데이터가 손상된다.
new_df = df.copy() new_df # hex(id(df)) ≠ hex(id(new_df)) # 메모리 주소가 다르기 때문에, 원본 데이터가 유지된다
- dictionary 형태로 append 메소드를 이용해서 추가시켜주기.
- ignore_index = True를 반드시 달아주기.
- 새로운 변수에 새롭게 할당해주기.
훨씬 쉽다. 원하는 칼럼을 만들어주고, 추가해주면 된다.
df["원하는 새로운 칼럼"] = "추가하고 싶은 값" df # 원하는 새로운 칼럼이 생기고, 그곳에 추가하고 싶은 값들이 들어간다 # 바꾸고 싶은 경우에는 행과 열을 잘 지정해서 값 변경한다 df[바꾸고 싶은 행, 바꾸고 싶은 열] = 바꾸고 싶은 값 df
📌 데이터 프레임의 전반적인 모습을 알아보는 메소드들
df.info() # 결측치 값이 몇 개인지 알 수 있다 df.describe() # 산술적인 계산이 되는 경우만 출력된다 # std : 평균 값에서 얼마만큼 떨어져 있는지 알려주는 지표
📌 자주 쓰이는 통계값 메소드들
1. df["원하는 칼럼"].min() 2. df["원하는 칼럼"].max() 3. df["원하는 칼럼"].sum() 4. df["원하는 칼럼"].mean() 5. df["원하는 칼럼"].var() 6. df["원하는 칼럼"].std() # 평균에서 얼마 만큼 떨어져 있는지 알려주는 지표이다 7. df["원하는 칼럼"].count() 8. df["원하는 칼럼"].median() # 중앙값 9. df["원하는 칼럼"].mode() # 최빈값
원본을 지키는 copy와 새로운 열과 행을 추가하는 방법, 그리고 통계값 다루는 방법을 알아봤다.
새로운 열을 추가하는 경우에는 3가지 순서가 있다.
1. append 메소드 + dictionary 이용하기.
2. ignore_index = True 를 꼭 적어주기.
3. 새로운 변수에 할당시켜주기.