[pandas] 두 장으로 판다스 뽀개기_정리(1)

JIEUN KANG·2020년 11월 7일
0

시리즈일때와 데이터프레임 칼럼을 여러가지 가져올 때

시리즈 = df["확진일"]
데이터프레임에 = df[["확진일", "확진일자"]] 

datetime에서 원하는 월, 주 뽑아보기

df['특정칼럼'].dt.month #월
df['특정칼럼'].dt.week #주

map과 lambda를 쓰는 예제

  • 가장 어려운 부분 중 하나인데, 데이터의 세부 사항을 바꾸기 위한 방법으로 생각하고 있음
  • map(f, iterable)은 함수(f)와 반복 가능한(iterable) 자료형을 입력으로 받는다. map은 입력받은 자료형의 각 요소를 함수 f가 수행한 결과를 묶어서 돌려주는 함수이다.
  • 내 생각: map은 그냥 함수를 받아주는 함수다!!
  • lambda는 함수를 만드는데, 아주 간단하게 쓰고 버리는 함수! def처럼 번거롭지 않다.

-> 즉 map + lambda = 데이터를 빠르게 처리하고 싶을때 쓸 수 있는 가장 단순한 표현!

df["확진일자"].astype(str).map(lambda x:x) #그냥 x의 값은 x대로 돌려준 상태

0 2020-06-30
1 2020-06-30
2 2020-06-30
3 2020-06-30
4 2020-06-30
...
1316 2020-01-31
1317 2020-01-30
1318 2020-01-30
1319 2020-01-30
1320 2020-01-24

df["확진일자"].astype(str).map(lambda x : x[-5:]) #위의 식에서 맨끝에서 5번째 까지만 슬라이싱한 값을 보여줌!!
profile
가장 보통의 존재

0개의 댓글