Pandas3_2

지두의 개발자 도전기·2025년 3월 12일

Pandas

목록 보기
4/9
post-thumbnail

유니버설 함수

넘파이를 적용한 abs()

  • abs() 함수는 절댓값을 반환하는 함수이며, 넘파이 배열에 적용하면 각 요소의 절댓값을 반환함.
  • 넘파이 배열을 사용하면 빠르고 효율적인 연산이 가능함.
  • 예제 코드:
    import numpy as np
    arr = np.array([-1, -2, 3, -4])
    print(np.abs(arr))
    #[1 2 3 4]
    

map() 메소드와 applymap() 메소드의 주의사항

  • map(): 시리즈 객체에 적용하여 각 요소를 변환함.
  • applymap(): 데이터프레임 객체에 적용하여 각 요소를 변환함.
  • 주의할 점:
    • map()은 시리즈에만 적용 가능하며, 데이터프레임에는 사용할 수 없음.
    • applymap()은 데이터프레임의 각 요소에 함수 적용 시 사용됨.
    • 예제 코드:
      import pandas as pd
      df = pd.DataFrame({'A': [-1, -2, 3], 'B': [4, -5, 6]})
      print(df.applymap(abs))
      
         A  B
      0  1  4
      1  2  5
      2  3  6
      

apply() 메소드

  • apply()는 행(axis=1) 또는 열(axis=0) 단위로 함수 적용 가능.
  • axis=1 또는 axis='columns'를 지정해야 하는 경우:
    • 행 방향으로 함수를 적용해야 할 때 axis=1 또는 axis='columns'를 지정해야 함.
    • 예제 코드:
      출력:
      ```python
      df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
      print(df.apply(np.sum, axis=1))
      
      ```
      
      ```
      0    5
      1    7
      2    9
      dtype: int64
      
      ```
      
      ---

정렬

sort_index() 메소드

  • 인덱스를 기준으로 정렬할 때 사용.
  • ascending=False: 내림차순 정렬.
  • axis=1을 지정해야 하는 경우:
    • 열 이름을 기준으로 정렬할 때 axis=1 또는 axis='columns'를 사용해야 함.
  • 예제 코드:
    df = pd.DataFrame({'A': [3, 1, 2]}, index=['c', 'a', 'b'])
    print(df.sort_index())
    
       A
    a  1
    b  2
    c  3
    

sort_values() 메소드

  • 특정 열을 기준으로 정렬할 때 사용.
  • by 키워드 인자를 이용해 정렬 기준 열을 지정해야 함.
  • 결측치 위치: 주로 NaN 값은 정렬 시 마지막에 위치함
  • 예제 코드:
    df = pd.DataFrame({'A': [3, 1, np.nan, 2], 'B': [4, 2, 3, 1]})
    print(df.sort_values(by='A'))
    
         A  B
    1  1.0  2
    3  2.0  1
    0  3.0  4
    2  NaN  3
    

행/열 삭제

drop() 메소드

  • 특정 행 또는 열을 삭제할 때 사용.
  • inplace=True 키워드 인자를 사용하면 원본 데이터프레임이 변경됨.

데이터프레임의 행 삭제

  • 특정 행을 삭제할 때 drop() 사용.
  • 예제 코드:
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    df = df.drop(index=1)
    print(df)
    
       A  B
    0  1  4
    2  3  6
    

데이터프레임의 열 삭제

  • axis=1 또는 axis='columns'를 지정해야 함.
  • 예제 코드:
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    df = df.drop(columns='A')
    print(df)
    
       B
    0  4
    1  5
    2  6
    

inplace=True 키워드 인자

  • drop() 사용 시 inplace=True를 설정하면 원본 데이터가 직접 변경됨.
  • 예제 코드:
df.drop(index=1, inplace=True)
print(df)
   A  B
0  1  4
2  3  6

0개의 댓글