Pandas 전처리 연습(2)

SeongGyun Hong·2024년 10월 28일

빅데이터 분석기사

목록 보기
2/16

1. dataframe에서의 & |의 활용

import pandas as pd

# 예시 데이터프레임 생성
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David'],
    'age': [25, 30, 35, 40],
    'salary': [50000, 60000, 70000, 80000]
}
df = pd.DataFrame(data)

# AND 연산자 사용: 나이가 30세 이상이고 연봉이 70000 이상인 사람 필터링
and_filter = df[(df['age'] >= 30) & (df['salary'] >= 70000)]

# OR 연산자 사용: 나이가 30세 이상이거나 연봉이 70000 이상인 사람 필터링
or_filter = df[(df['age'] >= 30) | (df['salary'] >= 70000)]

print("AND Filter:")
print(and_filter)

print("\nOR Filter:")
print(or_filter)

꼭 그 안에 () 괄호 빼먹지 말자...
그리고 datetime의 경우
시, 분, 초를 : 으로 표기함. 이것도 뺴먹지 말자...

2. diff()

diff 함수는 데이터프레임이나 시리즈에서 각 요소와 그 이전 요소 간의 차이를 계산한다.
기본적으로 diff(1)은 현재 값과 이전 값의 차이를 계산함.

위와 같이 출력되는 행들은
이전 행과의 차이가 5분 이하 또는 20분 이상인 것.

profile
헤매는 만큼 자기 땅이다.

0개의 댓글