[Pandas] 데이터 조건 필터링

hugingstar·2023년 10월 10일

DevOps

목록 보기

4/14

상황에 따라서 쿼리보다 판다스나 가공툴로 데이터 처리하는 게 빠를 때가 있다. 이번 글에서는 csv 파일을 읽고, 데이터 프레임을 실행했다. 데이터를 가공하는 방법을 설명한다.

df =pd.read_csv('*.csv')

df_sub = df.loc[:, 'col_name']

df.loc[df['col_name'] <= 100, 'col_name2'] = 3

df.at['2023-01-01 00:00:00', 'col_name'] = 0

예시 : col_name 컬럼의 행 값이 50 미만이면서 col_name2 컬럼의 모든 행의 값이 200을 초과하는 경우에 col_name3은 1 값을 넣어준다.
활용 : 규칙기반 고장진단할 때 사용하면 여러 조건을 고려한 고장 규칙을 만들 수 있다.

df.loc[(df['col_name'] < 50) & (df['col_name2'] > 200), "col_name3"] = 1

    data.loc[data["label1"] <= 0, ["feature1", "feature2", "feature3"]] = data[target_label]