판다스(Pandas)는 파이썬 데이터 분석에 필수적인 라이브러리로, 주로 데이터 조작과 분석을 위해 사용된다. 특히, 테이블 형태의 데이터를 쉽게 처리할 수 있는 데이터 프레임(DataFrame) 기능이 매우 유용하다.
먼저, 판다스 라이브러리를 임포트한다.
import pandas as pd
데이터 프레임은 다양한 방식으로 생성할 수 있다. 여기서는 딕셔너리를 사용해 데이터 프레임을 만들어본다.
data = {
'이름': ['홍길동', '김철수', '이영희'],
'나이': [25, 32, 45],
'성별': ['남', '남', '여']
}
df = pd.DataFrame(data)
이제 df
변수는 다음과 같은 데이터 프레임을 가진다.
이름 | 나이 | 성별 | |
---|---|---|---|
0 | 홍길동 | 25 | 남 |
1 | 김철수 | 32 | 남 |
2 | 이영희 | 45 | 여 |
print(df['이름'])
print(df.iloc[0]) # 첫 번째 행 조회
df = df.append({'이름': '박지민', '나이': 28, '성별': '여'}, ignore_index=True)
df['거주지'] = ['서울', '부산', '대구', '광주']
df = df.drop(1) # 1번 인덱스 행 삭제
df = df.drop(columns=['거주지'])
print(df)
판다스는 데이터 분석과 조작에 있어서 매우 강력한 도구이다. 복잡한 데이터를 쉽게 처리할 수 있으며, 다양한 데이터 소스에서 데이터를 읽고 쓸 수 있다는 장점이 있다.