판다스를 활용한 데이터 프레임 만들기

Plcb Archive·2024년 2월 5일
0

파이썬

목록 보기
16/22

판다스

판다스(Pandas)는 파이썬 데이터 분석에 필수적인 라이브러리로, 주로 데이터 조작과 분석을 위해 사용된다. 특히, 테이블 형태의 데이터를 쉽게 처리할 수 있는 데이터 프레임(DataFrame) 기능이 매우 유용하다.

데이터 프레임 만들기

먼저, 판다스 라이브러리를 임포트한다.

import pandas as pd

데이터 프레임 생성

데이터 프레임은 다양한 방식으로 생성할 수 있다. 여기서는 딕셔너리를 사용해 데이터 프레임을 만들어본다.

data = {
    '이름': ['홍길동', '김철수', '이영희'],
    '나이': [25, 32, 45],
    '성별': ['남', '남', '여']
}

df = pd.DataFrame(data)

이제 df 변수는 다음과 같은 데이터 프레임을 가진다.

이름나이성별
0홍길동25
1김철수32
2이영희45

데이터 프레임 기본 조작

데이터 조회

  • 특정 컬럼 조회하기
print(df['이름'])
  • 특정 행 조회하기
print(df.iloc[0])  # 첫 번째 행 조회

데이터 추가

  • 새로운 행 추가하기
df = df.append({'이름': '박지민', '나이': 28, '성별': '여'}, ignore_index=True)
  • 새로운 열 추가하기
df['거주지'] = ['서울', '부산', '대구', '광주']

데이터 삭제

  • 특정 행 삭제하기
df = df.drop(1)  # 1번 인덱스 행 삭제
  • 특정 열 삭제하기
df = df.drop(columns=['거주지'])

결과 확인

print(df)

판다스는 데이터 분석과 조작에 있어서 매우 강력한 도구이다. 복잡한 데이터를 쉽게 처리할 수 있으며, 다양한 데이터 소스에서 데이터를 읽고 쓸 수 있다는 장점이 있다.

0개의 댓글