데이터 스쿨 4주차 학습내용 정리 - 6

호진·2023년 11월 25일
0

AI_스쿨

목록 보기
15/51
post-thumbnail

판다스(Pandas)

판다스(Pandas)는 파이썬에서 데이터 분석을 위한 라이브러리입니다. 판다스는 다양한 데이터 구조를 제공하며, 다양한 데이터 처리 기능을 제공합니다.

import pandas as pd

판다스 라이브러리를 불러옴

pd.read_csv()

pd.read_csv

pd.read_csv() 함수는 CSV 파일을 읽어 판다스 DataFrame으로 변환하는 함수입니다.

df = pd.read_csv("data.csv")

data.csv 파일을 읽어 판다스 DataFrame으로 변환합니다.

head(), tail()

head()
tail()

head() 함수는 DataFrame의 처음 몇 개 행을 반환하는 함수입니다.

tail() 함수는 DataFrame의 마지막 몇 개 행을 반환하는 함수입니다.

info()

info() 함수는 DataFrame의 정보를 요약하여 반환하는 함수입니다.

df.info()

DataFrame의 열 이름, 데이터 타입, null 값의 개수 등을 반환합니다.

index, columns

index 속성은 DataFrame의 인덱스를 반환합니다.

df.index

DataFrame의 인덱스를 반환합니다.

columns 속성은 DataFrame의 열 이름을 반환합니다.

df.columns

DataFrame의 열 이름을 반환합니다.

rename()

rename() 메서드는 DataFrame의 열 이름을 바꾸는 메서드입니다.

Series

Series는 1차원 배열과 유사한 데이터 구조입니다.

s = pd.Series([1, 2, 3, 4, 5])

위 코드는 1차원 배열을 Series로 변환합니다.

date_range()

date_range() 함수는 날짜 범위를 생성하는 함수입니다.

pd.date_range("2023-07-01", "2023-07-31")

2023년 7월 1일부터 7월 31일까지의 날짜 범위를 생성합니다.

describe()

describe() 메서드는 DataFrame의 통계 정보를 요약하여 반환하는 메서드입니다.

df.describe()

DataFrame의 평균, 표준편차, 최솟값, 최댓값 등의 통계 정보를 반환합니다.

profile
중요한 건 꺽였는데도 그냥 하는 마음

0개의 댓글