Jupyter Notebook을 통한 pandas 시작

gaebokchi·2021년 2월 4일

데이터분석

목록 보기

2/5

# Pandas의 Dataframe을 생성
names = ['Bob','Jessica','Mary','John','Mel']
births = [968, 155, 77, 578, 973]
custom = [1, 5, 25, 13, 23232]

BabyDataSet = list(zip(names,births)) #zip은 두 배열을 한 쌍으로 묶어줌
df = pd.DataFrame(data = BabyDataSet, columns=['Names', 'Births'])

# pandas 형태의 데이터프레임이므로 행과 열의 형태로 나타남
df.head()

# 데이터프레임의 열 타입 정보를 출력
print(df.dtypes)
print("-----------")

# 데이터프레임의 형태 정보
print(df.index)
print("-----------")

# 데이터프레임의 열 정보
print(df.columns)

# 데이터프레임의 하나의 열을 선택
df['Names']

# 0~3 번째 인덱스를 선택 (행)
df[0:3]

# Births 열이 100보다 큰 데이터를 선택
df[df['Births'] > 100].head(2) # .head(2) 의미 -> 상위 두개의 행만 받겠다

# 데이터프레임에서의 평균값을 계산
df.mean() # 평균 계산 가능한 column이 birth 밖에 없기 때문에 알아서 births 평균 값 반환

# 여러 연산에 대한 결과
df.describe()

gaebokchi

이전 포스트

Anaconda 설치 및 가상환경 구축

다음 포스트

Jupyter Notebook을 통한 pandas 시작

데이터분석

Anaconda 설치 및 가상환경 구축

Jupyter Notebook을 통한 Numpy 시작

0개의 댓글