Jupiter Notebook(Anaconda), Python3, Pandas, Matpotlib
다량의 빅데이터 분석이 가능(엑셀에서 다루기 어려운 용량의 파일 분석), 세밀한 시각화 가능, 다양한 패키지 툴 사용 가능
import pandas as pd
import matplotlib.pyplot as plt
pd.read_csv('파일의경로+파일의이름'
마지막 5개 보기
데이터명.tail(5)
기초통계 보기
데이터명 .describe()
성별 데이터 교집합, 데이터 수 확인
gender_range = set(chicken07['성별'])
print(gender_range, len(gender_range))
데이터 합치기
chicken_data = pd.concat([chicken07, chicken08, chicken09])
인텍스 재설정
chicken_data = chicken_data.reset_index(drop=True)
A요인(X축) 기준 B요인(Y축) 데이터 보기
sumof_calls_by__week = chicken_data.groupby('요일')['통화건수'].sum()
오름차순 정렬
sortedsum_of_calls_by__week = sum_of_calls_by_week.sort_values(ascending=True)
그래프 그리기
plt.figure(figsize=(8,5)) # 그래프의 사이즈
plt.bar(sum_of_calls_by_week.index, sum_of_calls_by_week) # bar 그래프에 x축, y축 값을 넣어줍니다.
plt.xlabel('서울 소재 구') # X축명 설정
plt.xticks(rotation = 45) # X축 요인명 기울여서 노출
plt.title('요일에 따른 치킨 주문량 합계') # 그래프의 제목
plt.show()
print('설정 되어 있는 폰트 사이즈 :', plt.rcParams['font.size'])
print('설정 되어 있는 폰트 글꼴 :', plt.rcParams['font.family'])
plt.rcParams['font.family'] = "Malgun Gothic"
Apple은 'AppleGothic', Windows는 'Malgun Gothic'을 추천