파이썬 데이터 분석 1주차 정리

Nana·2021년 11월 13일
0

Preview "Installing Anaconda"
: 아나콘다는 분석을 도와주는 '패키지매니징 플랫폼'이다.
: 개발에 필요한 도구들을 포함하고 있다.

"파이썬 라이브러리"
: 파이썬에서 관련있는 기능들의 묶음을 모듈, 모듈들의 묶음을 패키지, 패키지들의 묶음을 라이브러리라고 부른다. (패키지와 라이브러리는 많이들 혼용해서 쓰기도 한다)

  1. Python
    1) 자료형
  • 리스트 형
waiting_list = []  # 비어있는 리스트 만들기
waiting_list.append('이현호')  # 리스트에 문자열 데이터를 넣는다
print(waiting_list)
  • 딕셔너리 형
eng_kor_dict = {}  # 비어있는 딕셔너리 만들기

eng_kor_dict = {'apple': '사과', 'pear': '배'}
eng_kor_dict['apple']

# 딕셔너리에 추가하고 싶을 때
eng_kor_dict['banana'] = '바나나'
eng_kor_dict

리스트에 있는 데이터에 접근: list_name[0]
딕셔너레이 있는 데이터에 접근: dictionary_name["키값"]

  1. Pandas
    : 파이썬에서 사용되는 데이터 분석 라이브러리
# 판다스, 데이터 불러오기
import pandas as pd
chicken07 = pd.read_csv('./data/chicken_07.csv')

#데이터 합치기
chicken07 = pd.read_csv('./data/chicken_07.csv')
chicken08 = pd.read_csv('./data/chicken_08.csv')
chicken09 = pd.read_csv('./data/chicken_09.csv')

chicken_data = pd.concat([chicken07, chicken08, chicken09])

#합쳐진 데이터 인덱스 수정
chicken_data = chicken_data.reset_index(drop=True)
chicken_data
  1. Matplotlib
    : 파이썬에서 사용되는 시각화 라이브러리
#Matplotlib불러오기
import pandas as pd
import matplotlib.pyplot as plt

#한글 설정하기
plt.rcParams['font.family'] = "Malgun Gothic" / "AppleGothic"

#막대 그래프 그리기
sum_of_calls_by_week = chicken_data.groupby('요일')['통화건수'].sum()
sum_of_calls_by_week

plt.figure(figsize=(8,5)) # 그래프의 사이즈
plt.bar(sum_of_calls_by_week.index, sum_of_calls_by_week) # bar 그래프에 x축, y축 값을 넣어줍니다.
plt.xlabel('요일')
plt.ylabel('치킨 주문량 합계')
plt.xticks(rotation = 90)
plt.title('요일에 따른 치킨 주문량 합계') # 그래프의 제목
plt.show() # 그래프 그리기

profile
심리학적 데이터를 활용한 탐구를 즐기는 사람

0개의 댓글