chapter2

이다·2022년 10월 16일

[누구나 python] 너도 데이터 가지고 놀 수 있어!

  • 민형기 지음

pandas

pip install pandas

  • 자유로운 데이터 변환
  • 엑셀처럼 활용도가 높은 데이터 구조 변환
  • pivot table과 같이 데이터 구조에 대한 변환
  • 날짜형 데이터 (시계형)
    	> data_range 함수 사용 : 날짜 생성
  • 다양한 필터링
  • 누락된 데이터의 처리 기능

part1.

  • random 변수를 통해 dataFrame 생성 values : random 변수/ index : 행 / columns : 열 /
    	> df = pd.DataFrame()
  • 정렬 기능 등의 기초 활용 함수
    	> df.describe(), df.sort_values()
  • DataFrame의 slice 기능, 범위 지정
    	> df.loc() / df.iloc()
  • DataFrame 내에서의 조건문 사용
  • 행과 열의 변경
    	> df = pd.DataFrame()

part2.

  • 서울 열린 데이터 관장

  • https://data.seoul.go.kr/

  • 서울시 청소년 정신건강 통계 다운로드 > excel

  • 시점 2021년 지정 후 통계표 조회

  • 다운로드 > xls 파일

pip3 install xlrd
엑셀 파일 사용 라이브러리 : .xsl (.xslx 안됨)
error : There was an error checking the latest version of pip
python -m pip install --upgrade pip

※ 책의 데이터 내용과 변경됨 > 응답 부분을 남학생 여학생 비율로 변경함

Matplot 기초

  • 설치

    python -m pip install -U matplotlib

  • matplot에서 한글 표기
    from matplotlib import font_manager, rc

    plt.rcParams['axes.unicode_minus'] = False   	

    #한글 변경 시 마이너스 기호 깨짐

    f_path = "C:/Windows/Fonts/malgun.ttf"
    font_name = font_manager.FontProperties(fname=f_path).get_name()
    rc('font', family = font_name)

0개의 댓글