✏️데이터 취업 스쿨 스터디 노트(EDA ②)

Cheon Bumin·2023년 12월 6일

Study Note✏️

목록 보기
10/17

12/5 Data Study to do

  • CCTV현황 데이터 읽기 (3강)
  • Pandas 기초 (Ch.2 서울시 CCTV 현황, 4-6강)
  • Pandas 데이터 합치기 (Ch.2 서울시 CCTV 현황, 4-6강)
  • matplotlib 기초 (Ch.2 서울시 CCTV 현황, 12-14강)
  • Pandas 피봇테이블 (Ch.3 서울시 범죄 현황, 3-4강)
  • python의 for문 (Ch.3 서울시 범죄 현황, 10-11강)
  • 자기소개서 필수문항 1-3번 작성

오늘 공부 요약짤...🥲


📌공부 내용

Pandas(클래스)

  • 판다스 호출

    • import pandas as pd : 판다스를 호출하고 pd로 명명
    • import numpy as np : numpy(수치해석적 함수)를 호출하고 np로 명명
  • Series : 판다스 데이터형을 구성하는 기본 형태

    • 칼럼 기준으로 한줄이 시리즈 데이터
  • date

    • 날짜를 출력하는 함수 (pd. date_range('년월일', periods = 기간)
    • 판다스 버전에 따라 출력되는 형태가 조금씩 다름
  • DataFrame

    • 판다스에서 가장 많이 사용되는 데이터형 (표데이터)
    • index와 columns를 지정해서 사용
  • 자료의 OOO을 확인하는 함수

    • 변수.head() : 자료의 앞 부분 데이터 5줄(괄호에 넣는 숫자만큼) 확인
    • 변수.values : 데이터형의 value 값을 확인
    • 변수.columns: 데이터형의 columns 값 확인
    • 변수.info() : 데이터형의 정보를 요약해서 출력 (인덱스, 칼럼 개수 등)
    • 변수.describe() : 데이터형의 통계적 정보를 확인 가능
  • 데이터 정렬함수 : sort_values(by='B', ascending=False)

    • by='B': B 칼럼을 기준으로
    • ascending=False : 내림차순으로 정렬
  • 특정 내용만 출력

    • 변수['칼럼'] : 해당 칼럼만 출력

    • 변수[n:m] : n부터 m-1 인덱스만 출력

      • 그러나 인덱스나 컬럼의 이름으로 slice하는 경우 끝을 포함▼
    • 데이터 슬라이스 : 변수.loc[:, ['칼럼, '칼럼']]

      • loc : location의 약자
        • : : 인덱스 전체
        • ['칼럼, '칼럼'] : 칼럼 어디에서 어디까지
    • 변수. iloc[인덱스] : 표시한 인덱스 행을 출력

    • 변수[변수['칼럼'] > 0] : 칼럼에서 0보다 큰 값만 출력해라

    • isin() : 특정 요소가 있는지 확인하는 함수

      • 변수['칼럼'].isin(['two', 'four']) : 칼럼에 two와 four가 있는지 확인해라
    • 특정 컬럼 제거 : del 변수['칼럼']
      - del 변수['칼럼']
      - 변수.drop(['칼럼'], axis = 0(가로) or 1(세로)

    • 데이터형에 함수 적용 : 변수.apply(함수.기능)
      ex) df.apply(np.cumsum) : 각 컬럼 누적합

  • 주피터 단축키

    • 셀타입 변경 시 esc 후 단축키 클릭 필요
  • 데이터 타입 바꾸기 : dtype = (바꿀 데이터 타입)

    • object : 파이썬 'str'과 동일한 의미
  • 함수/모듈의 사용법이 궁금할 때 : 함수() ← 괄호 안에서 shift + tab

  • 호출할 때 괄호를 쓸 때와 안 쓸 때

    • ex) head(), tail() : 판다스 객체 안, 메소드를 호출해야 할 때
    • ex) index, values, columns : 변수를 호출해야 할 때
🪄 사소하지만 알아두면 좋은 정보
- non-null : 빈 값이 없다는 뜻
- NaN : 데이터가 없다(Not a Number)

하루 공부를 마치며🔥

  • 오늘 학습 시간 : 3시간 36분
  • 같은 파이썬인데 주피터는 재미가 없다
  • 저녁에 먹은 불닭볶음면 때문에 죽을 것 같다
profile
포기만 하지 말자

0개의 댓글