학습내용 정리 - 10주차

박무연·2023년 3월 11일
0
post-thumbnail

잠깐만..

  • 9주차, 10주차 통계 태블로를 공부하면서 정리하기에는 조금 난애(?) 하기도 하고 약간 공부하는데 풀렸다..
  • 다음주 부터는 다시 SQL, 관련 책들 읽으면서 잘 준비해야겠다
  • 이번주 파이썬, 태블로, SQL 공부하면서 정리해 둘 것만 간단히 작성하자

Python

- df.info() 가 안보일때

df.info(verbose=Truem show_counts=True)

- 컬럼 순서정리

  • 컬럼 순서를 정리할 일이 없었는데 이번에 알았으니 기억은 해두자
df = df[[column1 , column2, column3, ....]]
  • 컬럼명을 배열 해주면 된다!

- 결측치 데이터 시각화

import smissingno as msno

msno.matrix(df)
plt.show()
  • 결측치 부분이 흰색으로 보인다
  • 흰색 부분이 많으면 결측치가 많은 컬럼이라고 보면 된다!

- value_counts()

  • 활용성이 많은 메서드인데 잘 사용하는방법이 익숙치 않다(?)

- Series to DataFrame

  • to_frame() 은 너무나 유명
  • Series.reset_index() 하면 인덱스가 생기변서 DataFrame 으로 변환

- mataplotlib

  • 공식 문서를 따르자!
fig, ax = plt.subplots(figsize=(15,6))

sns.countplot(palette = ~~~~) 
  • palette로 sns 효과를 낼 수 있다

  • sns 안에서 order!
    - order= 하면 원하는 컬럼으로 정렬 가능!

  • pie 차트를 깔끔하게
    - 공식 문서를 보고 깔끔하게 정리하자!

  • stacked=True

df.sort_values(by =columns).plot(kind='barh', stacked=True, figsize=(18,10), color=sns.color_palette('RdYlGn',9))

- 차트 레이블 달아주기

ax.bar_label(ax.containers[0]) 
print(ax.containers) # 바 개수
  • labels : 원하는 라벨 작성 가능
  • fmt : 소수점 자리 지정
  • label_type : center(그래프 중앙), edge(default)
  • padding : edge로 부터 얼마나 떨어 뜨릴 수 있나

- div.(~~)

  • a.div(b)
  • a : 분자 , b : 분모
  • 이것도 잘 쓰기가 쉽지 않다

Tableau

- 얘도 어떻게 정리해야할지 몰라서 일단 그냥 막 적었다

- 계속 추가해나가야 할 듯 싶다

- 차원 vs 측정값

  • 측정값 : 숫자 (#) 형태를 띄고 이씅ㅁ
  • 차원 : 조건을 쪼개서 보는 것
  • label : 범위를 조정해 테이블, 패널 등등.. 으로 조정해 줄 수 있다.
    하이라이트, 하이라이트를 추가해 볼 수 있음

-연속형 vs 불연속형

  • (차원)파란색 : 불연속, 분절 된 데이터
  • 그라데이션 : 연속형 (불연속형과 비슷한 색상으로 변환 가능)

서식

  • 축 : 그래프의 축을 의미

  • 패널 : 뷰안의 막대 변경

  • 원(단위) 표현을 하고 싶다면 ?
    - 패널 > 숫자 > 접두사 추가

  • 막대차트
    - 범주 데이터 비교

  • 라인 차트
    - 시간별 추세 확인날짜 형식

  • 날짜
    - 위 > 불연속 , 아래 > 연속

  • 연속형, 불연속형
    - 불연속형인 경우 년단위로 끊긴다?

  • 파이차트
    - 배열도 정리 가능 색상을 먹인 측정값에 정렬을 누룬다

  • 도넛 차트
    - 이중축기능, 두개의 원을 만들어 두고(열 컬럼에) 하나는 원하는 값을 먹여준다. 전체 총 매출정보는 합친 하얀 원에 넣는다

  • 맵 차트
    - 시도 차원에서 지리적 역할을 선택한다.

  • 각각 색상 분절 : 별도의 범례 선택

  • 날짜 필터
    - 굳이 매개변수가 필요 없다. 필터를 걸어주고 전체 시트에 적용해주면 깔끔하게 된다

SQL

- Python to SQL

  • f'' 쓰지말자, 많이 꼬인다,,
  • 파이썬에서 쿼리문을 작성할때 '\' 도 많은 문제가 생긴다
  • 다음에는 """ """ 사용해보자

- 기타

  • 왜 굳이 SQL을 쓰는지 조금 의문이였는데 이번 과제를 하면서 하나 깨달은게 있다.
  • 조금 복잡한 형태의 테이블을 만들때 SQL이 훨씬 편하다!
  • 가령 여러가지 컬럼 값(?) Value 값(?) 을 뽑아내야 할때 pivot_table은 다소 불편한데 SQL 쉽다!
  • with ~ as 문을 조금 봐야겠다..
profile
Easy day!

0개의 댓글