TIL(2024-05-13)

JayJay Choi·2024년 5월 13일
0

TIL

목록 보기
24/61

한주를 시작하는 왕왕초보 데이터분석가

Today Goal

✅ 파이썬 81~100까지 풀기 & 오답⭕

✅ SQL 코드카타 2문제풀기 & 오답⭕

✅ 데이터 전처리 & 시각화 숙제⭕

✅ 7시에 데이터분석 라이브 세션 ⭕

Today I Learn

💡SQL

✔1683. Invalid Tweets
✅ 오답노트 쿼리문

💡Python 300제

✔따로 오답할 것은 없었음.

💡알게 된것

  • Categorical함수를 사용하면 카테고리가 몇 개 있는지를 알려줄 뿐만 아니라 카테고리에 존재하는지 않는 것들을 집어넣을 경우 에러가 뜨게 함

    • transpose =원하는 행열 형태로 변경한다.
      • axis = 0 행방향 (df.sort_index(axis = 0. ascending = False)내림 차순
      • axis = 1 열방향
  • 가능한 판다스를 사용하여 추축하는 것이 좋음

  • 데이터 프레임? 시리즈?

    • 데이터 프레임 : 라벨링 된 축 (행 및 열)을 가진 크기 조정 가능한 이차원 표 형태의 데이터 구조
    • 시리즈 : 판다스에서 1차원 데이터를 다루기 위한 기본 자료형이다. 물론 파이썬에는 리스트라는 1차원 배열 형태의 자료형이 이미 기본적으로 제공되고 있긴 하다. 시리즈가 리스트와 다른 점은 인덱스(index), 즉 자료값에 대한 명칭 붙어 있다는 것이다
  1. (), []. {} : 각각 언제 사용하는지?

() : 함수(매서드), 튜플

{} : 딕셔너리,포멧팅

[] : 리스트(series, DataFrame), 인덱싱,슬라이싱

  1. index=date 라고 했을 때 어떤 기준으로 인덱스가 지정되는지

위에서 인덱스가 될 날짜를 dates로 지정해서 매개변수로 할당한 경우.

  • Pandas의 series와 Numpy array와 list의 공통점과 차이점에 대해서 알고 싶습니다

1. series는 인덱스 명을 지정할 수 있고, 경우에 따라 문자열로 인덱싱이 가능하다는 점에서 딕셔너리와 유사. 

2. array는 고차원으로 갈수록 메모리를 덜 잡아먹고 수학적 연산이 리스트에 비해 쉽다는 차이가 있다

How was it?

✔ 오늘의 내 상태는.. 메롱이었다.

✔ 공부가 오늘은 너무 힘든거 같다...

profile
차근차근 열심히 따라가보는 왕초보의 기록들!

0개의 댓글