[TIL]데이터 분석 부트캠프(4기) 30일차

Data_Student·2024년 11월 19일
0

TIL

목록 보기
30/54

[TIL]데이터 분석 부트캠프(4기) 30일차


0. 들어가며

  • 아침 루틴 일부 변경 완료!
  • 추가적으로 개선 필요!
  • 정해진 시간에 최대한 집중하기!!!

1. 오전 일과

1-1 코드카타 및 내용 정리

내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-37-Game-Play-Analysis-IV

  • 코드카타 1문제 풀이 완료
    • 문제를 잘 읽기..!
    • 문제 상에 처음 로그인한 일과 다음 날까지 연속접속한 player_id를 구하는 것인데
    • min() 함수를 활용하니 답 도출..!
    • 작은 부분에 대해서도

1-2 [통계학] 라이브 세션

  • 내용 정리는 오후에 진행하여 정리 링크는 하단에..!

2. 오후 일과

2-1 라이브 세션 복습 및 내용 정리

내용 정리 링크
https://velog.io/@dav74/%ED%86%B5%EA%B3%84%ED%95%99-%ED%86%B5%EA%B3%84%EC%95%BC-%EB%86%80%EC%9E%90-04

  • 회귀 분석
    • 선형회귀분석
    • 로지스틱회귀분석
    • 3단계를 통한 분석 진행
      • 독립변수, 종속변수 설정 + 가설 설정
      • 데이터 경향성 확인
      • 정합성 검증 & 결과 해석

2-2 아티클 스터디

내용 정리 링크
https://velog.io/@dav74/%EC%95%84%ED%8B%B0%ED%81%B4-%EC%8A%A4%ED%84%B0%EB%94%94-%EA%B8%B0%ED%9A%8D%EC%9E%90%EA%B0%80-%EC%95%8C%EC%95%84%EC%95%BC-%ED%95%A0-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EB%8F%84%EA%B5%AC%EC%99%80-%ED%99%9C%EC%9A%A9%EB%B2%95

  • 데이터 분석 도구는 '의사결정'에 도움을 주는 도구로서 활용하고,
    기획자로서 데이터 분석 도구를 통해 올바른 의사결정하는 것이 중요하다!

2-3 Python Basic 3회차 라이브세션

  • While 문
    • 조건문이 참이면 계속해서 반복 실행 ( 무한 루프에 걸릴 수 있으니 주의! )
    • While문 강제로 빠져나가기 → break
    • continue 문
      • 조건이 True ( or False) 일 경우 단계를 넘기고 반복문의 시작으로 되돌아가기!
    • While문 vs For 문
    • While - 조건에 따른 반복 횟수가 동적으로 결정, 조건을 미충족시 무한 루프
    • For - 고정된 반복 구조 수행, 주어진 반복 횟수가 끝나면 자동 종료
  • Pandas의 Series, DataFrame, 데이터 로드
    • Series와 DataFrame이라는 두 가지 기본 데이터 구조를 제공하여 저장 및 조작할 수 있는 라이브러리
    • Series : 1차원 배열
    • DataFrame : 2차원 데이터 구조 ( Excel 데이터 시트 ) 와 같다
      • index, columns, values, dtypes, T, shape 등을 통한 데이터 기초 분석 가능
      • ()의 여부 : 있으면 - 함수 실행 / 없으면 - 함수 참조
    • pd.read_csv('파일명') 으로 데이터 불러오기!
      • encoding 형식 ( euc-kr, utf-8, cp949, utf-8-sig 등 )
    • DataFrame 메서드
      • 조회 및 탐색 : head(), tail(), describe(), info()
      • 데이터 선택 및 필터링 : loc[], iloc[], query(), filter()
      • 데이터 조작 및 변형 : append(), drop(), rename(), melt(), pivot()
      • 정렬 및 그룹화 : sort_values() sort_index(), groupby()
      • 결합 및 병합 : concat(), merge(), join()
      • 결측치 처리 : isnull(), notnull(), fillna(), dropna()
      • 통계 및 계산 : mean(), median(), sum(), std(), corr()
      • 변형 및 재구성 : pivot(), pivot_table(), stack(), unstack()
      • 시계열 데이터 처리 : resample(), asfreq(), rolling()
    • loc vs iloc의 차이
      • loc : 행과 열의 라벨(이름)을 사용하여 데이터를 선택
      • iloc : 행과 열의 정수 위치를 사용하여 데이터를 선택

3. 마치며

  • 학습 주차로 통계와 머신러닝과 관련 내용에 대해 반복해서 학습 중..!
  • 분명 계속 들었던 내용들이라는 느낌을 받고 있음..!
    그러니 개념을 확실히 하여 잊지말고 정확하게 숙지할 필요가 있다!!
  • 그리고 금요일 QCC를 대비하여 SQL 코드카타 복습도 꾸준히 하기!

0개의 댓글