[TIL]데이터 분석 부트캠프(4기) 15일차

Data_Student·2024년 10월 29일
0

TIL

목록 보기
15/34

[TIL]데이터 분석 부트캠프(4기) 15일차


0. 들어가며

  • 어제보다는 더 집중하면서 공부 실시!
  • 공부 계획 시간에 미스가 있어서 내용 정리에 많은 시간을 할애!
  • 그래서 시간이 부족하다고 느꼈기에 보다 구체적인 계획 수립이 필요!

1. 오전 일과

1-1 코드카타 및 내용 정리

내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-11-%EC%A1%B0%EA%B1%B4%EC%97%90-%EB%B6%80%ED%95%A9%ED%95%98%EB%8A%94-%EC%A4%91%EA%B3%A0%EA%B1%B0%EB%9E%98-%EB%8C%93%EA%B8%80-%EC%A1%B0%ED%9A%8C%ED%95%98%EA%B8%B0

  • 코드카타 1문제 풀이 완료
    • 문제에서 조건에 대해 이해 잘하기
    • 문제를 읽고 잘못 생각해서 WHERE절에 작성한 조건을 잘못 작성해서 오래 시간이 걸림
    • 오해한 이유 : 예시 결과문을 보고 조건 판단을 잘못함
    • 문제 난이도는 높은 편이 아니나 문제를 정확히 이해했는지 여부가 중요!
    • 파이썬 recursive을 참조하기!
    • 코드카타 다음 문제에서 recursive의 활용이 필요함
      recursive에 대해서 내용 확인 후 다시 문제 풀이하기!

1-2 파이썬 과제 및 4회차 실습

#1. 데이터 불러오기
  pd.read_csv()을 활용
#테이블의 행과 열 개수를 확인하기
  df.shape
#테이블의 처음 5줄을 확인하기
  df.head()
#테이블 마지막 5줄을 확인하기
  df.tail()
#2. 결측치 처리
#각 컬럼별 결측치 개수를 구하기
  pd.isnull().sum() 
#결측치가 있는 행을 모두 제거
  pd.dropna(inplace=True)

2. 오후 일과

2-1 파이썬 과제 및 4회차 실습

#3. 조건에 맞는 데이터 추출하기
#데이터프레임의 Destination 컬럼 기준 price의 평균값과 중앙값을 동시에 구해주세요.
  df.groupby('Destination')['Price'].agg(['mean','median']), 1)
#데이터프레임의 Airline, Total_Stops 기준 Route 컬럼을 중복값 없이 추출해주시고, 
 인덱스를 재정렬해주세요. 이를 df2 라는 dataframe 으로 받아주세요.
  df2 = df.groupby(['Airline','Total_Stops'])['Route'].nunique().reset_index()
#4. 조건에 맞는 데이터 추출하기2
#피벗테이블을 구현하여 출발지와 도착지를 기준으로 Airline을 카운트해주세요.
  pd.pivot_table(df, index=['Source','Destination'], values='Airline' , aggfunc='count').sort_values(by='Airline', ascending=False)
#Airline 컬럼이 Air India 이고, Price 컬럼이 7000 이상인 데이터를 필터링해주세요.
  mask = (df.Airline == 'Air India') & (df.Price >= 7000)
  df[mask]
  • 필수문제는 해결 완료
  • 도전 과제는 내일 도전 예정!

2-2 ADsP 12~14강 강의

내용 정리
1. https://velog.io/@dav74/ADsP-12%EA%B0%95-%ED%9A%8C%EA%B7%80%EB%B6%84%EC%84%9D-%EC%8B%9C%EA%B3%84%EC%97%B4-%EB%B6%84%EC%84%9D
2. https://velog.io/@dav74/ADsP-13%EA%B0%95-%EC%A0%95%ED%98%95-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A7%88%EC%9D%B4%EB%8B%9D-01
3. https://velog.io/@dav74/ADsP-14%EA%B0%95-%EC%A0%95%ED%98%95-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A7%88%EC%9D%B4%EB%8B%9D-02

  • ADsP 이론 강의 및 내용 정리 완료
    • 회귀분석 ~ 데이터 마이닝까지!
    • 세부 내용은 위 링크 참조!
    • 드디어 1회차 강의 완강!
    • 앞으로 문제풀이 위주 및 2회, 그 이상 반복하기!

3. 마치며

  • 생각보다 시간이 부족하다!
  • 오늘은 어제보다는 집중해서 한다고 했는데 내용 정리하는데 시간이 많이 소요되었다.
  • 그래서 시간이 부족하게 느껴졌다..!
  • 해야할 것들이 많으니 계획을 보다 세부적으로 수립하고, 자투리 시간 활용하기!
  • 드디어 ADsP 이론 강의 1회독 완료!

0개의 댓글