[TIL]데이터 분석 부트캠프(4기) 15일차

Data_Student·2024년 10월 29일

15일차 TIL 내일배움캠프 데이터 분석 부트캠프 스파르타코딩

TIL

목록 보기

15/54

[TIL]데이터 분석 부트캠프(4기) 15일차

0. 들어가며

어제보다는 더 집중하면서 공부 실시!
공부 계획 시간에 미스가 있어서 내용 정리에 많은 시간을 할애!
그래서 시간이 부족하다고 느꼈기에 보다 구체적인 계획 수립이 필요!

1. 오전 일과

1-1 코드카타 및 내용 정리

내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-11-%EC%A1%B0%EA%B1%B4%EC%97%90-%EB%B6%80%ED%95%A9%ED%95%98%EB%8A%94-%EC%A4%91%EA%B3%A0%EA%B1%B0%EB%9E%98-%EB%8C%93%EA%B8%80-%EC%A1%B0%ED%9A%8C%ED%95%98%EA%B8%B0

코드카타 1문제 풀이 완료
- 문제에서 조건에 대해 이해 잘하기
- 문제를 읽고 잘못 생각해서 WHERE절에 작성한 조건을 잘못 작성해서 오래 시간이 걸림
- 오해한 이유 : 예시 결과문을 보고 조건 판단을 잘못함
- 문제 난이도는 높은 편이 아니나 문제를 정확히 이해했는지 여부가 중요!
- 파이썬 recursive을 참조하기!
- 코드카타 다음 문제에서 recursive의 활용이 필요함
  recursive에 대해서 내용 확인 후 다시 문제 풀이하기!

1-2 파이썬 과제 및 4회차 실습

#1. 데이터 불러오기
  pd.read_csv()을 활용
#테이블의 행과 열 개수를 확인하기
  df.shape
#테이블의 처음 5줄을 확인하기
  df.head()
#테이블 마지막 5줄을 확인하기
  df.tail()

#2. 결측치 처리
#각 컬럼별 결측치 개수를 구하기
  pd.isnull().sum() 
#결측치가 있는 행을 모두 제거
  pd.dropna(inplace=True)

2. 오후 일과

2-1 파이썬 과제 및 4회차 실습

#3. 조건에 맞는 데이터 추출하기
#데이터프레임의 Destination 컬럼 기준 price의 평균값과 중앙값을 동시에 구해주세요.
  df.groupby('Destination')['Price'].agg(['mean','median']), 1)
#데이터프레임의 Airline, Total_Stops 기준 Route 컬럼을 중복값 없이 추출해주시고, 
 인덱스를 재정렬해주세요. 이를 df2 라는 dataframe 으로 받아주세요.
  df2 = df.groupby(['Airline','Total_Stops'])['Route'].nunique().reset_index()

#4. 조건에 맞는 데이터 추출하기2
#피벗테이블을 구현하여 출발지와 도착지를 기준으로 Airline을 카운트해주세요.
  pd.pivot_table(df, index=['Source','Destination'], values='Airline' , aggfunc='count').sort_values(by='Airline', ascending=False)
#Airline 컬럼이 Air India 이고, Price 컬럼이 7000 이상인 데이터를 필터링해주세요.
  mask = (df.Airline == 'Air India') & (df.Price >= 7000)
  df[mask]

필수문제는 해결 완료
도전 과제는 내일 도전 예정!

2-2 ADsP 12~14강 강의

내용 정리
1. https://velog.io/@dav74/ADsP-12%EA%B0%95-%ED%9A%8C%EA%B7%80%EB%B6%84%EC%84%9D-%EC%8B%9C%EA%B3%84%EC%97%B4-%EB%B6%84%EC%84%9D
2. https://velog.io/@dav74/ADsP-13%EA%B0%95-%EC%A0%95%ED%98%95-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A7%88%EC%9D%B4%EB%8B%9D-01
3. https://velog.io/@dav74/ADsP-14%EA%B0%95-%EC%A0%95%ED%98%95-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A7%88%EC%9D%B4%EB%8B%9D-02

ADsP 이론 강의 및 내용 정리 완료
- 회귀분석 ~ 데이터 마이닝까지!
- 세부 내용은 위 링크 참조!
- 드디어 1회차 강의 완강!
- 앞으로 문제풀이 위주 및 2회, 그 이상 반복하기!

3. 마치며

생각보다 시간이 부족하다!
오늘은 어제보다는 집중해서 한다고 했는데 내용 정리하는데 시간이 많이 소요되었다.
그래서 시간이 부족하게 느껴졌다..!
해야할 것들이 많으니 계획을 보다 세부적으로 수립하고, 자투리 시간 활용하기!
드디어 ADsP 이론 강의 1회독 완료!

Data_Student

이전 포스트

[TIL]데이터 분석 부트캠프(4기) 14일차

다음 포스트

[TIL]데이터 분석 부트캠프(4기) 15일차

TIL

[TIL]데이터 분석 부트캠프(4기) 15일차

0. 들어가며

1. 오전 일과

2. 오후 일과

3. 마치며

[TIL]데이터 분석 부트캠프(4기) 14일차

[TIL]데이터 분석 부트캠프(4기) 16일차

0개의 댓글

관련 채용 정보