1-1 코드카타 및 내용 정리
1-2 파이썬 과제 및 4회차 실습
#1. 데이터 불러오기 pd.read_csv()을 활용 #테이블의 행과 열 개수를 확인하기 df.shape #테이블의 처음 5줄을 확인하기 df.head() #테이블 마지막 5줄을 확인하기 df.tail()
#2. 결측치 처리 #각 컬럼별 결측치 개수를 구하기 pd.isnull().sum() #결측치가 있는 행을 모두 제거 pd.dropna(inplace=True)
2-1 파이썬 과제 및 4회차 실습
#3. 조건에 맞는 데이터 추출하기 #데이터프레임의 Destination 컬럼 기준 price의 평균값과 중앙값을 동시에 구해주세요. df.groupby('Destination')['Price'].agg(['mean','median']), 1) #데이터프레임의 Airline, Total_Stops 기준 Route 컬럼을 중복값 없이 추출해주시고, 인덱스를 재정렬해주세요. 이를 df2 라는 dataframe 으로 받아주세요. df2 = df.groupby(['Airline','Total_Stops'])['Route'].nunique().reset_index()
#4. 조건에 맞는 데이터 추출하기2 #피벗테이블을 구현하여 출발지와 도착지를 기준으로 Airline을 카운트해주세요. pd.pivot_table(df, index=['Source','Destination'], values='Airline' , aggfunc='count').sort_values(by='Airline', ascending=False) #Airline 컬럼이 Air India 이고, Price 컬럼이 7000 이상인 데이터를 필터링해주세요. mask = (df.Airline == 'Air India') & (df.Price >= 7000) df[mask]
2-2 ADsP 12~14강 강의
내용 정리
1. https://velog.io/@dav74/ADsP-12%EA%B0%95-%ED%9A%8C%EA%B7%80%EB%B6%84%EC%84%9D-%EC%8B%9C%EA%B3%84%EC%97%B4-%EB%B6%84%EC%84%9D
2. https://velog.io/@dav74/ADsP-13%EA%B0%95-%EC%A0%95%ED%98%95-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A7%88%EC%9D%B4%EB%8B%9D-01
3. https://velog.io/@dav74/ADsP-14%EA%B0%95-%EC%A0%95%ED%98%95-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A7%88%EC%9D%B4%EB%8B%9D-02