
9/12 5, 6세션
head(n) : 상위 n개 데이터 확인tail(n) : 하위 n개 데이터 확인shape : 데이터프레임 크기. (rows, cols) 튜플 형태 반환index : 인덱스 정보 확인 RangeIndex(start=0, stop=244, step=1) 로 반환values : 값 정보 확인. 배열로 반환columns : 열 정보 확인. Index(['total_bill', 'tip', 'sex', 'smoker', 'day', 'time', 'size'], dtype='object') 로 반환dtypes : 열 자료형 확인. (int64 / float64 / object 등)info() : 열에 대한 상세한 정보 확인 (null값 개수 확인, 열 자료형, 행 및 열 개수 등)describe() : 기술통계정보 확인sort_values(by='열이름') 메서드ascending=True : 오름차순 (기본값)ascending=False : 내림차순# 열1 로 내림차순 하고, 같은 내용이 있다면 열2로 내림차순 한다.
데이터프레임.sort_values(['열1', '열2'], ascending=False)
# 열1 로 내림차순 하고, 같은 내용이 있다면 열2로 올림차순 한다.
데이터프레임.sort_values(['열1', '열2'], ascending=[False, True])
데이터프레임[열이름].unique() 메서드# day 열 고윳값 확인
> tip['day']
--> 시리즈 형으로 반환함.
> tip[['day']]
--> 데이터프레임으로 반환함. 여러개가 될 수 있다는 의지를 보여줌!
> tip['day'].unique()
array(['Sun', 'Sat', 'Thur', 'Fri'], dtype=object) # 고유값의 결과는 리스트
TIP! 시리즈 (Series)
데이터프레임과 비슷하나, 열이 1개임
데이터프레임[열이름].value_counts() 메서드normalize=True 옵션을 주면 %로 확인# day 열 고윳값 개수 확인
> tip['day'].value_counts()
day
Sat 87
Sun 76
Thur 62
Fri 19
Name: count, dtype: int64
mode() 메서드# day 열 최빈값 확인
> tip['day'].mode()
0 Sat
Name: day, dtype: object
# 최빈값의 값만 얻기
> tip['day'].mode()[0]
'Sat'
sum(axis=0) : 행을 더하면 결과로 열이 출력. 기본값sum(axis=1) : 열을 더하면 결과로 행을 출력`df.sum(numeric_only=True) : 숫자 자료형만 더한다df[열이름].sum() : 특정 열 합계 조회df[열이름].max
df[[열1, 열2]].mean()