원하는 데이터를 불러오기 가능하다.
주로 csv 파일 형태를 불러온다.
csv파일로 불러오면 데이터프레임 형태로 되어있기때문에 그대로 사용하면된다.
- 시리즈로 되어있는 변수를 적용할려면 DataFrame으로 변형해야함
import pandas as pd
csv = pd.read_csv('주소')
위 기준으로 정보를 확인 한다.
# 위에서 기본 5개 확인
csv.head()
# 지정해서 보이는 것도 가능하다.
csv.head(2) #2개만 보기
아래 기준으로 정보를 확인 한다.
# 아래에서 기본 5개를 확인
csv.tail()
# 지정해서 보이는 것도 가능하다.
csv.tail(2) # 2개만 보기
csv.describe()
csv.info()
결측치(Missing Value)를 확인할 수 있다.
NaN, Null 값 확인 가능
# null의 여부를 확인해 True, False 값으로 시리즈 형태로 가져옴.
csv.isna()
# sum()가 결합하여, 각각의 컬럼에 결측치의 갯수를 확인 할 수 있다.
csv.isna().sum()
결과 예시)

csv.value_counts()
값을 기준으로 오름차순으로 정렬
옵션으로 ascending=False를 부여할 경우 내림차순으로 변경된다.
# 기본 사용법
obj.sort_values() # 오름 차순으로 정렬
# 내림 차순 정렬
obj.sort_values(ascending = False)
결과 예시)

Index를 기준으로 오름차순으로 정렬한다.
옵션으로 ascending=False를 부여할 경우 내림차순으로 변경된다.
axis옵션을 부여할 경우 컬럼별로 적용이 된다.
# 기본 사용법
obj.sort_index() # 오름 차순으로 정렬
# 내림 차순으로 정렬
obj.sort_index(ascending = False)