누군가 이미 만들어놓은 함수, 클래스 덩어리 -> 'import'로 사용 선언
파이썬 데이터 분석을 위한 필수 패키지
import pandas as pd
#판다스를 사용할 때 pd라는 약자로 사용하겠다.
데이터프레임명 = pd.DataFrame({
'columeName1' : [row1,row2,row3...],
...
'columeName2' : [row1,row2,row3...],
})
import pandas as pd
items = pd.DataFrame({
'code' : [101,102,103,104,105,106,107],
'과목' : ['국','영','수','미','음','체','윤'],
'수강생' : [10,25,15,20,7,13,20],
'선생님' : ['가나','다라','마바','사아','자차','카타','파하']
})
items
items.head() #데이터의 상위 5개 출력
items.tail() #데이터의 하위 5개 출력
items.sample(3) #데이터의 랜덤 3개 출력
# 데이터프레임 2개를 연결
total_df = pd.concat([df1, df2])
total_df
#두 데이터 프레임 2개가 합쳐져서 출력된다.
total_df.to_csv('data.csv',index=False)
#데이터프레임을 'data.csv'로 저장해서 추후에 사용한다.
#csv는 엑셀의 한 종류라고 생각해도 된다.
#index=False 는 인덱스 번호 없이 저장하겠다.
new_df = pd.read_table('data.csv',sep=',')
#sep: ,를 기준으로 열을 나누겠다.
#읽어와서 new_df에 할당한다.