
07 기상
09-10 OT
10-12 Session & QnA
13-18 assignment
#데이터셋 불러오기
import pandas as pd
df = pd.read_csv(io ='', sheet_name=0)
저장 = df.to_csv('File name', mode= '')
#1행을 열이름으로 바꾸기
new_header = df1.iloc[0] #grab the first row for the header
df1 = df1[1:] #take the data less the header row
df1.columns = new_header #set the header row as the df header
#결측치 확인
DataFrame.isnull() or isnull(DataFrame)
DataFrame.isnull().sum() = 결측값 갯수
#결측치 '0'으로 변환
DataFrame.fillna(0)
#결측값 제거
DataFrame.dropna(axis=0)
#barplot 생성
DataFrame.plot.bar(x='', y='')
#'FCF' '0'미만, '0'초과 구하기
num1 = df1[df1['FCF'] > 0]['매출액'].count() + df2[df2['FCF'] > 0]['매출액'].count()
num2 = df1[df1['FCF'] < 0]['매출액'].count() + df2[df2['FCF'] < 0]['매출액'].count()
.count() = 데이터가 있는 셀의 개수를 구함
#Cross Tabulation(교차 목록)
pd.crosstab(x, y)
오늘은 첫날이라서 너무 힘들진 않은 하루였다.
아직 나에게 부족함은 많지만 동기분들이 모두 열정적이라 나도 그들을 따라 열정적으로 계속 나아갈 것이다.
내일은 또 다른 많은 것을 배우게 될 것이다.
너무 기대되는 내일이다.
미래에 데이터 직군에서 일할려면 더 열심히 하자.