import pandas as pd
#데이터 불러오기
data = pd.read_csv('/data')
#상위 70% 추출
data = data.iloc[:int(len(data)*0.7)]
#사분위수 Q1 추출
answer = data['x'].describe()['25%']
or
answer = data.x.quntile(0.25)
print(answer)
df.iloc[행,열] : 데이터 프레임의 행이나 칼럼의 순서를 나타내는 정수로 즉정 값을 추출
df.quantile(q=0.5, axis=0, numeric_only=True, interpolation='linear')
: 해당 행/열의 분위수의 해당하는 값을 반환하는 메서드
import pandas as pd
#데이터 로드
data = pd.read_csv('/data')
#2000년도 감염자 수 평균 구하기
mean = data[a.index==2000].mean(axis=1)
answer = data[data.columns()[0] > mean].tolist()
print(len(answer))
data.columns()[i] : 데이터프레임 i번째 열 이름 조회
data.values.tolist() : 행들의 데이터 목록으로 변환
data.columns.tolist() : 열의 이름 목록으로 변환
import pandas as pd
data = pd.read_csv('/data')
countnull = data.isnull().sum()
print((countnull / len(data)).sort_values(ascending = False).index[0])
data.isnull() : 결측치 확인
sort_values(ascending = False) : 내림차순 정렬