[빅분기] 21년 3회차 작업형 1번 기출

juyeon lee·2023년 5월 31일

빅분기

목록 보기
2/2

1번

상위 70% 추출하고 사분위수 Q1의 값을 구하시오.

import pandas as pd

#데이터 불러오기
data = pd.read_csv('/data')

#상위 70% 추출
data = data.iloc[:int(len(data)*0.7)]

#사분위수 Q1 추출
answer = data['x'].describe()['25%']
or
answer = data.x.quntile(0.25)
print(answer)

1-1 상위 데이터 추출

df.iloc[행,열] : 데이터 프레임의 행이나 칼럼의 순서를 나타내는 정수로 즉정 값을 추출

1-2 quntile

df.quantile(q=0.5, axis=0, numeric_only=True, interpolation='linear')
: 해당 행/열의 분위수의 해당하는 값을 반환하는 메서드



2번

2000년도 감염자 수의 평균보다 큰 나라의 개수를 구하시오

import pandas as pd

#데이터 로드
data = pd.read_csv('/data')

#2000년도 감염자 수 평균 구하기
mean = data[a.index==2000].mean(axis=1)

answer = data[data.columns()[0] > mean].tolist()
print(len(answer))

data.columns()[i] : 데이터프레임 i번째 열 이름 조회
data.values.tolist() : 행들의 데이터 목록으로 변환
data.columns.tolist() : 열의 이름 목록으로 변환



3번

결측치 비율이 가장 높은 변수명 구하시오

import pandas as pd

data = pd.read_csv('/data')
countnull = data.isnull().sum()

print((countnull / len(data)).sort_values(ascending = False).index[0])

data.isnull() : 결측치 확인
sort_values(ascending = False) : 내림차순 정렬


참고

0개의 댓글