01 Pandas Import 02 csv 파일 불러오기 03 col(열) 추출하기 원하는 col에 대해서 전부 추출 가능 04 특정 조건 검색 col2가 hello인 행의 col1, col2, col3만 추출해서 출력 비교연산자 전부 사용 가능(>, ==,
데이터 수집데이터 정규화 - 훈련 데이터, 테스트 데이터 정규화정답 데이터 지정 - 학습 데이터와 함께 해당 데이터 정답 지정모델 생성 - RandomForest 사용모델 훈련모델 예측정답 제출
alchol(음주수치) 상위 10번째 값으로 상위 1~10위의 범위의 값을 변경한 후 speeding(속도)가 7이상의 alchol(음주수치) 데이터들의 평균 산출데이터 첫번째 행부터 70% 까지의 데이터를 추출한 후 distance(거리)의 결측값을 distance(
독립성 검정 변수가 두개 이상 범주로 분할되어 있고, 독립적인지 연관성이 있는지 검정 귀무가설(H0) : 서로 독립 대립가설(H1) : 연관성이 있다 p-value < 0.05 이면 대립가설 채택 검정방법 순서 패키지 추가 (from scipy.stats import