📌 Pandas 설치 및 불러오기 📌 Series와 DataFrame 이해하기 Series: 1차원 데이터 (숫자, 문자열 등) DataFrame: 2차원 데이터 (엑셀처럼 행과 열이 있음) 📌 CSV 파일 불러오기 📌 데이터 미리보기 📌 열(Col
📌 다시 한 번 보기 👉 인덱싱 & 슬라이싱 👉 조건 필터링 👉 정렬 👉 열 추가 📌 행이나 열 삭제 df.drop(삭제할_이름, axis=방향, inplace=반영여부) 👉 열(Column) 삭제 '총점' : '총점' 선택 axis=1 : 열 방향 df.drop() : 삭제 df = df.drop('총점', axis=1) : '...
📌 데이터 불러오기 👉 대표적인 파일 종류와 불러오기 방법
📌 기초 정보 확인 👉 목적 👉 주요 함수 요약
📌 결측치 처리 👉 결측치? 👉 결측치 찾기
📌 중복값 처리 👉 중복값이란? 👉 중복값 확인 👉 중복 제거 👉 keep 옵션
📌 👉 데이터 타입 변환의 중요성 👉 데이터 타입 확인
📌 열/행 정리 👉 열/행 정리가 필요할 때 👉 열 삭제 (axis=1) 👉 행 삭제 (axis=0)
📌 값 변경 및 조건 처리 데이터를 실제로 분석 가능한 형태로 바꾸는 핵심 작업 👉 값 변경 및 조건 처리가 필요할 때
📌 데이터 인코딩 👉 대표적인 인코딩 방식 2가지
📌 스케일링 & 정규화
📌 그룹화 및 집계 👉 기본 문법 👉 여러 기준으로 그룹화 👉 여러 열에 대해 집계하기 👉 여러 집계 함수
📌 데이터 병합 및 연결 👉 병합과 연결의 차이점
📌 필터링과 정렬 👉 필터링 👉정렬
📌 데이터 전처리 전체흐름
astype() vs pd.to_numeric() 1. astype() 특정 타입(자료형)으로 “강제 변환” 데이터가 실제로 변환 가능한 값이어야만 제대로 동작 ● 예시 모든 값이 변환 불가능하면 → 에러 발생! 예: '오류', '없음' 같은 값이 있으면 ValueError 발생 ● 특징 int ↔ float, float ↔ str, bo...
크롤링 데이터 → 판다스 DataFrame 만드는 법 1. 크롤링 결과가 “리스트(딕셔너리)” 형태라면 > (가장 표준적인, “파싱된 데이터” 형태) > 예시: 리스트 안에 각 행(딕셔너리) → 한 번에 DF로 변환 크롤링 라이브러리(requests, BeautifulSoup, selenium, API 등)로 데이터를 파싱해 딕셔너리(사전)...