
가장 많이 등장한 단어: 데이터 분석 (5회)내가 하고 싶은 일과의 관계:☑️ 일치한다선택 포지션:☑ DA (데이터 애널리스트)☐ BA (비즈니스 애널리스트)☐ PA (프로덕트 애널리스트)☐ BI (BI 분석가)☐ DS (데이터 사이언티스트)이유:데이터 분석 역량이 강

업로드중..\*\*데이터 전처리(Data Preprocessing)\*\*는 머신러닝, 통계 분석, 데이터 시각화 등 다양한 분석 작업을 수행하기 전에 데이터를 분석 가능하게 정제하고 구조화하는 단계임.원본 데이터에는 오류, 결측치, 중복, 이상치 등이 존재하며, 이를
/usr/local/lib/python3.11/site-packages/ <-- site-packages (패키지 설치 위치)└── pandas/ <-- 패키지 ├── init.py

/usr/local/lib/python3.11/site-packages/ <-- site-packages (패키지 설치 위치)└── pandas/ <-- 패키지 ├── init.py

이틀 연속 엉덩이 왕.오늘도 타이타닉을 쓸 거다먼저 대충 크기를 보자 .shape전체적인 통계치를 먼저 보자 .describe()분위 수를 나눠서 더 자세히 보자더 많은 범주형 데이터를 보려면count 각 열에 대해 비어있지 않은 값(NaN이 아닌 값)의 개수uniqu

오늘도 산뜻하게 임포트하고 시작하자타이타닉도 쓸 것이다..ffill() |이전 값으로 결측치를 채움.bfill() |다음 값으로 결측치를 채움원본 데이터는 계속 써야 하니까 카피를 하자.비교를 위해 채우기 전 값도 시리즈로 빼놓자.age_ffill이라는 컬럼을 새로

오늘도 산뜻하게 임포트하고 시작하자import pandas as pd전자상거래 주문 데이터 시뮬레이션 (다양한 포맷이지만 파싱 가능한 형태로 구성)데이터 타입을 봐보자. 보시다시피 전부 다 Object다. 오라이.그래도 계산 해보고 싶다면 말리지 않겠다아 사실 지금 집
💻 터미널이란?터미널(Terminal)은 컴퓨터에게 직접 명령을 내리는 창구. 마우스로 클릭하거나 앱을 더블클릭하는 대신, 글자로 명령을 입력해서 컴퓨터와 대화하는 방식코랩에선 기본 셀 앞에 !를 붙여서 사용
| 항목 | iloc | loc | | -- | -------------------- | ------------------------------ | | 의미 | 정수 기반 위치 인덱싱 | 라벨(인덱스 이름) 기반 인덱싱 | | 입력 | 0, 1, 2 같은 숫자 위치...
이번 주는 matplotlib랑 pandas 쪽에 집중함.처음엔 그냥 plt.plot()만 쓰다가 fig, ax = plt.subplots() 쓰는 객체지향 인터페이스 방식도 써봤고, 각종 시각화 관련 옵션들 (label, legend, linestyle, marker

사용 상황: 시간에 따른 데이터의 변화를 표현할 때 사용함.예시: 주식 가격 추이, 기온 변화 등.장점: 연속적인 데이터의 추세를 직관적으로 파악 가능.plt.scatter(x, y) : pyplot 방식으로 산점도 생성ax.scatter(x, y) : axes 객체를

plt.figure(figsize=(w,h)) : pyplot 방식으로 그래프 크기 지정 (인치 단위)plt.subplots(figsize=(w,h)) : 객체지향 방식에서도 크기 지정plt.xlim() / plt.ylim() : pyplot 방식 축 범위 조절ax.s