데이터 전처리란?
데이터 전처리 (컬럼)
데이터 확인
세션 내용
Series = 한 행으로 이루어진 것.
EX)
ages = pd.Series([25, 30, 35, 28, 32])
print("Series 예제:")
print(ages)
나이로 이루어진 시리즈, 한 행.
Data Frame = 여러 개의 행으로 이루어진 것. 시리즈의 집합
EX)
data = {
'name': ['김철수', '이영희', '박민수', '최지은'],
'age': [25, 30, 35, 28],
'city': ['서울', '부산', '대구', '인천']
}
df = pd.DataFrame(data)
print("DataFrame 예제:")
df
이름, 나이, 도시의 여러 행으로 이루어진 데이터 프레임
-> 'df.shape'을 입력하면 , 행렬 정보가 나옴. = (5, 4)
df.shape는 속성을 나타냄. 매서드는 뒤에 ()가 붙음.
매서드 = 기능(동사) / 속성 = 특징(명사)
EX)
이름 나이 도시
1
2
3
▶ 1,2,3(인덱스, 데이터베이스의 PK와 유사)