Python (개념)

김혜민·2024년 4월 5일

Python

목록 보기
6/11

1. Series 객체

  • Series 객체는 pandas 라이브러리에서 제공하는 1차원 데이터 구조
  • 기본적으로 인덱스와 값으로 구성
  • Series 객체는 리스트, 배열 또는 딕셔너리와 유사한 특성을 가지고 있으며, 데이터를 라벨링하거나 인덱싱하는 데 사용
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)

# 1부터 5까지의 값을 갖는 Series 객체를 생성 , 출력값은 아래!
0    1
1    2
2    3
3    4
4    5

2.Loc

  • loc는 특정 조건을 충족하는 행 또는 열을 선택하기 위한 메서드
  • loc를 사용하여 데이터프레임에서 특정 조건을 만족하는 행을 선택하고 그 행에 대한 특정 열을 선택할 수 있음
view_data.loc[view_data['category_1'] != 'Not defined', 'category_1']

# 'category_1' 열에서 값이 'Not defined'가 아닌 행만을 선택
# 여기서 loc를 사용하는 이유? 데이터프레임의 특정 위치를 선택하고 필터링하는 데 사용되기 때문
# 행과 열을 지정하여 DataFrame의 일부분을 선택하거나 수정하는 데 사용
# Ex) df.loc[row_label, column_label] 형식으로 사용하여 DataFrame에서 특정 위치의 데이터를 선택하거나 수정할 수 있음

3. Size Vs len()

  • len() 함수와 size 속성은 모두 데이터의 크기를 반환하는 데 사용

1) len()

  • len() 함수는 파이썬 내장 함수로, 주어진 객체의 요소 수를 반환
  • 데이터프레임에서 len() 함수를 사용하면 DataFrame의 행 수가 반환

2) size

  • size 속성은 데이터프레임 또는 시리즈 객체에서 사용할 수 있는 속성
  • 해당 객체의 요소 수를 반환
  • 데이터프레임에서 size 속성을 사용하면 DataFrame의 전체 요소 수가 반환
    → 행과 열의 곱으로 계산

즉, len() 함수는 데이터프레임의 행 수를 반환하고, size 속성은 전체 요소 수를 반환함!

ex) 데이터프레임이 3개의 행과 4개의 열을 가지고 있다면?
→ len() 함수는 3을 반환, size 속성은 12를 반환

profile
성장하는 주니어 데이터 분석가입니다!

0개의 댓글