### **Pandas에서 `.loc[]`과 `DataFrame['column']`을 사용하여 데이터 선택하기**

Yeeun·2025년 4월 28일

Python

목록 보기
23/31

Pandas에서 .loc[]DataFrame['column']을 사용하여 데이터 선택하기

Pandas에서 데이터에 접근할 때 두 가지 주요 방법이 있습니다. 하나는 .loc[]을 사용하여 행과 열을 선택하는 방법이고, 다른 하나는 DataFrame['column']을 사용하여 열을 선택하는 방법입니다. 이 두 방법은 데이터 분석에서 매우 자주 사용됩니다.

예시: DataFrame['column']을 사용하여 열 선택하기

우리는 이전에 states라는 DataFrame을 사용하여 주별 인구수면적을 담은 데이터를 가지고 있었습니다. states DataFrame은 다음과 같습니다:

import pandas as pd

# 인구수와 면적 데이터로 Series 생성
population = pd.Series([38332521, 19552860, 12882135, 19651127, 26448193], 
                       index=['California', 'Florida', 'Illinois', 'New York', 'Texas'])

area = pd.Series([423967, 170312, 149995, 141297, 695662], 
                 index=['California', 'Florida', 'Illinois', 'New York', 'Texas'])

# DataFrame 생성
states = pd.DataFrame({'population': population, 'area': area})

# DataFrame 출력
print(states)

출력은 다음과 같습니다:

             population    area
California    38332521  423967
Florida       19552860  170312
Illinois      12882135  149995
New York     19651127  141297
Texas        26448193  695662

1. DataFrame['column']을 사용하여 열 선택하기

states['area']'area' 열을 선택하는 방법입니다. 이렇게 하면 해당 열의 값들을 쉽게 얻을 수 있습니다.

# 'area' 열만 선택
print(states['area'])

출력:

California    423967
Florida       170312
Illinois      149995
New York     141297
Texas        695662
Name: area, dtype: int64

설명:

  • states['area']는 DataFrame에서 'area' 열만 선택하여 반환합니다. 이 결과는 Pandas Series 형식으로, 인덱스는 주 이름(예: California, Florida 등)이고 값은 각 주의 면적입니다.

2. .loc[]을 사용하여 행과 열 선택하기

loc[]은 레이블을 기반으로 행과 열을 선택하는 데 유용합니다. 예를 들어, California 주의 전체 행을 선택하고 싶다면:

# 'California' 행 선택
print(states.loc['California'])

출력:

population    38332521
area            423967
Name: California, dtype: int64

또는 특정 열만 선택하고 싶다면:

# 'California' 행에서 'area' 열만 선택
print(states.loc['California', 'area'])

출력:

423967

설명:

  • states.loc['California', 'area']'California' 행에서 'area' 열만 선택하는 방법입니다. 이 결과는 423967로, California의 면적을 반환합니다.

3. .loc[]DataFrame['column']의 차이점

  • states['area']: DataFrame에서 'area' 열을 선택하여 Series로 반환합니다. 인덱스는 주 이름이고, 값은 면적입니다.
  • states.loc['California']: 'California'라는 행을 선택하여 해당 주에 대한 모든 열을 반환합니다.
  • states.loc['California', 'area']: 'California' 행에서 'area' 열만 선택하여 그 값을 반환합니다.

정리

  • DataFrame['column']: 특정 을 선택하는 방법입니다. 예를 들어, states['area']'area' 열만 선택합니다.
  • .loc[]: 레이블을 기반으로 행과 열을 동시에 선택할 수 있는 방법입니다. 예를 들어, states.loc['California', 'area']California 행에서 area 열을 선택합니다.

이 두 가지 방법을 적절히 활용하면 데이터를 더욱 직관적으로 선택하고 다룰 수 있습니다.

0개의 댓글