[Python] 데이터 카운팅, Counter 함수

PhilAI·2023년 8월 1일
0

Counter함수 간단 정리

Counter 함수는 collections 모듈에 포함된 파이썬의 내장 함수로, 시퀀스(리스트, 튜플, 문자열 등)에 포함된 요소들의 개수를 셀 때 사용됩니다.
각 요소들과 해당 요소의 개수를 딕셔너리 형태로 반환하여 데이터 카운팅 작업을 효율적으로 수행할 수 있습니다.

Counter 함수를 사용하기 위해서는 먼저 collections 모듈을 import해야 합니다.
(항상 까먹고 왜 안되지 한 사람이 저입니다.. ㅎㅎ)
그리고 Counter 함수를 호출하고자 하는 시퀀스를 전달하여 사용합니다.

from collections import Counter

# 리스트 데이터에 대한 카운팅
data = [1, 2, 3, 4, 1, 2, 3, 1, 2, 1]
counter_result = Counter(data)
print(counter_result)  # 출력: Counter({1: 4, 2: 3, 3: 2, 4: 1})

# 문자열 데이터에 대한 카운팅
text = "apple"
counter_result = Counter(text)
print(counter_result)  # 출력: Counter({'p': 2, 'a': 1, 'l': 1, 'e': 1})

Counter함수 활용 예시

1. 가장 빈도가 높은 요소 찾기

from collections import Counter

fruits = ["apple", "orange", "banana", "apple", "orange", "apple"]
counter_result = Counter(fruits)

# 가장 빈도가 높은 요소 2개 출력
most_common = counter_result.most_common(2)
print(most_common)  # 출력: [('apple', 3), ('orange', 2)]

2. 두 개의 카운터 합치기

from collections import Counter

data1 = [1, 2, 3, 1, 2]
data2 = [2, 3, 4, 4]

counter1 = Counter(data1)
counter2 = Counter(data2)

# 두 카운터를 합친 결과 출력
combined_counter = counter1 + counter2
print(combined_counter)  # 출력: Counter({2: 3, 3: 2, 1: 2, 4: 2})
profile
철학과가 도전하는 Big Data, AI

0개의 댓글