파이썬[4일차]

정지범·2024년 12월 8일
0

python

목록 보기
4/8
참고
참고 자료는 점프 투 파이썬으로 선택했습니다.
※스스로를 위해 정리한 참고 자료입니다.

집합 자료형

집합(set)은 집합에 관련된 것을 쉽게 처리하기 위해 만든 자료형이다.

집합 자료형은 어떻게 만들까?

  • 집합 자료형은 다음과 같이 set 키워드를 사용해 만들 수 있다.
>>> s1 = set([1,2,3])
>>> s1
{1,2,3}
  • 위와 같이 set()의 괄호 안에 리스트를 입력하여 만들거나 다음과 같이 문자열을 입력하여 만들 수도 있다.
>>> s2 = set("Hello")
>>> s2
{'e','H','l','o'}

비어 있는 집합 자료형은 s = set()로 만들 수 있다.

집합 자료형의 특징

그런데 위에서 살펴본 set("Hello")의 결과가 좀 이상하지 않은가?
분명 "Hello" 문자열로 set 자료형을 만들었는데 생성된 자료형에는 l 문자가 하나 빠져 있고 순서도 뒤죽박죽이다.
그 이유는 set에 다음과 같은 2가지 특징이 있기 때문이다.

  • 중복을 허용하지 않는다.

  • 순서가 없다(Unordered).

    set은 중복을 허용하지 않는 특징 때문에 데이터의 중복을 제거하기 위한 필터로 종종 사용된다.

    • 리스트나 튜플은 순서가 있기(ordered) 때문에 인덱싱을 통해 요솟값을 얻을 수 있지만,
    • set 자료형은 순서가 없기(unordered) 때문에 인덱싱을 통해 요솟값을 얻을 수 없다.
    • 이는 마치 딕셔너리와 비슷하다.
    • 딕셔너리 역시 순서가 없는 자료형이므로 인덱싱을 지원하지 않는다.
  • 만약 set 자료형에 저장된 값을 인덱싱으로 접근하려면 다음과 같이 리스트나 튜플로 변환한 후에 해야 한다.

>>> s1 = set([1, 2, 3])
>>> l1 = list(s1)
>>> l1
[1, 2, 3]
>>> l1[0]
1
>>> t1 = tuple(s1)
>>> t1
(1, 2, 3)
>>> t1[0]
1

교집한, 합집합, 차집합 구하기

set 자료형을 정말 유용하게 사용하는 경우는 교집합, 합집합, 차집합을 구할 때이다.

  • 먼저 다음과 같이 2개의 set 자료형을 만든 후 따라 해 보자.
    s1에는 1부터 6까지의 값, s2에는 4부터 9까지의 값을 주었다.
> s1 = set([1, 2, 3, 4, 5, 6])
> s2 = set([4, 5, 6, 7, 8, 9])

교집합 구하기

s1과 s2의 교집합을 구해 보자.

  • 다음과 같이 '&'를 이용하면 교집합을 간단히 구할 수 있다.
> s1 & s2
{4,5,6}
  • 또는 다음과 같이 intersection 함수를 사용해도 결과는 동일하다.
> s1.intersection(s2)
{4,5,6}
  • s2.intersection(s1)을 사용해도 결과는 동일하다.

합집합 구하기

'|'를 사용하면 합집합을 구할 수 있다.
이때 4,5,6처럼 중복해서 포함된 값은 1개씩만 표현된다.

> s1 | s2
{1, 2, 3, 4, 5, 6, 7, 8, 9}
  • union 함수를 사용해도 된다.
> s1.union(s2)
{1, 2, 3, 4, 5, 6, 7, 8, 9}
  • s2.union(s1)을 사용해도 결과는 동일하다.

차집합 구하기

-(빼기_를 사용하면 차집합을 구할 수 있다.

> s1 - s2
{1, 2, 3}
> s2 - s1
{8, 9, 7}
  • difference 함수를 사용해도 차집합을 구할 수 있다.
> s1.difference(s2)
{1, 2, 3}
> s2.difference(s1)
{8, 9, 7}

집합 자료형 관련 함수

값 1개 추가하기 - add

  • 이미 만들어진 set 자료형에 값을 추가할 수 있다.
  • 1개의 값만 추가 add할 때는 다음과 같이 하면 된다.
>>> s1 = set([1, 2, 3])
>>> s1.add(4)
>>> s1
{1, 2, 3, 4}

값 여러 개 추가하기 - update

  • 여러 개의 값을 한꺼번에 추가(update)할 때는 다음과 같이 하면 된다.
>>> s1 = set([1, 2, 3])
>>> s1.update([4, 5, 6])
>>> s1
{1, 2, 3, 4, 5, 6}

특정 값 제거하기 - remove

특정 값을 제거하고 싶을 때는 다음과 같이 하면 된다.

>>> s1 = set([1, 2, 3])
>>> s1.remove(2)
>>> s1
{1, 3}

불 자료형

불(bool) 자료형이란 참(True)과 거짓(False)을 나타내는 자료형이다.

  • 불 자료형은 다음 2가지 값만을 가질 수 있다.
    • True: 참을 의미한다.
    • False: 거짓을 의미한다.

True나 False는 파이썬의 예약어로, true, false와 같이 작성하면 안 되고 첫 문자를 항상 대문자로 작성해야 한다.

불 자료형은 어떻게 사용할까?

다음과 같이 변수 a에는 True, 변수 b에는 False를 지정해 보자.

>>> a = True
>>> b = False
  • 따옴표로 감싸지 않은 문자열을 변수에 지정해서 오류가 발생할 것 같지만, 잘 실행된다.
  • type 함수를 변수 a와 b에 사용하면 두 변수의 자료형이 bool로 지정된 것을 확인할 수 있다
>>> type(a)
<class 'bool'>
>>> type(b)
<class 'bool'>

type(x)는 x의 자료형을 확인하는 파이썬의 내장 함수이다.

  • 불 자료형은 조건문의 리턴값으로도 사용된다.
  • 조건문에 대해서는 if 문에서 자세히 배우겠지만 잠시 살펴보고 넘어가자.
ed!>>> 1 == 1
True
  • 1 == 1 은 ‘1과 1이 같은가?’를 묻는 조건문이다.
  • 이런 조건문은 결과로 True 또는 False에 해당하는 불 자료형을 리턴한다.
    • 1과 1은 같으므로 True를 리턴한다.
>>> 2 > 1
True
  • 2는 1보다 크므로 2 > 1 조건문은 참이다. 즉, True를 리턴한다.
>>> 2 < 1
False
  • 2는 1보다 작지 않으므로 2 < 1 조건문은 거짓이다. 즉, False를 리턴한다.

자료형의 참과 거짓

‘자료형에 참과 거짓이 있다?’라는 말이 조금 이상하게 들리겠지만, 참과 거짓은 분명히 있다. 이는 매우 중요한 특징이며 실제로도 자주 쓰인다.

  • 자료형의 참과 거짓을 구분하는 기준은 다음과 같다.
참 or 거짓
"python"
""거짓
[1, 2, 3]
[]거짓
(1, 2, 3)
()거짓
{'a': 1}
{}거짓
1
0거짓
None거짓
  • 문자열, 리스트, 튜플, 딕셔너리 등의 값이 비어 있으면("", [], (), {}) 거짓이 되고 비어 있지 않으면 참이 된다.
  • 숫자에서는 그 값이 0일 때 거짓이 된다. 위 표를 보면 None이 있는데, 이것에 대해서는 뒷부분에서 배우므로 아직은 신경 쓰지 말자.
    • 그저 None은 거짓을 뜻한다는 것만 알아 두자.

다음 예를 보고 자료형의 참과 거짓이 프로그램에서 어떻게 쓰이는지 간단히 알아보자.

>>> a = [1, 2, 3, 4]
>>> while a:
...     print(a.pop())
...
4
3
2
1
  • 먼저 a = [1,2,3,4]라는 리스트를 만들었다.
  • while 문은 조건문이 참인 동안 조건문 안에 있는 문장을 반복해서 수행한다.
  while 조건문:
    수행할_문장

즉, 위 예를 보면 a가 참인 경우, a.pop()를 계속 실행하여 출력하라는 의미이다.
a.pop() 함수는 리스트 a의 마지막 요소를 끄집어 내는 함수이므로 리스트 안에 요소가 존재하는 한(a가 참인 동안) 마지막 요소를 계속 끄집어 낼 것이다.
결국 더 이상 끄집어 낼 것이 없으면 a가 빈 리스트([])가 되어 거짓이 된다.
따라서 while 문에서 조건문이 거짓이 되므로 while 문을 빠져나가게 된다

위 예제가 복잡하다면 아래 예를 보자

>>> if []:
...     print("참")
... else:
...     print("거짓")
...
거짓
  • []는 앞의 표에서 볼 수 있듯이 비어 있는 리스트이므로 거짓이다.
  • 따라서 "거짓"이라는 문자열이 출력된다.

다른 예도 하나만 더 살펴보자.

>>> if [1, 2, 3]:
...     print("참")
... else:
...     print("거짓")
...
  • 만약 [1, 2, 3]이 참이면 "참"이라는 문자열을 출력하고, 그렇지 않으면 "거짓"이라는 문자열을 출력하라.
  • [1, 2, 3]은 요솟값이 있는 리스트이므로 참이다. 따라서 "참"을 출력한다.

불 연산

자료형에 참과 거짓이 있다는 것을 이제 알게 되었다.
bool 함수를 사용하면 자료형의 참과 거짓을 보다 정확하게 식별할 수 있다.

>>> bool('python')
True
  • 'python' 문자열은 비어 있지 않으므로 bool 연산의 결과로 불 자료형인 True를 리턴한다.
>>> bool('')
False
  • ''문자열은 비어 있으므로 bool 연산의 결과로 불 자료형인 False를 리턴한다.

앞에서 알아본 몇 가지 예제를 더 수행해 보자.

>>> bool([1, 2, 3])
True
>>> bool([])
False
>>> bool(0)
False
>>> bool(3)
True
  • 앞에서 알아본 것과 동일한 참과 거짓에 대한 결과를 리턴하는 것을 확인할 수 있다.



출처 및 참고 자료

https://wikidocs.net/18

profile
안녕하세요

0개의 댓글