[Python] zip 에 대해서 알아보자

Tomato·2022년 5월 13일
0

Python

목록 보기
3/5
  • zip(*iterables, strict=False)

Iterate over several iterables in parallel, producing tuples with an item from each one.

공식문서를 요약하자면:

  • zip은 iterable한 튜플을 반환해준다. (추가 설명: for 문을 통해서 출력된 값을 확인해보면 튜플로 변환되었기 때문에, row가 column이 되고, column이 row로 변한 것으로 생각해볼 수도 있다. 밑의 코드를 살펴보면, 각 row vector들이 실제로 column이 되었다.) zip은 두 개의 리스트를 튜플로 조합하기 때문에 짝이 있어야 한다. 따라서 서로 길이가 같은 리스트일 때 유용하다. 길이가 같지 않아 쌍이 없는 원소들은 배제된다. 리턴해보면 아예 값이 빠져있는 것을 확인할 수 있다. 원소가 사라지는 걸 원치 않는다면, 두 리스트의 길이가 같은지 먼저 확인해야 한다. zip에는 이를 간편하게 확인할 수 있는 strict 인자가 존재한다. strict=True로 해주면 만약 길이가 다를 시 error를 반환받을 수 있다.

Example:

> for item in zip([1, 2, 3], ['sugar', 'spice', 'everything nice']):
...     print(item)
...
(1, 'sugar')
(2, 'spice')
(3, 'everything nice')
More formally: zip() returns an iterator of tuples, where the i-th tuple contains the i-th element from each of the argument iterables.

Another way to think of zip() is that it turns rows into columns, and columns into rows. This is similar to transposing a matrix.

  • zip() is lazy: The elements won’t be processed until the iterable is iterated on, e.g. by a for loop or by wrapping in a list.

One thing to consider is that the iterables passed to zip() could have different lengths; sometimes by design, and sometimes because of a bug in the code that prepared these iterables. Python offers three different approaches to dealing with this issue:

  • By default, zip() stops when the shortest iterable is exhausted. It will ignore the remaining items in the longer iterables, cutting off the result to the length of the shortest iterable:
1. > list(zip(range(3), ['fee', 'fi', 'fo', 'fum']))
[(0, 'fee'), (1, 'fi'), (2, 'fo')]
zip() is often used in cases where the iterables are assumed to be of equal length. In such cases, it’s recommended to use the strict=True option. Its output is the same as regular zip():

2. > list(zip(('a', 'b', 'c'), (1, 2, 3), strict=True))
[('a', 1), ('b', 2), ('c', 3)]
Unlike the default behavior, it checks that the lengths of iterables are identical, raising a ValueError if they aren’t:

3. > list(zip(range(3), ['fee', 'fi', 'fo', 'fum'], strict=True))
Traceback (most recent call last):
  ...
ValueError: zip() argument 2 is longer than argument 1
Without the strict=True argument, any bug that results in iterables of different lengths will be silenced, possibly manifesting as a hard-to-find bug in another part of the program.
profile
Study archive

0개의 댓글

관련 채용 정보