[AWS] AWS Athena 상에서의 중첩 어레이는 어떻게 풀까?

JIEUN KANG·2021년 9월 3일
0

빅쿼리나 아테나 환경에서 만나게 되는, 가장 당황스러운 데이터를 뽑자면 아마 중첩 어레이일 것이다.
한마디로 중첩 어레이는 하나의 row에 데이터 값이 같은 타입으로 여러개 저장된다는 뜻.
내가 봤던 경우는 이런 경우였다.

(빅쿼리의 경우도 비슷하기에... 잘 설명된 자료는 https://zzsza.github.io/gcp/2020/04/12/bigquery-unnest-array-struct/)

문제는 저렇게 줄줄이 소시지처럼 얽힌 귀여운 데이터들을
어떻게 풀어줘서, 다른 테이블과 지지고 볶고를 할수 있냐는 것인데,
그걸 도와주는 함수가 UNNEST 라는 함수.

CROSS JOIN UNNEST(풀어줘야 하는 칼럼명) as 별칭

칼럼명을 넣는 자리에, 데이터 가공이 한번 더 필요하다면
때에 따라서 split 함수 등과 사용해야 할 때도 있다.
데이터의 특징에 따라 필요한 함수와 혼용을 하는 것에 주의!

중첩 어레이 관련 도움말 : https://docs.aws.amazon.com/ko_kr/athena/latest/ug/creating-arrays.html

profile
가장 보통의 존재

0개의 댓글