Power BI - 데이터 변환 2 - 열 병합 및 분할

Ryan·2025년 1월 15일

SQL/Python 분석

목록 보기
59/94

1. 열 병합(Merge Columns)

  1. Power Query Editor 열기
    • Power BI Desktop → “홈(HOME)” 탭 → “데이터 변환(Transform data)” 클릭.
  2. 합칠 열 선택
    • Ctrl(또는 Shift)을 누른 상태로 병합할 열을 차례대로 클릭해 동시에 선택합니다.
  3. 열 병합 실행
    • 상단 메뉴에서 “추가 열(Add Column)” 또는 “변환(Transform)” 탭 내 병합 열(Merge Columns) 버튼을 클릭합니다.
      • “추가 열” 탭에서 병합을 수행하면 원본 열은 그대로 유지하되, 새 열이 추가됩니다.
      • “변환” 탭에서 병합하면 기존 열들이 사라지고 병합된 열로 대체됩니다.
  4. 구분 기호(Delimiter) & 새 열 이름 지정
    • 병합 시, 열 사이에 들어갈 구분 기호(예: 공백, 쉼표, 대시 등)를 선택할 수 있습니다.
    • “새 열의 이름(New Column Name)”을 원하는 대로 입력합니다.
  5. 확인(OK)
    • 선택한 열들이 지정한 구분 기호로 합쳐진 단일 열이 생성됩니다.

예시

  • “이름” 열과 “성” 열을 합쳐서 “전체이름(FullName)”을 만들 때, 구분 기호로 “공백(space)”를 지정.
  • 결과: 성 + " " + 이름 형태로 하나의 컬럼이 생성됨.

2. 열 분할(Split Columns)

  1. 분할할 열 선택
    • Power Query Editor에서 분할 대상이 될 열을 클릭해 선택합니다.
  2. 열 분할 메뉴
    • 상단 메뉴 중 “추가 열(Add Column)” 또는 “변환(Transform)” 탭 내 열 분할(Split Column) 버튼을 클릭합니다.
  3. 구분 기호(Delimiter)에 따른 분할
    • 보통 “구분 기호에 따라 분할(By Delimiter)”을 많이 사용합니다.
    • 쉼표(,), 공백( ), 세미콜론(;), 탭(\t) 등 다양한 문자를 구분 기호로 지정할 수 있습니다.
    • “각 구분 기호에서 분할” 또는 “가장 왼쪽/오른쪽 구분 기호에서 분할” 등 세분화된 옵션을 선택할 수 있습니다.
  4. 확인(OK)
    • 기존 열이 구분 기호를 기준으로 여러 열(2개 이상)로 나뉘어 생성됩니다.
    • 예: “이름” 열이 “김-철수” 형식이라면, 구분 기호 “-”로 분할 시 “김” / “철수” 두 열이 만들어짐.

3. 통합 활용 시나리오

  1. 열 병합 후 다시 분할
    • 먼저 여러 열을 합친 뒤(머지), 추가로 특정 규칙(예: 날짜 형식)에 따라 다시 분할하는 경우도 있습니다.
    • 예: “연도 + 분기” 형태로 병합한 뒤, “-” 구분 기호로 재분할해 사용하는 식.
  2. 여러 열 병합으로 키(Primary Key) 만들기
    • 다중 컬럼(예: “지역코드 + 제품코드”)을 합쳐 고유 식별자(Unique ID) 형태로 사용할 수 있습니다.
    • 혹은 로우(row)를 태깅(tagging)하기 위한 임시 컬럼을 만드는 데도 활용 가능.
  3. 분할 시 일괄 처리
    • “이름, 전화번호” 등이 하나의 열에 섞여 있어 불편할 때, 구분 기호를 이용해 각각의 열로 분리해 놓으면 분석/가공이 쉬워집니다.

4. 주의사항 & 팁

  1. 변환(Transform) vs. 추가 열(Add Column)
    • “변환”을 통해 병합/분할하면 원본 열이 사라지고 결과 열만 남습니다.
    • “추가 열”을 통해 병합/분할하면 원본 열은 유지된 상태로 새 열이 생성됩니다.
    • 상황에 따라 원하는 작업 방식을 선택하세요.
  2. 데이터 타입 재확인
    • 병합/분할 이후, 새 열의 데이터 타입(Text, Number, Date 등)이 의도한 대로 설정되어 있는지 확인합니다.
    • 필요하면 변경(예: 날짜/시간 열로 지정)해 주어야 합니다.
  3. 구분 기호가 데이터 안에 여러 번 등장하는 경우
    • “각 구분 기호마다 분할” 옵션을 사용하면, 구분 기호가 나타날 때마다 열이 계속 분할됩니다.
    • 특정 위치에서만 분할하려면, “왼쪽 구분 기호에서 분할” 또는 “오른쪽 구분 기호에서 분할” 같은 옵션을 선택해 제한할 수 있습니다.
  4. 대량 데이터 성능
    • 병합/분할 연산도 모든 행에 대해 수행되므로, 데이터 양이 많으면 변환 시간이 길어질 수 있습니다.
    • 필요 없는 컬럼은 미리 제거(또는 필터링)하는 등 절차를 간소화하여 성능을 최적화하는 것이 좋습니다.

5. 정리

  • 열 병합(Merge): 여러 열을 하나로 합치고, 원하는 구분 기호와 새 열 이름을 설정할 수 있습니다.
  • 열 분할(Split): 특정 구분 기호, 정해진 문자, 또는 고정 너비 등에 따라 한 열을 여러 열로 나눌 수 있습니다.
  • “변환”과 “추가 열” 메뉴 중 어느 것을 사용하느냐에 따라 원본 열 유지 여부가 달라지니, 유의해서 선택하세요.

이처럼 열 병합열 분할 기능은 데이터를 더 가독성 있고 분석 친화적으로 재구성하는 데 중요한 단계입니다.

가령, 복잡하게 섞여 있는 문자열을 분리해 구조화하거나, 여러 열을 결합해 식별자나 새로운 분석 지표를 만드는 식으로,

Power Query Editor에서 자유롭게 전처리 작업을 시도해 보시길 바랍니다!

0개의 댓글