๐ ๏ธ 3ํ์ฐจ: ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ์ ํต์ฌ, ํ์ ์ฟผ๋ฆฌ ํธ์ง๊ธฐ
๋ฐ์ดํฐ ๋ถ์์ 80%๋ ๋ฐ์ดํฐ๋ฅผ ๋ฆ๊ณ ์กฐ์ด๋ '์ ์ฒ๋ฆฌ' ๊ณผ์ ์ด๋ผ๊ณ ํด๋ ๊ณผ์ธ์ด ์๋๋๋ค. Power BI์์๋ ํ์ ์ฟผ๋ฆฌ ํธ์ง๊ธฐ(Power Query Editor)๊ฐ ๋ฐ๋ก ๊ทธ ์ญํ ์ ๋ด๋นํ๋ ๊ฐ๋ ฅํ ์ฃผ๋ฐฉ๊ณผ๋ ๊ฐ์ ๊ณต๊ฐ์
๋๋ค.
๐จโ๐ณ 1. ํ์ ์ฟผ๋ฆฌ ํธ์ง๊ธฐ๋ ๋ฌด์์ธ๊ฐ?
์๋ณธ ๋ฐ์ดํฐ๋ฅผ ๋ถ์์ ์ ํฉํ ํํ๋ก ์ ์ (Cleaning), ๋ณํ(Transformation), ์
ฐ์ดํ(Shaping)ํ๋ ๋๊ตฌ์
๋๋ค. ์ฝ๋ฉ์ ๋ชฐ๋ผ๋ GUI(๊ทธ๋ํฝ ์ธํฐํ์ด์ค)๋ฅผ ํตํด ๋ณต์กํ ETL(Extract, Transform, Load) ์์
์ ์ํํ ์ ์์ต๋๋ค.
๐ฅ๏ธ ์ธํฐํ์ด์ค ๊ตฌ์ฑ ์์
- ๐ ๋ฆฌ๋ณธ ๋ฉ๋ด (์๋จ): ๋ฐ์ดํฐ ๋ณํ์ ํ์ํ ๋ชจ๋ ๋๊ตฌ(ํ, ๋ณํ, ์ด ์ถ๊ฐ ๋ฑ)๊ฐ ๋ชจ์ฌ ์์ต๋๋ค.
- ๐ ์ฟผ๋ฆฌ ์ฐฝ (์ผ์ชฝ): ํ์ฌ ๋ถ๋ฌ์จ ํ
์ด๋ธ(์ฟผ๋ฆฌ) ๋ชฉ๋ก์ ํ๋์ ํ์ธํฉ๋๋ค.
- ๐ ๋ฐ์ดํฐ ๋ฏธ๋ฆฌ๋ณด๊ธฐ (์ค์): ๋ณํ ๊ฒฐ๊ณผ๊ฐ ์ด๋ป๊ฒ ๋ณํ๋์ง ์ค์๊ฐ์ผ๋ก ์ํ(์์ 1,000ํ)์ ๋ณด์ฌ์ค๋๋ค.
- ๐ ์ฟผ๋ฆฌ ์ค์ & ์ ์ฉ๋ ๋จ๊ณ (์ค๋ฅธ์ชฝ): ์ด ํธ์ง๊ธฐ์ ๊ฐ์ฅ ์ค์ํ ํต์ฌ์ผ๋ก, ๋ด๊ฐ ์ํํ ๋ชจ๋ ์์
์ด ์์๋๋ก ๊ธฐ๋ก๋ฉ๋๋ค.
๐ 2. ํต์ฌ ๊ฐ๋
: '์ ์ฉ๋ ๋จ๊ณ(Applied Steps)'
ํ์ ์ฟผ๋ฆฌ์๋ '์คํ ์ทจ์(Ctrl+Z)'๊ฐ ์์ต๋๋ค. ๋์ ์ ์ฉ๋ ๋จ๊ณ ํจ๋์ด ๊ทธ ์ด์์ ์ญํ ์ ์ํํฉ๋๋ค.
- ํ์คํ ๋ฆฌ ๊ธฐ๋ก: ์ด์ ์ญ์ ํ๊ฑฐ๋ ํ์์ ๋ฐ๊พธ๋ ๋ชจ๋ ๊ณผ์ ์ด ๋ ์ํผ์ฒ๋ผ ์ ์ฅ๋ฉ๋๋ค.
- ์ธ์ ๋ ์์ ๊ฐ๋ฅ: ์ค๊ฐ ๋จ๊ณ์ ์ค์ (ํฑ๋๋ฐํด ์์ด์ฝ)์ ๋ฐ๊พธ๊ฑฐ๋, ํน์ ๋จ๊ณ๋ฅผ ์ญ์ (X)ํ์ฌ ์ด์ ์ํ๋ก ์๋ฒฝํ๊ฒ ๋๋๋ฆด ์ ์์ต๋๋ค.
- ์๋ํ์ ๊ธฐ๋ฐ: ์๋ก์ด ๋ฐ์ดํฐ๊ฐ ๋ค์ด์ '์๋ก ๊ณ ์นจ'์ ๋๋ฅด๋ฉด, ๊ธฐ๋ก๋ ๋จ๊ณ๋ค์ด ์์ฐจ์ ์ผ๋ก ์๋ ์คํ๋์ด ๋๊ฐ์ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ๋ฐ๋ณตํฉ๋๋ค.
๐ก M ์ฟผ๋ฆฌ ์ธ์ด: ์ฐ๋ฆฌ๊ฐ ๋ง์ฐ์ค๋ก ํด๋ฆญํ๋ ๋ชจ๋ ์์
์ ๋ฐฑ๊ทธ๋ผ์ด๋์์ 'M ์ธ์ด'๋ผ๋ ์ฝ๋๋ก ์๋ ๋ณํ๋์ด ์ ์ฅ๋ฉ๋๋ค.
๐งผ 3. ์ฃผ์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๊ธฐ๋ฅ (Cleaning & Shaping)
๋ถ์ ๊ฒฐ๊ณผ์ ์ ๋ขฐ๋๋ฅผ ๋์ด๊ธฐ ์ํด ๋ฐ์ดํฐ๋ฅผ ๊นจ๋ํ๊ฒ ๋ง๋๋ ๊ณผ์ ์
๋๋ค.
โ ๋ฐ์ดํฐ ์ ์ (Cleaning)
- ๋ถํ์ํ ๋ฐ์ดํฐ ์ ๊ฑฐ: ์์/ํ์ ํ ์ ๊ฑฐ, ์ค๋ณต๋ ํญ๋ชฉ ์ญ์ , ๋น ํ ์ ๊ฑฐ ๋ฑ์ ํตํด ๋ฐ์ดํฐ์ '๋
ธ์ด์ฆ'๋ฅผ ์์ฑ๋๋ค.
- ๊ฒฐ์ธก์น(Null) ์ฒ๋ฆฌ: ๋น์ด์๋ ๊ฐ(Null)์ ์ฐพ์ 0์ผ๋ก ๋ฐ๊พธ๊ฑฐ๋, ํ๊ท ๊ฐ์ผ๋ก ์ฑ์ฐ๊ฑฐ๋, ์์ ํด๋น ํ์ ์ ์ธํฉ๋๋ค.
- ํํฐ๋ง: ๋ถ์ ๋์์ด ์๋ ํน์ ํญ๋ชฉ(์: ํด์ฌ์, ํ์
์ ํฌ ๋ฑ)์ ๋ฏธ๋ฆฌ ๊ฑธ๋ฌ๋
๋๋ค.
โก ๋ฐ์ดํฐ ํํ ๋ณํ (Shaping)
- ๋จธ๋ฆฌ๊ธ ์น๊ฒฉ: ์์
ํ์ผ์ ๋ถ๋ฌ์ฌ ๋ ์ฒซ ์ค์ด ์ ๋ชฉ์ด ์๋ ๋ฐ์ดํฐ๋ก ์ธ์๋๋ค๋ฉด, '์ฒซ ํ์ ๋จธ๋ฆฌ๊ธ๋ก ์ฌ์ฉ' ๊ธฐ๋ฅ์ ํตํด ์ ๋ชฉ์ผ๋ก ์ฌ๋ฆฝ๋๋ค.
- ๋ฐ์ดํฐ ํ์ ์ง์ : ์ซ์๊ฐ ํ
์คํธ๋ก ์ธ์๋์ด ์์ผ๋ฉด ํฉ๊ณ๋ฅผ ๊ตฌํ ์ ์์ต๋๋ค. ๋ฐ๋์ ์ ์, ๋ ์ง, ํ
์คํธ ๋ฑ ์ ํํ ํ์์ ์ง์ ํด์ผ ํฉ๋๋ค.
- ์ด ๋ถํ & ๋ณํฉ: '์์ธํน๋ณ์ ๊ฐ๋จ๊ตฌ'๋ฅผ '์์ธํน๋ณ์'์ '๊ฐ๋จ๊ตฌ'๋ก ์ชผ๊ฐ๊ฑฐ๋(๋ถํ ), '์ฑ'๊ณผ '์ด๋ฆ'์ ํ๋๋ก ํฉ์น๋(๋ณํฉ) ์์
์
๋๋ค.
๐ 4. ๊ณ ๊ธ ์ด ๋ฐ์ดํฐ ๋ค๋ฃจ๊ธฐ
๋จ์ํ ๊ฐ๊ณต์ ๋์ด ์๋ก์ด ์ ๋ณด๋ฅผ ์ฐฝ์ถํ๋ ๋จ๊ณ์
๋๋ค.
- โ ์กฐ๊ฑด ์ด ์ถ๊ฐ: "์ ์๊ฐ 90์ ์ด์์ด๋ฉด '์ฐ์', ์๋๋ฉด '๋ณดํต'"๊ณผ ๊ฐ์ด ์กฐ๊ฑด๋ฌธ์ ์ฌ์ฉํ์ฌ ์๋ก์ด ์ด์ ๋ง๋ญ๋๋ค.
- ๐ง ์์ ์ ์ด (Column from Examples): ์ฌ์ฉ์๊ฐ ์ํ๋ ๊ฒฐ๊ณผ ์์๋ฅผ ๋ช ๊ฐ ์
๋ ฅํ๋ฉด, AI๊ฐ ํจํด์ ํ์
ํด ๋ณต์กํ ์์ ์์ด๋ ์๋์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ถ์ถ/๊ฒฐํฉํด ์ค๋๋ค.
- โฌ๏ธ ์ฑ์ฐ๊ธฐ (Fill Down/Up): ์์ชฝ ์
์ ๊ฐ์ด ์๋์ชฝ ๋น ์
์๋ ํด๋นํ ๋, ์๋๋ก ์ญ ์ฑ์ ๋ฃ์ด ๋ฐ์ดํฐ์ ์ฐ์์ฑ์ ํ๋ณดํฉ๋๋ค. (์์
์ ๋ณํฉ๋ ์
์ ํ ๋ ๋งค์ฐ ์ ์ฉํฉ๋๋ค.)
๐๏ธ 5. ํ์ผ ๋ฐ ์ฟผ๋ฆฌ ๊ฒฐํฉ (๋ณํฉ vs ์ถ๊ฐ)
์ฌ๋ฌ ๊ณณ์ ํฉ์ด์ง ๋ฐ์ดํฐ๋ฅผ ํ๋๋ก ํฉ์น๋ ๊ฐ๋ ฅํ ๊ธฐ๋ฅ์
๋๋ค.
| ๊ธฐ๋ฅ | ์ค๋ช
(๋น์ ) | ์ฃผ์ ์ฉ๋ |
|---|
| ๐ ์ฟผ๋ฆฌ ๋ณํฉ (Merge) | ๊ฐ๋ก๋ก ๋ถ์ด๊ธฐ (VLOOKUP๊ณผ ์ ์ฌ) | ๋งค์ถ ํ
์ด๋ธ์ ์ํ ๋ง์คํฐ์ '๋จ๊ฐ'๋ฅผ ๊ฐ์ ธ์ฌ ๋ |
| โ ์ฟผ๋ฆฌ ์ถ๊ฐ (Append) | ์ธ๋ก๋ก ์๊ธฐ | 1์ ๋งค์ถ ๋ฐ์ดํฐ ์๋์ 2์ ๋ฐ์ดํฐ๋ฅผ ์ด์ด ๋ถ์ผ ๋ |
๐ 6. ๋ฐ์ดํฐ ๋ชจ๋ธ๋ง์์์ DAX ํ์ฉ (๋ฐ์ดํฐ ๋ณด๊ธฐ)
ํ์ ์ฟผ๋ฆฌ์์ ๋ฐ์ดํฐ๋ฅผ ๋ก๋ํ ํ, ๋ฐ์ดํฐ ๋ณด๊ธฐ(Data View) ํญ์์ DAX(Data Analysis Expressions) ํจ์๋ฅผ ์จ์ ๋์ ์ธ ์ด์ ์ถ๊ฐํ ์ ์์ต๋๋ค.
- ์๊ฐ ์ ๋ณด ์ถ์ถ:
HOUR, WEEKDAY ํจ์๋ก ๋์ฌ ์ผ์์์ ์๊ฐ๋๋ ์์ผ์ ๋ฝ์๋ด ๋ถ์์ ์ฐจ์์ ๋ํ๋๋ค.
- SWITCH ํจ์: ์ซ์ ์ฝ๋(1, 2, 3)๋ฅผ ์๋ฏธ ์๋ ํ
์คํธ(์, ์ค, ํ)๋ก ๋ณํํ ๋ ์ ์ฉํฉ๋๋ค.
- ์ ๋ ฌ ์์ ์ง์ : '์' ์ด๋ฆ์ด ๊ฐ๋๋ค์(10์, 11์, 1์...)์ผ๋ก ์์ผ ๋, ์ซ์ ์ด์ ๊ธฐ์ค์ผ๋ก ์ ๋ ฌ ์์๋ฅผ ๋ฐ๋ก์ก์ต๋๋ค.
โ
๋ง์น๋ฉฐ: ์ข
๋ฃ ๋ฐ ์ ์ฉ
ํ์ ์ฟผ๋ฆฌ ํธ์ง๊ธฐ์์์ ๋ชจ๋ ์์
์ [๋ซ๊ธฐ ๋ฐ ์ ์ฉ] ๋ฒํผ์ ๋๋ฅด๊ธฐ ์ ๊น์ง๋ Power BI ๋ณธ์ฒด์ ๋ฐ์๋์ง ์์ต๋๋ค. ์์
์ด ๋๋๋ฉด ๋ฐ๋์ ์ด ๋ฒํผ์ ๋๋ฌ ์ ์ ๋ ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ธ๋ก ๋๊ฒจ์ฃผ์ธ์!