EDA에 대한 소개와 나의 생각

용가리·2024년 8월 24일

반갑습니다.
EDA에 대해 설명해볼까 합니다.

EDA란?

EDA란 Explomentary Data Analysis의 약자로 데이터를 이리저리 바꾸고, 특징을 추출해가며 데이터에 대해 Insight를 탐구하고 분석하는 과정을 의미합니다.

EDA는 정말 넓은 의미를 가지고 있습니다.
데이터 분석을 통해 어떤 데이터를 AI모델에 넣을것이냐를 위해서도 EDA를 사용하고,
그냥 데이터만 분석을 해서 기업의 의사 결정, 주가 예측 등을 할 수도 있습니다.
제 생각에 데이터 분석을 매우 잘한다면 어느 집단에서도 환영받는 인재가 될 수 있다고 생각합니다.
그만큼 가장 기본적이고 중요한 부분이죠.

데이터 분석의 목적은 뭘까?

데이터 분석은 다양한 방면으로 쓰이는데, 궁극적인 목표가 뭘까요
제가 샤워하면서 고민해본 결과
데이터를 분석한다는 것은
1. '미래'를 얼마만큼 합리적으로 예측할수 있냐
2. 사람들은 어떤 분포에 존재하는가
이 두가지 인 것 같습니다.(제 생각입니다)

  1. 에 대해서 얘기를 해보겠습니다.
    예를 들어서 제 26년 인생동안 어머니께 거짓말을 치면 맨날 혼났다고 가정해봅시다.
    그러면 다음에 거짓말을 쳤을 때 혼날 것이라는것을 알 수 있겠죠
    저의 피지컬메모리가 그렇게 느낀 것입니다.
    왜 그렇게 느꼈을까요
    그야 맨날 혼났으니까 그렇죠
    저는 저의 데이터를 전부 깊게 알고 있으니 바로 결론이 납니다.
    하지만 다른 가정집의 경우를 본다면 당연히 구라를 쳤을때 혼날지 안혼날지 판단이 안 설겁니다.
    데이터 분석은 다른 가정집의 기록을 찾아보는 과정이라고 생각합니다.
    다른 가정집이라도 아들래미가 몇번 혼났는지를 보면 그래도 얼추 읽어볼 수 있겠죠.

  2. 를 보면
    어떤 기업의 유저 데이터가 있다고 생각해봅시다.
    기업은 본인 회사의 제품이 반응이 좋은지 사용자가 필요한 부분의 맥을 딱 짚었는지가 제일 궁금하겠죠.
    유저들은 본인이 마음에 드는지 안드는지를 점수로 메기고 있지 않고, 설령 그렇다고 하더라도 기업에게 알려주지 않습니다.
    그렇다면 기업은 세상 사람들의 불편함을 직접 찾아내야 회사를 더 발전시킬 수 있겠죠.
    어떤 집단의 어떤 부분이 불편한지
    어떤 분포의 사람들이 불편함을 느끼는지
    이런 경우에 유저 데이터를 분석하면서 찾아갈 수 있겠습니다.

데이터를 잘 보고 분석한다는 것은 결국 남들이 모르는 최고의 정배를 찾는 과정이라고 생각합니다.

데이터분석은 마치 제가 예전에 했던것처럼 LCK 어느 팀의 경기에서 욕설이 가장 많은지를 보는것만으로 그쳐서는 안됩니다.
그것이 어떤 비즈니스적으로 얼마나 좋은 결과인지 또는 세상 사람들에게 선한 영향을 끼칠 수 있는지를 봐야하죠.

그런 분석능력은 단순히 배운다고 되는게 아닌 것 같습니다.
항상 배려심을 갖고 어떻게 하면 타인에게 도움이 될 지를 꾸준히 생각해야 한다고 생각합니다.
저도 그런 생각을 무의식에도 계속 가지고 있을 수 있도록 많이 노력해야겠습니다.

0개의 댓글