🚩 데이터 분석이란?

📣 유용한 정보를 발굴하고 결론 내용을 알리며 의사결정을 지원하는 것을 목표로 데이터를 정리, 변환, 모델링하는 과정

📣 비즈니스 부문) 의사 결정을 더 과학적으로 만들어주고 비즈니스를 더 효율적으로 운영할 수 있도록 도와주는 역할

🪄 다양한 데이터 → 분석 기법 활용 → 문제 발견 → 원인 파악 → 해결 방안 모색 → 인사이트 도출


🚩 데이터 분석 과정

🪄 데이터 수집 → 데이터 전처리 → 데이터 모델링 → 검증 및 평가 → 데이터 시각화

🔹데이터 수집

: 업무 상황에서 발생하는 다양한 데이터 수집

🔸데이터 전처리

: 분석 목적 및 방법에 부합하도록 데이터의 내용, 형태를 가공
➡️ 데이터 및 변수 형태 변환
➡️ 변수 선정
➡️ 결측치 및 이상치 처리
➡️ 데이터 분리 및 결함
➡️ 데이터 및 변수 형태 변환

🔹데이터 모델링

: 결과 도출을 위한 수식/함수/기능 적용

🔹검증 및 평가

: 개선 효과 계산, 과거 데이터와 비교, 다양한 방법 간 비교

🔹데이터 시각화

: 보고서, 대시보드 등의 회의/보고 자료 작성


🚩 데이터 분석 기법 활용

🌈 상관 분석

🔸상관 분석

: 두 변수 간에 어떤 선형적 또는 비선형적 관계를 갖고 있는지를 분석하는 방법

🔸상관 관계

: 한쪽이 증가하면 다른 쪽도 증가하거나 반대로 감소되는 경향을 인정하는 두 양 사이의 통계적 관계
➡️ 두 변수가 선형 관계인지, 비선형 관계인지 파악

🔸상관 계수

: 두 변수 사이의 상관성을 나타내며 일반적으로 피어슨(Pearson) 상관계수를 사용

🔑 -1 ≤ 상관 계수 ≤ 1
❗상관계수가 0.7이상이면 강한 양의 상관관계, -0.7이하면 강한 음의 상관관계


🌈 회귀 분석

🔸회귀 분석

: 연속형 변수인 종속 변수와 한 개 이상의 독립 변수 간의 관계를 파악하는 분석
➡️ 두 변수 간의 관계 파악
➡️ 미래 값 예측

🔑 y=ax+b

🔸회귀 분석의 종류

✔️ 단순 회귀 분석

: 독립 변수가 한 개
: 독립 변수가 변할 때, 종속 변수 값이 어떻게 변하는지를 가장 잘 설명해주는 직선을 찾아 분석하는 방법
❗ 이때 직선은 최소 제곱법을 이용하여 전체적으로 오차가 작은 직선을 찾음

✔️ 다중 회귀 분석

: 독립 변수가 여러 개
: 여러 개의 독립 변수가 종속 변수값에 미치는 영향 파악

🔸회귀 분석의 평가와 해석

🌲 결정 계수 : 0~1의 값을 가지며 1에 가까울수록 회귀 모형이 실제 값을 잘 설명
🌲 F-value : 0.05미만이면 회귀 모형이 유의미
🌲 Y절편 및 X1 계수 확인(회귀식) : Y절편은 위의 식의 b값, X1의 값은 a(기울기)를 뜻함


🚩 데이터 시각화

🔹막대형 차트

🔹꺽은선형 차트

🔹원형 차트

🔹콤보형 차트

: 막대형 또는 꺾은선형 그래프를 그린 후 계열 차트 종류 변경

🔹거품형 차트

: 숫자의 크기나 비율을 거품으로 나타내는 차트
: 거품의 위치와 거품의 크기, 색 등을 활용해 정보를 표현

🔹폭포형 차트

: 숫자의 증가, 감소분 만큼 막대 그래프로 표현

🔹조건부 서식

: 특정한 조건 규칙을 만족하는 데이터에만 자동으로 서식이 적용되도록 하는 기능

profile
To be Data Analysist

0개의 댓글