📣 유용한 정보를 발굴하고 결론 내용을 알리며 의사결정을 지원하는 것을 목표로 데이터를 정리, 변환, 모델링하는 과정
📣 비즈니스 부문) 의사 결정을 더 과학적으로 만들어주고 비즈니스를 더 효율적으로 운영할 수 있도록 도와주는 역할
: 업무 상황에서 발생하는 다양한 데이터 수집
: 분석 목적 및 방법에 부합하도록 데이터의 내용, 형태를 가공
➡️ 데이터 및 변수 형태 변환
➡️ 변수 선정
➡️ 결측치 및 이상치 처리
➡️ 데이터 분리 및 결함
➡️ 데이터 및 변수 형태 변환
: 결과 도출을 위한 수식/함수/기능 적용
: 개선 효과 계산, 과거 데이터와 비교, 다양한 방법 간 비교
: 보고서, 대시보드 등의 회의/보고 자료 작성
: 두 변수 간에 어떤 선형적 또는 비선형적 관계를 갖고 있는지를 분석하는 방법
: 한쪽이 증가하면 다른 쪽도 증가하거나 반대로 감소되는 경향을 인정하는 두 양 사이의 통계적 관계
➡️ 두 변수가 선형 관계인지, 비선형 관계인지 파악
: 두 변수 사이의 상관성을 나타내며 일반적으로 피어슨(Pearson) 상관계수를 사용
🔑 -1 ≤ 상관 계수 ≤ 1
❗상관계수가 0.7이상이면 강한 양의 상관관계, -0.7이하면 강한 음의 상관관계
: 연속형 변수인 종속 변수와 한 개 이상의 독립 변수 간의 관계를 파악하는 분석
➡️ 두 변수 간의 관계 파악
➡️ 미래 값 예측
🔑 y=ax+b
: 독립 변수가 한 개
: 독립 변수가 변할 때, 종속 변수 값이 어떻게 변하는지를 가장 잘 설명해주는 직선을 찾아 분석하는 방법
❗ 이때 직선은 최소 제곱법을 이용하여 전체적으로 오차가 작은 직선을 찾음
: 독립 변수가 여러 개
: 여러 개의 독립 변수가 종속 변수값에 미치는 영향 파악
🌲 결정 계수 : 0~1의 값을 가지며 1에 가까울수록 회귀 모형이 실제 값을 잘 설명
🌲 F-value : 0.05미만이면 회귀 모형이 유의미
🌲 Y절편 및 X1 계수 확인(회귀식) : Y절편은 위의 식의 b값, X1의 값은 a(기울기)를 뜻함
: 막대형 또는 꺾은선형 그래프를 그린 후 계열 차트 종류 변경
: 숫자의 크기나 비율을 거품으로 나타내는 차트
: 거품의 위치와 거품의 크기, 색 등을 활용해 정보를 표현
: 숫자의 증가, 감소분 만큼 막대 그래프로 표현
: 특정한 조건 규칙을 만족하는 데이터에만 자동으로 서식이 적용되도록 하는 기능