AI 리터러시 과제 - ADsP 핵심 요약 노트

·2026년 3월 10일

✍🏻information

목록 보기
9/22

ADsP 핵심 요약 암기노트


1. 데이터 이해

1. 데이터의 정의

데이터 → 정보 → 지식 → 지혜

단계설명
데이터가공되지 않은 사실
정보의미 있는 데이터
지식경험과 결합된 정보
지혜의사결정에 활용

2. 데이터 특징 (4V)

요소의미
Volume데이터 규모
Velocity데이터 생성 속도
Variety데이터 종류
Value데이터 가치

※ 시험에서 Velocity / Variety 혼동 문제 자주 출제


3. 데이터 유형

정형 데이터 (Structured Data)

  • RDB
  • 테이블 형태
  • SQL 분석 가능

  • 고객 DB
  • 매출 데이터

반정형 데이터 (Semi-Structured Data)

  • XML
  • JSON

비정형 데이터 (Unstructured Data)

  • 텍스트
  • 영상
  • 음성
  • SNS 데이터

4. 데이터베이스 특징

특징의미
통합성데이터 중복 최소
저장성지속적으로 저장
공용성여러 사용자가 공유
변화성데이터 수정 가능

5. 데이터베이스 구조 (3계층 구조)

계층설명
External Schema사용자 관점
Conceptual Schema전체 구조
Internal Schema물리적 저장 구조

6. 데이터 마이닝

대량 데이터에서 패턴을 발견하는 기술

대표 기법

  • 분류 (Classification)
  • 군집 (Clustering)
  • 연관 규칙 (Association)
  • 회귀 (Regression)

2. 데이터 분석 기획

1. 데이터 분석 프로세스

CRISP-DM

데이터 분석 산업 표준 프로세스

  1. Business Understanding
  2. Data Understanding
  3. Data Preparation
  4. Modeling
  5. Evaluation
  6. Deployment

암기

비즈니스 → 데이터 → 준비 → 모델 → 평가 → 배포


2. KDD 분석 프로세스

  1. 데이터 선택
  2. 데이터 전처리
  3. 데이터 변환
  4. 데이터 마이닝
  5. 결과 해석

3. 분석 방법론 비교

방법론특징
CRISP-DM산업 표준
KDD데이터 중심
SEMMASAS 분석 방법론

SEMMA 단계

  1. Sample
  2. Explore
  3. Modify
  4. Model
  5. Assess

4. 분석 과제 도출 방법

방식설명
Top-down문제 → 데이터
Bottom-up데이터 → 문제

5. 분석 과제 우선순위

평가 기준

  • 전략 적합성
  • 실행 가능성
  • ROI (Return on Investment)

6. 분석 조직 유형

유형특징
집중형중앙 분석 조직
기능형부서별 분석
혼합형두 방식 결합

3. 데이터 분석

1. 통계 기초

평균

평균 = Σx / n

중앙값

데이터 가운데 값

최빈값

가장 많이 나온 값

분산

데이터 퍼짐 정도

표준편차

분산의 제곱근


2. 정규분포

특징

  • 평균 = 중앙값 = 최빈값
  • 종 모양 분포

68-95-99 법칙

범위확률
±1σ68%
±2σ95%
±3σ99%

3. 가설검정

개념의미
귀무가설 (H0)차이 없음
대립가설 (H1)차이 있음

p-value 기준

p < 0.05 → 귀무가설 기각


4. 상관분석

상관계수 r

범위

-1 ~ +1

의미
+1완전 양의 상관
0상관 없음
-1완전 음의 상관

5. 회귀분석

독립변수 → 종속변수 영향 분석

단순회귀식

Y = a + bX


6. 분류 분석 (Classification)

대표 알고리즘

  • 의사결정나무
  • 로지스틱 회귀
  • SVM
  • 랜덤포레스트

7. 군집 분석 (Clustering)

비지도 학습

대표 알고리즘

  • K-means
  • 계층적 군집

8. 연관 분석 (Association Analysis)

대표 알고리즘

  • Apriori

주요 지표

지표의미
Support발생 빈도
Confidence조건 확률
Lift연관 강도

ADsP 시험 핵심 암기 포인트

시험에서 자주 출제되는 핵심 개념

  1. CRISP-DM 6단계
  2. 데이터 4V
  3. SEMMA 단계
  4. 가설검정 p-value 기준
  5. Support / Confidence / Lift
  6. 정규분포 68-95-99 법칙
  7. Top-down vs Bottom-up 분석 방식
profile
내일배움캠프 PM 6기

0개의 댓글