| 방법론 | 설명 | 특징 | 주요 활용 |
|---|---|---|---|
| CRISP-DM | 산업 간 표준 프로세스 | 비즈니스 문제 해결 중심 | 산업 전반적 사용 |
| SEMMA | 샘플링, 탐색, 수정 등 분석 중심 | 기술적 분석기법 중심 | 통계 패키지 사용 |
| KDD | DB 기반 지식 발굴 | 데이터베이스(DB) 기반 | Oracle DB 등 활용 |
| 이상 현상 | 설명 | 예시 |
|---|---|---|
| 삭제 이상 | 불필요한 데이터까지 함께 삭제되는 현상 | 주문 정보 삭제 시 회원 정보도 삭제됨 |
| 삽입 이상 | 정보 부족으로 데이터 삽입 불가능 현상 | 이름 없는 주소 데이터 |
| 갱신 이상 | 데이터 갱신 시 일부만 갱신되어 정보 불일치 | 마우스 단가 변경 시 일부만 갱신 |
| 종류 | 설명 |
|---|---|
| 완전 함수 종속 | 기본키 전체에 종속 |
| 부분 함수 종속 | 기본키 일부에만 종속 |
| 이행적 종속 | A → B, B → C 관계에서 A → C 성립 |
| 단계 | 특징 | 설명 |
|---|---|---|
| 1차 정규화 | 반복되는 속정 제거 | 각 항목을 단일 원자값으로 |
| 2차 정규화 | 부분적 종속 제거 | 완전한 함수적 종속 유지 |
| 3차 정규화 | 이행적 종속 제거 | 직접적 종속관계만 유지 |
| BCNF | 모든 결정자가 후보키가 되는 구조 | 3차 이상의 엄격한 정규화 |
| 4차 정규화 | 다중값 종속 제거 | 다중값 속성을 별도 분리 |
| 5차 정규화 | 결합 종속 제거 | 관계성 간 결합의 독립성 유지 |
| 방법 | 설명 |
|---|---|
| 릴레이션 병합 | 두 개 이상의 테이블을 합침 |
| 릴레이션 분할 | 테이블을 사용 빈도에 따라 나눔 (수직﹒수평) |
| 속성 역정규화 | 검색 효율성을 위해 추가 속성 생성 |