1-21. DB 관련 신기술 / 용어

민성·2022년 4월 14일
0
post-thumbnail

1. DB 관련 신기술


  1. 빅데이터(Big Data)
  • 막대한 향의 정형 또는 비정형 데이터 집합

  • 빅데이터를 효과적으로 분석함으로써 미래를 예측해 최적의 대응 방안을 찾고, 이를 수익으로 연결하여 새로운 가치 창출

  1. 브로드 데이터(Broad Data)
  • 다양한 채널에서 소비자와 상호 작용을 통해 생성된 것

  • 마케팅에 있어 효율적이고 다양한 데이터

  • 이전에 사용하지 않거나 알지 못했던 새로운 데이터나 기존 데이터에 새로운 가치가 더해진 데이터

  1. 메타 데이터(Meta Data)
  • 일련의 데이터를 정의하고 설명해 주는 데이터

  • 컴퓨터에서는 데이터 사전의 내용, 스키마 등을 의미

  • HTML 문서에서는 메타 태그 내의 내용이 메타 데이터

  1. 디지털 아카이빙(Digital Archiving)
  • 디지털 정보 자원을 장기적으로 보존하기 위한 작업

  • 아날로그 콘텐츠는 디지털로 변환 후 압축해서 저장

  • 디지털 콘텐츠도 체계적으로 분류하고 메타 데이터를 만들어 DB화 하는 작업

  1. 하둡(Hadoop)
  • 오픈 소스를 기반으로 한 분산 컴퓨팅 플랫폼

  • 데이터 세트를 병렬로 처리할 수 있도록 개발된 자바 소프트에어 프레임워크

  1. 맵리듀스(MapReduce)
  • 대용량 데이터를 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델

  • 연관성 있는 데이터 분류로 묶는 Map 작업 수행 후 중복 데이터 제고하고, 원하는 데이터를 추출하는 Reduce 작업 수행

  • Google 에 의해 고안

  1. 타조(Tajo)
  • 아파치 하둡 기반의 분산 데이터 웨어하우스 프로젝트

  1. 데이터 다이어트(Data Diet)
  • 데이터 삭제가 아니라 압축하고

  • 중복된 정보는 중복 배제

  • 새로운 기존에 따라 나누어 저장

  1. 데이터 마이닝(Data Mining)
  • 대량이 데이터 분석

  • 데이터에 내재도니 변수 사이의 상호 관계를 규명

  • 일정한 패턴 찾아냄

  1. OLAP(Online Analytical Processing)
  • 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석
    ⇒ 의사결정에 활용

  • OLAP 연산

    • Roll-up
    • Roll-down
    • Drill-through
    • Drill-across
    • Pivoting
    • Slicing
    • Dicing

2. DB 관련 용어


  1. 스택(Stack)
  • 리스트의 한쪽 끝으로만 자료의 삽입, 삭제 작업이 이루어지는 자료 구조

  • 후입선출(LIFO; Last In First Out)

  1. 큐(Queue)
  • 리스트의 한쪽에서는 삽입 작업, 다른 한쪽에서는 삭제 작업이 이루어지는 자료구조

  • 선입선출(FIFO; First In First Out)

  1. 정규화(Normalization)
  • 잘못 설계된 관계형 스키마를 더 작은 속성의 세트로 쪼갬
    ⇒ 바람직한 스키마로 만들기

  1. 반정규화(Denormalization)
  • 정규화된 데이터 모델을 통합, 중복, 분리하는과정
    ⇒ 의도적으로 정규화 원칙을 위배하는 행위

  1. 이상(Anomaly)
  • 정규화를 거치지 않으면 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 못한 곤란한 현상 발생
    ⇒ 이상

  • 삽입 이상, 삭제 이상, 갱신 이상

  1. 인덱스(Index)
  • <키 값, 포인터> 쌍으로 구성되는 데이터 구조
    ⇒ 데이터 레코드를 빠르게 접근하기 위해

  1. 뷰(View)
  • 하나 이상의 기본 테이블로부터 유도된, 이름을 가지는 가상 테이블
    ⇒ 접근이 허용된 자료만을 제한적으로 보여주기 위해

  1. 파티션(Partition)
  • 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것

  1. 관계대수
  • 관계형 DB에서 원하는 정보와 그 정보를 검색하기 위해서 어떻게 유도하는가를 기술하는 절차적 언어

  1. 관계해석
  • 관계 데이터의 연선 표현 방법

  1. 후보키(Candidate Key)
  • 릴레이션을 구성하는 속성들 중 튜플을 유일하게 식별하기 위해 사용하는 속성들의 부분집합
    ⇒ 기본키로 사용할 수 있는 속성

  • 모든 튜플에 대해서 유일성과 최소성을 만족시켜야 함

  1. 기본키(Primary Key)
  • 후보키 중에서 특별히 선정된 주키

  • 중복된 값을 가질 수 없음

  1. 대체키(Alternate Key)
  • 기본키를 제외한 나머지 후보키를 의미

  • 보조키 라고도 함

  1. 슈퍼키(Super Key)
  • 릴레이션 내에 있는 속성들의 집합으로 구성된 키

  • 모든 튜플에 대해 유일성은 만족시키지만, 최소성은 만족시키지 못함

  1. 왜래키(Foreign Key)
  • 다른 릴레이션의 기본키를 참조하는 속성

  1. 개체 무결성(Entity Integrity)
  • 기본키를 구성하는 어떤 속성도 Null 값이나 중복값을 가질 수 없음

  1. 참조 무결성(Referential Integrity)
  • 외래키 값은 Null 이거나 참조 릴레이션의 기본키 값과 동일해야 함
    ⇒ 릴레이션은 참조할 수 없는 외래키 값을 가질 수 없음
profile
mdalss0113@gmail.com

0개의 댓글

관련 채용 정보