[정보처리기사 실기] DB 신기술

HyeJean·2023년 10월 1일
0

정보처리기사

목록 보기
5/8

✏️ DataBase 관련 신기술


1. 빅 데이터(Big Data)

  • 기존의 관리 방법이나 분석 체계로는 처리하기 어려운 막대한 양의 정형 또는 비정형 데이터 집합
  • 빅데이터가 주목받고 있는 이유는 기업이나 정부, 포털 등이 빅데이터를 효과적으로 분석함으로써 미래를 예측해 최적의 대응 방안을 찾고, 이를 수익으로 연결하여 새로운 가치를 창출하기 때문이다.

2. 브로드 데이터(Broad Data)

  • 다양한 채널에서 소비자와 상호 작용을 통해 생성된 것
  • 이전에 사용하지 않았거나 알지 못했던 새로운 데이터나 기존 데이터에 새로운 가치가 더해진 데이터

3. 메타 데이터(Meta Data)

  • 일련의 데이터를 정의하고 설명해 주는 데이터
  • 컴퓨터에서는 데이터 사전의 내용, 스키마 등을 의미
  • HTML 문서에서는 메타 태그 내의 내용

4. 디지털 아카이빙(Digital Archiving)

  • 디지털 정보 자원을 장기적으로 보존하기 위한 작업
  • 아날로그 콘텐츠는 디지털로 변환한 후 압축해서 저장하고, 디지털 콘텐츠는 체계적으로 분류하고 메타 데이터를 만들어 DB화 하는 작업

5. 하둡(Hadoop)

  • 오픈 소스를 기반으로 한 분산 컴퓨팅 플랫폼
  • 자바 소프트웨어 프레임워크

6. 맵리듀스(Map + Reduce)

  • 대용량 데이터를 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델
  • 흩어져 있는 데이터를 연관성 있는 데이터 분류로 묶는 Map
  • 중복 데이터를 제거하고 원하는 데이터를 추출하는 Reduce
  • Google에 의해 고안

7. 타조(Tajo)

  • 오픈 소스 기반 분산 컴퓨팅 플랫폼인 아파치 하둡 기반의 분산 데이터 웨어하우스 프로젝트

데이터 웨어하우스(Data Warehouse)

- 정보와 창고의 합성어로, 기업의 의사결정 과정에 효과적으로 사용될 수 있도록 
여러 시스템에 분산되어 있는 데이터를 주제별로 통합·축적해 놓은 데이터베이스

8. 데이터 다이어트(Data Diet)

  • 데이터를 삭제하는 것이 아니라 압축하고, 중복된 정보는 중복을 배제하고, 새로운 기준에 따라 나누어 저장하는 작업

9. 데이터 마이닝(Data Mining)

  • 대량의 데이터를 분석하여 데이터에 내재된 변수 사이의 상호 관계를 규명하여 일정한 패턴을 찾아내는 기법

10. OLAP(Online Analytical Processing)

  • 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석하여 의사결정에 활용하는 방식

0개의 댓글