데이터베이스

chaemin·2024년 8월 13일

CS지식

목록 보기
3/4

📌기초부터 - 데이터베이스란?

데이터베이스

  • 구조화된 정보의 모음으로서 컴퓨터 시스템에 전자적으로 저장됩니다.
  • 데이터베이스 관리 시스템(DBMS)에 의해 제어.

DBMS란?

데이터베이스를 관리하고 운영하는 소프트웨어

  • Oracle, MYSQL등등이 DBMS인 것이다.

SQL이란?

데이터를 쿼리를 통해 조작하는 프로그래밍 언어.

빅데이터란?

규모가 크고 시간이 지남에 따라 크기가 빠르게 증가하는 크고 다양한 데이터 세트를 말합니다.

  • 3V: 규모(volume), 속도(velocity), 다양성(variety)

ETL

  • 추출(Extract), 변환(Transform), 적재(Load)
    다양한 원천 데이터를 취합해 추출하고 공돝된 형식으로 변환하여 적재하는 과정.

0. 엔터티

사람, 개념 등의 여러개의 속성을 지닌 명사.

  • 종속 여부에 따라 강한 엔터티, 약한 엔터티가 있다.

    방: 약한 엔터티 / 건물: 강한 엔터티

1. 릴레이션

데이터베이스에서 정보를 구분하여 저장하는 기본 단위. 즉 관계형 데이터베이스에서는 '테이블'이라고 한다.

2. 속성, 튜플 등등 용어

3. 관계 연산자(SELECT, PROJECT..)

4. 도메인

속성들이 가질 수 있는 값의 집합

'성별' 속성의 도메인: {남, 여}


하둡

분산 처리 환경에서 대용량 데이터 처리 및 분석을 지원하는 오픈 소스 소프트웨어 프레임워크 이다.

  • 분산파일시스템을 통해 대용량 파일을 나누어 저장할 수 있다.

NoSQL

비관계형 데이터베이스로 SQL을 사용하지 않는 DBMS와 데이터 저장장치이다.

관계가 없다. 여러 테이블에 나누어담지않고 조인이라는 개념 없이 관련된 데이터를 동일한 컬렉션에 넣게된다.

  • 여러 테이블에 조인할 필요없이 이미 필요한 모든것을 갖춘 문서라고 할 수 있다.

관계를 맺고있는 데이터가 자주 변경되는 경우 - sql
읽기를 자주하지만 데이터 변경은 자주 없는 경우 - nosql

0개의 댓글