- 구조화된 정보의 모음으로서 컴퓨터 시스템에 전자적으로 저장됩니다.
- 데이터베이스 관리 시스템(DBMS)에 의해 제어.
데이터베이스를 관리하고 운영하는 소프트웨어
- Oracle, MYSQL등등이 DBMS인 것이다.
데이터를 쿼리를 통해 조작하는 프로그래밍 언어.
규모가 크고 시간이 지남에 따라 크기가 빠르게 증가하는 크고 다양한 데이터 세트를 말합니다.
- 3V: 규모(volume), 속도(velocity), 다양성(variety)
- 추출(Extract), 변환(Transform), 적재(Load)
다양한 원천 데이터를 취합해 추출하고 공돝된 형식으로 변환하여 적재하는 과정.
사람, 개념 등의 여러개의 속성을 지닌 명사.
- 종속 여부에 따라 강한 엔터티, 약한 엔터티가 있다.
방: 약한 엔터티 / 건물: 강한 엔터티
데이터베이스에서 정보를 구분하여 저장하는 기본 단위. 즉 관계형 데이터베이스에서는 '테이블'이라고 한다.


속성들이 가질 수 있는 값의 집합
'성별' 속성의 도메인: {남, 여}
분산 처리 환경에서 대용량 데이터 처리 및 분석을 지원하는 오픈 소스 소프트웨어 프레임워크 이다.
- 분산파일시스템을 통해 대용량 파일을 나누어 저장할 수 있다.
비관계형 데이터베이스로 SQL을 사용하지 않는 DBMS와 데이터 저장장치이다.
관계가 없다. 여러 테이블에 나누어담지않고 조인이라는 개념 없이 관련된 데이터를 동일한 컬렉션에 넣게된다.
관계를 맺고있는 데이터가 자주 변경되는 경우 - sql
읽기를 자주하지만 데이터 변경은 자주 없는 경우 - nosql