DataBase Management System
계층형/네트워크형/관계형/객체형 등등 다양한 데이터베이스가 있음
그중 많이 쓰이는 관계형을 다루는 RDBMS는
https://www.datacamp.com/blog/data-lakes-vs-data-warehouses를 참고함
무분별하게 데이터가 쌓여있는 호수를 생각하면 되겠다. 가공이 적게 되어있고 양이 방대하다. 딥러닝 등에 사용
전처리가 되어있는 데이터들의 모음이다. 가공이 잘 되어있어 비즈니스적인 데이터 분석에 사용한다.
추후작성
현실세계 데이터에서 E(ntity)-R(elationship) 다이어그램 을 만든다.
ERD를 만들 때 AQuerytool 이나 erdcloud를 이용하면 편하다..
E-R다이어그램에서 각 개체, 관계별로 2차원 table인 Relation을 만드는 과정이다.
https://partrita.github.io/posts/tidy-data/
이 곳을 참고하자.
- 각 변수는 개별의 열(column)으로 존재한다.
- 각 관측치는 행(row)를 구성한다.
- 각 표는 단 하나의 관측기준에 의해서 조직된 데이터를 저장한다.
- 만약 여러개의 표가 존재한다면, 적어도 하나이상의 열(column)이 공유되어야 한다
2차원 table에서 SQL코드로 변환하는 과정이다.
ex)
CREATE TABLE member (
memid INT PRIMARY KEY,
name VARCHAR(40),
...
);
CREATE TABLE order (
orderid INT PRIMARY KEY,
memid INT,
FOREIGN KEY(memid) REFERENCES member(memid), # foreign key로 연결
...
);
relation 자체를 다루는 언어. CREATE / ALTER / DROP 등이 있다.
데이터 관리를 위한 언어. SELECT / INSERT / UPDATE / DELETE
사용자 관리, 사용자 별 권한 등을 다룬다. GRANT / REVOKE