Database 정리 2

임동준·2023년 11월 23일

Database

목록 보기

2/3

💡 RDBMS와 NoSQL의 차이에 대해 설명해주세요.

RDBMS는 모든 데이터를 2차원 테이블 형태로 표현합니다.
- 장점 : 스키마에 맞춰 데이터를 관리하기 때문에 데이터의 정합성을 보장할 수 있다.
- 단점 : 시스템이 커질 수록 쿼리가 복잡해지고 성능이 저하되며 Scale-out이 어렵다(Scale-up만 가능)
NoSQL(Not Only SQL)은 RDBMS와 반대로 데이터간의 관계를 정의하지 않고, 스키마가 없어 좀 더 자유롭게 데이터를 관리할 수 있으며, 컬렉션이라는 형태로 데이터를 관리합니다.
- 장점
  스키마 없이 Key-Value 형태로 데이터를 관리해 자유롭게 데이터를 관리할 수 있다.
  데이터 분산이 용이하여 성능 향상을 위한 scale-up 뿐만아닌 scale-out 또한 가능하다.
- 단점
  데이터 중복이 발생할 수 있고, 중복된 데이터가 변경될 경우 수정을 모든 컬렉션에서 수행해야 한다.
  스키마가 존재하지 않기에 명확한 데이터 구조를 보장하지 않아 데이터 구조 결정이 어려울 수 있다.

💡 그렇다면 RDBMS와 NoSQL은 어느 경우에 적합한가요?

RDBMS는 데이터 구조가 명확하고, 변경 될 여지가 없으며 스키마가 중요한 경우 사용하는 것이 좋습니다. 또한 중복된 데이터가 없어(데이터 무결성) 변경이 용이하기 때문에 관계를 맺고 있는 데이터가 자주 변경이 이루어지는 시스템에 적합합니다.
NoSQL은 정확한 데이터 구조를 알 수 없고 데이터가 변경/확장 될 수 있는 경우 사용하는 것이 좋습니다. 또한 단점에서도 명확하듯 데이터 중복이 발생할 수 있으며 중복된 데이터가 변경될 시 모든 컬렉션에서 수정해야 하기 때문에 Update가 많이 이루어지지 않는 시스템에 좋으며, Scale-out이 가능하다는 장점을 활용해 막대한 데이터를 저장해야 해서 DB를 Scale-out 해야 되는 시스템에 적합합니다.

💡 트랜잭션이란 무엇인지 설명해주세요.

트랜잭션은 작업의 완전성을 보장해줍니다.
즉, 작업들을 모두 처리하거나 처리하지 못할 경우 이전 상태로 복구하여 작업의 일부만 적용되는 현상이 발생하지 않게 만들어주는 기능입니다.
하나의 트랜잭션은 Commit(작업완료)되거나 Rollback(취소)됩니다.

💡 트랜잭션의 특성(ACID)에 대해 설명해주세요.

원자성(Atomicity) 작업이 모두 반영되던지 아니면 전혀 반영되지 않아야 한다.
일관성(Consistency) 실행이 완료되면 언제나 일관성 있는 상태를 유지해야 한다.
독립성(Isolation) 둘 이상 트랜잭션이 동시에 실행될 경우 서로의 연산에 끼어들 수 없다.
영속성(Durability) 완료된 결과는 영구적으로 반영되어야 한다.

💡 DB 락에 대해 설명해주세요.

DB Lock은 트랜잭션 처리의 순차성을 보장하기 위한 방법입니다.
공유락(LS, Shared Lock) Read Lock라고도 하는 공유락은 트랜잭션이 읽기를 할 때 사용하는 락이며, 데이터를 읽기만하기 때문에 같은 공유락 끼리는 동시에 접근이 가능합니다.
베타락(LX, Exclusive Lock) Write Lock라고도 하는 베타락은 데이터를 변경할 때 사용하는 락입니다. 트랜잭션이 완료될 때까지 유지되며, 베타락이 끝나기 전까지 어떠한 접근도 허용하지 않습니다.

💡 inner join과 outer join의 차이를 설명해주세요.

inner join 은 서로 연관된 내용만 검색하는 조인 방법입니다.A와 B에 대해 수행하는 것은, A와 B의 교집합을 말합니다.
벤다이어그램으로 그렸을 때 교차되는 부분입니다.
outer join 은 한 쪽에는 데이터가 있고 한 쪽에는 데이터가 없는 경우, 데이터가 있는 쪽의 내용을 전부 출력하는 방법입니다.
벤다이어그램으로 그렸을 때 합집합 부분입니다.outer join에는 LEFT OUTER JOIN, RIGHT OUTER JOIN, FULL OUTER JOIN이 있습니다.

💡 group by의 역할에 대해 설명해주세요.

GROUP BY 는 GROUP BY 명령어를 통해 특정 컬럼을 기준으로 연산한 결과를 집계 키로 정의하여 그룹을 짓는 역할을 합니다.
집합 연산자는 COUNT, SUM, AVG, MAX, MIN 등이 있고, DISTINCT와 같이 중복 데이터를 제거하는 특징이 있습니다.

💡 DELETE, TRUNCATE, DROP의 차이를 설명해주세요.

DELETE는 데이터는 지우지만 테이블 용량은 줄어들지 않고 원하는 데이터만 골라서 지울 수 있습니다. 삭제 후 되돌릴 수 있습니다.
TRUNCATE는 전체 데이터를 한번에 삭제하는 방식입니다. 테이블 용량이 줄어들고 인덱스 등도 삭제되지만 테이블은 삭제할 수 없고, 삭제 후 되돌릴 수 없습니다.
DROP은 테이블 자체를 완전히 삭제하는 방식(공간, 인덱스, 객체 모두 삭제)입니다. 삭제 후 되돌릴 수 없습니다.

💡 데이터베이스 클러스터링과 리플리케이션의 차이에 대해 설명해주세요.

클러스터링이란 여러 개의 DB를 수평적인 구조로 구축하는 방식입니다. 동기 방식으로 사용되며, 다음과 같은 장단점이 있습니다.
- 장점
  DB 간의 데이터를 동기화하여 항상 일관성있는 데이터를 얻을 수 있다.1개의 DB가 죽어도 다른 DB가 살아 있어 시스템을 장애없이 운영할 수 있다. (높은 가용성)기존에 하나의 DB서버에 몰리던 부하를 여러 곳으로 분산시킬 수 있다. (로드밸런싱)
- 단점
  저장소 하나를 공유하면 병목현상이 발생할 수 있다.
  ※ 병목현상 : 전체 시스템이 성능이나 용량이 하나의 구성요소로 인해 제한을 받는 현상이다.
  서버를 동시에 운영하기 위한 비용이 많이 든다.
리플리케이션은 여러 개의 DB를 권한에 따라 수직적인 구조로 구축하는 방식입니다. 비동기 방식으로 사용되며, 다음과 같은 장단점이 있습니다.
- 장점 : DB 요청의 60~80% 정도가 읽기 작업이기 때문에 Replication만으로도 충분히 성능을 높일 수 있다. 비동기 방식으로 운영되어 지연 시간이 거의 없다.
- 단점 : 노드들 간 데이터 동기화가 보장되지 않아 일관성있는 데이터를 얻지 못할 수 있다. Master DB가 다운되면 복구 및 대처가 까다롭다.

💡 HAVING과 WHERE의 차이를 설명해주세요.

having은 그룹을 필터링 하는데 사용되고, where은 개별 행을 필터링하는데 사용됩니다.

집계 함수(COUNT, SUM, AVG, MAX, MIN 등)는 having절과 함께 사용할 수 있으나, where절은 사용할 수 없습니다.( 집계함수를 사용할 수 있는 GROUP BY 절보다 WHERE절이 먼저 수행)

having은 그룹화 또는 집계가 발생한 후 필터링하는데 사용되고,
where은 그룹화 또는 집계가 발생하기 전에 필터링하는데 사용됩니다.

💡 JOIN에서 ON과 WHERE의 차이를 설명해주세요.

ON 이 WHERE 보다 먼저 실행되어 JOIN 을 하기 전에 필터링을 하고 (=ON 조건으로 필터링이 된 레코들간 JOIN이 이뤄진다)WHERE은 JOIN 을 한 후에 필터링을 합니다. (=JOIN을 한 결과에서 WHERE 조건절로 필터링이 이뤄진다)

임동준

공부하는 중

이전 포스트

Database 정리

다음 포스트

Database 정리 2

Database

💡 RDBMS와 NoSQL의 차이에 대해 설명해주세요.

💡 그렇다면 RDBMS와 NoSQL은 어느 경우에 적합한가요?

💡 트랜잭션이란 무엇인지 설명해주세요.

💡 트랜잭션의 특성(ACID)에 대해 설명해주세요.

💡 DB 락에 대해 설명해주세요.

💡 inner join과 outer join의 차이를 설명해주세요.

💡 group by의 역할에 대해 설명해주세요.

💡 DELETE, TRUNCATE, DROP의 차이를 설명해주세요.

💡 데이터베이스 클러스터링과 리플리케이션의 차이에 대해 설명해주세요.

💡 HAVING과 WHERE의 차이를 설명해주세요.

💡 JOIN에서 ON과 WHERE의 차이를 설명해주세요.

Database 정리

RDBMS란 무엇인가

0개의 댓글