SQL을 사용하면 RDBMS에서 데이터를 저장, 수정, 삭제 및 검색을 할 수 있다.
관계형 데이터베이스에는 핵심적인 두 가지 특징이 있다.
- 데이터는 정해진 데이터 스키마에 따라 테이블에 저장된다. 따라서 처음에 스키마를 정할 때 적절한 기준에 따라 잘 정해야 된다.
- 데이터는 관계를 통해 여러 테이블에 분산된다.
데이터는 테이블에 레코드로 저장이 되는데, 각 테이블마다 명확하게 정의된 구조가 있다. 해당 구조는 필드의 이름과 데이터 유형으로 정의된다.
따라서 스키마를 준수하지 않는 레코드는 테이블에 추가할 수 없다. 즉 스키마를 수정하지 않는 이상은 정해진 구조에 맞는 레코드만 추가가 가능한 것이 관계형 테이터베이스의 특징이다.
또한 SQL은 이러한 관계를 가지기 때문에 데이터의 중복을 피할 수 있다. 미리 틀을 만들어 놓았기 때문에 거기에 맞춰서 데이터를 저장하고 관리하기 때문에 중복 또한 피할 수 있는 것이고 부정확한 데이터를 다룰 위험이 없어지는 것이다.
NoSQL은 말그대로 관계형 데이터베이스의 반대이다.
스키마도 없고, 관계도 없다.
NoSQL에서는 레코드를 문서(documents)라고 부른다.
여기서 SQL과 핵심적인 차이가 있는데, SQL은 정해진 스키마를 따르지 않으면 데이터 추가가 불가능했다. 하지만 NoSQL에서는 다른 구조의 데이터를 같은 컬렉션에 추가가 가능하다.
문서(documents)는 JSON과 비슷한 형태로 가지고 있다.
관계형 데이터베이스처럼 여러 테이블에 나누어담지 않고, 관련 데이터를 동일한 '컬렉션'에 넣는다.
따라서 위 사진에 SQL에서 진행한 Orders, Users, Products 테이블로 나눈 것을 NoSQL에서는 Orders에 한꺼번에 포함해서 저장하게 된다.
따라서 여러 테이블에 조인할 필요없이 이미 필요한 모든 것을 갖춘 문서를 작성하는 것이 NoSQL이다.(NoSQL에는 조인이라는 개념이 존재하지 않는다.)
그러면 조인하고 싶을 때 NoSQL은 어떻게 할까?
하지만 이러면 데이터가 중복되어 서로 영향을 줄 위험이 있다. 따라서 조인을 잘 사용하지 않고 자주 변경되지 않는 데이터일 때 NoSQL을 사용하면 상당히 효율적이다.
두 데이터베이스를 비교할 때 중요한 Scaling 개념도 존재한다.
데이터베이스 서버의 확장성은 '수직적 확장'과 '수평적 확장'으로 나뉘어진다.
데이터 저장 방식으로 인해 SQL 데이터베이스는 일반적으로 수직적 확장만 지원함
선택하는 것은 어떠한 데이터를 담느냐의 문제이다. 답변에 어이가 없을 수도 있겠지만 데이터를 담는 자의 선택이고 장단점을 생각해서 선택을 고려해야한다. 보통 대기업에서는 SQL을 스타트업에서는 NoSQL을 사용한다는 소리가 있다. 그 이유는 장단점에서 찾을 수 있다.