[SQL] SQL

Peter·2021년 7월 10일
0

SQL

목록 보기
3/19

SQL소개

Structured Query Language

  • 관계형 데이터베이스에 있는 데이터(테이블)를 질의하거나 조작해주는 언어
  • SQL은 1970년대 초반에 IBM이 개발한 구조화된 데이터 질의 언어
  • 두 종류의 언어로 구성됨

DDL(Data Definition Language)

  • 테이블의 구조를 정의하는 언어

DML(Data manipulation Language)

  • 테이블에서 원하는 레코드들을 읽어오는 질의 언어
  • 테이블에 레코드를 추가/삭세/갱신해주는데 사용하는 언어

빅데이터 세상에서 SQL

  • 구조화된 데이터를 다루는한 SQL은 데이터 규모와 상관없이 쓰임
  • 모든 대용량 데이터 웨어하우스는 SQL기반
    - Redshift, Snowflake, BigQuery, Hive
    - Spark, Hadoop도 SparkSQL, Hive라는 본인들만의 SQL 언어 지원
  • 데이터엔지니어, 데이터분석가, 데이터과학자 등 데이터 분야에서 일하려면 반드시 익혀야할 기본 기술

SQL의 단점

구조화된 데이터

  • 구조화된 데이터를 다루는데 최적화가 되어있음

  • 정규표현식을 통해 비구조화된 데이터를 어느 정도 다루는 것은 가능하나 제약이 심함

  • 많은 관계형 데이터베이스들이 플랫한 구조만 지원함(no nested like JSON)
    - 구글 빅쿼리는 nested structure를 지원함

  • 비구조화된 데이터를 다루는데 Spark, Hadoop과 같은 분산 컴퓨팅 환경이 필요해짐

  • 관계형 데이터베이스마다 SQL 문법이 조금씩 상이

profile
컴퓨터가 좋아

0개의 댓글