[Hive] Hive 의 특징

Woong·2022년 1월 10일
0

Apache Hadoop

목록 보기
5/10

HiveQL

  • 친숙한 SQL 문법을 사용

대화형

  • 대화형 프롬프트로 쿼리문 사용 가능
  • Hive QL 을 통해 일반적인 RDB처럼 SQL문을 통해 데이터 조회

확장 가능(Scalable)

  • 클러스터에 적재된 빅데이터에 작업 가능

쉬운 OLAP 쿼리

  • 복잡하게 MapReduce를 직접 하는 대신 SQL 로 쉽게 사용
    • 실시간성 쿼리에 유용
    • 큰 데이터셋 전체에 분석적 쿼리를 할 경우 다소 빛이 바램

높은 확장성

  • 사용자 정의 함수를 사용하거나
  • 다른 데이터베이스처럼 JDBC/ODBC 드라이버로 확장 가능
  • Thrift server 제공
    • Hive 외부에서 다른 언어로 접근할 수 있도록 함

비정규화된 데이터를 처리

  • 지나치게 복잡한 쿼리의 경우 spark를 사용하는 것이 더 유리할 수 있음

그러나, 데이터베이스는 아니다

  • 데이터를 SQL로 접근할 수 있지만 데이터베이스인 것은 아님
    • 내부 데이터 처리는 MapReduce 로 변환하여 처리

view 활용

  • 쿼리 결과를 뷰에 저장하고 다음 쿼리에 사용 가능
  • 데이터 복사본을 저장하는 것이 아닌 논리적 구조를 유지

reference

  • 글로벌 Best】 Hadoop : 최고의 하둡 실습으로 빅 데이터 길들이기! (한글 자막) 강의

0개의 댓글