sql학습 및 실습현대사회에서 수많은 데이터가 끊임없이 만들어지고 있으며, 그 중에서 가치가 있는 데이터만 추출하여 유의미한 정보로 만들어야 한다. 그러기 위해서는 데이터를 보는 인사이트 + 자유자재로 컨트롤할 수 있는 실력이 필요하다.
평균 일일 대여 요금 구하기다음은 어느 자동차 대여 회사에서 대여중인 자동차들의 정보를 담은 CAR_RENTAL_COMPANY_CAR 테이블입니다.
조건에 맞는 도서 리스트 출력하기다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(BOOK) 테이블입니다.
온라인쇼핑몰 거래액 데이터 Select, From, Where, like, in, not in, group by, having, order by , desc, avg() 등을 이용합니다.
2021년 6월 1일 하루 동안의 가상의 패션 이커머스 데이터 분석 테이블 4개 (csv파일 4개) 불러온 뒤, JOIN 을 통해 원하는 값을 추출해내겠습니다.
다양한 함수들을 이용하여 컬럼 형태 변환 및 생성 합니다.
날짜 형태 추출,변환 + 사칙연산 등으로 가공하는 방법
서브쿼리(쿼리안에쿼리문), 윈도우함수, DDL, DML 등의 이론을 간단히 알아봅니다.
데이터분석MySQL 이지만, PostgreSQL로 실습해보겠습니다.
PostgreSQL 데이터 스토리텔링 가이드북 으로 SQL 학습
데이터베이스 생성 CREATE DATABASE , 테이블(열,데이터타입)생성 CREATE TABLE , 각 데이터값 생성 INSERT INTO 와 VALUES
기초 쿼리 구문 작성
INT (Serial, Identity, Fixed소수점, Float소수점), 날짜형 Timestamp와 Interval, CAST AS 와 :: 로 데이터 타입 변환
데이터베이스 연결 및 COPY를 통해 데이터 불러오기를 시도하다 만난 Error
데이터베이스의 데이터를 COPY로 가져와 테이블에 저장하고 확인합니다.
데이터셋을 이용하여 기본연산, 백분율 및 변화율, 백분율과 백분위수(25%, 50%, 75%) 를 구해보고 보기 편하게 행으로 나열해주는 UNNEST()
CCONSTRAINT 를 이용해 PRIMARY KEY 와 UNIQUE 한 데이터 타입을 지정해서 테이블을 만들고 JOIN ON, JOIN USING 등 n개 테이블을 합칩니다.
SQL 데이터베이스를 구성하고 속도를 빠르게 만들기 위해 필요합니다. 이름 지정 규칙 (네이밍 컨벤션) 과 코딩 컨벤션데이터 무결성 유지 쿼리 속도를 높이기 위한 테이블에 인덱스 추가 등이 있습니다.
IMLS의 워싱턴과 사모아를 포함한 모든 지역의 공립 도서관 기관의 설문조사 데이터셋2018년, 2017년, 2016년 조사 데이터를 저장할 수 있는 3개의 테이블 생성하고 각 테이블에서 시간이 지남에 따라 측정값이 어떻게 변하는지 살펴보겠습니다.
오랜만에 접속해서 그런것일까요... 왜 기존 database가 나오지 않을까요... START를 눌러도 이미 실행되고 있다고 합니다. Port 5432 is already in use 으로 구글링 해보았습니다.
미국 농무부 산하기관인 식품안전검사국(FSIS, Food Safety Inspection Service) 의 육류, 가금류 및 계란 생산업체 데이터로 알아보겠습니다.
2014~2018년 미국 지역사회설문조사 (ACS, American Community Survey) 5년 추정치에서 수집한 '미국 인구조사국' 데이터로 진행해보겠습니다.
뉴욕시 택시 및 리무진 위원회는 월별 노란색 택시 운행과 기타 렌트차량에 대한 데이터를 발표합니다. 2016년 6월 1일 하루 동안의 노란 택시 운행 기록 데이터로 날짜와 시간 관련 쿼리를 작성해보겠습니다.
코멘토\_SQL과 Redash를 이용한 데이터분석보고서 및 대시보드 만들기 수업 1주차 학습 내용 및 과제 정리 w3school을 통해 SQL 데이터 추출 문제 풀어보기
리대시Redash에서 가상의 식품회사 데이터베이스 (Northwind Database)의 쿼리를 작성해봅니다.
리대시Redash에서 가상의 식품회사 데이터베이스 (Northwind Database)의 쿼리를 작성하여 PPT로 정리합니다.
단순히 개별 지표를 추출하는 것을 넘어 이를 시각화하여 보고서 형태로 만들어 봅니다. 이를 위해 먼저 지표라는 것이 무엇인지, 어떻게 정의하고 측정할 것인지 알아봅니다.
이전 대충 가설3개를 정해놨지만, 가설끼리 서로 데이터 스토리텔링이 되어야 한다길래 다시 해보았습니다.
워드로 작성한 내용을 다시 PPT로 정리했습니다. 현황 대시보드까지 만들기 위함이였으나, 시간이 없어 우선 워드로 작성한 내용까지 정리했습니다. 결론 및 인사이트 등 추가 세부내용도 덧붙혔습니다.
데이터 관련 직종에 입문하기를 원하는 사람들은 기본적으로 데이터베이스를 다룰 줄 알아야 합니다. 데이터베이스를 설계할 수 있는 능력까지 갖춘다면 금상첨화일 것 입니다. 개발하고자 하는 시스템의 규모가 커지면 커질수록 데이터베이스를 효율적으로 설계하는 일이 중요해집니다.
초스피드 1회독으로는 데이터베이스 구축을 혼자 어떻게 할 수 있을지 전혀! 감이 오지 않습니다. 교재에 나온 연습문제를 따로 만들어가며, 스스로 연필로 풀어가며 복습할 수 있게끔 정리하였습니다. 바보같이 교재의 연습문제에 나온 예제를 하나하나 엑셀로 만들어갔습니다.
도서관관리ERD를 참고하여, 각 테이블에 대한 물리적ERD를 작성하고, 그를 바탕으로 DBeaver프로그램을 통해 테이블 입력이 완료된 데이터베이스를 생성하시오.
MySQL은 세계에서 가장 많이 사용되는 오픈소스 관계형 데이터베이스 관리 시스템 (DBMS) 이고, MySQL Workbench는 쉽게 말하여, 데이터베이스를 좀 더 쉽게 사용할 수 있는 통합 시각적 도구를 제공하는 프로그램 입니다.
MySQL 공식 사이트에서 sakila, world 예제 데이터베이스를 다운받습니다. 해당 데이터베이스에는 "영화"테이블, "배우"테이블, "영화와 배우간의 관계"테이블, "상점" 테이블 등이 포함된 DVD 대여점을 모델링한 데이터베이스입니다.
SQL문법에는 크게 3가지 종류가 있습니다. 데이터 정의 언어 DDL, 데이터 조작/수정 언어 DML, 데이터 제어 언어 DCL입니다.
생성된 데이터베이스에 데이터를 입력해보고, 수정해보고, 삭제해봅니다.
테이블 제약조건이란, 정확한 데이터만 저장 할 수 있도록 설정하는 것을 말합니다.
데이터베이스의 데이터를 불러올 땐, 꼭 필요한 정보만 찾아와야 합니다. 그럴 때 사용 되는 SELECT, FROM, WHERE 그리고 WHERE 절에 함께 쓰이는 비교연산자 (=, > , < ) 그리고 논리연산자 (AND, BETWEEN, IN, LIKE, OR 등)
ORDER BY를 통해서 데이터를 정렬할 수 있으며, 오름차순 또는 내림차순으로 정렬할 수 있습니다. ORDER BY 와 함께 특정구간에 쓰이는 LIMIT, OFFSET 을 알아봅니다.