- 본 게시물은 패스트캠퍼스의 데이터 분석 Master Class 올인원 패키지를 듣고 재구성한 자료입니다. 내용 참고 시 출처 기입을 해주시고, 무단으로 도용 및 배포는 되도록 삼가하여 주시기 바랍니다.
1. 데이터
1) 공공데이터를 활용한 사례
- 화해어플 : 화장품 성분 데이터에 대한 공공데이터 활용
- WAUG : 한국관광공사의 투어 API 활용
- 직방, 호갱노노 : 실거래가 정보 공공데이터 활용
- 모두의 주차장 : 주차장 정보 공공데이터 활용
- 아이엠스쿨 : 교육분야 공공데이터 활용
- 그 밖의 공공기관 사이트 및 어플
2) 공공데이터 활용 장점
- 데이터의 신뢰도가 높음
- 지속적으로 관리되며 쉽게 최신 데이터를 확보할 수 있음
- 빅데이터
- 무료로 사용 가능함
3) 데이터 종류
- csv : 데이터가 콤마로 구분됨
- xml : 각 데이터마다 태그로 구분됨
- json : 텍스트기반의 경량언어로 추가적인 코드작업 없이 손쉽게 파싱가능, 웹서비스 개발에 주로 쓰임.
parsing : 원본 데이터에서 데이터를 추출하는 것
2. SQL 구문
1) CREATE
- CREATE문으로 데이터베이스에 테이블을 생성할 수 있음.
- 테이블을 생성할 때 테이블명, 컬럼명, 컬럼의 데이터타입, 사이즈, 필수 여부 등에 대한 정의가 되어야 함.
- 테이블명은 숫자로 시작할 수 없으며, '_', '$' 외의 특수 기호는 사용할 수 없음.
2) ALTER
- CHANGE : 컬럼명 변경
- MODIFY : 컬럼의 데이터 타입 및 사이즈 변경
- ADD : 컬럼 추가
- DROP : 컬럼 삭제
- RENAME : 테이블명 변경
3) DROP/TRUNCATE
- TRUNCATE는 데이터만 삭제하는 명령어이고, DROP은 테이블과 데이터를 모두 삭제하는 명령어임.
- TRUNCATE는 특정 행만 삭제할 수가 없기 때문에
반드시 모든 행을 통쨰로 삭제하는 경우에만 사용해야 함.
- TRUNCATE, DROP 모두 한 번 실행하면 돌이킬 수 없음.
4) INSERT
- 전체 컬럼에 대한 타입과 선택 컬럼에 대한 타입으로 두 가지가 존재함.
- 데이터를 INSERT 할 때, 반드시 해당 컬럼의 데이터 타입과 사이즈를 맞춰야 함.
- INSERT 문 수행 후에는 COMMIT을 해줘야 모든 작업이 완료됨.
- INSERT 작업을 되돌이키고 싶을 때는 ROLLBACK을 해주면 됨.
5) UPDATE
- UPDATE 명령어를 작성할 때 조건절이 누락되지 않도록 주의해야 함.
- 변경할 데이터는 해당 컬럼의 데이터 타입과 사이즈가 맞아야 함.
- UPDATE문 수행 후에는 COMMIT을 해줘야 모든 작업이 완료됨.
- UPDATE 작업을 되돌이키고 싶을 때에는 ROLLBACK을 해주면 됨.
6) DELETE
- DELETE 명령어를 작성할 때 조건절이 누락되지 않도록 주의해야 함.
- DELETE문 수행 후에는 COMMIT을 해줘야 모든 작업이 완료됨.
- DELETE 작업을 되돌이키고 싶을 때에는 ROLLBACK을 해주면 됨.
SELECT 컬럼명 FROM 테이블명 WHERE 조건절 => 테이블 조회
SELECT COUNT(DISTINCT 컬럼명) AS CNT FROM 테이블명 => COUNT
SELECT 컬럼명 FROM 테이블명 WHERE 조건 LIKE % 문자 : 문자를 포함한 모든 행 나타냄
SELECT 컬럼명 FROM 테이블명 WHERE 조건 LIKE _ 문자 : 문자의 글자 수를 지정
SELECT 컬럼명 FROM 테이블명 WHERE COL LIKE '%#%%' ESCAPE '#' :
SQL구문 작성순서
- SELECT
- FROM
- WHERE
- GROUP BY
- HAVING
- ORDER BY