[ADsP] 1강 데이터의 이해
01. 데이터와 정보
1. 데이터의 정의
1) 데이터의 정의
(1) 데이터의 정의
ㄱ. 데이터 : 연구나 조사의 바탕이 되는 자료 또는 재료
컴퓨터의 발전으로 그 의미가 기술적이고 사실적인 '자료'로 변화
(2) 데이터의 특성
ㄱ. 데이터는 있는 그대로의 사실, 객관적 사실을 의미
예) 수학 80점, 영어 100점
ㄴ. 정보는 데이터로부터 가공된 자료를 의미
예) 수학과 영어 점수의 평균은 90점
ㄷ. 데이터의 존재적 특성 - 있는 그대로의 객관적 사실
ㄹ. 데이터의 당위적 특성 - 추론·예측·전망·추정을 위한 근거
2) 데이터의 유형
(1) 정성적 데이터와 정략적 데이터
ㄱ. 정성적 데이터 : 기준이 명확하지 않은 데이터
예) 언어, 문자 등
ㄴ. 정략적 데이터 : 기준이 명확한 데이터
예) 수치, 도형, 기호 등
(2) 정형 데이터와 비정형 데이터, 그리고 반정형 데이터
ㄱ. 정형 데이터 : 고정된 틀이 있고, 연산이 가능한 데이터
ㄴ. 비정형 데이터 : 고정된 틀이 없고, 연산이 불가한 데이터
ㄷ. 반정형 데이터 : 고정된 틀이 있고, 연산이 불가한 데이터
데이터 가공을 거쳐 정형 데이터로 변환 가능
(3) 암묵지와 형식지
ㄱ. 암묵지(Tacit Knowledge) : 학습과 체험을 통해 개인에게 습들되어 있지만
겉으로 들어나지 않은 상태의 지식
ㄴ. 형식지(Explicit Knowledge : 문서나 매뉴얼처럼 외부로 표출돼 여러 사람이
공유할 수 있는 지식
ㄷ. 암묵지와 형식지 상호작용
암묵지 형식지
공통화 표출화
내면화 연결화
3) DIKW 피라미드
(1) 데이터에서 지혜를 얻는 과정
ㄱ. 데이터(Data) : 객관적 사실
ㄴ. 정보(Information) : 데이터의 가공, 처리와 데이터 간 연관 관계 속에서 의미가 도출된 것
ㄷ. 지식(Knowledge) : 유의미한 정보를 분류하고 개인적인 경험을 결합해 고유의 지식으로 내재화된 것
ㄹ. 지혜(Wisdom) : 지식의 축적과 아이디어가 결합된 창의적 산물( + 예측)
(2) 데이터의 관한 상식
ㄱ. 비트와 바이트
비트 - 신호를 나타내는 최소단위
바이트 - 8비트, 데이터의 양을 나타내는 단위
02. 데이터베이스
1. 데이터베이스 개요
1)데이터베이스 정의(참고해서 읽어볼 것)
(1) 데이터베이스 용어의 연혁
(2) 데이터베이스의 다양한 정의
* DB vs DBMS
DB : 데이터를 저장하고 정리한 정보의 집합체
DBMS : 데이터베이스를 구축, 유지할 수 있게 하는 관리 소프트웨어(프로그램)
2) 데이터베이스의 특징
(1) 데이터베이스의 일반적인 특징
ㄱ. 통합된 데이터 : 동일한 내용의 데이터가 중복되지 않게 통합
ㄴ. 저장된 데이터 : 컴퓨터가 접근할 수 있는 저장 매체에 저장
ㄷ. 공용 데이터 : 여러 사용자가 서로 다른 목적으로 이용, 대용량화디고 구조가 복잡
ㄹ. 변화하는 데이터 : 삽입, 수정, 삭제를 통해 항상 최신의 정확한 데이터 상태를 유지
(2) 데이터베이스의 다양한 측면에서의 특성
ㄱ. 정보의 축적 및 전달 측면(기계) : 기계 가독성, 검색 가능성, 원격 조작성
ㄴ. 정보이용 측면(사용자) : 이용자의 정보유구에 따라 정보를 획득
ㄷ. 정보관리 측면(관리) : 일정한 질서와 구조에 따라 정보를 체계적으로 축적
ㄹ. 정보기술발전 측면 : 데이터베이스 활용을 위한 정보 전송을 위한 네트워크 기술 등의 발전 기여
ㅁ. 경제, 산업적 측면 : 경제, 산업, 사회 활동의 효율성을 제고하고 편의 증진하는 수단
2. 데이터베이스 활용
1) 데이터베이스 활용
(1) 기업 내부의 데이터베이스
ㄱ. 1990년대 정보통신망 구축 가속화 → ERP로 확대
ㄴ. OLTP(Online Transaction Processing) 시스템 : 1990년대 중반 데이터 갱신 위주
ㄷ. OLAP(Online Analytical Processing) 시스템 : 데이터 분석이 중심
ㄹ. CRM과 SCM :
고객관계관리(Customer Relationship Management),
공급망관리(Supply Chain Management)
(2) 산업 부문별 데이터베이스 발전 과정(참고하기)
ㄱ. 제조 부문
ㄴ. 금융 부문
ㄷ. 유통 부문 : RFID(전자태그), 유비쿼터스 등
(3) 사회기반구조로서의 데이터베이스(참고하기)
ㄱ. 물류 부문
ㄴ. 지리 부문
ㄷ. 교통 부문
ㄹ. 의료 부문
ㅁ. 교육 부문
2) 데이터베이스 종류
(1) 데이터베이스의 종류
ㄱ. 관계형데이터베이스(RDB) : 정형 데이터를 다루는데 특화
ㄴ. NoSQL : Not only SQL 기존 RDB의 SQL을 보완 및 개선한 비관계형 DB라는 의미
(2) SQL의 이해
ㄱ. DDL : 데이터 정의 언어(CREATE, ALTER, RENAME, DROP)
ㄴ. DML : 데이터 조작 언어(SELECT, INSERT, UPDATE, DELETE)
ㄷ. DCL : 데이터 제어 언어(GRANT, REVOKE)
ㄹ. TCL : 트랜잭션 제어 언어(COMMIT, SAVEPOINT, ROLLBACK)