데이터 정의, 데이터베이스 정의와 특징, 활용에 대해 알아보자.
옥스퍼드 대사전
데이터
: 추론과 추정의 근거를 이루는 사실
데이터의 의미
관념
, 추상
=> 기술
, 사실
데이터, 정보, 지식
의 관계
데이터->정보->지식->지혜
추론
, 예측
, 전망
, 추정
을 위한 근거
데이터의 정의
데이터(Data)
: 라틴어인 Dare의 과거분사형으로 '주어진 것' 이라는 의미관념적
이고 추상적
인 개념에서 기술적
이고 사실적
인 의미로 변화추론
과 추정
의 근거
를 이루는 사실다른 객체
와의 상호관계 속
에서 가치
를 갖는 것수요조사, 실험, 검사
등 데이터
를 수집
, 축적하고 다양한 방법으로 분석
하여 마케팅 리포트부터 심도있는 논문, 미래 예측을 위한 경영전략 또는 정책을 수립하는 일련의 가치 창출 과정
에서의 가장 기초를 이루는 것 데이터의 특성
구분 | 특성 |
---|---|
존재적 특성 | 객관적 사실(Fact, Raw Material) |
당위적 특성 | 추론, 예측, 전망, 추정을 위한 근거(Basis) |
구분 | 형태 | 예시 | 특징 |
---|---|---|---|
정성적 데이터(Qualitative Data) | 언어, 문자 등 | 회사 매출이 증가 | 저장, 검색, 분석에 많은 비용 소모 |
정량적 데이터(Quantitative Data) | 수치, 도형, 기호 등 | 나이, 몸무게, 주가 | 정형화된 데이터로 비용 소모 적음 |
데이터
는 지식경영의 핵심 이슈인 암묵지
와 형식지
의 상호작용에 중요한 역할
암묵지와 형식지의 상호작용 관계
공통화
: 암묵지
를 타인
에게 알려주기표출화
: 암묵지
를 책 등 형식지
로 만들기연결화
: 책 등에 자신이 아는 새로운 지식
추가내면화
: 책 등을 보고 타인들이 암묵적 지식 습득
암묵지
: 개인
에게 축적된 내면화
된 지식 -> 조직
의 지식으로 공통화
형식지
: 언어, 기호, 숫자
로 표출화
된 지식 -> 개인
의 지식으로 연결화
구분 | 의미 | 예시 | 특징 | 상호작용 |
---|---|---|---|---|
암묵지 | 학습과 경험을 통해 개인에게 체화되어 있으나 겉으로 드러나지 않는 지식 | 김치 담그기, 자전거 타기 | 사회적으로 중요하지만 다른 사람에게 공유되기 어려움 | 공통화, 내면화 |
형식지 | 문서, 매뉴얼처럼 형상화된 지식 | 교과서, 비디오, DB | 전달과 공유 용이 | 표출화, 연결화 |
DIKW 정의
구분 | 특성 |
---|---|
데이터(Data) | 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실 |
정보(Information) | 데이터의 가공, 처리와 데이터간 연관관계 속 의미 도출 |
지식(Knowledge) | 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것 |
지혜(Wisdom) | 지식의 축적과 아이디어가 결합된 창의적인 산물 |
DIKW 피라미드
: 데이터, 정보, 지식
을 통해 최종적으로 지혜
를 얻어내는 과정을 계층구조로 설명
년도 | 내용 |
---|---|
1950년대 | 미국에서 군대의 군비상황을 집중 관리하기 위하여 컴퓨터 도서관을 설립하면서 데이터(Data)의 기지(Base)라는 뜻의 데이터베이스가 탄생 |
1963년 6월 | 미국 'SDC'가 개최한 심포지엄에서 데이터베이스라는 용어 공식사용. 데이터베이스 초기 개념인 '대량의 데이터를 축적하는 기지' |
1963년 | GE의 C.바크만은 데이터베이스 관리 시스템 IDS 개발 |
1965년 | 2차 심포지엄에서 시스템을 통한 체계적인 관리와 저장 등의 의미를 담은 '데이터베이스 시스템' 용어 등장 |
1970년대 초반 | 유럽에서 '데이터베이스'라는 단일어가 일반화 |
1975년 | 미국의 CAC가 KORSTIC을 통해 서비스되면서 우리나라에서 데이터베이스 이용이 이루어짐 |
1980년 | KORSTIC이 해외 전문 데이터베이스를 확충하여 'TECHNOLINE'이라는 온라인 정보검색 서비스를 개시하여 본격적인 데이터베이스 서비스 시대 맞이 |
1980년대 중반 | 국내의 데이터베이스 관련 기술 연구, 개발 |
데이터베이스
의 일반적인
특징
데이터베이스 특징 | 설명 |
---|---|
통합된 데이터(Integrated Data) | 동일한 내용의 데이터가 중복되어 있지 않음. 데이터 중복은 관리상의 복잡한 부작용 초래 |
저장된 데이터(Stored Data) | 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장매체에 저장되는 것. 데이터베이스는 기본적으로 컴퓨터 기술을 바탕으로 한 것 |
공용 데이터(Shared Data) | 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것. 대용량화되고 구조가 복잡한 것이 보통 |
변화되는 데이터(Changable Data) | 데이터베이스에 저장된 내용은 곧 데이터베이스의 현 시점에서의 상태를 나타냄. 다만 이 상태는 새로운 데이터의 삽입, 삭제, 갱신 등 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야함 |
데이터베이스
의 다양한 측면
에서의 특징
측면 | 특성 |
---|---|
정보의 축적 및 전달 측면 | - 기계 가독성 : 일정한 형식에 따라 컴퓨터 등의 정보처리기기가 읽고 쓸 수 있음 - 검색 가독성 : 다양한 방법으로 필요한 정보를 검색 - 원격 조작성 : 정보통신망을 통하여 원거리에서도 즉시 온라인을 이용 |
정보 이용 측면 | - 이용자의 정보 요구에 따라 다양한 정보를 신속하게 획득 - 원하는 정보를 정확하고 경제적으로 찾아낼 수 있음 |
정보 관리 측면 | - 정보를 일정한 질서와 구조에 따라 정리, 저장, 검색, 관리 할 수 있도록 하여 방대한 양의 정보를 체계적으로 축적하고 새로운 내용의 추가나 갱신이 용이 |
정보기술 발전 측면 | - 데이터베이스는 정보처리, 검색/관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술의 발전을 견인 |
경제/산업 측면 | - 다양한 정보를 필요에 따라 신속하게 제공,이용할 수 있는 인프라라는 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성으로 제고하고 국민의 편의를 증진하는 수단 |
1.1980년대
기업내부 데이터베이스
OLTP(On-Line Transaction Processing)
: 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태의 하나.
-여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터
가 데이터베이스
를 액세스
하고, 바로 처리 결과를 돌려보내
는 형태.
-데이터베이스 데이터를 수시로 갱신
하는 프로세싱
-데이터 갱신 위주
ex) 주문입력시스템, 재고관리시스템 등
OLAP(On-Line Analytical Processing)
: 정보
위주의 분석
처리를 의미.
-다양한 비즈니스 관점
에서 쉽고 빠르게 다차원
적인 데이터에 접근하여 의사 결정
에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술
-OLTP
에서 처리된 트랜잭션 데이터를 분석
하여 제품의 판매 추이
, 구매 성향 파악
, 재무 회계 분석
등을 프로세싱
-데이터 조회 위주
구분 | OLTP | OLAP |
---|---|---|
데이터 구조 | 복잡 | 단순 |
데이터 갱신 | 동적으로 순간적 | 정적으로 주기적 |
응답 시간 | 수 초 이내 | 수 초에서 몇 분 사이 |
데이터 범위 | 수 십일 전후 | 오랜기간 저장 |
데이터 성격 | 정규적인 핵심 데이터 | 비정규적인 읽기 전용 데이터 |
데이터 크기 | 수 기가 바이트 | 수 테라 바이트 |
데이터 내용 | 현재 데이터 | 요약된 데이터 |
데이터 특성 | 트랜잭션 중심 | 주제 중심 |
데이터 액세스 빈도 | 높음 | 보통 |
질의 결과 예측 | 주기적이며 예측 가능 | 예측하기 어려움 |
2.2000년대
기업내부 데이터베이스
CRM(Customer Relationship Management)
: 고객관계관리
라고 하며, 기업이 고객
과 관련된 내/외부 자료를 분석/통합
해 고객 중심 자원
을 극대화
하고, 이를 토대로 고객특성
에 맞게 마케팅 활동을 계획/지원/평가
하는 과정
-최근에 등장한 데이터베이스 마케팅(DB marketing)
의 일대일 마케팅(One-to-One marketing)
, 관계 마케팅(Relationship marketing)
에서 진화한 요소들을 기반으로 등장
SCM(Supply Chain Management)
: 공급망 관리
를 뜻하며, 기업에서 원재료의 생산/유통
등 모든 공급망 단계
를 최적화
해 수요자
가 원하는 제품
을 원하는 시간과 장소
에 제공
하는 것.
-부품 공급업체
와 생산 업체
, 그리고 고객
에 이르기까지 거래관계
에 있는 기업들 간 IT를 이용한 실시간 정보공유
를 통해 시장
이나 수요자
들의 요구
에 기민하게 대응
하도록 지원하는 것
각 분야
별 내부 데이터베이스
분야별
데이터베이스 개념
제조부문
제조업
의 데이터베이스 기술 적용은 2000년
을 기점으로 전환클라이언트/서버
기반의 내부 정보시스템에서 웹기반
의 데이터베이스로 전환ERP
에서 CRM
으로 발전RTE
를 통한 협업적 IT화의 비중을 확대금융부문
금융부문
은 업무 프로세스 효율화
나 통합시스템 구축
으로 확산EAI
, ERP
, e-CRM
을 통한 정보 공유
및 통합
, 그리고 고객 정보
의 전략적 활용
시작DW(Data Warehouse)
도입을 통한 DB활용 마케팅
강화, DW
를 위한 최적화
와 BI
기반의 시스템 구축이 급속하게 퍼짐바젤2
등의 대형 프로젝트가 마무리 되면서 향후 EDW(Enterprise Data Warehouse)
의 확장이 DB 시장 확장에 기여유통부문
CRM
과 SCM
의 구축이 활발상거래
를 위한 인프라와 KMS
를 위한 백업시스템 구축도 함께 진행RFID
의 등장으로 유비쿼터스 시대에 접어들음분야별
데이터베이스 소개
제조분야
ERP(Enterprise Resource Planning)
:경영자원
을 하나의 통합 시스템
으로 재구축함
으로써 생산성을 극대화하려는 경영혁신기법BI(Business Intelligence)
:데이터를 정리
하고 분석
해 기업의 의사결정에 활용
하는 일련의 프로세스
CRM(Customer Relationship Management)
:고객
과 관련된 내외부 자료를 분석/통합
해 고객 중심 자원
을 극대화
하고, 이를 토대로 고객특성
에 맞게 마케팅 활동
을 계획/지원/평가
하는 과정RTE(Real-Time Enterprise)
:경영정보
를 통합관리
하는 실시간
기업의 새로운 기업경영시스템
.전사적 지원관리(ERP)
, 판매망관리(SCM)
, 고객관리(CRM)
등 부문별 전산화에서 한발 나아가 회사 전 부문의 정보
를 하나로 통합
함으로써 경영자의 빠른 의사결정
을 이끌어내려는 목적.글로벌화
되고 기술의 발전
으로 제품 수명이 짧아지는 현실에 대응금융부문
EAI(Enterprise Application Integration)
:모든 애플리케이션
을 유기적으로 연동
하여 필요한 정보
를 중앙 집중적
으로 통합
,관리
,사용
할 수 있는 환경
을 구현
하는 것.e-비즈니스
를 위한 기본 인프라EDW(Enterprise Data Warehouse)
:BPR
과 CRM
, BSC
같은 다양한 분석 애플리케이션
들을 위한 원천
.EDW
를 구축하는 것은 단순히 정보를 빠르게 전달하는 대형 시스템을 도입하는 의미 뿐만 아니라 기업 리소스의 유기적 통합
, 다원화된 관리 체계 정비
, 데이터의 중복 방지
등을 위해 시스템을 재설계
하는 것유통부문
KMS(Knowledge Management System)
:지식관리시스템
을 의미, 기업의 환경이 물품
을 주로 생산
하던 산업사회
에서 지적 재산
의 중요성이 커지는 지식사회
로 급격히 이동함에 따라 기업 경영을 지식
이라는 관점에서 새롭게 조명하는 접근방식
RFID(Radio Frequency, RF)
:주파수
를 이용해 ID를 식별
하는 시스템, 일명 전자태그
먼 거리
에서 정보를 인식하는 기술로 적용 대상에 RFID 칩
을 부착한 후 reader
를 통해 정보를 인식사회기반구조
로서의 데이터베이스
개념
1990년대
사회 각 부문의 정보화
가 본격화되면서 데이터베이스 구축 활발.무역,통관,물류,조세,국세,조달
등 사회간접자본(SOC)
차원에서 EDI
를 활용하여 부가가치통신망(VAN)
을 통해 정보망이 구축 시작.1990년대 후반
에는 지리,교통
부문의 데이터베이스 구축2000년대
고도화 되어 일반 국민들의 가정
에서도 손쉽게 생활
에 필요한 정보를 습득종류
EDI(Electronic Data Interchange)
: 주문서, 납품서, 청구서 등 무역
에 필요한 각종 서류를 표준화된 양식
을 통해 전자적 신호
로 바꿔 컴퓨터통신망을 이용하여 거래처
에 전송하는 시스템VAN(Value Added Network)
: 부가가치통신망
. 공중 전기통신사업자로부터 통신회선
을 차용
하여 독자적인 네트워크
를 형성
하는 것.부호
,영상
,음성
등으로 교환하거나 정보를 축적
하거나 또는 복수
로 해서 전송하는 등 단순한 통신이 아니라 부가가치가 높은 서비스
를 하는 것CALS(Commerce At Light Speed)
: 전자상거래 구축
을 위해 기업 내에서 비용 절감
과 생산성 향상
을 추구할 목적으로 시작된, 제품의 설계/개발/생산
에서 유통/폐기
에 이르기까지 제품의 라이프 사이클(Life Cycle)
전반에 관련된 데이터를 통합/공유/교환
할 수 있도록 한 경영통합정보시스템
.전 생산/유통 과정
에서 컴퓨터를 활용한 자동화시스템
을 구축해 효율적인 군수 조달
을 위해 개발된 시스템분야별
사회기반 구조
의 데이터베이스분야 | 솔루션 |
---|---|
물류부문 | - CVO(Commercial Vehicle Operation System, 화물운송정보) - PORT-MIS(항만운영정보시스템) - KROIS(철도운영정보시스템) |
지리/교통부문 | - GIS(Geographic Information System, 지리정보시스템) - RS(Remote Sensing, 원격탐사) - GPS(Global Positioning System, 범지구위치결정시스템) - ITS(Intelligent Transport System, 지능형교통시스템) - LBS(Location Based Service, 위치기반서비스) - SIM(Spatial Information Management, 공간정보관리) |
의료부문 | - PACS(Picture Archiving and Communication System) - U헬스(Ubiquitous-Health) |
교육부문 | - NEIS(National Education Information System, 교육행정정보시스템) |