[ADsP] 데이터의 이해

당당·2023년 7월 11일
0

ADsP

목록 보기
1/13

📔설명

데이터 정의, 데이터베이스 정의와 특징, 활용에 대해 알아보자.

  • 옥스퍼드 대사전
    데이터: 추론과 추정의 근거를 이루는 사실

  • 데이터의 의미
    관념, 추상 => 기술, 사실

  • 데이터, 정보, 지식관계
    데이터->정보->지식->지혜
    추론, 예측, 전망, 추정을 위한 근거


🧂데이터와 정보

데이터의 정의와 특성

데이터의 정의

  • 데이터(Data) : 라틴어인 Dare의 과거분사형으로 '주어진 것' 이라는 의미
  • 컴퓨터 시대 시작과 함께 발전하며 과거의 관념적이고 추상적인 개념에서 기술적이고 사실적인 의미로 변화
  • 추론추정근거를 이루는 사실
  • 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것
  • 수요조사, 실험, 검사데이터수집, 축적하고 다양한 방법으로 분석하여 마케팅 리포트부터 심도있는 논문, 미래 예측을 위한 경영전략 또는 정책을 수립하는 일련의 가치 창출 과정에서의 가장 기초를 이루는 것

데이터의 특성

구분특성
존재적 특성객관적 사실(Fact, Raw Material)
당위적 특성추론, 예측, 전망, 추정을 위한 근거(Basis)

데이터의 유형

구분형태예시특징
정성적 데이터(Qualitative Data)언어, 문자 등회사 매출이 증가저장, 검색, 분석에 많은 비용 소모
정량적 데이터(Quantitative Data)수치, 도형, 기호 등나이, 몸무게, 주가정형화된 데이터로 비용 소모 적음


지식경영의 핵심 이슈

데이터는 지식경영의 핵심 이슈인 암묵지형식지의 상호작용에 중요한 역할

암묵지와 형식지의 상호작용 관계

  1. 공통화 : 암묵지타인에게 알려주기
  2. 표출화 : 암묵지를 책 등 형식지로 만들기
  3. 연결화 : 책 등에 자신이 아는 새로운 지식 추가
  4. 내면화 : 책 등을 보고 타인들이 암묵적 지식 습득

암묵지
: 개인에게 축적된 내면화된 지식 -> 조직의 지식으로 공통화

형식지
: 언어, 기호, 숫자표출화된 지식 -> 개인의 지식으로 연결화


구분의미예시특징상호작용
암묵지학습과 경험을 통해 개인에게 체화되어 있으나 겉으로 드러나지 않는 지식김치 담그기, 자전거 타기사회적으로 중요하지만 다른 사람에게 공유되기 어려움공통화, 내면화
형식지문서, 매뉴얼처럼 형상화된 지식교과서, 비디오, DB전달과 공유 용이표출화, 연결화

데이터와 정보의 관계

DIKW 정의

구분특성
데이터(Data)개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실
정보(Information)데이터의 가공, 처리와 데이터간 연관관계 속 의미 도출
지식(Knowledge)데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것
지혜(Wisdom)지식의 축적과 아이디어가 결합된 창의적인 산물

DIKW 피라미드
: 데이터, 정보, 지식을 통해 최종적으로 지혜를 얻어내는 과정을 계층구조로 설명


🍗데이터베이스 정의와 특징

용어의 연혁

년도내용
1950년대미국에서 군대의 군비상황을 집중 관리하기 위하여 컴퓨터 도서관을 설립하면서 데이터(Data)의 기지(Base)라는 뜻의 데이터베이스가 탄생
1963년 6월미국 'SDC'가 개최한 심포지엄에서 데이터베이스라는 용어 공식사용. 데이터베이스 초기 개념인 '대량의 데이터를 축적하는 기지'
1963년GE의 C.바크만은 데이터베이스 관리 시스템 IDS 개발
1965년2차 심포지엄에서 시스템을 통한 체계적인 관리와 저장 등의 의미를 담은 '데이터베이스 시스템' 용어 등장
1970년대 초반유럽에서 '데이터베이스'라는 단일어가 일반화
1975년미국의 CAC가 KORSTIC을 통해 서비스되면서 우리나라에서 데이터베이스 이용이 이루어짐
1980년KORSTIC이 해외 전문 데이터베이스를 확충하여 'TECHNOLINE'이라는 온라인 정보검색 서비스를 개시하여 본격적인 데이터베이스 서비스 시대 맞이
1980년대 중반국내의 데이터베이스 관련 기술 연구, 개발

데이터베이스의 정의


데이터베이스의 특징

데이터베이스일반적인 특징

데이터베이스 특징설명
통합된 데이터(Integrated Data)동일한 내용의 데이터가 중복되어 있지 않음. 데이터 중복은 관리상의 복잡한 부작용 초래
저장된 데이터(Stored Data)자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장매체에 저장되는 것. 데이터베이스는 기본적으로 컴퓨터 기술을 바탕으로 한 것
공용 데이터(Shared Data)여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것. 대용량화되고 구조가 복잡한 것이 보통
변화되는 데이터(Changable Data)데이터베이스에 저장된 내용은 곧 데이터베이스의 현 시점에서의 상태를 나타냄. 다만 이 상태는 새로운 데이터의 삽입, 삭제, 갱신 등 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야함

데이터베이스다양한 측면에서의 특징

측면특성
정보의 축적 및 전달 측면- 기계 가독성 : 일정한 형식에 따라 컴퓨터 등의 정보처리기기가 읽고 쓸 수 있음
- 검색 가독성 : 다양한 방법으로 필요한 정보를 검색
- 원격 조작성 : 정보통신망을 통하여 원거리에서도 즉시 온라인을 이용
정보 이용 측면- 이용자의 정보 요구에 따라 다양한 정보를 신속하게 획득
- 원하는 정보를 정확하고 경제적으로 찾아낼 수 있음
정보 관리 측면- 정보를 일정한 질서와 구조에 따라 정리, 저장, 검색, 관리 할 수 있도록 하여 방대한 양의 정보를 체계적으로 축적하고 새로운 내용의 추가나 갱신이 용이
정보기술 발전 측면- 데이터베이스는 정보처리, 검색/관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술의 발전을 견인
경제/산업 측면- 다양한 정보를 필요에 따라 신속하게 제공,이용할 수 있는 인프라라는 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성으로 제고하고 국민의 편의를 증진하는 수단

🧶데이터베이스 활용

기업내부 데이터베이스

1.1980년대 기업내부 데이터베이스

  • OLTP(On-Line Transaction Processing) : 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태의 하나.
    -여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터데이터베이스액세스하고, 바로 처리 결과를 돌려보내는 형태.
    -데이터베이스 데이터를 수시로 갱신하는 프로세싱
    -데이터 갱신 위주
    ex) 주문입력시스템, 재고관리시스템 등

  • OLAP(On-Line Analytical Processing) : 정보 위주의 분석 처리를 의미.
    -다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술
    -OLTP에서 처리된 트랜잭션 데이터를 분석하여 제품의 판매 추이, 구매 성향 파악, 재무 회계 분석 등을 프로세싱
    -데이터 조회 위주

구분OLTPOLAP
데이터 구조복잡단순
데이터 갱신동적으로 순간적정적으로 주기적
응답 시간수 초 이내수 초에서 몇 분 사이
데이터 범위수 십일 전후오랜기간 저장
데이터 성격정규적인 핵심 데이터비정규적인 읽기 전용 데이터
데이터 크기수 기가 바이트수 테라 바이트
데이터 내용현재 데이터요약된 데이터
데이터 특성트랜잭션 중심주제 중심
데이터 액세스 빈도높음보통
질의 결과 예측주기적이며 예측 가능예측하기 어려움

2.2000년대 기업내부 데이터베이스

  • CRM(Customer Relationship Management) : 고객관계관리라고 하며, 기업이 고객과 관련된 내/외부 자료를 분석/통합고객 중심 자원극대화하고, 이를 토대로 고객특성에 맞게 마케팅 활동을 계획/지원/평가하는 과정
    -최근에 등장한 데이터베이스 마케팅(DB marketing)일대일 마케팅(One-to-One marketing), 관계 마케팅(Relationship marketing)에서 진화한 요소들을 기반으로 등장

  • SCM(Supply Chain Management) : 공급망 관리를 뜻하며, 기업에서 원재료의 생산/유통등 모든 공급망 단계최적화수요자가 원하는 제품원하는 시간과 장소제공하는 것.
    -부품 공급업체생산 업체, 그리고 고객에 이르기까지 거래관계에 있는 기업들 간 IT를 이용한 실시간 정보공유를 통해 시장이나 수요자들의 요구에 기민하게 대응하도록 지원하는 것


분야내부 데이터베이스

  1. 분야별 데이터베이스 개념

    • 제조부문

      • 제조업의 데이터베이스 기술 적용은 2000년을 기점으로 전환
      • 클라이언트/서버 기반의 내부 정보시스템에서 웹기반의 데이터베이스로 전환
      • 대기업을 위주로 ERP에서 CRM으로 발전
      • 대기업은 중소기업과의 협업으로 인해 중소기업에 투자를 확대할 필요성 인지, RTE를 통한 협업적 IT화의 비중을 확대
    • 금융부문

      • 1998년 IMF 이후, 금융부문업무 프로세스 효율화통합시스템 구축으로 확산
      • 2000년대 초반, EAI, ERP, e-CRM을 통한 정보 공유통합, 그리고 고객 정보전략적 활용 시작
      • 2000년대 중반, DW(Data Warehouse)도입을 통한 DB활용 마케팅 강화, DW를 위한 최적화BI기반의 시스템 구축이 급속하게 퍼짐
      • 바젤2등의 대형 프로젝트가 마무리 되면서 향후 EDW(Enterprise Data Warehouse)의 확장이 DB 시장 확장에 기여
    • 유통부문

      • 2000년 이후, IT 환경 변화에 따라 CRMSCM의 구축이 활발
      • 상거래를 위한 인프라와 KMS를 위한 백업시스템 구축도 함께 진행
      • RFID의 등장으로 유비쿼터스 시대에 접어들음

  1. 분야별 데이터베이스 소개

    • 제조분야

      • ERP(Enterprise Resource Planning) :
        인사/ 재무/ 생산 등 기업의 전 부문에 걸쳐 독립적으로 운영되던 각종 관리 시스템의 경영자원하나의 통합 시스템으로 재구축함으로써 생산성을 극대화하려는 경영혁신기법
      • BI(Business Intelligence) :
        기업이 보유하고 있는 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 일련의 프로세스
      • CRM(Customer Relationship Management) :
        '고객관계관리'라고 하며, 기업이 고객과 관련된 내외부 자료를 분석/통합고객 중심 자원극대화하고, 이를 토대로 고객특성에 맞게 마케팅 활동계획/지원/평가하는 과정
      • RTE(Real-Time Enterprise) :
        회사의 주요 경영정보통합관리하는 실시간 기업의 새로운 기업경영시스템.
        전사적 지원관리(ERP) , 판매망관리(SCM), 고객관리(CRM) 등 부문별 전산화에서 한발 나아가 회사 전 부문의 정보하나로 통합함으로써 경영자의 빠른 의사결정을 이끌어내려는 목적.
        기업활동이 글로벌화되고 기술의 발전으로 제품 수명이 짧아지는 현실에 대응
    • 금융부문

      • EAI(Enterprise Application Integration) :
        기업 내 상호 연관된 모든 애플리케이션유기적으로 연동하여 필요한 정보중앙 집중적으로 통합,관리,사용할 수 있는 환경구현하는 것.
        e-비즈니스를 위한 기본 인프라
      • EDW(Enterprise Data Warehouse) :
        기존 DW(Data Warehouse)를 전사적으로 확장한 모델.
        BPRCRM, BSC같은 다양한 분석 애플리케이션들을 위한 원천.
        EDW를 구축하는 것은 단순히 정보를 빠르게 전달하는 대형 시스템을 도입하는 의미 뿐만 아니라 기업 리소스의 유기적 통합, 다원화된 관리 체계 정비, 데이터의 중복 방지등을 위해 시스템을 재설계하는 것
    • 유통부문

      • KMS(Knowledge Management System) :
        지식관리시스템을 의미, 기업의 환경이 물품을 주로 생산하던 산업사회에서 지적 재산의 중요성이 커지는 지식사회로 급격히 이동함에 따라 기업 경영을 지식이라는 관점에서 새롭게 조명하는 접근방식
      • RFID(Radio Frequency, RF) :
        주파수를 이용해 ID를 식별하는 시스템, 일명 전자태그
        전파를 이용해 먼 거리에서 정보를 인식하는 기술로 적용 대상에 RFID 칩을 부착한 후 reader를 통해 정보를 인식

사회기반구조로서의 데이터베이스

  1. 개념
  • 1990년대 사회 각 부문의 정보화가 본격화되면서 데이터베이스 구축 활발.
    정부를 중심으로 무역,통관,물류,조세,국세,조달사회간접자본(SOC) 차원에서 EDI를 활용하여 부가가치통신망(VAN)을 통해 정보망이 구축 시작.
  • 1990년대 후반에는 지리,교통부문의 데이터베이스 구축
  • 2000년대 고도화 되어 일반 국민들의 가정에서도 손쉽게 생활에 필요한 정보를 습득

  1. 종류
  • EDI(Electronic Data Interchange) : 주문서, 납품서, 청구서 등 무역에 필요한 각종 서류를 표준화된 양식을 통해 전자적 신호로 바꿔 컴퓨터통신망을 이용하여 거래처에 전송하는 시스템
  • VAN(Value Added Network) : 부가가치통신망. 공중 전기통신사업자로부터 통신회선차용하여 독자적인 네트워크형성하는 것.
    독자적인 네트워크로 각종 정보를 부호,영상,음성등으로 교환하거나 정보를 축적하거나 또는 복수로 해서 전송하는 등 단순한 통신이 아니라 부가가치가 높은 서비스를 하는 것
  • CALS(Commerce At Light Speed) : 전자상거래 구축을 위해 기업 내에서 비용 절감생산성 향상을 추구할 목적으로 시작된, 제품의 설계/개발/생산에서 유통/폐기에 이르기까지 제품의 라이프 사이클(Life Cycle) 전반에 관련된 데이터를 통합/공유/교환할 수 있도록 한 경영통합정보시스템.
    1980년대 초, 미 국방성 제품의 전 생산/유통 과정에서 컴퓨터를 활용한 자동화시스템을 구축해 효율적인 군수 조달을 위해 개발된 시스템

  1. 분야별 사회기반 구조의 데이터베이스
분야솔루션
물류부문- CVO(Commercial Vehicle Operation System, 화물운송정보)
- PORT-MIS(항만운영정보시스템)
- KROIS(철도운영정보시스템)
지리/교통부문- GIS(Geographic Information System, 지리정보시스템)
- RS(Remote Sensing, 원격탐사)
- GPS(Global Positioning System, 범지구위치결정시스템)
- ITS(Intelligent Transport System, 지능형교통시스템)
- LBS(Location Based Service, 위치기반서비스)
- SIM(Spatial Information Management, 공간정보관리)
의료부문- PACS(Picture Archiving and Communication System)
- U헬스(Ubiquitous-Health)
교육부문- NEIS(National Education Information System, 교육행정정보시스템)
profile
MySQL DBA 신입

0개의 댓글