[ADsP] 데이터이해 - 데이터의 이해

박진우·2022년 6월 14일
1

ADsP

목록 보기
1/16
post-thumbnail

💡 데이터의 정의

데이터란 ❓

  • 데이터의 의미는 과거 관념적이고 추상적인 개념에서 기술적이고 사실적인 의미로 변화했다.

  • 데이터란 추론과 추정의 근거를 이루는 사실(옥스퍼드 대사전) : 데이터를 단순한 객체로서 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명

  • 데이터는 객관적 사실(fact, raw material)이라는 존재적 특성을 갖는 동시에 추론∙예측∙전 망∙추정을 위한 근거(basis)로 기능하는 당위적 특성을 가진다.

  • 논문, 경영전략, 정책수립 등 일련의 가치 창출과정에서 가장 기초를 이 루는 것 이다.


◽ 용어의 역사

  • 1646년 영국 문헌에 처음 등장했다. (라틴어인 dare(주다)의 과거분사형)

  • 1940년대 이후 컴퓨터와 사회과학의 진일보에 따라 관념적ㆍ추상적 개념에서 기술적ㆍ사실적 개념으로 변화했다.


◽ 데이터 유형

구분 형태 분석 용이도
정성적 데이터(qualitative data, 비정형데이터) 언어, 문자 등 용이 주관식 응답, 블로그 글 등
정량적 데이터(quantitative data) 수치, 도형, 기호 등 기술, 비용이 많이 소모 온도, 풍속, 강우량 등


◽ 암묵지와 형식지

◾ 암묵지

  • 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식 (ex : 김장김치 담그기, 자전거 타기 등)

  • 시행착오와 오랜 경험을 통해 개인에게 습득된 무형의 지식


◾ 형식지

  • 교과서, 매뉴얼과 같이 형상화된 지식

  • 유형의 대상을 통해 지식의 전달과 공유가 용이




조직차원에서 조직원 개인의 지식을 공유하고 발전시키는 데에 있어 암묵지와 형식지의 상호작용 이 중요하다.

➡️ 개인에게 '내면화'된 지식을 조직에 '공통화'시키기 위해

➡️ 언어나 기호, 숫자로 '표출'하고, 다른 개인은 표출된 지식을 자신의 지식과 '연결'하여 내면화하는 과정을 반복한다.



◽ 데이터와 정보의 관계

◾지식의 피라미드(DIKW 피라미드)

  • 데이터(Data)

    • 개별 데이터 자체로는 의미가 중요하지 않은 객관적 사실

  • 정보(Information)

    • 데이터의 가공ㆍ처리와 데이터간 연관관계 속에 의미가 도출된 것

    • 유용하지 않은 것도 포함

  • 지식(Knowledge)

    • 다양한 정보를 구조화하여 유의미한 정보 분류

    • 유의미한 정보에 개인적인 경험을 결합시켜 내재화한 것


  • 지혜(Wisdom)

    • 지식의 축적과 아이디어가 결합된 창의적 산물

✅DIKW 피라미드 : 데이터, 정보, 지식을 통해 최종적으로 지혜를 얻는 과정을 계층구조로 설명

구분

의미

데이터

개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실.
존재형식을 불문하고, 타 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호를 의미

A는 100원,

B는 200원에

연필을 판매

정보

데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가
도출된 것.

데이터의 가공 및 상관관계간 이해를 통해 패턴을 인식하고
그 의미를 부여한 데이터

A마트의
연필이 더 싸다

지식

데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것.

상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과

상대적으로

저렴한 A마트에서 연필을 사야겠다

지혜

지식의 축적과 아이디어가 결합된 창의적인 산물.

근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적인 아이디어

A마트의 다른 상품들도 B마트보다 더 쌀 것이라고 판단한다.

  • 데이터, 정보, 지식은 상호 관계 속에서 역할을 수행하며 인간이 사회활동에서 추구하는 가치창출을 위한 일련의 프로세스로 기능한다.

  • 데이터의 정확성은 향수 데이터 간의 관계 및 현상의 분석(정보)적용(지식), 더 나아가 미래를 예측하고 창의적 산물을 도출(지혜)하는데 지대한 영향을 미치며 가치창출에 핵심적인 역할 을 수행한다.

💡 데이터베이스 정의와 특징

◽ 데이터베이스 정의

데이터 베이스(Database) 란❓

  • 문자,기호,음성,화상,영상 등 상호 관련된 다수의 콘텐츠를 정보 처리정보통신 기기에 의하여 체계적으로 수집ㆍ축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체

  • 법률적으로 데이터베이스는 기술을 기반으로 한 일종의 저작물로 인정된다.

  • 관련된 레코드의 집합, 소프트웨어로는 데이터베이스관리시스템(DBMS)을 의미

  • 데이터베이스의 개념은 체계적으로 정렬된 데이터 집합을 의미하며 데이터양과 이용이 늘어나면서 대용량의 데이터를 저장,관리,검색,이용할 수 있는 컴퓨터 기반의 데이터베이스로 진화했다.



◾ 용어의 역사

  • 1950년대 미국 정부의 군비 상황을 관리하기 위해 구현한 것을 '데이터(Data)의 기지(Base)'라는 뜻으로 하여 탄생했다.

  • 1963년 미국의 한 심포지엄에서 데이터베이스라는 용어가 공식 사용했다.

  • 1963년 GE에서 최초의 현대적 의미의 데이터베이스 관리시스템인 IDS 를 개발했다.

  • 1970년 초반 유럽 데이터베이스라는 단일어 일반화, 70년대 후반 미국 주요신문 등에 흔히 사용했다.



◾ 일반적 특징

  • 통합된 데이터(integrated data): 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미.

    데이터 중복은 관리상의 복잡한 부작용을 초래한다.

  • 저장된 데이터(stored data): 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것 을 의미.

    데이터베이스는 기본적으로 컴퓨터 기술을 바탕으로 한 것

  • 공용 데이터(shared data): 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미.

    대용량화 되고 구조가 복잡하다.

  • 변화되는 데이터(changeable data): 데이터베이스에 저장된 내용은 곧 데이터베이스의 현 상태를 나타냄. 다만 이 상태는 새로운 데이터의 삽입, 기존 데이터의 삭제, 갱신으로 항상 변화하면서도 현재의 정확한 데이터를 유지
    해야 한다.


✅ 초기에는 일반적인 텍스트나 숫자, 그래프 형태의 데이터를 저장하였으나, 이후 정보기술이 발달하면서 그 범위는 이미지, 동영상 등을 포함한 멀티미디어로 확대. 단순한 데이터 저장에서 머무르지 않고 정보를 저장하는 지식베이스 로 진화했다.

✅ 데이터베이스가 단순한 저장소의 개념이 아니라 첨단 정보기술을 바탕으로 원하는 데이터를 저장∙검색할 수 있는 복합체로 이해


◾ 정보의 축적 및 전달 측면의 특성

  • 기계가독성 : 대량의 정보를 일정한 형식에 따라 컴퓨터 등의 정보처리기기가 읽고 쓸 수 있도록 한다.

  • 검색가능성 : 다양한 방법으로 필요한 정보 검색 가능하다.

  • 원격조작성 : 정보통신망을 통하여 원거리에서도 즉시 온라인으로 이용 가능하다.



◾ 정보 이용 측면의 특성

  • 정보 요구에 따라 신속하게 획득하고, 원하는 정보정확하고 경제적으로 찾아내는 특성


◾ 정보 관리 측면의 특성

  • 일정한 질서와 구조에 따라 저장ㆍ검색ㆍ관리하여 방대한 양을 체계적으로 축적하고 정보의 추가갱신이 용이하다.

◾ 정보기술 발전 측면의 특성

  • 데이터베이스는 정보처리, 검색∙관리 소프트웨어, 관련 하드웨어,
    정보전송을 위한 네트워크 기술 등의 발전을 견인할 수 있다.


◾경제ㆍ산업적 측면의 특성

  • 다양한 정보를 신속하게 제공ㆍ이용할 수 있도록 하는 인프라의 특성

  • 경제, 산업, 사회 활동의 효율성 제고 및 국민 편의 증진한다.


◽ 데이터베이스 활용

◾기업내부 데이터베이스(인하우스 DB)

  • 1990년대

    • 기업 경영 전반에 관한 모든 자료를 연계하여 구축, 운영하는 전사 시스템으로 확대했다.

    • 단순한 정보의 '수집'과 단순 자동화에 치우친 OLTP(Online Transaction Processing) 시스템


  • 1990년대 중반이후

    • 데이터 마이닝 등의 기술 등장과 함께 '분석'이 중심이 되는 OLAP(Online Analytical Processing) 시스템으로 변화했다.

  • 2000년대

    • CRM(고객 관계 관리), SCM(공급망 관리)로 DB구축의 화두가 바뀌었다.

CRM(Consumer Relationship Management) : 고객별 구매이력을 분석하여 각종 마케팅 전략을 펼치는 것

SCM(Supply Chain Management) : 공급업체 또는 제휴업체와 정보시스템을 연계하여 시간ㆍ비용을 최적화하는 것

OLTP (On-Line Transaction Processing): 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태의 하나이다.

여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 액세스하고 바로 처리 결과를 돌려보내는 형태를 말한다.

데이터베이스의 데이터를 수시로 갱신하는 프로세싱을 의미한다.
✔️ (Ex) 주문 입력 시스템, 재고 관리 시스템 등

OLAP (On-Line Analytical Processing): 정보 위주 분석 처리를 의미하며, 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻게 해주는 시스템이다.

ERP (Enterprise Resource Planning):인사·재무·생산 등 기업의 전 부문에 걸쳐 독립적으로 운영되던 각종 관리시스템의 경영자원을 하나의 통합 시스템으로 재구축함으로써 생산성을 극대화하려는 경영혁신기법을 의미한다.

BI (Business Intelligence):기업이 보유하고 있는 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 일련의 프로세스를 말한다.

즉, 기업의 사용자가 더 좋은 의사결정 을 하도록 데이터 수집, 저장, 분석, 접근을 지원하는 응용시스템과 기술인 것이다.



▪️ 제조

  • 데이터베이스 기술이 가장 중요한 분야

  • 부품 테이블이나 재고관리 등의 활용에서 전 공정을 포함하는 범위로 확대했다.

  • 기업별 고유 시스템에서 솔루션 유형으로 변화했다.

  • 최근에는 ERP, DW, CRM, BI 등 진보된 기술을 적용한 DB 구축이 주류를 이루었다.


▪️ 금융

  • IMF 이후 업무 프로세스 효율화나 e비즈니스 활성화, 금융권 통합 시스템 구축 등이 크게 확산했다.

  • 고객 정보의 전략적 활용에 집중하였으며, 인터넷뱅킹 정착과 방카슈랑스 도입에 따라 선도적인 정보화 레퍼런스로 부상했다.

▪️ 유통

  • 백화점, 할인점, 홈쇼핑 등으로 유통부문이 다양해지면서 CRMㆍSCM 구축이 이루어졌다.

  • 균형성과관리(BSC), 핵심성과지표(KPI), 웹 리포팅 등 다양한 고객 분석 툴 을 데이터베이스와 연계했다.

  • RFID의 등장으로 대용량 데이터베이스를 지원하는 플랫폼이 요구되는 상황이다.



◾사회기반시설 데이터베이스

  • 1990년대

    • 정부부처 중심으로 사회간접자본(SOC) 차원에서 전자문서교환(EDI, Electronic Data Interchange) 활용이 본격화 했다.

    • 부가가치통신망(VAN)을 통한 정보망 구축을 했다.

    • 구축된 데이터베이스는 공공DB로서 활용될 뿐만 아니라 관련 산업의 인프라로서 유용하게 활용했다.

  • 1990년대 후반

    • 문서교환 등에 국한되었던 것에서 벗어나 기반 시설인 지리, 교통부문의 데이터베이스 구축이 본격화 됐다.
  • 2000년대

    • 기존 DB의 고도화와 함께 의료ㆍ교육ㆍ행정 등 사회 각 부문으로 데이터베이스 구축 및 이용이 확대했다.
  • 물류

    • "실시간 차량추적"을 위한 종합물류정보망을 구축했다.

    • CVO 서비스, EDI 서비스, 물류정보 DB 서비스, 부가서비스 등으로 구성했다.

  • 지리

    • GIS 응용에 활용하는 4S 통합기술, LBS, SIM, 공간 DBMS 및 웹 GIS 실현

    • 지리정보통합관리소 운영, 지리정보유통망 가시화했다.

  • 교통

    • 지능형교통시스템(ITS), 교통정보, 교통분야별 기초자료 및 통계, 대민 서비스 확대했다.
  • 의료

    • 의료정보시스템 구축(처방전달시스템, 전자의무기록, 원격의료, 지식정보화 등으로 구성)

    • 국제 의료정보 전송 표준 HL7의 국내 표준화 작업

    • u헬스(ubiquitous-Health) 등장

  • 교육

    • ICT를 활용한 각종 교육정보의 개발 및 보급

    • 대학정보화 및 교육행정정보화 위주의 사업 추진


0개의 댓글