ADSP_1_데이터의 이해(...ing)

potato·2024년 7월 18일

DATA

목록 보기
3/3

1.데이터와 정보

데이터의 정의

데이터의 정의와 특성

  • 가공되지 않은 자료,즉 객관적인 사실을 의미
  • 있는 그대로의 사실 : 존재적 특성
  • 추론,예측,전망,추정을 위한 정보의 근거 : 당위적 특성
  • 데이터(자료) -> 의미와 가치가 부여됨 -> 정보

데이터의 유형

  1. 정성적(특성,속성,카테고리) 데이터와 정량적(수치,도형,기호) 데이터
    1) 정성적 : 언어,문자,소리 등
    2) 정량적 : 길이,무게,삼각형,오각형 등
  2. 정형(고정된 프레임) 데이터와 비정형(자유로운 프레임) 데이터, 그리고 반정형(고정된 형태지만 연산 불가) 데이터
    1) 정형 : 연산 및 평가가 가능한 데이터, 수집 및 관리 용이하므로 일반적으로 RDB 에서 사용
    2) 비정형 : 연산이 매우 어렵거나 불가능, 관리 또한 어렵다. 일반적으로 NoSQL DB 에서 사용
    3) 반정형 : 고정된 형태 존재. 단, 수집 및 관리가 쉽지 않아 가공을 통해 정형 데이터로 변환 가능
  3. 암묵지(무형의 지식) 와 형식지(유형의 지식)
    1) 암묵지 : 경험을 기반으로 시행착오 겪어 정립된 지식. 겉으로 드러나지 않는다. #공통화 #내면화
    2) 형식지 : 문서나 메뉴얼과 같은 유형의 객체로 존재하는 지식. 공유 할 수 있는 지식으로 반드시 형상화 되어 있다. #표출화 #연결화

데이터와 정보

DIKW 피라미드 ⭐️⭐️⭐️

이터 ㄴ포메이선 ㄹ로지 스덤

  • 데이터 : 객관적 사실
  • 정보 : 데이터의 가공 및 처리 이후 의미와 가치가 부여되어 도출된 것 (단, 정보가 유의미한 것인지에 대한 판단은 어려움)
  • 지식 : 정보를 구조화하여 유의미한 정보를 분류하고 개인의 경험을 결합해 고유의 지식으로 내재화된 것
  • 지혜 : 지식의 축적 + 아이디어 + 창의성 + ... 이 결합된 산물. 창의성이 포함되어 유의미한 비정형 정보일 확률이 높다.
  • 참고이미지

데이터에 관한 상식

  • 비트 ? bit. binary digit(이진수) 의 약자로 "0"과 "1" 두 가지 값으로 표현하는 단위 (LOW LEVEL 수준의 신호를 표현)
  • 바이트 ? byte(=8 bit). 신호의 집합으로 일반적으로 데이터의 양을 나타내는 단위.

    1 byte 는 "숫자 및 영어, 특수문자 1글자 표현 가능"
    2 byte 는 "한글, 일어, 중국어 등 문자 1글자 표현 가능"

데이터의 단위 ⭐️

Bit -> Byte -> KB -> MB -> GB -> TB -> PB -> EB -> ZB -> YB


2. 데이터베이스

데이터베이스 개요

데이터베이스 정의 _ 연혁

  • 최초에는 군수물자를 관리하기 위해 수집된 자료를 뜻하는 데이터 + 기지의 뜻으로 "데이터베이스" 라고 부르기 시작함(1950년대)
  • 미국 SDC가 개최한 심포지엄에서 "대량의 데이터 축적하는 기지" 라는 뜻으로 사용(1963년)
  • 미국의 CAC가 한국과학기술정보센터(KORATIC)를 통해 처음 시작(1975년)
  • 다양한 정의
    1) EU, 데이터베이스의 법적 보호에 관한 지침
    : 체계적,조직적으로 정리된 접근 가능한 독립된 저작물이나 데이터, 기타수집물2) 한국, 저작권법
    : 소재를 체계적으로 배열 또는 구성한 편집물. 법률적으로 기술 기반 저작물 인정
    3) 컴퓨터 용어사전, 정보통신용어사전(TTA)
    : 복수 이용자의 요구에 대응하여 데이터 저장-공급
    4) 위키피디아
    : 체계적으로 정렬된 데이터 집합. 저장,관리,검색,이용할 수 있는 컴퓨터 기반의 DB 로 진화
    5) 한국데이터산업진흥원
    : 다수의 콘텐츠를 정보처리 및 체계적인 수집-축적으로 다양한 용도와 방법으로 이용할 수 있게 정리한 정보 집합체

DB ? 정보집합체
DBMS ? DB 관리 소프트웨어

데이터베이스의 특징

  • 일반적인 특징 (통합,저장,공용,변화)
    1) 통합된 데이터(Integrated Data) : 데이터가 중복되지 않게 통합
    2) 저장된 데이터(Stored Data) : 저장 매체에 저장(컴퓨터 기술 비탕)
    3) 공용 데이터(Shared Data) : 여러 사용자가 데이터를 공동으로 이용(+대용량화,+복잡도), 이용목적은 다를 수 있다. 공유
    4) 변화하는 데이터(Operational Data) : 운영 데이터라고도 부르며 CUD 를 통해 항상 최신의 정확한 상태를 유지한다.

데이터베이스의 다양한 측면에서의 특성 ⭐️⭐️

측면특성
정보의 축적 및 전달기계가독성(정보처리기기가 활용할 수 있는 형식), 검색가능성(필요한 정보 검색가능), 원격조작성(온라인으로 즉시 이용가능)
정보이용이용자의 요구에 따라 정보를 신속정확하게 조회 / +경제성
정보관리일정한 질서(인덱스)와 구조(스키마)에 따라 검색 및 관리, 체계적이고 관리가 용이하며 최신 상태 유지
정보기술발전정보를 활용한 소프트웨어,하드웨어,처리기술,네트워크 기술 등의 발전을 유도(견인)
경제-산업적축적된 유의미하고 정확한 데이터베이스의 인프라를 활용하여 경제,산업,사회 전반에 긍정적인 영향을 미쳐 효율성 및 편의성 증대

트랜잭션의 특성

Transaction, 명령에 따른 작업수행의 논리적인 단위. 예를 들면 "데이터 조회 요청" 은 트랜젝션이 1번 발생, "내용 저장이지만 중복된 내용을 확인하고 기존 내역은 삭제 후 저장" 의 경우 DB 작업은 여러 번 발생하지만 조회와 마찬가지로 하나의 트랜젝션으로 묶여 "1개의 작업단위"로 판단할 수 있다.

트랜젝션의 특성은 원자성(모두적용 or 무효),일관성(결과의 일관성),고립성(서로다른 트랜잭션은 서로 영향X),지속성(수행결과는 영구적) 이 있다.


데이터베이스 활용

활용방안

  1. 기업 내부의 DB
    1) 인하우스DB <1990년대~> : 정보통신망 구축 가속화 -> 기업 경영 전반에 필요한 자료를 체계화 하고 운영 -> 전사관리시스템(ERP) 의 전신
    2) OLTP(Online Transation Processing) <1990년대 중반 이전> : 정보수집 및 공유를 위한 경영정보시스템(MIS) 과 단순 자동화 중심의 시스템 구축
    3) OLAP(Online Analytical Processing) : 데이터마이닝 기술의 등장 -> 단순 "수집" 과 "공유" 에서 "분석" 중심 시스템 구축
    4) CRM & SCM <2000년대> : DB 구축의 화두가 보다 유의미한 고객관계관리(Customer Relationship Management)공급망관리(Supply Chain Management) 중심으로 변화. 공급망 정보와 고객 정보가 연동.

  2. OLTP 와 OLAP 의 차이
    OLTP 는 Transaction, 거래단위에 초점
    OLAP 는 Analytical, 적제된데이터에 초점

  3. EAI(Enterprise Application Integration) : 여러 개의 서비스를 연계하기 위하여 중앙관리 방식으로 연결 루트를 최적화하는 애플리케이션 통합 서비스

  4. KMS(Knowledge Management System) : 지식 경영 시스템을 의미, 기업이 보유할 수 있는 지식을 통합하여 관리하는 것으로 문제해결능력 향상 목적
    기업이 보유할 수 있는 지식 예시
    1) 프로젝트 경험
    2) 직원 역량(직원의 경험)
    3) 과거 사례
    4) 와부 사례

  5. SCM(Supply Chain Management) : 유통 부문의 SCM 은 공급망 관리를 의미한다. 원자재 -> 기업 -> ... -> 고객까지의 유통단계를 최적화 하는 것이 목적

  6. ERP(Enterprise Resource Planning) : 제조 부문의 ERP 는 경영자원통합관리를 의미한다. 부서별 업무에 필요한 자원을 직접 또는 간접적으로 지원하여 업무 효율성 을 높이는 것이 목적

  7. CRM(Custom Relationship Management) : 제조 부문의 CRM 은 고객 관계 관리로 분석을 통한 신규 고객 창출, 기존 고객 이탈 방지을 목적

  8. BI(Business Intelligence) : 기업의 의사결정 프로세스로 기업데이터 가공 및 분석 - 비지니스 이슈에 답하기 의해 신속한 보고서를 작성하는 도구로는 "ad hoc report" 가 있다.

  9. RTE(Real Time Enterprise) : 프로세스에서 발생하는 정보를 실시간으로 통합 및 전달하는 스피드 경영

profile
null

0개의 댓글