데이터 -> 정보 -> 기술 -> 지식
데이터:
사실이나 정보를 수집하여 기록한 형태.
숫자, 문자, 이미지, 영상, 센서 값 등이 있다.
정보의 디지털화와 데이터 기반 의사결정의 핵심이 되고있다.
예) 전자상거래 추천 시스템, 교통량 분석을 통한 신호 제어 최적화
정형데이터는 구성, 정리, 검색 및 분석이 쉬운 반면, 비정형 데이터는 분석이 어려움





운영 데이터(Operational Data)
기업이나 기관에서 운영 과정에서 발생하는 데이터
(고객 정보, 주문 내역, 생산 데이터 등)
트랜잭션 데이터(Transaction Data)
금융, 온라인 쇼핑, 예약 시스템 등에서 발생하는 거래 기록
(카드 결제 기록, 인터넷 뱅킹 내역)
센서 데이터(Sensor Data)
IoT 기기, 스마트폰, CCTV 등에서 수십되는 데이터(온도 센서 값, GPS 데이터, 생체 인식 데이터)
소셜 데이터(Social Data)
커뮤니티, 블로그 등에서 생성되는 데이터
(댓글, 좋아요, 공유 데이터)
과학 및 연구 데이터(Scientific Data)
연구 기관, 실험실 등에서 생성하는 데이터
(유전자 분석 데이터, 천문 관측 데이터)
이를 적절히 활용하여 데이터 기반 의사결정과 비즈니스 혁신을 실현해야 함



데이터 생성 방식 비교

통계적 분석 가능 여부에 따른 데이터 유형
수치로 표현되며, 수학적 연산이 가능
예) 키, 몸무게, 연봉, 매출액 등
이산형 데이터(Discrete Data)
특정 값만 가질 수 있는 데이터(연속성이 없음)
예) 학생 수, 자동차 개수, 주사위 값
연속형 데이터(Continuous Data)
특정 범위 내에서 무한한 값을 가질 수 있는 데이터
예) 온도, 몸무게, 시간
숫자가 아닌 형태의 데이터로, 의미를 해석하는 데 초점
예) 이름, 성별, 국적, 고객 리뷰 등






통합적 분석의 중요성
예) 고객 만족도 조사에서 점수(정량적 데이터)와
리뷰 내용(정성적 데이터)을 함께 분석하여 고객 요구를 깊이 이해

간격형 데이터(Interval Data)
순서뿐만 아니라 데이터 값 사이의 간격으 측정할 수 있는 데이터. 그러나 '절대적인 0(Zero Point)'가 존재하지 않음
비율형 데이터(Ratio Data)
값 간의 순서, 간격, 비율을 모두 비교할 수 있음.
'절대적 0(Zero Point)'가 존재하는 데이터


데이터의 유형에 맞는 분석 도구와 기법을 적절히 활용하면, 시사점 도출과 의사결정의 정확성을 높일 수 있음



상황에 따라 적합한 데이터 활용
수동 데이터는 특정 목적에 맞춘 정밀 분석 관리가 필요한 경우에 적합.
예) 마케팅 조사, 의료 기록 분석
자동 데이터는 대규모 실시간 처리 및 예측 분석에 적합.
예) 스마트홈, 자율주행차, 금융 거래
통합적 데이터 관리 전략 필요
수동 데이터와 자동 데이터를 결합하여 정확성과 신속성을 모두 확보하는 전략이 필요함.
예) 매출 데이터(수동)와 실시간 고객 반응(자동)을 결합한 마케팅 전략 수립
AI 및 빅데이터 분석 활용 강화
자동 데이터를 AI 및 머신러닝에 활용하여 예측 분석, 패턴 인식, 실시간 대응 시스템을 구축할 수 있음.
데이터 품질 및 보안 관리 강화
자동 데이터의 경우 오류나 보안 문제 발생 가능성이 높으므로, 정기적인 품질 검증 및 보안 강화가 중요함.
데이터를 설명하는 '정보(정보의 정보)'로, 데이터의 구조, 속성, 출처 등을 정의함
데이터의 의미, 형식, 출처, 생성 시간, 저장 위치 등을 포함하여 데이터 관리와 해석을 용이하게 제공함
데이터 관리 및 검색 효율화
데이터 베이스 내 데이터 구조와 내용을 명확히 설명하여 접근을 용이하게 함.
예) 데이터베이스 필드명, 설명, 데이터 타입 정의
데이터 품질 및 신뢰성 보장
출처 및 수집 방식 정보를 제공하여 데이터 신뢰성 검증 가능
예) 데이터 생성 시간, 생성 도구, 수집 프로세스
데이터 해석 지원
데이터의 맥락과 의미를 제공하여 해석 오류를 방지
예) 단위, 측정 방법, 표기 규칙
데이터 공유 및 표준화
서로 다른 시스템이나 조직 간 데이터 교환을 용이하게 함.
예) 데이터 표준 코드(ISO, JSON, XML)
빅데이터와 AI 시대에서는 메타 데이터를 통한 데이터 정제와 구조화가 데이터 기반 의사결정의 신뢰성을 높이는 중요한 전략이 될 수 있음
