[자격증] ADsP 1과목 정리

km-ji·2025년 5월 13일

자격증

목록 보기
7/14
post-thumbnail

데이터와 정보

데이터와 정보 (1)

  1. 데이터와 정보

  2. 데이터 특성 - 존재적(사실 ex. 값), 당위적(가공된 내용 ex. 평균)

  3. 데이터 유형
    (1) 정성적 / 정량적
    - 정성적: 기준이 불명확, 집합으로 표현 불가 (언어, 문자, 텍스트)
    - 정량적: 기준이 명확, 집합으로 표현 가능 (수치, 도형, 기호)

    (2) 정형 / 반정형 / 비정형
    - 정형: 고정된 틀, 연산 가능 (csv, 엑셀)
    - 반정형: 고정된 틀, 연산 불가능 (XML, JSON)
    - 비정형: 고정된 틀없고, 연산 불가능 (소셜데이터, 영상, 음성, 댓글)

    (3) 암묵지 / 형식지
    - 암묵지(Tacit): 겉으로 표출되지 않는 상태, 개인에게 습득되어 있음
    - 형식지(Explicit): 외부로 표출됨, 공유 가능(문서, 메뉴얼처럼)

    *상호작용
     공통화 - 암->암 (대화, 상호작용)
     표출화 - 암->형 (문서화 매체화)
     연결화 - 형+형 (형식이 상호결합)
     내면화 - 형->암* (교육, 행동)

데이터와 정보 (2)

  1. DIKW 피라미드
    (1) Data / Information / Knowledge / Wisdom
    (2) 데이터 단위
    1byte = 8bit
    k m g t p e z y
    킬로 메가 기가 테라 페타 엑사 제타 요타

데이터베이스 (1)

  1. 데이터베이스?

    • DB: 정보의 집합체
    • DBMS: 관리 소프트웨어
  2. 특징

    • 일반적
      통합 / 저장 / 공용 / 변화
    • 다양한 측면
      정보축적 및 전달 / 이용 / 관리 / 발전 / 경제 및 산업적
  3. DB 트랜잭션 특성 (ACID)

    • 트랜잭션: DB에서 명령을 수행하는 하나의 논리적인 기능의 단위
      원자성 / 일관성 / 고립성 / 지속성
    • 원자성: 모두 적용 or not
    • 일관성: 완료하면 항상 유지
    • 고립성: 중간 과정에 개입 불가
    • 지속성: 영구적

데이터베이스 (2)
1. 기업내부 DB
- OLTP
- OLAP
- EAI
- KMS
- SCM
- ERP
- CRM
- BI
- RTE

2.사회구조 기반 DB
- NEIS
- PACS
- GIS

  1. DB 종류
  • RDBMS / NoSQL
  • 계층형 / 네트워크형 / 분산형 / 객체지향형
    - 계층형: 부모-자식 단계
    • 네트워크형: 그물형태
    • 분산형: 분산된 여러개 DB를 하나로
    • 객체지향: 원하는 타입을 원하는 형태로 저장 가능
  • DB 구성요소
    - 인스턴스 / 속성 / 엔터티 / 메타데이터 / 인덱스
  1. SQL
  • DDL (CREATE, ALTER, RENAME, DROP)
  • DML (SELECT, INSERT, UPDATE, DELETE)
  • DCL (GRANT, REVOKE)
  • TCL (COMMIT, ROLLBACK, SAVEPOINT)

데이터의 가치와 미래

빅데이터의 이해 (1)

  1. 빅데이터 정의
    • 특징: 3V, 4V (volume, variety, velocity, value, verocity)
  1. 빅데이터 의한 변화
    • 사전처리 -> 사후처리 (인사이트 발굴)
    • 표본조사 -> 전수조사 (처리 비용 감소하면서 가능해짐)
    • 질 -> 양 (data 많을수록 정확도 높아짐)
    • 인과관계 -> 상관관계 (현상의 발생가능성을 포착, 행동 추천)
    • 기술과 인재, 조직변화 (관련 인재 요구됨, data 중심 조직 등장)

빅데이터 가치와 영향

  • 활용 방식이 많이 달라짐

빅데이터 비즈니스 모델

  1. 빅데이터 활용에 필요한 3요서: 데이터, 기술, 인력

  2. 활용 기본 테크닉

    • 연관규칙 학습(상관관계 파악하기)
    • 유형분석 (범주 찾아내기)
    • 유전 알고리즘 (점진적으로 진화시키기)
    • 기계학습=머신러닝 (예측하기)
    • 회귀분석 (독립변수 조작.. 종속변수 어떻게 변화하는 지 파악하기)
    • 감성분석 (비정형 텍스트 마이닝 -> 사람 감성/긍부정 판별)
    • SNS분석 (인플루언서의 고객과 소셜 관계 파악, 영향력 파악)

빅데이터의 위기요인과 통제방안

  1. 3가지

    • 사생활침해: 동의 -> 책임
    • 책임원칙훼손: 결과기반 책임원칙 고수
    • 데이터오용: 알고리즘 접근 허용
  2. 개인정보 비식별 기술

    • 가명처리 (다른값(홍길동을 김가명)으로 대체)
    • 마스킹 (임의의 값(홍OO)으로 대체)
    • 총계처리 (통곗값(이름들의 몸무게합) 적용)
    • 삭제 (일부 삭제(921212 -> 90년대))
    • 범주화 (특정값->범위로(홍씨))

가치창조를 위한 데이터사이언스와 전략 인사이트

  1. 데이터 사이언스

    • 통계학: 정형화된 실험 데이터 분석
    • 데이터마이닝: 분석에 초점 맞춤
    • 그럼,, 데이터사이언스: 다양한 유형 분석 + 구현, 전달까지 포괄
    • (통계학, 데이터마이닝) < 데이터사이언스
  2. 데이터사이언스 정의

    • 데이터로부터 의미있는 정보를 추출해내는 학문
    • 다양한 데이터 유형 분석함
  3. 데이터사이언스 구성요소

    • analytics (분석 모델)
    • IT (컴퓨팅)
    • 비즈니스분석 (커뮤 등)
  4. 인문학 열풍

    • 외부환경 (디버전스, 서비스, 시장창조)
    • 변화 (복잡세계화, 서비스, 무형자산의 경쟁)
  5. 데이터 사이언티스트

    • 가트너 제시: 데이터관리 + 분석모델링 + 비즈니스분석 + 소프트스킬
  6. 가치 패러다임 변화

    • 디지털화 -> 연결 -> 에이전시
profile
I'm mz. Do you want to try mzing?

0개의 댓글