[ADsP] 자격증 챌린지 1주차

Hyunjun Kim·2024년 9월 26일

ADsP (자격증)

목록 보기
1/18

개요

데이터의 이해

데이터란?

데이터는 정보.
저장이나 처리에 효율적인 형태로 변환된 정보 > 데이터

2025년 전 세계 데이터 생성량은 175ZB에 이를 것(Seagate)

bit 0/1
1 Byte == 8 bit
1 Kilo == 1000 Byte
1 Mega == 1000Kilo
1 Giga == 1000 Mega
1 Tera == 1000 Giga
1 Peta == 1000 Tera
1 Exa == 1000 Peta
1 Zeta == 1000 Exa
1 Yota == 1000 Zeta

즉 매 순간 엄청난 데이터가 축적되고 있음
무한하게 증가하는 이 데이터를 잘 저장하고 관리하는 기술이 필요.

데이터정의 - 주다 주어진 것이란 의미로 처음 사용
데이터 특성 - 객관적 사실이라는 존재적 특성 / 추론,예측,전망 추정을 위한 근거로 기능하는 당위적 특성 가지고 있다.

정성적 데이터와 정량적 데이터
언어,문자로 표현되는 정성 데이터
수치, 기호, 도형 등으로 표시되는 정량 데이터 있다.

정형, 비정형, 반정형 데이터
정형 : 고정된 틀 연산 가능 / CSV, 엑셀, 스프레드시트
비정형 : 고정된 틀 x, 연산 x / NoSQL, 영상, 음성
반정형 : 고정된 틀 있지만 연산 x / HTML, JSON, XML

암묵지와 형식지
암묵지 : 학습,체험 통해 개인에게 습득, 겉으로 드러나지 않는 지식
형식지 : 교과서, 메뉴얼 등 형상화 된 지식 , 유형의 대상이 있기 때문에 공유 할 수 있는 지식 문서처럼 공유 전달 용이

여기 개념 다시 보기.

한 명이 가지고 있는 암묵지를 여러 사람에게 주는 것 : 공통화
암묵지 >표출화> 형식지
표출화된 지식 > 연결화 통해서 만들고
연결화된 지식을 내면화
내면화된 지식을 다시 공통화 하는 순환.

DIKW 피라미드 Data, Information, Knowledge, Wisdom
지혜를 얻어내는 과정을 계층구조로 설명.
data : 타 데이터와 상관관계가 없는 순수한 수치나 기호를 의미
information : 데이터를 가공, 그리고 상관관계깐 이해를 통해 패턴을 인식하고 그 의미를 부여한 데이터
knowledge : 상호 연결된 데이터를 가지고 추론
Wisdom : 예측

데이터베이스 개요

데이터베이스 정의 - 외우지 마셈 ㅋㅋ
용어 언제 처음 등장 했는가? 군비 상황에 등장했다 읽어보시고

데이터베이스의 다양한 정의 - 읽어보세요

헷갈리기 쉬운 DB / DBMS
DB 필요로 하는 정보를 체계적으로 수집/축적하여 제공하는 정보의 집합체
DBMS 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어

데이터베이스의 종류
계층형, 네트워크형, 관계형, NoSQL등이 있음

  • 관계형 데이터베이스 RDB
    데이터를 행과 열로 표현된 표 형식으로 저장
    SQL 을 사용하여 데이터를 조작,검색, Oracle, MySQL, MariaDB, SQLite, Postgresql 등

  • 비관계형 데이터베이스 NoSQL
    "Not Only SQL"또는 "Non-SQL"의 약자로, 관계형 데이터베이스가 아닌 형태의 데이터베이스 관리 시스템을 나타내는 용어 쓰임새가 다르다.
    비정형, 대용량 데이터 분석 및 분산 처리에 용이
    MongoDB, ElasticSearch 등

DB 일반적인 특징 - 자주 나옴
통합된 데이터 - 중복x 데이터
저장된 데이터 - 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미
공용 데이터 - 다수의 사용자가 다양한 목적으로 이용
변화되는 데이터 - 데이터가 변화하면서도 항상 정확한 데이터 상태 유지

데이터베이스의 다양한 측면에서의 특징
구분 | 특징
정보의 축적 및 전달 측면 : = 기계 가독성, 검색가능성, 원격 조작성

정보 이용 측면 : 다양한 정보 신속하게 획득, 경제적으로 찾아낼 수 있다

정보 관리 측면 : 정보를 일정한 질서, 구조에 따라 정리/저장/검색/관리 할 수 있도록 하여 대량의 정보를 체계적으로 축적, 새 내용 추가 용이

정보기술 발전의 측면 : 정보처리, 검색,관리 소프트웨어. 관련 하드웨어, 정보 전송을 위한 네트워크 기술 등의 발전을 견일 할 수 있다.

경제,산어적 측면 : 다양한 정보를 필요에 따라 신속하게 제공하고 이용할 수있는 인프라 특성, 국민의 편의, 사회 활동의 효율성 제고

1.기업 내부 데이터베이스
OLTP - Transaction - 데이터 갱신 위주
OLAP - Analytical - 데이터 조회 위주 (분석 중심)

2.CRM - 고객 구매이력 분석 고객 이해도 높이고 효과적 마케팅전략 고객 관계 관리)
ERP - 기업 보유 자원을 효율적 활용, 분배 (경영 자원 통합)
RTE = 신속한 대응 위 한 DB

산업 부분별 DB발전 과정 - 읽고 넘어가도 충분함
1.제조
2.금융
3.유통

사회 기반 구조에서의 데이터베이스 챙겨줘야함
물류인지, 지리인지, 교통인지, 의료인지, 교육인지 보고 알아야 함.

숙제

데이터란?
저장이나 처리에 효율적인 형태로 변환된 정보
데이터 특성
존재적 특성 : 객관적 사실
당위적 특성 : 추론, 예측, 전망을 위한 근거

정성적 데이터 : 언어 문자로 표현
정량적 데이터 : 수치, 기호, 도형 등으로 표시

정형 : 고정된 틀, 연산가능
비정형 : 고정된 틀x, 연산 x
반정형 : 고정된 틀, 연산 x

암묵지 : 학습, 체험 통해 개인에게 습득, 겉으로 드러나지 x 지식
형식지 : 교과서, 메뉴얼 등 형상화 된 지식. 공유 용이

암묵지는 표출화를 거쳐 형식지가 된다.
표출화된 지식은 연결화 되고
연결화된 지식을 개개인이 내면화 함.
내면화 된 지식을 다시 공통화 하는 순환

DIKW
data : 타 데이터와 상관관계 x 순수 수치나 기호 의미
information : 데이터를 가공, 상관관계 이해를 통해 패턴 인식, 의미 부여한 데이터
knowledge : 상호 연결된 데이터로 추론
wisdom : 예측

관계형 DB : RDB : 행,열로 표현, SQL로 데이터 조작 검색
비 관계형 NoSQL : 비정형, 대용량 분석, 분산처리 용이

DB 일반적 특징
통합 데이터 - 중복 x데이터
저장된 데이터 - 컴퓨터가 접근할 수 있는 저장
공용 데이터 - 다수의 사용자가 다양한 목적으로 이용
변화되는 데이터 - 데이터가 변화하면서도 항상 정확한 데이터 상태 유지

정보 축적 및 전달 측면 : 기계가독성, 검색가능성, 원격 조작성
정보 이용 측면 : 다양한 정보 신속하게 획득, 경제적
정보 관리 측면 : 정보 일정한 질서, 구조에 따라 정리/저장/검색/관리 할 수 있도록 해서 정보 체계적 축적. 새 내용 추가 용이
정보 기술 발전의 측면 : 정보처리, 검색, 관리 소프트웨어, 관련 하드웨어, 정보전송을 위한 네트워크 기술 등의 발전 견인
경제, 산업적 측면 : 다양한 정보 필요에 따라 신속하게 제공할 수 있는 인프라 특성, 국민의 편의, 사회 활동의 효율성 제고

기업 내부 db
OLTP - transaction - 데이터 갱신 위주
OLAP - Analytical - 데이터 조회 위주 (분석 중심)

CRM - 고객 관계 관리 - 구매 이력 분석, 효과적 마케팅 전략
ERP - 경영 자원 통합 - 기업 자원 효율적 활용, 분배
RTE - 신속한 대응 위한 DB

사회 기반 구조에서의 데이터베이스
물류 -
지리 -
교통 -
의료 -
교육 -

profile
Data Analytics Engineer 가 되

0개의 댓글