즉, 데이터 분석 업무 대신 데이터 수집 / 가공 업무를 한다고 보면 된다.
데이터 분석가나 데이터 과학자를 꿈꾼다면 공공데이터 일경험 수련생보다는 공공 빅데이터로 지원을, 데이터 엔지니어(DB 관리)를 희망한다면 일경험 수련생을 지원하는 것을 추천한다.
실제 교육 과정도 공공빅데이터 청년인턴은 R과 python을, 공공데이터 일경험 수련생 수업은 SQL 및 데이터베이스 커리큘럼이 위주다.
: 데이터베이스, 전자화된 파일 등 공공기관이 법령 등에서 정하는 목적을 위하여 생성 또는 취득하여 관리하고 있는 광 또는 전자적 방식으로 처리된 자료 및 정보
: 중요지식자산인 국가데이터 중 하나로, 전자적/ 공공의 특성을 띤다.
❓ 기계 판독이 가능한 형태란?
- 소프트웨어로 데이터의 개별 내용 또는 내부구조를 확인하거나 수정, 변환, 추출 등 가공할 수 있는 상태를 의미
- 1단계(포털등록불가) : 특정 소프트웨어에서 읽기 가능 자유로운 수정, 변환 불가 예) PDF
- 2단계(포털등록가능, 최소충족포맷) : 특정 소프트웨어에서 읽고, 수정 변환 가능 예) hwp, xls, jpg, wmv, mpeg, mp3, swf
- 3단계(오픈포맷) : 모든 소프트웨어에서 읽고 수정, 변환 가능
예) csv, json, xml- 4단계(오픈포맷) : URL을 기반으로 데이터 속성 특성 관계를 기술하는 구조 예) RDF
- 5단계(오픈포맷) : 웹 상의 다른 데이터와 연결, 공유 가능
예) LOD
✋🏻 제공과 공개 구분하기!
데이터 가치사슬 : 분석, 처리, 유통 → 활용, 혁신 서비스 → 수집, 생성 → 저장, 집계
데이터 이해관계자
- 역할 : 데이터 보유자, 데이터 중개자, 데이터 이용자, 혁신적 사업가
- 주체 : 공공, 기업, 사용자, NPO, 기술 / 학계
공공데이터 1.0
: 공급자 주도, 규모 중심 개방
: 정형 데이터 중심
: 일방적 개방 및 활용 지원
공공데이터 2.0
: 수요자 중심, 품질 중심 개방
: 정형/비정형으로 다양화
: 민관협력을 통한 생태계 조성
공공데이터 ∩ 민간데이터 = 공익데이터
해당 내용 이후부터는 따로 기록합니다!