비식별 기술이란 데이터 셋에서 개인을 식별할 수 있는 요소의 전부 또는 일부를 삭제하거나 다른 값으로 대체하는 방법으로 개인을 알아볼 수 없도록 하는 기술을 일컫는다.비식별 기술의 종류와 예시과거(Digitalization)아날로그 세상을 어떻게 효과적으로 디지털화하는
개념하나의 데이터베이스를 여러 개의 서버(또는 가상 서버) 상에 구축하는 것을 의미한다.데이터를 통합할 때 성능과 가용성의 향상을 위해 데이터베이스 차원의 파티셔닝 또는 클러스터링을 이용한다.데이터베이스 파티셔닝 구현의 효과병령처리, 고가용성(특정 파티션에서 장애가 발
과제 발굴개별 조직이나 개인이 도출한 분석 아이디어를 발굴하고 이를 과제화하여 분석 과제 풀(Pool)로 관리하면서 분석 프로젝트를 선정하는 작업을 수행한다.과제 수행분석을 수행할 팀을 구성하고 분석 과제 실행 시 지속적인 모니터링과 과제 결과를 공유하고 개선하는 절차
이표본에 의한 분산비 검정은 두 표본의 분산이 동일한지를 비교하는 검정으로 검정통계량은 F분포를 따른다.모분산이 추론의 대상이 되는 경우는 모집단의 변동성 또는 퍼짐의 정도에 관심이 있을 때이다.모집단이 정규분포를 따르지 않더라도 중심극한정리를 통해 정규 모집단으로부터
데이터각각 분리된 개별적인 기초자료(원자료)데이터는 불완전하고 비연속적이며, 완전한 메시지가 아니므로 정보 전달 측면에서의 가치는 없다.예시 : 강수량정보데이터 간의 관계(상관관계, 인과관계)가 생성된 것서로 다른 데이터 간의 관계와 일정한 패턴을 가시화시킴으로써 정보
데이터 사이언스와 통계학이 다른 점을 나열하였다. 다음 중 가장 부적절한 것은?① 데이터 사이언스는 통계학과 달리 총체적 접근법을 사용한다.② 정형 및 비정형을 포함한 다양한 유형의 데이터를 분석대상으로 한다.③ 분석뿐만 아니라 이를 효과적으로 구현하고 전달하는 과정까
다음 중 정보 관리 시스템의 능력을 넘어서는 정보량을 다루기 위해 필요한 정보만을 수집하여 효율성을 달성하는 것은?① 사전처리② 표본조사③ 상관관계④ 인과분석정답 ①해설그냥 사전처리의 정의를 말하고 고르라는 것인 듯한 문제다음 중 통찰력을 제공하는 분석 기술로 부적절한
다음 중 빅데이터의 가치 산정이 어려운 이유의 사례로 보기 어려운 것은?① 전기차 배터리 정보를 충전소 최적지 선정과 같은 2차적 목적에 활용② 은행 대출심사 알고리즘 작동 원리 이해의 어려움③ 구글 검색에서 나타나는 것과 같은 데이터의 반복적 재사용④ 독자의 전자책
✐ 2과목 : 데이터 처리 기술 이해 ⚑ 문제1 HDFS에서 파일 데이터는 기본 단위로 나누어져 여러 데이터노드에 분산 저장된다. HDFS의 기본 저장 단위로 적절한 것은? ① Chunk ② Block ③ Node ④ Memory >정답 ② 해설 GFS 파일 데이터
다음 중 빅데이터의 가치 산정이 어려운 이유의 사례로 보기 어려운 것은?① 전기차 배터리 정보를 충전소 최적지 선정과 같은 2차적 목적에 활용② 은행 대출심사 알고리즘 작동 원리 이해의 어려움③ 구글 검색에서 나타나는 것과 같은 데이터의 반복적 재사용④ 독자의 전자책
지식창조과정에 대한 설명으로 부적절한 것은?① 공통화 : 다른 사람과의 대화 등 상호작용을 통해 개인의 암묵지로 습득하는 단계② 표출화 : 암묵지를 언어나 상징으로 표현함으로써 형식지화 하는 단계③ 연결화 : 형식지를 암묵지에 맞춰 수행하고 편집하여 정리하는 단계④ 내
데이터에 대한 요약과 일부르 보여준 뒤, 데이터 분석 방법과 인사이트를 제시하는 문제제시된 데이터에 대해 어떻게 이해하고 있는지 기술해야 한다.적절한 분석방법론을 나열해야 한다.예상되는 가상 분석 결과를 제시해야 한다.3에서 제시한 가상 분석 결과를 통해 어떤 인사이트
맵리듀스가 실행되는 절차로 적절한 것은?① Input - Split - Shuffle & Sort - Map - Combine - Reduce - Output② Input - Split - Map - Shuffle & Sort - Combine - Reduce - Ou