# adp

ADP 필기 모의고사 오답노트 (3)
맵리듀스가 실행되는 절차로 적절한 것은?① Input - Split - Shuffle & Sort - Map - Combine - Reduce - Output② Input - Split - Map - Shuffle & Sort - Combine - Reduce - Ou

ADP 서술형
데이터에 대한 요약과 일부르 보여준 뒤, 데이터 분석 방법과 인사이트를 제시하는 문제제시된 데이터에 대해 어떻게 이해하고 있는지 기술해야 한다.적절한 분석방법론을 나열해야 한다.예상되는 가상 분석 결과를 제시해야 한다.3에서 제시한 가상 분석 결과를 통해 어떤 인사이트

ADP 필기 기출 10, 11회 오답노트 (2)
지식창조과정에 대한 설명으로 부적절한 것은?① 공통화 : 다른 사람과의 대화 등 상호작용을 통해 개인의 암묵지로 습득하는 단계② 표출화 : 암묵지를 언어나 상징으로 표현함으로써 형식지화 하는 단계③ 연결화 : 형식지를 암묵지에 맞춰 수행하고 편집하여 정리하는 단계④ 내

ADP 필기 모의고사 오답노트 (2)
다음 중 빅데이터의 가치 산정이 어려운 이유의 사례로 보기 어려운 것은?① 전기차 배터리 정보를 충전소 최적지 선정과 같은 2차적 목적에 활용② 은행 대출심사 알고리즘 작동 원리 이해의 어려움③ 구글 검색에서 나타나는 것과 같은 데이터의 반복적 재사용④ 독자의 전자책

ADP 2019년 필기(12~15회) 기출 오답노트
✐ 2과목 : 데이터 처리 기술 이해 ⚑ 문제1 HDFS에서 파일 데이터는 기본 단위로 나누어져 여러 데이터노드에 분산 저장된다. HDFS의 기본 저장 단위로 적절한 것은? ① Chunk ② Block ③ Node ④ Memory >정답 ② 해설 GFS 파일 데이터

ADP 필기 모의고사 오답노트 (1)
다음 중 빅데이터의 가치 산정이 어려운 이유의 사례로 보기 어려운 것은?① 전기차 배터리 정보를 충전소 최적지 선정과 같은 2차적 목적에 활용② 은행 대출심사 알고리즘 작동 원리 이해의 어려움③ 구글 검색에서 나타나는 것과 같은 데이터의 반복적 재사용④ 독자의 전자책

ADP 필기 기출 11회 오답노트 (1)
다음 중 정보 관리 시스템의 능력을 넘어서는 정보량을 다루기 위해 필요한 정보만을 수집하여 효율성을 달성하는 것은?① 사전처리② 표본조사③ 상관관계④ 인과분석정답 ①해설그냥 사전처리의 정의를 말하고 고르라는 것인 듯한 문제다음 중 통찰력을 제공하는 분석 기술로 부적절한

ADP 필기 기출 10회 오답노트 (1)
데이터 사이언스와 통계학이 다른 점을 나열하였다. 다음 중 가장 부적절한 것은?① 데이터 사이언스는 통계학과 달리 총체적 접근법을 사용한다.② 정형 및 비정형을 포함한 다양한 유형의 데이터를 분석대상으로 한다.③ 분석뿐만 아니라 이를 효과적으로 구현하고 전달하는 과정까

ADP 5과목 - 데이터 시각화
데이터각각 분리된 개별적인 기초자료(원자료)데이터는 불완전하고 비연속적이며, 완전한 메시지가 아니므로 정보 전달 측면에서의 가치는 없다.예시 : 강수량정보데이터 간의 관계(상관관계, 인과관계)가 생성된 것서로 다른 데이터 간의 관계와 일정한 패턴을 가시화시킴으로써 정보

ADP 4과목 - 데이터 분석
이표본에 의한 분산비 검정은 두 표본의 분산이 동일한지를 비교하는 검정으로 검정통계량은 F분포를 따른다.모분산이 추론의 대상이 되는 경우는 모집단의 변동성 또는 퍼짐의 정도에 관심이 있을 때이다.모집단이 정규분포를 따르지 않더라도 중심극한정리를 통해 정규 모집단으로부터

ADP 3과목 - 데이터 분석 기획
과제 발굴개별 조직이나 개인이 도출한 분석 아이디어를 발굴하고 이를 과제화하여 분석 과제 풀(Pool)로 관리하면서 분석 프로젝트를 선정하는 작업을 수행한다.과제 수행분석을 수행할 팀을 구성하고 분석 과제 실행 시 지속적인 모니터링과 과제 결과를 공유하고 개선하는 절차

ADP 2과목 - 데이터 처리 기술 이해
개념하나의 데이터베이스를 여러 개의 서버(또는 가상 서버) 상에 구축하는 것을 의미한다.데이터를 통합할 때 성능과 가용성의 향상을 위해 데이터베이스 차원의 파티셔닝 또는 클러스터링을 이용한다.데이터베이스 파티셔닝 구현의 효과병령처리, 고가용성(특정 파티션에서 장애가 발

ADP 1과목 - 데이터 이해
비식별 기술이란 데이터 셋에서 개인을 식별할 수 있는 요소의 전부 또는 일부를 삭제하거나 다른 값으로 대체하는 방법으로 개인을 알아볼 수 없도록 하는 기술을 일컫는다.비식별 기술의 종류와 예시과거(Digitalization)아날로그 세상을 어떻게 효과적으로 디지털화하는

AdaBoost와 GBM
📖 앙상블 학습의 유형은 보팅(Voting), 배깅(Bagging), 부스팅(Boosting), 스태킹(Stacking) 등이 있습니다. 이번 포스팅에서는 부스팅 알고리즘 중 AdaBoost와 GBM에 대해 알아보고자 합니다. 우선 부스팅의 원리부터 차근차근 알아봅시
차이검정 - T 검정
📖 전체집단을 모두 조사하는것은 현실적으로 불가능함으로 적절한 표본집단을 지정하여 이 표본집단에서 평균, 표준편차와 같은 통계량을 구한 뒤 이를 통해 모집단의 모수를 추정합니다. 이 때 널리 쓰이는 통계적 검정 방법들을 딱 한 번의 정리를 통해 이해를 돕겠습니다.사람
시계열 군집
📖 시계열 데이터를 계층적, 분할적 군집화하기 위한 방법을 간단하게 코드 위주로 각각 알아봅시다. 군집화 가능한 시계열 데이터의 형태로 변환 기존 데이터는 각 컬럼이 각 집단의 시계열 정보를 가지고 있습니다. 이를 전치시켜 각 로우데이터가 각 집단 별 시계열 데이터