데이터는 정보.저장이나 처리에 효율적인 형태로 변환된 정보 > 데이터2025년 전 세계 데이터 생성량은 175ZB에 이를 것(Seagate)bit 0/11 Byte == 8 bit1 Kilo == 1000 Byte1 Mega == 1000Kilo1 Giga == 10

표본 조사와 추정 표본집단의 평균의 분산은 모집단의 분산보다 작다. 추정이란? 실제 모집단에 대한 모수를 찾기 위한 전수조사가 불가능하기 떄문에 표본조사를 통해 모집단의 모수를 예측하고자 하는 것. 점 추정이란? 모집단의 모수가 특정한 값일 것으로 생각하는 것. ( 일
ADsP 과목별 정리 잘 되어 있는 블로그!
1. 빅데이터의 이해 빅데이터의 정의 일반적인 빅데이터 정의 빅데이터는 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터다. 가트너그룹(Gartner Group)의 더그래니(Doug Laney)의 정의 (3V) 빅데이터는

분석 기획 정의분석기획이란 분석을 수행 전, 분석 수행할 과제의 정의 및 결과를 도출할 수 있도록 관리하는 방안을 사전에 계획하는 작업어떤 목표를 달성하기 위해 어떤 데이터를 가지고 어떤 방식으로 수행할지에 대한 일련의 계획수립, 사전작업분석기획의 특징데이터 사이언티스

마스터플랜 수립 개요분석 대상을 도출하고 우선순위를 평가하여 세부 이행 계획과 로드맵을 작성분석 마스터 플랜을 수립하는 가장 첫 번째 단계는 우선순위를 정하는 일이다.우선순위는 전략적 중요도, 비즈니스 성과 및 ROI, 분석 과제의 실행 용이성을 기준으로 설정한다.그다

데이터 분석을 위하여 사용하는 다양한 종류의 소프트웨어가 있습니다. 그중에서 R은 통계 분석 과정에서 수행되는 복잡한 계산이나 시각화 기법을 쉽게 사용할 수 있도록 설계된 무료 소프트웨어입니다. R은 뉴질랜드 통계학자인 로스 이하카와 캐나다 통계학자인 로버트 젠틀맨에

데이터 마이닝에서 다양한 분석기법을 적용해 모델을 개발하는 과정을 모델링이라고 합니다. 모델링 분석에 앞서 데이터를 수집, 변형하는 과정이 필요한데, 잘 정리된 데이터 마트를 개발해 놓으면 보다 효율적이고 신속한 모델링이 될 수 있습니다. 데이터 마트란, 데이터 웨어하

통계란, 분석하고자 하는 특정집단을 대상으로 수행한 조사나 실험을 통해 얻은 자료 및 요약된 형태의 표현. 일상적으로 접하는 통계로는 일기예보, 물가, 실업률, 정당지지도, 임상실험 결과 등이 있다. 데이터 자체로는 아무것도 할 수 없기에 통계를 사용합니다. 데이터로

자료의 특성을 표, 그림, 통계량 등을 사용하여 쉽게 파악할 수 있도록 정리/요약하는 것데이터 분석에 앞서 데이터의 대략적인 통계적 수치를 계산해 보며 분석에 대한 통찰력을 얻을 수 있다.히스토그램주어진 데이터를 구간으로 나누고 각 구간에 속하는 데이터의 빈도를 막대로

연습문제

다차원척도법(Multidimensional Scaling, MDS)은 여러 대상 간의 거리가 주어져 있을 때, 대상들을 동일한 상대적 거리를 가진 실수공간의 점들로 배치시키는 방법을 말한다.자료들의 상대적 관계를 이해하는 시각화 방법의 근간으로 주로 사용된다.군집분석과

시간의 흐름에 따라 관찰된 값들을 시계열 자료라 한다. 일정 시간 간격으로 기록된 자료들에 대하여 특성을 파악하고 미래를 예측하는 분석 방법이다.주가 데이터, 환율 데이터, 월별 재고량 등이 시계열 자료에 해당한다.시계열 자료들은 자기상관성을 가지고 있다. 인접한 자료

데이터 마이닝이란 용어는 대부분 통계학자들과 데이터베이스 학자들이 MIS분야와 경영분야 등에서 사용하는 용어이다. 거대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 과정이라고 할 수 있다. 숨겨진 규칙, 패턴 등을 찾아내어 예측하거나 의사결정에 활용

13. 정형 데이터 마이닝 - 분류분석

군집분석은 각 개체에 대해 관측된 여러 개의 변수 ($x_1,x_2,...,x_p$) 값들로부터 $n$개의 개체를 유사한 성격을 가지는 몇 개의 군집으로 집단화하고, 형성된 군집들의 특성을 파악하여 군집들 사이의 관계를 분석하는 다변량분석 기법이다. 군집 분석에 이용되

데이터베이스는 계층형, 네트워크형, 관계형, NoSQL 등 여러 가지가 있으며, 가장 많이 사용하는 관계형 데이터베이스와 NoSQL에 대해서는 숙지하는 것이 좋다.DBMS는 데이터베이스를 관리하여 응용 프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는
다음 중 빅데이터 분석에 경제성을 제공해 준 결정적인 기술로 가장 적절한 것은?① 스마트폰의 급속한 확산② 클라우드 컴퓨팅③ 저장장치 비용의 지속적인 하락④ 텍스트 마이닝정답클라우드 컴퓨팅은 빅데이터 분석에 필요한 대규모의 컴퓨팅 리소스를 탄력적으로 확보할 수 있게 해