통계학이란 불확실한 상황 하에서 과학적인 의사결정을 도출하기 위한 이론과 방법의 체계통계학은 매우 다양한 분야의 연구에서 주어진 문제에 대하여 적절한 데이터를 수집하고 분석하여 해답을 구하는 과정을 연구하는 과학의 한 분야학문적 관점에서 보면 통계학은 응용 수학의 한
통계데이터수정과 분석에 주로 사용되는 언어무료프로그램이지만 프로그래밍, 그래픽측면(시각화)에서는 상용프로그램과 대등하거나 월등함통계기능 뿐만 아니라 일반적인 프로그래밍이 가능ex) 분석자동화, 새로운 함수 생성오픈소스 소프트웨어임으로 사용자들이 수많은 함수를 공유하고
숫자형: 모든 숫자문자형: 모든 문자논리형: TRUE & FALSENA & NULL형: 없음 & 비어있음Date & Time: 시간과 날짜 저장R에서 가장 기본이 되는 데이터 구조동일한 유형의 데이터가 1차원으로 구성벡터 중에서 구성인자가 1개인 것을 '스칼라'라고 함
벡터를 여러개 합친 형태row와 column으로 구성모든 데이터의 타입은 동일해야 함
다양한 데이터 타입을 저장할 수 있는 자료형태일반 DBMS에서의 Table과 같은 자료구조대부분의 데이터들은 데이터프레임에 저장됨파이썬의 Pandas 라이브러리도 R의 데이터프레임을 본 따서 만든 것!
통계학을 적용한 자료는 신뢰성을 가진다.통계는 의사결정에 필요한 근거 자료를 제시한다.통계는 현상을 분석하여 실증자료를 제시한다.통계학(statistics): 수량적인 비교를 기초로 많은 사실을 관찰하고 처리하는 방법을 연구하는 학문기술통계(descriptive sta
1. 표본공간과 사상 확률의 태동 계기: 우연한 사건이나 불확실한 현상에 대한 과학적 관심에서 비롯 발전: 어떤 사건의 가능성을 수리적으로 측정하는 노력 16세기, 도박에서의 승률의 예상 그리고 배당금의 배분 문제를 풀기 위해 확률 개념이 만들어짐 17세기,
확률변수와 확률분포의 개념 확률변수(random variable) 표본공간의 각 원소를 실수 값으로 바꾸는 함수 확률분포를 가짐 동전을 세 번 던지는 실험에서의 표본공간 -> S = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT} 동전의 뒷면이