post-thumbnail

[데린이 일기장] 1. 데이터분석 그거 어떻게 시작하는건데?

이전글을 읽고 오면 알겠지만 나는 데이터분석전문가를 꿈꾸는 대학생이다. 물론 지금은 아니다.나는 코딩이라는 것에 베이스가 없었기에 입학전 1-2개월간 코딩을 조금이나마 하기위해 독학을 하였다.물론 한창 술도 마시고 놀때라 많이 하진 못했지만 했다는 나 자신에게 칭찬한다

2023년 9월 16일
·
0개의 댓글
·
post-thumbnail

[데린이 일기장] 0. 데린이가 뭐야?

나는 데린이다.근데 데린이가 뭐냐고? ~데바데하는 데린이가 아니다.~때는 21년 전으로 거슬러 올라간다. 내가 태어났다.어릴적부터 이것저것 관심이 많았다. 기계를 만지는 것도 좋아했고 수학도 좋아했고... 서론이 너무 긴 것 같다. 뭐 어쨋든 그래서 그런지 어릴적부터

2023년 9월 10일
·
0개의 댓글
·
post-thumbnail

정보처리기능사 실기(SQL 활용)

DDL : CREATE, DROP, ALTERDML : SELECT, INSERT, DELETE, UPDATEDCL : COMMIT, ROLLBACK, GRANT, REVOKEPRIMARY KEY : 기본키로 사용할 속성을 지정 UNIQUE : 대체키로 사용할 속성 또

2022년 10월 27일
·
0개의 댓글
·
post-thumbnail

정보처리기능사 실기(애플리케이션 테스트 수행)

정적 테스트 : 프로그램을 실행하지 않고 명세서나 소스 코드를 대상으로 분석하는 테스트동적 테스트 : 프로그램을 실행하여 오류를 찾는 테스트명세 기반 테스트 : 사용자의 요구사항에 대해 명세를 빠짐없이 테스트 케이스로 만들어 구현구조 기반 테스트 : 소프트웨어 내부의

2022년 10월 27일
·
0개의 댓글
·
post-thumbnail

정보처리기능사 실기(응용 SW 기초 기술 활용)

운영체제의 목적 처리능력, 반환시간, 사용가능도, 신뢰도 운영체제의 발달과정 일괄처리 시스템 다중프로그래밍 시스템 시분할 시스템 다중처리 시스템 범용 시스템 분산처리 시스템 안드로이드 버전 5 롤리팝 6 마시멜로 7 누가 8 오레오 9 파이 Windows 특징

2022년 10월 26일
·
0개의 댓글
·
post-thumbnail

범주형 자료분석

적합성 검정 : 하나의 변수에 대해 우리가 기대하는 분포를 따르는지 여부를 검정한다. 즉 기대하는 값과 실제값이 같은지 예측하는 것이다.동질성 검정 : 두 범주형 변수 사이에서 같은 확률분포를 가지는지 즉 그룹들이 동질한지에 대해 검정하는 것이다.독립성 검정 : 두 범

2022년 10월 5일
·
0개의 댓글
·
post-thumbnail

분산분석(ANOVA)

여러 개의 다른 모집단의 평균, 분산값을 비교하는 분석기법ANOVA의 결과값은 F 통계량이다.t-검정의 경우 1-2개의 표본만 비교할 수 있었지만 F-검정의 경우 여러개를 비교할 수 있다.독립변수 : 이산형, 범주형 변수만 가능종속변수 : 연속형 변수만 가능$Y{ij}

2022년 10월 5일
·
0개의 댓글
·
post-thumbnail

회귀분석

둘 이상의 변수 간의 관계를 보여주는 통계적 방법 독립변수(X) : 다른 변수에 영향을 주는 변수 종속변수($Y^-$) : 다른 변수의 영향을 받는 변수 산점도 두 변수 사이의 연관성을 살펴볼 수 있는 그림 단순선형회귀분석 하나의 독립변수와 하나의 종속변수 사

2022년 10월 4일
·
0개의 댓글
·
post-thumbnail

두 모집단의 비교

독립표본 : 실험 대상을 임의로 두 개의 그룹으로 나누고 각각의 그룹에 A,B 다른 방법을 적용하여 그 실험 결과를 비교 ex) 남자와 여자의 1년 다이어트 후 평균 몸무게 차이대응표본(짝비교) : 비슷한 조건을 가진 실험군을 하나의 쌍으로 묶고 하나에는 A, 나머지

2022년 10월 2일
·
0개의 댓글
·
post-thumbnail

정규모집단에서의 추론(표본의 크기가 작을 때)

독립된 두 집단의 평균의 유의미한 차이가 있는지를 검사한다일반적으로 $n\\leq30$ 즉 적은 수의 표본에 대해 사용한다. / 표본이 많으면 정규분포를 사용하면된다.모집단의 표준편차($\\sigma$)를 모를 때 사용한다.자유도가 증가할수록 표준정규분포에 가까워진다(

2022년 10월 1일
·
0개의 댓글
·
post-thumbnail

통계적 추론(표본의 크기가 클 때)

표본의 정보를 통해 모집단의 특성을 추론추정량 : 추정치를 구하기 위해 사용되는 추정 방법이나 도구 ex) 모평균의 추정량은 표본평균이고 모분산의 추정량은 표본분산이다추정치 : 추정량의 구체적인 수치값모수를 하나의 값으로 추정단점 : 점을 하나만 가지고 추정하기에 추정

2022년 9월 26일
·
0개의 댓글
·
post-thumbnail

표집분포

모수 : 모집단의 특성을 나타내는 값으로 모평균, 모분산 등이 이에 해당한다. 추론 : 실제로는 모수는 모집단을 전수조사해야만 알 수 있지만 불가능 하기에 표본조사를 통한 표본평균, 표본분산의 값 등으로 모평균, 모분산등을 추정할 수 있다.통계량 : 관측한 자료에 의해

2022년 9월 25일
·
0개의 댓글
·
post-thumbnail

정규분포

주어진 구간에서 확률이 어떻게 분포하는지에 대한 함수를 계산특정 x값이 가질수 있는 확률은 0임확률밀도함수 구하는 방법은 x축과 그래프 사이의 넓이를 구하면되고 전체 넓이는 1이다.$X$~$N(\\mu,\\sigma^2)$$f(x) = \\frac{1}{\\sqrt{2

2022년 9월 24일
·
0개의 댓글
·
post-thumbnail

이항분포와 그에 관련된 분포들

베르누이 시행 각 시행의 결과가 성공, 실패로 두가지 중 하나만 나오는 경우 조건 각 시행의 결과는 성공(S) 혹은 실패(F) 중 하나로 분류 각 시행에서 성공확률 p 실패확률 1-p로 그 값은 일정함 각 시행은 서로 독립 이항분포 $n$

2022년 9월 23일
·
0개의 댓글
·
post-thumbnail

확률분포

표본공간의 각 결과에 실수 값을 대응시키는 함수흔히 X,Y,Z를 사용하여 나타냄확률 변수는 크게 이산확률변수와 연속확률변수로 나뉜다.이산확률변수 : 확률변수가 가질 수 있는 값을 셀 수 있는경우연속확률변수 : 확률변수가 어느 구간에 속하는 모든 값을 가질 수 있는 경우

2022년 9월 21일
·
0개의 댓글
·
post-thumbnail

확률

확률 어떤 사건이 일어날 가능성을 0과 1사이의 값으로 나타낸 것 표본공간 : 일어날 수 있는 모든 결과들의 집합 근원사건 : 일어날 수 있는 각각의 결과 사건 : 어떤 특성을 갖는 결과들의 집합 (표본공간의 부분집합) P(A) : 사건 A가 발생활 확률

2022년 9월 19일
·
0개의 댓글
·
post-thumbnail

두 변수 자료의 요약

조사 대상으로부터 두 개 이상의 변수들을 동시에 관측하는 경우주로 두 변수 사이의 연관성에 초점을 둔다ex) 아버지와 아들의 키, 학생의 국어, 영어, 수학 성적 등두 변수가 모두 범주형인 경우에 표를 이용하여 요약한다2차원 도수분포표가로 : 한 변수에 대한 범주세로

2022년 9월 18일
·
0개의 댓글
·
post-thumbnail

수치를 통한 연속형 자료의 요약

표와 그림을 이용한 자료 요약의 단점 일관성 객관성 부족 / 작성자의 주관적 판단에 따라 달라질 수 있음 추론을 위한 이론적 근거 부족 이를 보완하기 위해 객관적인 수치로 자료의 분포를 파악 중심위치의 측도 평균 모든 관측값의 합을 자료의 개수로 나눈 것 일반적

2022년 9월 18일
·
0개의 댓글
·
post-thumbnail

표,그림을 이용한 자료 요약

자료의 형태 수치 자료 (양적 자료) : 관측되는 값이 수치로 측정되는 자료 연속형 자료 : 연속적인 값을 가지는 자료 / ex) 키, 몸무게 이산형 자료 : 이산적인 값을 가지는 자료 / ex) 주사위, 사람 수 > 연속형자료 VS 이산형자료

2022년 9월 18일
·
0개의 댓글
·
post-thumbnail

통계학이란

통계학 데이터를 정리, 분석, 해석 하여 그 결과를 제시하는 학문 , 주어진 자료를 토대로 보편 타당한 이론을 추론해 내는 학문 자료 분석 단계 자료를 효과적으로 수집 자료를 합리적으로 해석 자료로부터 올바른 결론을 유도 모집단과 표본 모집단 : 수집가능한

2022년 9월 18일
·
0개의 댓글
·