데이터과학_4_1

김경민·2024년 9월 29일

3학년 2학기

목록 보기
9/29
post-thumbnail

📌점추정

모수를 하나의 값으로 예측

표본: 𝑋1, 𝑋_2, 𝑋_3, …, 𝑋𝑛

𝜇 ̂1 = 𝑋_1
𝜇 ̂_2 = (𝑋_1+𝑋
𝑛)/2
𝜇 ̂3 = (𝑋𝑚𝑖𝑛+𝑋𝑚𝑎𝑥)/2
𝜇 ̂_4 = 𝑋 ̅=1/𝑛∑𝑋
𝑖

🎯모평균의 구간추정(신뢰구간)

신뢰도 95%인 신뢰구간
[𝑿 ̅−𝟏.𝟗𝟔 𝝈/√𝒏,𝑿 ̅+𝟏.𝟗𝟔 𝝈/√𝒏]
신뢰도 99%인 신뢰구간
[𝑿 ̅−𝟐.𝟓𝟖 𝝈/√𝒏,𝑿 ̅+𝟐.𝟓𝟖 𝝈/√𝒏]

🎯좋은 추정량의 기준

  • 불편성(unbiasedness)
    𝐸(𝜃)=𝜃인 추정량을 불편추정량이라고 한다.
  • 유효성
    분산이 더 작은 추정량
  • 일치성
    표본의 크기가 커짐에 따라 불편추정량에 가까워짐

🎯신뢰구간의 길이

  • 신뢰도가 높을수록 길어진다.
  • (모)표준편차가 작을수록 짧아진다.
  • 표본의 크기가 클수록 짧아진다

🎯신뢰구간의 의미

  • 신뢰구간(confidence interval)과 신뢰도
    표본에 따라 신뢰구간은 달라짐.
  • 신뢰도 95%의 의미
    100번 반복하여 모평균의 신뢰구간을 구하면 100번 중 5번 정도는 신뢰구간이 모평균을 포함하지 않을수도 있다는 뜻

엑셀 실습: 신뢰구간 simulation.xlsx!

강의자료실에서 “신뢰구간 simulation.xlsx”를 다운 받아 실습
난수로 모집단을 생성
표본의 크기 20인 확률표본 추출 모의실험을 1000번 실행
신뢰도를 바꾸어가며 실제로 모평균을 포함하는 신뢰구간의 개수 확인


📌모비율의 추정

🎯 기타 추정법 - 포획-재포획

연못에 살고 있는 잉어의 개체 수는?

  • 20마리를 잡아 표시를 한 후 놓아줌
  • 다시 10마리를 잡아 표시한 잉어의 수 조사 예를 들어 10마리 중 2마리가 표시된 잉어라면 표본비율은 𝒑 ̂=𝟐/𝟏𝟎
  • 점추정에 의해 모비율을 𝟐/𝟏𝟎으로 생각하고 비례식 전체를 N마리 중 표시된 잉어는 10마리

    참고

    출처: https://www.webpages.uidaho.edu/wlf448/cap_recap.htm

🎯 기타 추정법 - 포획-재포획

  • 버스의 배차 시간은?

  • 버스에 탄 n명의 기다린 시간 조사

  • 자료: 𝑋1, 𝑋_2, 𝑋_3, …, 𝑋𝑛

  • 버스의 배차 간격으로 적절한 추정량은?
    〖𝜇 ̂1= 𝑋〗𝑚𝑎𝑥 (최댓값)
    𝜇 ̂2= 𝑋 ̅ (평균)
    𝜇 ̂_3=(𝑋
    𝑚𝑖𝑛+𝑋_𝑚𝑎𝑥)/2 (최솟값과 최댓값의 평균)
    𝜇 ̂_4=2𝑋 ̅ (평균의 2배)

-> 버스 배차 간격에 경우 1번 or 4번이 적합하다.


📌데이터과학_4_2

-> 엑셀 실습 문제풀이 진행

profile
무지(無知)

0개의 댓글