Article 4. 표본분포 2314

1 minute read

Section 1. 기술 통계

Paragraph 1. 표본 분포(Sampling Distribution) 개념

  • 표본 분포란 모집단에서 추출한 크기가 일정한(n개인) 표본이 가지는 추정량의 확률 분포이다.

    모집단/표본 관계

  • 통계량에 의해 모집단에 있는 모수를 추론한다.

Paragraph 2. 표본 분포

Subparagraph 1. 표본 분포 용어

표본 분포의 용어로는 모집단, 모수, 통계량, 추정량, 표준편차 등이 있다.

용어 설명
모집단
(Population)
• 정보를 얻고자 하는 대상이 되는 집단 전체
모수
(Parameter)
• 모집단의 특성을 나타내는 대푯값
통계량
(Statistic)
• 표본에서 얻은 평균이나 표준 오차와 같은 값
• 이 값을 통해 모수를 추정하며, 무작위로 추출할 경우 각 표본에 따라 달라지는 확률변수
추정량
(Estimator)
• 모수의 추정을 위해 구해진 통계량
표준 편차
(Standard Deviation)
• 자료의 변동 정도
• σ, s를 의미
표준 오차
(Standard Error)
• 통계량의 변동 정도를 의미
• 평균을 낸 값들의 표준편차를 표준 오차라고 부름
σ_x, s_x로 표기(보통은 X 위에 bar가 있는 형태로 표기

Subparagraph 2. 표본조사 용어

  • 수집된 자료를 토대로 모집단의 특성을 추정하게 되는데, 이때 조사하는 모집단의 일부분을 표본(Sample)이라고 한다.
  • 모집단의 일부분을 조사하는 행위가 표본조사이다.
구분 내용
표본오차
(Sampling Error)
• 모집단을 대표할 수 있는 표본 단위들이 조사대상으로 추출되지 못하기 때문에 발생하는 오차
비표본오차
(Non-Sampling Error)
• 표본오차를 제외한 모든 오차로써 조사 과정에서 발생하는 모든 부주의나 실수, 알 수 없는 원인 등 모든 오차를 의미하며 조사대상이 증가하면 오차가 커짐
표본편의
(Sampling Bias)
• 모수를 작게 또는 크게 할 때 추정하는 것과 같이 표본추출 방법에서 기인하는 오차
• 표본편의는 확률화에 의해 최소화하거나 없애지는 못함

Paragraph 3. 표본 분포와 관련된 법칙

표본 분포와 관련된 법칙에 대표적으로 큰 수의 법칙, 중심 극한 정리가 있다.

법칙 설명
큰 수의 법칙
(Law Large Number)
• 데이터를 많이 뽑을수록(n이 커질수록) 표본평균의 분산은 0에 가까워짐
• 데이터의 퍼짐이 적어져 정확해짐
중심 극한 정리
(Central Limit Theorem)
• 표본의 개수가 커지면 모집단의 분포와 상관없이 표본 분포는 정규 분포에 근사

Paragraph 4. 표본 분포의 유형

표본 분포의 유형으로는 Z-분포, T-분포, 카이제곱 분포, F-분포 등이 있다.

유형 설명
Z-분포 • 표본 통계량이 표본 평균일 때, 이를 표준화(정규화)시킨 표본 분포
• 개념적으로 정규 분포와 동일하여, 정규 분포 평균의 해석에 많이 쓰이는 분포
T-분포 • 모집단이 정규 분포라는 정도만 알고, 모 표준편차는 모를 때 사용하는 표준 분포
카이제곱 분포 k개의 서로 독립적인 표준 정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포
F-분포 • 표본 통계량이 두 독립 표본에서 계산된 표본분산들의 비율일 때의 표본 분포