goaswon

Anyone.

Article 4. 표본분포 2314

1 minute read

Section 1. 기술 통계

Paragraph 1. 표본 분포(Sampling Distribution) 개념

표본 분포란 모집단에서 추출한 크기가 일정한(n개인) 표본이 가지는 추정량의 확률 분포이다.
통계량에 의해 모집단에 있는 모수를 추론한다.

Paragraph 2. 표본 분포

Subparagraph 1. 표본 분포 용어

표본 분포의 용어로는 모집단, 모수, 통계량, 추정량, 표준편차 등이 있다.

용어	설명
모집단 (Population)	• 정보를 얻고자 하는 대상이 되는 집단 전체
모수 (Parameter)	• 모집단의 특성을 나타내는 대푯값
통계량 (Statistic)	• 표본에서 얻은 평균이나 표준 오차와 같은 값 • 이 값을 통해 모수를 추정하며, 무작위로 추출할 경우 각 표본에 따라 달라지는 확률변수
추정량 (Estimator)	• 모수의 추정을 위해 구해진 통계량
표준 편차 (Standard Deviation)	• 자료의 변동 정도 • σ, s를 의미
표준 오차 (Standard Error)	• 통계량의 변동 정도를 의미 • 평균을 낸 값들의 표준편차를 표준 오차라고 부름 • σ_x, s_x로 표기(보통은 X 위에 bar가 있는 형태로 표기

Subparagraph 2. 표본조사 용어

수집된 자료를 토대로 모집단의 특성을 추정하게 되는데, 이때 조사하는 모집단의 일부분을 표본(Sample)이라고 한다.
모집단의 일부분을 조사하는 행위가 표본조사이다.

구분	내용
표본오차 (Sampling Error)	• 모집단을 대표할 수 있는 표본 단위들이 조사대상으로 추출되지 못하기 때문에 발생하는 오차
비표본오차 (Non-Sampling Error)	• 표본오차를 제외한 모든 오차로써 조사 과정에서 발생하는 모든 부주의나 실수, 알 수 없는 원인 등 모든 오차를 의미하며 조사대상이 증가하면 오차가 커짐
표본편의 (Sampling Bias)	• 모수를 작게 또는 크게 할 때 추정하는 것과 같이 표본추출 방법에서 기인하는 오차 • 표본편의는 확률화에 의해 최소화하거나 없애지는 못함

Paragraph 3. 표본 분포와 관련된 법칙

표본 분포와 관련된 법칙에 대표적으로 큰 수의 법칙, 중심 극한 정리가 있다.

법칙	설명
큰 수의 법칙 (Law Large Number)	• 데이터를 많이 뽑을수록(n이 커질수록) 표본평균의 분산은 0에 가까워짐 • 데이터의 퍼짐이 적어져 정확해짐
중심 극한 정리 (Central Limit Theorem)	• 표본의 개수가 커지면 모집단의 분포와 상관없이 표본 분포는 정규 분포에 근사

Paragraph 4. 표본 분포의 유형

표본 분포의 유형으로는 Z-분포, T-분포, 카이제곱 분포, F-분포 등이 있다.

유형	설명
Z-분포	• 표본 통계량이 표본 평균일 때, 이를 표준화(정규화)시킨 표본 분포 • 개념적으로 정규 분포와 동일하여, 정규 분포 평균의 해석에 많이 쓰이는 분포
T-분포	• 모집단이 정규 분포라는 정도만 알고, 모 표준편차는 모를 때 사용하는 표준 분포
카이제곱 분포	• k개의 서로 독립적인 표준 정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포
F-분포	• 표본 통계량이 두 독립 표본에서 계산된 표본분산들의 비율일 때의 표본 분포

Twitter Facebook LinkedIn

You May Also Enjoy

Chapter 2. 분석 결과 해석 및 활용 4200

less than 1 minute read

Part 4. 빅데이터 결과 해석

Chapter 1. 분석 모형 평가 및 개선 4100

less than 1 minute read

Part 4. 빅데이터 결과 해석

Chapter 2. 분석기법 적용 3200

less than 1 minute read

Part 3. 빅데이터 모델링

Chapter 1. 분석 모형 설계 3100

less than 1 minute read

Part 3. 빅데이터 모델링