모집단
모집단(population) : 관심이 있는 대상과 관련된 모든 관측 가능한 값의 집합
모집단의 크기(size) : 관측가능한 수
유한 모집단 : 관심 대상의 수가 유한
무한 모집단 : 원소의 수가 무한한(제한이 없는) 모집단. 크기가 상당히 큰 경우 이론적으로 무한으로 간주하기도 합니다.
(예 : 주사위를 계속 던지는 것, 대량으로 제조되는 제품 등)
확률변수를 이용 : 모집단에서 각각의 관측값은 확률변수의 값입니다. 이 확률변수를 $X$라 하고 확률분포 함수 $f(x)$를 따릅니다.
모집단의 관측값들의 확률변수들이 이항분포/정규분포/분포함수 $f(x)$를 따를 경우. 그 모집단을 이항 모집단/정규 모집단/ 모집단 $f(x)$ 등으로 부르기도 합니다.
확률변수(또는 확률분포)의 평균, 분산은 모집단의 평균, 분산을 의미합니다.
표본
표본은 모집단의 부분집합입니다.
모집단에 대한 표본으로부터 추론이 유효하려면 모집단으로부터 표본을 추출할 때 모집단의 성질을 잘 반영할 수 있어야 합니다.
모집단으로부터 추출하기 편리한 원소들만으로 얻어진 표본으로부터의 추론은 오류를 유발시킵니다.
편향(biased)/ 편의 된 표본 추출 : 모집단의 특성 값을 추정할 때 일관된 과대 추정 또는 일관된 과소추정이 발생하는 경우입니다.
편향을 제거하기 위해 무작위적이고 독립적인 확률 표본(random sample)을 선택하는 것이 좋습니다.
서로 독립인 $n$개의 확률변수 $X_{1}$, $X_{2}$,..., $X_{n}$이 동등한 동일한 확률분포 $f(x)$를 따를 때, $X_{1}, X_{2},..., X_{n}$을 모집단 $f(x)$로부터 크기 $n$인 확률 표본으로 정의합니다.
이때 결합 확률분포는 $f(x_{1}, x_{2},..., x_{n}) = f(x_{1})f(x_{2})\cdots f(x_{n})$입니다.
유한 모집단에서 비 복원 추출에 의해 정의되는 확률변수 $X_{1}, X_{2},..., X_{n}$은 확률 표본이 아닙니다. 서로 독립이 아니기 때문입니다.
댓글