모집단
모집단(population) : 관심이 있는 대상과 관련된 모든 관측 가능한 값의 집합
모집단의 크기(size) : 관측가능한 수
유한 모집단 : 관심 대상의 수가 유한
무한 모집단 : 원소의 수가 무한한(제한이 없는) 모집단. 크기가 상당히 큰 경우 이론적으로 무한으로 간주하기도 합니다.
(예 : 주사위를 계속 던지는 것, 대량으로 제조되는 제품 등)
확률변수를 이용 : 모집단에서 각각의 관측값은 확률변수의 값입니다. 이 확률변수를 X라 하고 확률분포 함수 f(x)를 따릅니다.
모집단의 관측값들의 확률변수들이 이항분포/정규분포/분포함수 f(x)를 따를 경우. 그 모집단을 이항 모집단/정규 모집단/ 모집단 f(x) 등으로 부르기도 합니다.
확률변수(또는 확률분포)의 평균, 분산은 모집단의 평균, 분산을 의미합니다.
표본
표본은 모집단의 부분집합입니다.
모집단에 대한 표본으로부터 추론이 유효하려면 모집단으로부터 표본을 추출할 때 모집단의 성질을 잘 반영할 수 있어야 합니다.
모집단으로부터 추출하기 편리한 원소들만으로 얻어진 표본으로부터의 추론은 오류를 유발시킵니다.
편향(biased)/ 편의 된 표본 추출 : 모집단의 특성 값을 추정할 때 일관된 과대 추정 또는 일관된 과소추정이 발생하는 경우입니다.
편향을 제거하기 위해 무작위적이고 독립적인 확률 표본(random sample)을 선택하는 것이 좋습니다.
서로 독립인 n개의 확률변수 X1, X2,..., Xn이 동등한 동일한 확률분포 f(x)를 따를 때, X1,X2,...,Xn을 모집단 f(x)로부터 크기 n인 확률 표본으로 정의합니다.
이때 결합 확률분포는 f(x1,x2,...,xn)=f(x1)f(x2)⋯f(xn)입니다.
유한 모집단에서 비 복원 추출에 의해 정의되는 확률변수 X1,X2,...,Xn은 확률 표본이 아닙니다. 서로 독립이 아니기 때문입니다.
댓글