충분통계량 정의 : 표본으로 이루어진 함수
모수 θ를 갖는 분포에서 추출한 확률 표본 X1,...,Xn에 대한 통계량 Y=u(X1,...,Xn이 주어질 때,
Y=y일 때의 임의의 통계량 W=g(X1,...,Xn)에 대한 조건부 확률분포가 θ와 무관하면
Y는 모수 θ에 대한 충분통계량이고 그 역도 성립합니다.
Neymann 인수분해정리
확률분포 함수가 fX(x;θ)인 모집단에서 추출한 확률 표본 X1,...,Xn에 대해
통계량 Y=u(X1,...,Xn)이 θ의 충분통계량이 되기 위한 필요충분조건은 우도 함수
L(x1,...,xn;θ)=∏ni=1fx(x;θ)가 두 함수의 곱으로 표현되는 것입니다.
L(x1,...,xn;θ)=g(y;θ)h(x1,...,xn)
g는 y와 θ만의 함수이고, h는 θ를 포함하지 않는 함수입니다.
Neymann 인수분해 정리 증명 : 이산형
Y가 θ에 대한 충분 통계량이면 모든 (x1,...,xn), y에 대해
P(X1=x1,...,Xn=xn|Y=y)가 θ에 의존하지 않습니다.
따라서
P(X1=x1,...,Xn=xn|Y=y)=P(X1=x1,...,Xn=xn|Y=u(x1,...,xn))=h(x1,...,xn)입니다.
θ가 주어질 때 P(Y=y)는 θ가 변하면 변할 수 있으므로, P(Y=y)는 y와 θ의 함수로 나타내 집니다.
다시 표현하면 P(Y=y)=g(y;θ)입니다.
정리하면,
L(x1,...,xn;θ)=∏ni=1fX(xi;θ)=P(X1=x1,...,Xn=xn)
=P(Y=y)P(X1=x1,...,Xn=xn|Y=y)=g(y;θ)h(x1,...,xn)
Neymann 인수분해 정리 증명 : 연속형
Y가 θ에 대한 충분 통계량이면 X1,...,Xn|Y의 분포 함수
fX(x1,...,xn;θ)fY(y;θ)=L(x1,...,xn;θ)fY(u(x1,...,xn;θ)
이는 θ와 무관하므로 이를 h(x1,...,xn)으로 놓을 수 있습니다.
fX(x1,...,xn)=fY(y;θ)h(x1,...,xn)이고, g(y;θ)=fY(y;θ)로 놓으면 결과가 성립합니다.
Neymann 인수분해 정리 예시 : 연속형
X1,X2,...,Xn이 평균이 0, 분산이 θ인 정규분포에서 추출된 확률 표본일 때 Y=∑X2i가 θ에 대한 충분 통계량임을 보이세요.
풀이 :
L(x1,...,xn;θ)=(1√2πσ)nexp(−12θ∑x2i)=(1√2πσ)nexp(−12θy)=g(y;θ)⋅1로 인수 분해됩니다.
따라서 Y=∑X2i는 분산 θ에 대한 충분 통계량입니다.
결합 충분 통계량
모수 θ=(θ1,...,θk)를 가지는 모집단에서 확률 표본 X=(X1,...,Xn)의 결합 확률분포 함수를
fX(x;θ)라 하고, Y=(Y1,...,Yk)를 k차원 통계량이라 할 때,
모든 가능한 y에 대해 X|Y=y의 분포가 모수 θ에 종속되어 있지 않으면, Y1,...,Yk를 θ에 대한 결합 충분 통계량이라 합니다.
유니와이즈 수리통계학의 내용을 바탕으로 요약 작성되었습니다.
댓글