Processing math: 100%
본문 바로가기
수리통계학/평균과 분산

확률변수 - 공분산

by 지식광부키우기 2019. 10. 4.

 

공분산

 

확률변수 XY의 값이 확률적으로 어떻게 결합되어 있는가를 나타내는 지표입니다.

 

XY를 결합확률분포 f(x,y)를 가지는 확률변수라고 할 때, XY의 공분산(covariance)은 다음과 같습니다.

 

Cov(X,Y)=σXY=E[(XμX)(YμY)]= 

xy(xμX)(yμY)f(x,y) (이산형)

(xμX)(yμY)f(x,y)dxdy (연속형)

 

X 값이 클 때 Y 값이 크고, X 값이 작을 때 Y 값이 작으면 (XμX)(YμY)는 양의 값을 반대면 음의 값을 갖습니다.

 

X, Y가 통계적으로 독립이면 공분산은 0입니다. 역은 성립하지 않습니다. 

 

 

공분산 또 다른 정리

 

확률변수 XY의 평균이 μXμY이면, XY의 공분산은 

 

σXY=E(XY)μXμY

 

증명) 이산형

 

σXY  

=xy(xμX)(yμY)f(x,y)

 

=xy(xyμXyμYx+μXμY)f(x,y)

 

=xyxyf(x,y)μXxyyf(x,y)μYxyxf(x,y)+μXμYxyf(x,y)

 

μX=xyxf(x,y), μY=xyyf(x,y), xyf(x,y)=1

 

 σXY=E(XY)μXμYμYμX+μXμY=E(XY)μXμY

연속형의 경우에는 위의 합을 적분으로 바꿔주면 됩니다.

 

 

공분산 예시(연속형)

 

마라톤 코스를 완주한 남자의 비율 X와 여자의 비율 Y의 결합 확률분포는 다음과 같습니다. XY의 공분산을 구하세요.

 

f(x,y)=8xy, 0yx1, 그 외의 경우는 0

 

풀이)

 

주변 밀도 함수를 구하면

 

g(x)=4x3, 0x1, 그 외의 경우는 0

 

h(y)=4y(1y2), 0y1, 그 외의 경우는 0입니다.

 

g(x)=x08xydy=[4xy2]y=xy=0=4x3, 0x1

 

h(y)=1y8xydx=[4x2y]x=1x=y=4y(1y2), 0y1

 

μX=E(X)=104x4dx=45 

μY=E(Y)=104y2(1y2)dy=815

 

E(XY)=101y8x2y2dxdy=49

 

σXY=E(XY)μXμY=4945815=4225

 

 

상관계수

 

공분산은 두 확률변수 사이의 관련성을 나타내지만, σXY의 값은 XY의 측정단위에 따라 달라집니다.

 

상관계수는 측정 단위와 무관합니다.

 

확률변수 XY의 공분산이 σXY이고, 표준편차가 각각 σX, σY라고 합니다.

XY의 상관계수는 다음과 같습니다.

 

ρXY=σXYσXσY=Cov(X,Y)Var(X)Var(Y)

 

1ρXY1을 만족합니다. ρXYXY의 단위와 무관합니다.

 

공분산 σXY가 0이면 상관계수의 값도 0입니다.

'수리통계학 > 평균과 분산' 카테고리의 다른 글

확률변수의 분산  (0) 2019.10.01
확률변수의 평균  (0) 2019.09.30

댓글