확률변수 $X$의 분산(variacne)
$X$의 확률분포의 분산이라고도 하며, $g(X) = (X - \mu)^{2}$의 평균입니다.
$Var(X)$ 또는 $\sigma_{X}^{2}$, $\sigma^{2}$으로 표시합니다.
$X - \mu$는 관측값의 평균으로부터의 편차(deviation)입니다.
정의
확률변수 $X$가 확률분포 $f(x)$, 평균 $\mu$를 가진다고 할 때, $X$의 분산은
$Var(X) = \sigma^{2} = E[(X - \mu)^{2}] = $
$\sum_{x}(x - \mu)^{2} f(x)$ (이산형)
$\int_{-\infty}^{\infty} (x - \mu)^{2} f(x) dx$ (연속형)
입니다.
$\sqrt{Var{X}} = \sqrt {\sigma^{2}} = \sigma$를 $X$의 표준편차(standard deviation)라고 합니다.
분산 예시(이산형)
A, B 두 회사에서 사업목적으로 사용된 자동차의 수를 확률변수 X로 설정합니다.
A 회사에 대한 확률분포
$x$ | 1 | 2 | 3 |
$f(x)$ | 0.3 | 0.4 | 0.3 |
B 회사에 대한 확률분포
$x$ | 0 | 1 | 2 | 3 | 4 |
$f(x)$ | 0.2 | 0.1 | 0.3 | 0.3 | 0.1 |
확률분포의 분산을 비교해 봅니다.
A 회사의 경우
$\mu_{A} = E(X) = (1)(0.3) + (2)(0.4) + (3)(0.3) = 2$
$\sigma_{A}^{2} = \sum_{x=1}^{3}(x-2)^{2}f(x) = (1-2)^{2}(0.3) + (2-2)^{2}(0.4) + (3-2)^{2}(0.3) = 0.6$
B 회사의 경우
A와 같은 방식으로 진행합니다. 평균이 2, 분산이 1.6 나오면 맞습니다.
B회사의 분산이 A 회사보다 더 큽니다.
분산 구하는 두 번째 방법
확률변수 $X$의 분산은 $\sigma^{2} = E(X^{2}) - \mu^{2}$을 만족합니다.
증명 (연속형)
$\sigma^{2} = \int_{-\infty}^{\infty} (x - \mu)^{2}f(x)dx = \int_{-\infty}^{\infty} (x - 2\mu x + \mu^{2})f(x) dx = \int_{-\infty}^{\infty} x^{2} f(x) dx - 2\mu \int_{-\infty}^{\infty} xf(x) dx + \mu^{2} \int_{-\infty}^{\infty} f(x) dx = E(X^{2}) - 2\mu^{2} + \mu^{2} = E(X^{2}) - \mu^{2}$
종속 확률변수의 분산
$X$가 확률분포 $f(x)$를 가지는 확률변수이면, 확률변수 $g(X)$의 분산은
$\sigma_{g(X)}^{2} = E[(g(X)- \mu_g(X))^{2}]=$
$\sum_{x}(g(x)-\mu_{g(X)})^{2} f(x)$ (이산형)
$\int_{-\infty}^{\infty} (g(x)-\mu_{g(X)})^{2}f(x)dx$ (연속형)
종속 확률변수의 분산 예시(연속형)
확률변수 $X$의 확률밀도함수가
$f(x) = \frac {x^{2}}{3}$, -1 < $x$ < 2이고 그 외의 x에서 0일 때,
$g(X) = 4X + 3$의 분산을 구해보세요
$\mu_{4X + 3} = E(4X + 3) = \int_{-1}^{2} \frac{(4x+3) x^{2}}{3} dx = \frac {1}{3} \int_{-1}^{2} (4x^{3} + 3x^{2})dx = 8$
$\sigma_{4X + 3}^{2} = E([(4X + 3) - 8]^{2}) = E((4X - 5)^2) = \int_{-1}^{2} (4x - 5)^{2} \frac {x^{2}}{3} dx = \frac {1}{3}\int_{-1}^{2} (16x^{4}-40x^{3}+25x^{2})dx = \frac {51}{5}$
'수리통계학 > 평균과 분산' 카테고리의 다른 글
확률변수 - 공분산 (0) | 2019.10.04 |
---|---|
확률변수의 평균 (0) | 2019.09.30 |
댓글