확률변수의 평균
확률변수 $X$의 평균(mean) 또는 $X$의 확률분포의 평균은 ($\mu_{x}$ 또는 $\mu$로 표시합니다)
여러 번 시행 시 실제로 나오는 또는 나오리라고 예측되는 $X$ 값들의 평균입니다.
= ($X$의 값) X ($X$가 그 값인 상대 도수)의 합
= ($X$의 값) X ($X$가 그 값일 확률) 의 합
확률 변수 $X$의 수학적 기댓값 또는 기댓값이라고 하고 $E(X)$로 표시합니다.
동전 던지기 예
두 개의 동전을 던질 때 $X$를 각 시행해서 나오는 앞면의 수라고 합니다.
표본 공간은 $S = {HH, HT, TH, TT}$이고
$P(X = 0) = P(HH) = \frac {1}{4}$, $P(X = 1) = P(TH) + P(HT) = \frac {1}{2}$, $P(X = 2) = P(TT) = \frac {1}{4}$입니다.
참고로 수학적 확률은 상대 도수의 극한 개념입니다.
수학적 기댓값을 계산하면 $\mu = E(X) = 0 \cdot \frac {1}{4} + 1 \cdot \frac{1}{2} + 2 \cdot \frac{1}{4} = 1$이 됩니다.
두 개의 동전을 계속해서 던지면 매 시행에서 나오는 앞면의 평균 개수가 1입니다.
이산형, 연속형 정의
$X$가 확률분포 $f(x)$를 가지는 확률변수라 하면
$X$가 이산형인 경우 $X$의 평균, 기댓값은 $\mu = E(X) = \sum_{x} xf(x)$
$X$가 연속형인 경우 $X$의 평균, 기댓값은 $\mu = E(X) = \int_{-\infty}^{\infty} xf(x) dx$입니다.
이산형 예시
세 개의 동전을 던져서 모두 앞면이나 모두 뒷면이 나오면 500원을 받게 되고, 앞면의 수가 1개 또는 2개일 경우 300원을 내야 하는 게임을 할 때, 참가자가 기대할 수 있는 금액은?
확률변수 $X$를 돈의 액수, $Y$를 앞면의 개수라 할 때, $X$가 가질 수 있는 값은 500, -300
$X = 500$인 경우에는 $Y = 3$ 또는 $Y = 0$인 경우이며, $X = -300$인 경우에는 $Y = 1$ 또는 $Y = 2$인 경우입니다.
$p(X = 500) = P(Y = 3) + P(Y = 0) = \frac {1}{8} + \frac{1}{8} = \frac {1}{4}$
$p(X = -300) = P(Y = 1) + P(Y = 2) = \frac {3}{8} + \frac{3}{8} = \frac {3}{4}$
$X$의 기댓값은 $E(X) = 500 \cdot \frac {1}{4} + (-300) \cdot \frac {3}{4} = -100$
이 게임을 한 번 할 때 평균 100원을 잃는 것으로 생각할 수 있습니다.
연속형 예시
연속형 확률변수 $X$의 확률 밀도 함수가 $f(x) = 2x$, $0 \leq x \leq 1$일 때 $X$의 평균은?
$\mu = E(X) = \int_{-\infty}^{\infty} x f(x) dx = \int_{0}^{1} x \cdot 2x dx = \frac {2}{3}$
종속 확률변수
$X$가 확률 변수일 때, $g(X)$를 $X$의 함수라고 하면, $g(X)$ 또한 확률변수입니다($X$에 종속된 확률변수)
$X$가 확률분포 $f(x)$를 가지는 확률변수일 때, 확률변수 $g(X)$의 평균 혹은 기댓값은
$X$가 이산형인 경우 $\mu_{g(X)} = E [g(X)] = \sum_{x} g(x) f(x)$
$X$가 연속형인 경우 $X$의 평균, 기댓값은 $\mu_{g(X)} = E[g(X)] = \int_{-\infty}^{\infty} g(x) f(x) dx$입니다.
종속 확률변수 예시
세차장에서 1시간 동안 세차하는 수를 $X$라 할 때 $X$의 확률분포는 다음과 같습니다.
$x$ | 4 | 5 | 6 | 7 | 8 | 9 |
$f(x)$ | $\frac{1}{12}$ | $\frac{1}{12}$ | $\frac{1}{4}$ | $\frac{1}{4}$ | $\frac{1}{6}$ | $\frac{1}{6}$ |
$g(X) = 2X - 1$를 한 직원의 해당 시간의 수당(단위는 천 원)이라고 할 때, 기대수익을 구해보세요
$E [g(X)] = E(2X - 1) = \sum_{x = 4}^{9}(2x - 1) f(x) = 7 \cdot \frac {1}{12} + 9 \cdot \frac{1}{12} + 11 \cdot \frac {1}{4} + 15 \cdot \frac {1}{6} + 17 \cdot \frac{1}{6} = 12.67$
12670이 기대수익입니다.
두 확률변수의 기댓값
$X$와 $Y$를 결합 확률분포 $f(x, y)$를 가지는 확률변수라고 하면,
확률변수 $g(X, Y)$의 평균 혹은 기댓값은
이산형의 경우 $\mu_{g(X, Y)} = E [g(X, Y)] = \sum_{x} \sum_{y} g(x, y) f(x, y)$
연속형의 경우 $\mu_{g(X, Y)} = E[g(X, Y)] = \int_{-\infty}^{\infty} g(x, y) f(x, y) dxdy$입니다.
두 확률변수의 기댓값 예시
결합 밀도 함수가 $f(x, y) = \frac {x(1+3y^{2})}{4}$, 0 < x < 2, 0 < y < 1
그 외의 경우 0으로 주어질 때, $E(\frac {Y}{X})$를 구하시오.
$E(\frac{Y}{X}) = \int_{0}^{1} \int_{0}^{2} \frac {y(1+3y^{2})}{4} dx dy = \int_{0}^{1} \frac {y+3y^{3}}{2} dy = \frac {5}{8}$
주변 분포와 기댓값
$f(x, y)$가 $X$와 $Y$의 결합 확률분포라 하고, $g(x)$가 $X$의 주변 분포, $h(y)$가 $Y$의 주변 분포라 하면,
이산형의 경우 $g(x) = \sum_{y} f(x, y)$
연속형의 경우 $g(x) = \int_{-\infty}^{\infty} f(x, y) dy$
이산형의 경우 $h(y) = \sum_{x} f(x, y)$
연속형의 경우 $h(y) = \int_{-\infty}^{\infty} f(x, y) dx$
이산형의 경우 $E(X) = \sum_{x} \sum_{y} x f(x, y) = \sum_{x} x g(x)$
연속형의 경우 $E(X) = \int_{-\infty}^{\infty} x f(x, y) dy dx = \int_{-\infty}^{\infty} x g(x) dx$
이산형의 경우 $E(Y) = \sum_{x} \sum_{y} y f(x, y) = \sum_{y} y h(y)$
연속형의 경우 $E(Y) = \int_{-\infty}^{\infty} y f(x, y) dx dy = \int_{-\infty}^{\infty} y h(y) dy$
'수리통계학 > 평균과 분산' 카테고리의 다른 글
확률변수 - 공분산 (0) | 2019.10.04 |
---|---|
확률변수의 분산 (0) | 2019.10.01 |
댓글