본문 바로가기

수리통계학22

포아송 분포, 평균과 분산 증명 ▶ 포아송 실험 주어진 시간 간격 또는 일정한 영역 내에서 발생하는 결과들의 수를 나타내는 확률변수 $X$의 값을 산출하는 실험입니다. 일정 시간 일정 시간 동안에 방문한 고객의 수 사무실에 걸려오는 시간당 전화 수 하루 동안 태어나는 아기 수 일정 영역 단위 면적 당 들쥐의 수 한 페이지 당 오타 수 ▶ 포아송 과정 1. 단위 시간 간격이나 일정 영역에서 발생하는 결과의 수는 서로 겹치지 않는 다른 시간 간격이나 영역에서 발생하는 수와 독립 - 건망 성 특징 2. 매우 짧은 시간 간격이나 적은 영역에서 단 한 번의 결과가 일어날 확률은 시간간격의 길이나 영역에 비례하고, 그 시간 간격이나 영역 외부에서 발생하는 결과의 수와는 무관 3. 매우 짧은 시간간격이나 적은 영역에서 둘 이상의 결과가 일어날 확률.. 2019. 9. 23.
감마함수 감마함수 $\alpha > 0 $인 $\alpha$에 대해 $\Gamma(\alpha) = \int_{0}^{\infty} x^{\alpha - 1} e^{-x} dx$ 감마함수 특징 및 증명 $\alpha > 1$일 때 $\Gamma(\alpha) = (\alpha - 1)\Gamma(\alpha - 1)$ $\Gamma(1) = 1$, 양의 정수 n에 대해 $\Gamma(n) = (n - 1)!$ 증명 : $\alpha > 1$인 경우, 부분 적분($u = x^{\alpha - 1}, dv = e^{-x} dx$)을 이용합니다. $\Gamma(\alpha) = -e^{-x} x^{\alpha - 1}\mid^{\infty}_{0} +\int_{0}^{\infty} e^{-x}(\alpha - 1) x.. 2019. 9. 20.
회귀계수의 추론(기울기) $i = 1,2,..., n$에 대해 $\varepsilon_{i}$은 정규분포를 따른다고 가정 $Y_{i}$는 정규분포 $n(y_{i};\alpha+\beta x_{i}, \sigma)$를 따름 A, B는 독립인 정규확률변수의 선형 함수이므로 $n(a; \alpha, \sigma_{A})$, $n(b; \beta, \sigma_{B})$의 정규분포를 따름 ▶ 기울기 $\beta$의 추정 $\chi^{2} = \frac{(n-1)S^{2}}{\sigma^{2}} = \sum_{i=1}^{n}\frac{(X_{i}-\bar {X})^{2}}{\sigma^{2}}$은 자유도 $v = n - 1$인 카이제곱분포를 따른다. 통계량 $\frac{(n-2)S^{2}}{\sigma^{2}}$은 확률변수 B와 독립으로.. 2019. 9. 20.
단순선형회귀모형(Simple Linear Regression Model) ISLR에서 회귀 모형을 공부하면서 나온 개념들을 수리적으로 증명하려고 합니다. 수리적인 부분이 들어가면 지루하고 어려울 수 있으므로 짧게 여러 번 포스팅하겠습니다. ※ 최소 제곱 법과 적합 모형 ▶ SSE: 잔차 제곱합(residual sum of squares), 오차 제곱합(error sum of squares)라고 합니다. $SSE = \sum_{i=1}^{n} e_{i}^{2} = \sum_{i=1}^{n}(y_{i}-\hat {y_{i}})^{2}=\sum_{i=1}^{n}(y_{i}-a-bx_{i})^{2}$ (a, b에 대한 2 변수 함수) ▶ SSE를 최소화하는 a, b $\frac {\partial (SSE)}{\partial a} = -2\sum_{i=1}^{n}(y_{i}-a-bx_.. 2019. 9. 19.