두변수 결합확률분포
결합확률분포
- 확률변수 : 표본공간 S에서 정의한 두 확률변수 X와 Y에 대해, 이 확률변수들의 순서쌍(X,Y)
- 이변량 결합확률분포 : 이변량 확률변수 (X,Y)에 대한 확률 분포
- 결합확률 밀도(질량)함수(pdf)
\(P(X=x,Y=y)=f_{XY}(x,y) = f(x,y)\)
-
결합함수는 X가 x이고, 동시에 Y가 y인 사상에 대한 확률
- PDF의 특징 (이산형)
- \[f(x,y) \ge 0\quad \quad all \quad x \quad and \quad y\]
- \[\sum_{all}^{}\sum_{(x,y)}^{}f(x,y)=1\]
- \[P{(X,Y)∈ A} = \sum_{(x,y)}^{}\sum_{∈ A}^{}f(x,y)\]
- PDF의 특징 (연속형)
- \[f(x,y) \ge 0\quad \quad all \quad x \quad and \quad y\]
- \[\int_{-∞}^{∞} \int_{-∞}^{∞} f(x,y)dxdy = 1\]
- \[P{(X,Y)∈ A} = \int_{A}^{} \int_{}^{} f(x,y)dxdy\]
-
- 결확확률 누적분포함수(cdf)
-
이산형 cdf \(F(x,y)=P(X≤a, Y≤b) = \sum_{x=-∞}^{a}\sum_{y=-∞}^{b}f(x,y)\)
-
연속형 cdf \(F(x,y)=P(X≤a, Y≤b) = \int_{-∞}^{a} \int_{-∞}^{b} f(x,y)dydx \quad (*y먼저 적분)\) \(※ 여기서, \frac {d^{2}}{dxdy} F(x,y) = f(x,y)\)
-
CDF의 특징
- $F(x,y)$는 단조증가함수 ( x,y가 증가하면 반드시 이전값보다 같거나 커야함)
-
주변확률분포
- X와 Y가 결합확률분포를 만족 하는 경우 X나 Y의 분포만을 알고자 하는 경우 사용하는 분포
-
$f_{x}(X)$, $f_{y}(Y)$를 주변확률 분포(marginal distribution) 이라고 한다.
\[f(x) = \left\{\begin{matrix} \sum_{모든y} f(x,y) , 이산형 확률변수의 경우 \\ \int_{-∞}^{∞} f(x,y)dy, 연속형 확률변수의 경우 \\ \end{matrix}\right.\] \[f(y) = \left\{\begin{matrix} \sum_{모든x} f(x,y) , 이산형 확률변수의 경우 \\ \int_{-∞}^{∞} f(x,y)dx, 연속형 확률변수의 경우 \\ \end{matrix}\right.\]
조건부확률분포
-
확률변수 X=x로 주어졌을때 $Y x$의 조건부 확률분포는
독립확률변수 (Independent Random Variables)
- 다음 조건을 충족하면, 확률변수 X 와 Y가 독립이라고 한다.
- 결합확률함수는 각각의 주변확률함수의 곱으로 표현이 가능하다.
- X의 정보를 알고 있는 것이 Y의 값을 바꿀수 없다는 것
-
(x범위)×(y범위)의 형태가 사각형의 형로 표현 되지 않으면, 두변수가 독립이 될 수 없음
\[f(x,y)= f_{X}(x)·f_{Y}(y)\]또는
\[f(y|x)= f_{Y}(y)\] -
이산형 예제
Y X 0 1 2 fy(y) 5 0.2 0.1 0.1 0.4 10 0.1 0.2 0.3 0.6 </table> > Sol ) f(x=0,y=5) = 0.2 , f(x=0) = 0.3, f(x=5) = 0.4fx(X) 0.3 0.3 0.4 1.0
> f(x,y) ≠ fx(X)fy(Y) , not independent -
연속형의 예제
만일 fxy(x,y) = x+y
fx(x) = x + 1/2 , fy(y) = y+ 1/2Sol) fx(X)fy(y) = xy+(x+y)/2 + 1/4 ≠ f(x,y) , not independent
댓글남기기