UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERIA AREA DE ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA 1 Secciones C+ y D Inga. Alba Maritza Guerrero Spínola de López
DISTRIBUCIÓN DE PROBABILIDAD CONJUNTA
VARIABLES BIDIMENSIONALES DISCRETAS Si X y Y son dos variables aleatorias discretas, la distribución de probabilidad para sus ocurrencias simultáneas se puede representar mediante una función con valores f(x,y), para cualquier par de valores (x,y) dentro del rango de las variables aleatorias X y Y. Se acostumbra referirse a esta esta función función como la Distribución de probabilidad Conjunta de X y Y. Debe cumplir con los siguientes axiomas: 1. f(x,y) 0 para toda (x,y) f(x,y) = 1 2. x y
3.
P(X = x, Y = y) = f(x,y)
Para cualquier región A en el plano xy, P[(X,Y) ∈ A ] = f(x,y).
VARIABLES BIDIMENSIONALES CONTINUAS Si X y Y son dos variables aleatorias Continuas, la función de densidad conjunta f(x,y), es una superficie sobre el plano xy, y P[(X,Y) ∈ A ] donde A es cualquier región del plano xy, es igual al volumen del cilindro recto limitado por la base A y la superficie. Debe cumplir con los siguientes axiomas: 1. 2.
f(x,y) 0 para toda (x,y) ʃoo ʃoo f(x,y) dx dy = 1,
3.
P[(X,Y) ∈ A ] = ʃ Aʃ f(x,y) dx dy
-oo
-oo
Para cualquier región A en el plano xy.
DISTRIBUCIONES MARGINALES: Dada la distribución de probabilidad conjunta conjunta f(x,y) de de las variables aleatorias aleatorias discretas X y Y, la distribución de probabilidad g(x) de X sola se obtiene al sumar f(x,y) sobre los valores de Y. De manera manera similar, la distribución de probabilidad h(y) de Y sola se obtiene al sumar f(x,y) sobre los valores valores de X. Definimos g(x) y h(x) como distribuciones marginales de X y Y respectivamente. Las distribuciones marginales de X sola y Y sola son Para el caso discreto ,g(x) = f(x,y) y h(y) = f(x,y) y
x 1
Para el caso continuo ,g(x) = ʃoo f(x,y) dy -oo
h(y) = ʃoo f(x,y) dx
y
-oo
VARIABLES ALEATORIAS INDEPENDIENTES Sean X y Y dos variables aleatorias, discretas o continuas, con distribución de probabilidad conjunta f(x,y) y distribuciones marginales g(x) y h(y) respectivamente. Se dice que las variables aleatorias X y Y son estadísticamente independientes si y solo sí: ,f(x,y) = g(x) h(y) para toda (x,y) dentro de sus rangos.
ESPERANZA MATEMÁTICA PARA VARIABLES BIDIMENSIONALES Sean X y Y variables aleatorias con distribución de probabilidad conjunta f(x,y). La media o valor esperado de la variable aleatoria g(x,y) es
g(x,y) = E[g(x,y)] = ∑∑ g(x,y). f(x,y) xy
=
si X y Y son discretas
∑ Pi X .Y
g(x,y) = E[g(x,y)] = -ooʃoo-ooʃoo g(x,y). f(x,y) dx dy
si X y Y son continuas
Si X y Y son dos variables aleatorias continuas con función de densidad conjunta f(x,y), las medias o esperanzas de X ,Y son:
x = E(x) = -ooʃoo-ooʃoo x . f(x,y) dx dy y = E(y) = -ooʃoo-ooʃoo y . f(x,y) dx dy COVARIANZA MATEMÁTICA Sean X y Y variables aleatorias con distribución de probabilidad conjunta f(x,y). La covarianza de X y Y es Cov (X,Y) = xy = E [ (X - x) (Y - y)] = = ∑∑ (X - x) (Y - y) f(x,y) discretas
Si X y Y son
x y
Cov (X,Y) = xy = E(XY) - [ E(x) E(Y)] Donde
E(X) = E(Y) =
∑ X g(x) ∑ Y h(y)
Cov (X,Y) = xy = E [ (X - x) (Y - y)] =-ooʃoo-ooʃoo (X - x) (Y - y) f(x,y) dx dy
= Si X y Y son continuas 2
Teoremas importantes sobre la Covarianza: 1. Cov (X,Y) = xy = E(XY) - [ E(x) E(Y)] Cov (X,Y) = xy = E(XY) - x y Donde: E(X,Y) = -ooʃoo-ooʃoo XY f(x,y) dx dy E(X) = -ooʃoo X g(x) dx E(Y) = -ooʃoo Y h(y) dy 2.
Si X,Y son variables aleatorias independientes xy = Cov(X,Y) = 0
2.
Var(X + Y ) = Var (x) + Var (Y) + 2 Cov (X,Y) Ó
2x+y = 2x + 2y + 2xy
COEFICIENTE DE CORRELACIÓN Si X,Y son dependientes completamente, por ejemplo X = Y, entonces Cov(X,Y) = xy = x y. De esto llegamos a una medida de dependencia de las variables X,Y dada por
= xy = Cov (X,Y) x y Var (x)* Var (y) Var (X) = E(X2) - [E(X)] 2 Var (Y) = E(Y2) - [E(Y)] 2 Es una cantidad adimensional. Llamamos a el coeficiente de correlación. Siempre que -1 1 En el caso donde = 0 decimos que las variables X,Y no están correlacionadas. Si = 1 entonces puede afirmarse que X y Y tienen correlación positiva perfecta. Ello significa que los valores bajos de X guardan relación con los valores altos de Y, y a la inversa.
3
EJEMPLO CASO DISCRETO Se escogen dos números al azar de los siguientes 1,2,3,4 no se permite que escojan números iguales. Si definimos dos variables X: como la suma de los dos números escogidos y Y: como el mayor de los números escogidos. Encontrar: a) Distribución de probabilidad conjunta b) P(X <5, Y> 2) c) Determinar la esperanza matemática d) Determinar la covarianza e) Determinar el coeficiente de correlación Solución X = suma de los números escogidos Y = mayor de los números El espacio muestral del experimento es el siguiente: S= { (1,2) (1,3) (1,4) (2,3) (2,4) (3,4)} 3 4 5 5 6 7 El recorrido de X es: Rx= { 3,4,5,6,7,) El recorrido de Y es: Ry= { 2,3,4)
Tabla de distribución conjunta
Y X
3
4
5
6
7
2
1/6 *
0
0
0
0
1/6
3
0
1/6
1/6
0
0
2/6
4
0
0
1/6
1/6
1/6
3/6
,g(x) =
1/6
1/6
2/6
1/6
1/6
6/6
,h(y)
* para determinar la probabilidad debe cumplir para X que la suma sea igual a 3, para Y que el mayor sea 2
4
g(x) y h(y) son las probabilidades marginales = probabilidad acumulada b) P(X <5, Y> 2) x puede tomar los valores de 3 y 4; Y puede tomar los valores 3 y 4 P = (3,3) (3,4) (4,3)(4,4) P = 0+0+1/6+0 = 1/6 c) Determinar la esperanza matemática conjunta E(xy) = ∑∑ g(x,y). f(x,y) =∑ Pi X Y
= 3*2*1/6 4*2*0 5*2*0 6*2*0 7*2*0
+ + + + +
3*3*0 + 4*3*1/6 + 5*3*1/6 + 6*3*0 + 7*3*0 +
3*4*0 4*4*0 5*4*1/6 6*4*1/6 7*4*1/6
+ + + + =
= 6/6 + 12/6 + 15/6 + 20/6 + 24/6 + 28/6 = 105/6 = 35/3 d) Determinar la covarianza Cov (X,Y) = xy = E(XY) - [ E(x) E(Y)] E(XY) = 105/6 Las esperanzas para las variables solas se obtiene mediante: E(X) = E(Y) =
∑ X g(x) ∑ Y h(y)
E(X) = 3*1/6 + 4*1/6 + 5*2/6 + 6*1/6 + 7*1/6 = E(X) = 3/6 + 4/6 + 10/6 + 6/6 + 7/6 = 30/6 E(Y) = 2* 1/6 + 3 * 2/6 + 4 *3/6 = E(Y) = 2/6 + 6/6 + 12/6 = 20/6 Cov (X,Y) = xy = E(XY) - [ E(x) E(Y)] Cov (X,Y) = 105/6 - [ 30/6 * 20/6] Cov (X,Y) = 105/6 - 600/36 = 105/6 - 100/6 = 5/6 e) Determinar el coeficiente de correlación
= xy = Cov (X,Y) x y Var (x)+ Var (y) Var (X) = E(X2) - [E(X)] 2 = 160/6 - (30/6) 2 =10/6 Var (Y) = E(Y2) - [E(Y)] 2 = 70/6 - (20/6) 2 = 70/6 - 100/9 = 10/18= 5/9 5
E(X2) = 3*3*1/6 + 4*4*1/6 + 5*5*2/6 + 6*6*1/6 + 7*7*1/6 = = 9/6 + 16/6 + 50/6 + 36/6 + 49/6 = 160/6 2 E(Y ) = 2*2*1/6 + 3*3*2/6 + 4*4*3/6 = = 4/6 + 18/6 + 48/6 = 70/6
= Cov (X,Y) Var (x)* Var (y)
=
5/6 =
10/6 * 5/9
5/6
= 0.9486
50/54
Si el = 0 las variables son independientes EJEMPLO CASO DISCRETO La función de probabilidad conjunta de dos variables aleatorias discretas X,Y está dada por f(x,y) = c (2x + y) donde x, y pueden tomar todos los valores enteros tales que 0 x 2, 0 y 3 y f(x,y) = 0 de otra forma a) Hallar el valor de la constante c b) Hallar P(X = 2, Y = 1) c) Hallar P(X 1, Y 2) d) Hallar las funciones de probabilidad marginal de X y Y a. Hallar el valor de la constante c 2. f(x,y) = 1 x y
Probabilidades asociadas con dichos puntos
6
Valuando en la función c X
Y
(2x + y)
0
1
2
3
Totales g(x)
0
0
C
2c
3c
6c
1
2c
3c
4c
5c
14c
2
4c
5c
6c
7c
22c
6c
9c
12c
15c
42c
h(y)Totales =
Puesto que la sumatoria de las probabilidades debe ser igual a uno 42c = 1
entonces c = 1/42
b. Hallar P(X = 2, Y = 1) De la tabla determinamos que dicho valor es igual a P(X = 2, Y = 1) = 5c = 5*1/42 = 5/42 c. Hallar P(X 1, Y 2) =
x
1
f(x,y)
y
2
= (2c + 3c + 4c ) + (4c + 5c + 6c) = 24c = 24/42 = 4/7
d. Hallar las funciones de probabilidad marginal de X y Y g(x) = f(x,y) y h(y) = f(x,y) y
x
La función de probabilidad marginal tanto para X como para Y se obtiene del total de los margenes de las columnas y filas respectivamente P(X= x) = g(x) =
{
6c = 1/7
x=0
14c = 1/3
x=1
22c = 11/21 x= 2 Comprobando = 1/7+1/3+11/21 = 1 P(Y=y) = h(y) =
{
6c = 1/7
y=0 7
9c = 3/14
y=1
12c = 2/7
y= 2
15c = 5/14
y=3
Comprobando = 1/7+3/14+2/7 + 5/14 = 1
EJEMPLO CASO CONTINUO La función de densidad conjunta de dos variables aleatorias co ntinuas X,Y es ,f(x,y)=
cxy
0
0
en cualquier otro caso
a) hallar el valor de la constante C b) Hallar P(1< x < 2 , 2 < y < 3) c) Hallar P(X 3, Y 2) d) Hallar las funciones de distribución marginal de X y de Y e) Hallar E(x), E(Y), E(XY) , E(2x + 3y) f) Hallar la Cov(XY) a) Aplicamos el teorema ʃoo ʃoo f(x,y) dx dy = 1, -oo
-oo
ʃ4 ʃ5 cxy dx dy = C ʃ4 [ ʃ5 xy dy] dx o
1
C ʃ4 xy2 (6x2)
x=o
∣5
dx = C ʃ4
Y=1
( 25x
- x
2
2
) dx
= C ʃ4 12x dx = C
∣4 x=o
2
y=1
x =o
x =o
x =o
= 96C = 1
= C = 1/96
,f(x,y) = 1/96 xy
8
b) Hallar P(1< x < 2 , 2 < y < 3) = = ʃ2 ʃ3 xy dx dy = 1 ʃ2 [ ʃ3 xy dy] dx 1
=
2
96 x=1
5
96
∣3
1 ʃ2 xy2
=
=
96
2
2
Y=2
dx = 1 ʃ2 96 x =1
y=2
(x2)∣
x=1
( 5x ) dx 2
= 5/128
∣1
192 2
c) Hallar P(X 3, Y 2) = ʃ4 ʃ2 xy dx dy = 1 ʃ4 [ ʃ2 xy dy] dx = 96
x= 3 y=1
= 1 ʃ4 xy2 96 x=3
=
2
96
∣2
x=3
Y=1
(
dx = 1 ʃ4 3x 96 x =3
y=1
2
) dx =
7/128
d)Hallar las funciones de distribución marginal de X y de Y g(X) = P(X x) = ʃx ʃ00 f(u,v) du dv = 1 ʃx [ ʃ5 uv du] dv = x2 96 x=0 Y=1 u=-00 v=-00 16 Por lo tanto si valuamos
X 4 , F(x) = 1
Para
X < 0 F(x) = 0
{
g(X)=
h(Y) = P(Y y) = ʃ00
0
x< 0
x2/16
0x< 4
1
X4
ʃy f(u,v) du dv = 1 ʃ4 [ ʃy uv du] dv = y2 -
1 u=-00
v=1
96
x=0
Y=1
24 Por lo tanto si valuamos Para
y 5 , F(y) = 1 y < 1 F(y) = 0 9
h(y) =
{
0
y< 1
(y2 - 1)/24
1y<5
1
y5
e) Hallar E(x), E(Y), E(XY) , E(2x + 3y) Aplicando los teoremas E(X,Y) = -ooʃoo-ooʃoo XY f(x,y) dx dy x = E(x) = -ooʃoo-ooʃoo x . f(x,y) dx dy y = E(y) = -ooʃoo-ooʃoo y . f(x,y) dx dy E(X) = oʃ4 1ʃ5 X (xy/96) dx dy = 8/3 E(Y) = oʃ4 1ʃ5 Y (xy/96) dx dy = 31/9 E(X,Y) = 0ʃ4 ʃ5 XY (xy/96) dx dy = 248/27 E(2X + 3Y) = 0ʃ4 ʃ5 (2X+3Y) (xy/96) dx dy = 47/3 Puesto que X Y son independientes también podemos obtener E(X,Y) = E(x) * E(Y) = 8/3* 31/9 = 248/27 f) Aplicando el teorema de la covarianza Cov (X,Y) = xy = E(XY) - [ E(x) E(Y)] Cov (X,Y) = 248/27 - [ (8/3) * (31/9)] Cov(X,Y) = 248/27 - 248/27 Cov (X,Y) = 0 Son variables aleatorias independientes
10