Estudio conjunto de dos variables Consiste en analizar la relación y/o asociación existente entre dos variables cuantitativas, utilizando, en una primera etapa, la estadística descriptiva. ¿Son dependientes? N°
X
Y
1
X1
Y1
2
X2
Y2
3
X3
Y3
…
…
…
n
Xn
Yn
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
Use las medidas de dependencia
1
Medidas de asociación o dependencia Indicadores que se utilizan para determinar la existencia o no de la dependencia entre dos variables, y si existe dependencia permite establecer el tipo de dependencia: directa o inversa. Medida de Dependencia Absoluta
COVARIANCIA
Medida de Dependencia Relativa
COEFICIENTE DE CORRELACIÓN
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
2
Covariancia Mide el grado de dependencia o de asociación, en términos absolutos, que existe entre dos variables. N
Población
∑( x − µ Cov( x, y) = σ X ,Y =
X
)( y − µY )
i =1
N n
Muestra
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
ˆ ( x, y ) = S = Cov X ,Y
∑ ( x − x )( y − y ) i =1
n −1 3
Correlación Mide el grado de dependencia o de asociación, en términos relativos, que existe entre dos variables cuantitativas. N
∑ (x − µ Población
ρ X ,Y =
X
)( y − µ Y )
i =1 N
∑
(x − µ X )
i =1
2
N
∑
( y − µY )2
i =1
n
Muestra
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
ρˆ X ,Y = rX ,Y =
∑ ( x − x )( y − y ) i =1 n
n
2 ( x − x ) ∑
2 ( y − y ) ∑
i =1
i =1 4
Cálculo de la covariancia y de la correlación con datos muestrales no organizados en cuadros de frecuencias. SP ( X ,Y ) ˆ C o v ( X , Y ) = S X ,Y = n −1 S X ,Y SP ( X ,Y ) ρˆ X ,Y = rX ,Y = = S X SY S C ( X ) i S C (Y )
siendo: n
SP ( X , Y ) =
n
∑ ( x − x )( y − y ) = ∑ i =1
SC (Y ) =
∑ (x − x )
2
n
=
∑x
i =1
i =1
n
n
∑ (y − y) i =1
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
n
i =1
n
SC ( X ) =
x )( ∑ y ) ( ∑ xy −
2
=
∑ i =1
y
2
x) ( ∑ −
2
n
2
y) ( ∑ −
2
n
5
Cálculo de la covariancia y de la correlación: Cuadro de frecuencias de doble entrada Xi
\ Yi
Y1
Y2
…
Ym
Total
X1
f1,1
f1,2
…
f1,m
f1.
X2
f2,1
f2,2
…
f2,m
f2.
…
…
…
…
…
…
XK
fK,1
fK,2
…
fK,M
fK.
f.1
f.2
…
f.m
n
Total K
m
K
i=1 j=1
i=1
2 i i.
2
SP(X,Y) = ∑∑xi yj fi,j − n x y SC(X) = ∑x f − n x
SP ( X , Y ) ˆ ( X ,Y ) = S Cov = X ,Y n −1 UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
ρˆ X ,Y = rX ,Y =
m
SC(Y) = ∑ y2j f.j − n y2
S X ,Y S X SY
j=1
=
SP ( X , Y ) SC ( X ) i SC (Y )
6
Interpretación de la covariancia y la correlación Asociación Lineal directa y perfecta
Cov( x, y ) > 0,
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
ρ X ,Y = 1
7
Interpretación de la covariancia y la correlación Asociación lineal directa e imperfecta
Cov( x, y ) > 0,
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
0 < ρ X ,Y < 1
8
Interpretación de la covariancia y la correlación Asociación lineal inversa y perfecta
Cov( x, y ) < 0,
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
ρ X ,Y = −1
9
Interpretación de la covariancia y la correlación Asociación inversa e imperfecta
Cov( x, y ) < 0,
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
− 1 < ρ X ,Y < 0
10
Interpretación de la covariancia y la correlación Poca o ninguna asociación
Cov( x, y ) ≅ 0,
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
ρ X ,Y ≅ 0
11
Covariancia y correlación . Ejemplo con datos originales En un estudio sobre la relación entre el sueldo promedio de los integrantes del equipo de trabajo (en miles de soles) y la productividad (puntaje),se obtuvo la siguiente información Equipo (i)
Productividad (Y)
Sueldo Prom. (X)
1
42
2.5
2
39
2.0
3
48
3.0
4
51
3.3
5
49
3.1
6
53
3.5
7
51
3.2
8
60
4.0
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
¿Qué se puede afirmar sobre la asociación entre las variables Productividad y Sueldo promedio?
12
Covariancia y correlación . Ejemplo con datos originales
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
13
Covariancia y correlación. Ejemplo para datos originales
∑ X = 24.6, 2 Y ∑ = 19601
2 X ∑ = 78.24,
;
∑ Y = 393,
∑ X Y = 1235.9
ˆ ( X , Y ) = SP( X , Y ) = 27.425 = 3.91785714 Cov n −1 8 −1
ρˆ X ,Y = rX ,Y =
SP( X , Y ) 27.425 = = 0.9914 [ SC ( X )] [SC (Y )] (2.595)(294.875)
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
14
Covariancia y Correlación: Ejemplo con cuadro de frecuencias
Se tiene el siguiente cuadro sobre el ingreso familiar mensual (X, en miles de soles) y el gasto familiar mensual en alimentación (Y, en miles de soles). ¿Cuál es el grado de correlación entre las variables?
X \
Y
1.5
1.8
2
2.5
Total
2
20
10
0
0
30
3
10
8
2
0
20
4
8
4
2
2
16
5
0
3
6
5
14
Total
38
25
10
7
80
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
15
Covariancia y Correlación: Ejemplo con cuadro de frecuencias 4
4
∑∑x y f i
j i,j
= (2)(1.5)(20) + (2) (1.8) (10) + ... + (5)(2.5) (5) = 465.9
i=1 j=1 4 2 i i. i=1 4 2 j .j j=1
2 2 2 2 x f = (2) (30) + (3) (20) + (4) (16) + (5) (14) = 906 ∑
x = 3 .1 7 5
2 2 2 2 y f = (1.5) (38) + (1.8) (25) + (2) (10) + (2.5) (7) = 250.25 ∑
y= 1 .7 4 3 7 5
SP(X,Y) = 465.9 - (80) (3.175) (1.74375) ) = 22.9875 SC(X) = 906 - (80) (3.175)2 = 99.55 SC(Y) = 250.25 - (80) (1.74375)2 =6.996875
rX,Y =
22.9875 (99.55)(6.996875)
UNIVERSIDAD DEL PACÍFICO ESTADÍSTICA APLICADA I
= 0.8710
16