MUESTREO ESTRATIFICADO
Ayudantía Estadística III Octubre 2014.
MUESTREO ESTRATIFICADO
Hay homogeneidad de elementos dentro del estr estrat atoo y hete heterrog ogen enei eida dad d entr entree estr estrat atos os.. “La lógica que subyace subyace al muestreo muestreo estratifica estratificado do es que agrupando elementos en estratos homo homogé gén neos eos es posi posibl blee mejor mejorar ar la pr prec ecis isió ión n y mini minimi miza zarr el cost costoo respe espect ctoo al MAS” (Vivanco, 200 2005: 81). 1). Se busc buscan an estr estrat atos os al alta tame ment ntee homo homogé géne neos os.. Requi equier eree del del list listad adoo de el elem emen ento tos. s.
ME vs. MAS
El muestreo estratificado suele ser más preciso que el MAS, pues la varianza del estimador es baja (recordar que una varianza alta aumenta el tama tamaño ño muestr muestral al). ). Cuando los estratos tienen la misma dispersión interna (varianza) que se obtiene al realizar un Mues Muestr treo eo Al Alea eato tori rioo Simp Simple le,, quie quierre deci decirr que que la variable de estratificación no puede generar grupos homogéneos. En este caso, no tiene sentido reali ealizzar un mues muestr treo eo estr estraatifi tifica cado do.. No se gana ana precisión y el proceso es más engorroso.
ME vs. MAS
Si la varianza o proporciones son muy parecidas a las de otro, la variable de estratificación no es la adecuada para crear los estratos, pues éstos no son son dif diferen erenttes entr entree sí. sí.
ME vs. MAS
En el caso de que no conozcamos la varianza de ningún estrato, es más adecuado usar MAS. Si se opta por un muestreo estratificado y se usa varianza máxima en cada estrato, entonces todos los estratos tendrán el mismo grado de dispersión y no serían heterogéneos entre sí. En esta situación, un ME funcionaría igual que MAS (es como si hiciéramos una selección aleatoria simple y ag agru rupá párramo amos a esos esos el elem emen enttos al alea eattoria oriame ment nte) e)..
AFIJACIÓN
¿Cómo se asignan los elementos a los estratos muestrales? 1. Afijación igual 2. Afijación proporcional 3. Afijación óptima de varianza 4. Afijación óptima de costos
AFIJACIÓN PROPORCIONAL
Tiene que ver con el número de elementos que componen el estrato. El tamaño del estrato en la muestra se corresponde con el tamaño del estrato en la población. Todos los elementos de la población tienen la misma probabilidad de pertenecer a la muestra. Resulta una muestra autoponderada.
AFIJACIÓN ÓPTIMA DE VARIANZA
Tiene que ver con la varianza de los elementos que componen el estrato. Busca aumentar la precisión de la estimación. Su ventaja es que permite que estratos con una menor varianza (menos dispersión) tengan menos elementos en la muestra. No es necesario muestrear a tantos elementos. Se respeta la lógica de proporcionalidad.
AFIJACIÓN ÓPTIMA DE COSTOS
Tiene que ver con el costo de cada elemento dentro del estrato. Los estratos más caros tendrán menos elementos en la muestra. También incluye criterios de proporcionalidad y de varianza.
AFIJACIÓN
Entonces, el tamaño del estrato en la muestra será más pequeño si: 1. El tamaño del estrato en la población es pequeño. 2. El estrato tiene una varianza baja (hay poca dispersión entre los datos). 3. La población a muestrear es de difícil acceso y muy cara.
PRECISIÓN DE LA ESTIMACIÓN
MC < MAS < MEprop < MEóp var < MEóp cos
NOTACIÓN
N = tamaño de la población. h = estrato. Nh = tamaño del estrato en la población. nh = tamaño del estrato en la muestra. Wh = peso del estrato.
= media poblacional. = media del estrato. = varianza del estrato. h
S2 = desviación estándar del estrato. p = proporción en la población. ph = proporción en el estrato. e = error muestral (error máximo admisible).
= nivel de confianza.
FÓRMULAS PARA CALCULAR CON AFIJACIÓN PROPORCIONAL
Media Peso del estrato poblacional Intervalo de confianza
Proporción en la población
Intervalo de confianza
Intervalos de confianza
Tamaño muestral
Tamaño muestral
Estrato muestral
Estrato muestral
Tamaño muestral
FÓRMULAS PARA CALCULAR CON AFIJACIÓN ÓPTIMA DE VARIANZA
Intervalos de confianza
Tamaño muestral
2 2 ( ) OJO: ℎℎ ℎℎ ≠
EJERCICIO 1 – ME vs. MAS
Una inspectora de control de calidad debe estimar la proporción de circuitos integrales de microcomputadora defectuosos que provienen de dos operaciones de ensamble diferentes. Ella sabe que entre los circuitos integrados que van a ser inspeccionados, 561 proceden de la operación de ensamble A y 372 de la operación de ensamble B. Una muestra aleatoria estratificada de 100, resulta de 38 que provienen de la operación A y 62 de la operación B. De los circuitos integrados muestreados de la operación A 6 son defectuosos y 10 son defectuosos de la operación B.
EJERCICIO 1
a. Considerando únicamente la muestra irrestricta aleatoria de 100 circuitos integrados estime la proporción de los circuitos defectuosos del lote y establezca un límite para el error de estimación con un nivel de confianza de 95,5%. Comente.
EJERCICIO 1
b. Estratifique la muestra usando afijación proporcional y estime la proporción de los circuitos defectuosos en la población. Fije un límite para el error de estimación con un nivel de confianza de 95,5%. Comente.
EJERCICIO 1
a. Aleatorio simple intervalo de proporción.
N = 933 n = 100
Circuitos defectuosos: 16 p = = 0,16 n p = 0,16 q = 0,84 Z=2
∙ ± ∝/ ∙ ∙ 1 ,∙, − 0,16±2 ∙ ∙ −
± 2 ∙ 0,03466 0,16± 0,0693 0,16 0,0693 = 0,0907 0,16+ 0,0693 = 0,2293 0,16
EJERCICIO 1 Interpretación
“Con un
95,5% de confianza, y utilizando muestreo aleatorio simple, podemos afirmar que la proporción de circuitos defectuosos del lote se encuentra entre el 9,1% y el 22,9%.”
EJERCICIO 1
b. ME afijación proporcional intervalo de proporción. =
N = 933 NhA = 561 NhB = 372 n = 100 nhA = 38 nhB = 62
= 0,158 qhA = 0,842 phB = = 0,161 phA =
qhB = 0,839 Z=2
=
± ∝/ ∙ ∙ ∙
EJERCICIO 1
Calcular pesos de los estratos
=
561 = 933 = 0,601
=
372 = 933 = 0,399
+ = 1
EJERCICIO 1
Estrato
Nh
wh
nh
ph
qh
whphqh
whph
A
561
0,601
38
0,158
0,842
0,08
0,095
B
372
0,399
62
0,161
0,839
0,054
0,064
N=933
n=100
Ʃ=0,134 Ʃ=0,159
EJERCICIO 1 =
= 0,159 ± ∝/ ∙ ∙ ∙ 933 100 0,159 ± 2 ∙ 0,134 ∙ 933 ∙ 100
833 0,159 ± 2 ∙ 0,134 ∙ 93300 0,159 ± 2 ∙ 0,134 ∙ 0,00893 0,159 ± 2 ∙ 0,0012 0,159 ± 2 ∙ 0,0346 0,159 ± 0,0692 0,159 0,0692 = 0,0898 0,159 + 0,0692 = 0,2282
EJERCICIO 1 Interpretación
“Con un 95,5% de confianza, y
utilizando muestreo estratificado proporcional, podemos decir que la proporción de circuitos defectuosos en el lote total está entre el 9% y el 22,8%.”
EJERCICIO 1 – ME vs. MAS
Comparar resultados entre MAS y ME: a. MAS: intervalo entre el 9,1% y el 22,9%.
b. ME: intervalo entre el 9% y el 22,8%.
Los intervalos son prácticamente iguales…
EJERCICIO 1 – ME vs. MAS
Lo anterior se debe a que las proporciones son muy similares en ambos estratos, lo que indica que no fueron bien estimados.
∙
Estrato
ph
qh
A
0,158
0,842
B
0,161
0,839
Con varianzas (p q) tan similares en ambos grupos, no se entrega ninguna información más precisa de lo que se podría obtener con un muestreo aleatorio simple. Como vimos en los resultados, los intervalos son muy similares.
EJERCICIO 2 – AFIJACIÓN PROPORCIONAL VS. ÓPTIMA DE VARIANZA Se decide realizar una encuesta por muestreo para estimar el número promedio de horas por semana que se ve la televisión en los hogares del municipio. Este comprende dos pueblos, pueblo A y pueblo B, y un área rural. Existen 155 hogares en el pueblo A, 62 en el pueblo B y 93 en el área rural. Una encuesta previa sugiere que las varianzas de los estratos son s21=25, s22=225ys23=100.
EJERCICIO 2 – AFIJACIÓN PROPORCIONAL VS. ÓPTIMA DE VARIANZA Encuentre el tamaño de la muestra y los tamaños de los estratos con un error de estimación igual a 2 horas y un nivel de confianza de 95,5%. Utilice muestreo estratificado con: a. Afijación proporcional b. Afijación óptima.
EJERCICIO 2
a. ME afijación proporcional tamaño muestral para medias.
N = 310 Nh1 = 155 Nh2 = 62 Nh3 = 93
S21 = 25 S22= 225 S23 = 100 e=2 Z=2
= 2 ℎ ℎ = ℎℎ2 + = ∙
EJERCICIO 2
Calcular pesos de los estratos
=
155 = 310 = 0,5
=
62 = 310 = 0,2
=
93 = 310 = 0,3
EJERCICIO 2
Estrato
Nh
sh2
wh
whsh2
A (1)
155
0,5
25
12,5
B (2)
62
0,2
225
45
Rural (3) 93
0,3
100
30
N=310
Ʃ=87,5
EJERCICIO 2 2 = ℎℎℎℎ2 + 87,5 = 2 87,5 + 2 310 87,5 = 1 + 0,2823
EJERCICIO 2
87,5 = 1 + 0,2823 87,5 = 1,2823 = 68,24 El n total será de 68 hogares.
EJERCICIO 2
= ∙ = 68 ∙ 0,5 = 34 = 68 ∙ 0,2 = 13,6 = 14
Calcular tamaños de los estratos:
= ∙ = ∙ = ∙
= 68 ∙ 0,3 = 20,4 = 20
34 + 14 + 20 = 68 = n
EJERCICIO 2 Interpretación
poder estimar con un nivel de confianza del 95,5% y con un error de estimación del 6%, la muestra adecuada será de 68 hogares, 34 para el pueblo A, 14 para el pueblo B y 20 para el pueblo C.” “Para
EJERCICIO 2
b. ME afijación óptima de varianza tamaño muestral para medias.
N = 310 Nh1 = 155 Nh2 = 62 Nh3 = 93
S21 = 25 S22= 225 S23 = 100 S1 = S2 = S3 = e=2 Z=2
25 = 5 225 = 15 100 = 10
2 ( ) ℎ ℎ = ℎℎ2 +
= ∙
EJERCICIO 2
Estrato
Nh
wh
sh2
whsh2
whsh
sh
A (1)
155
0,5
25
12,5
5
2,5
B (2)
62
0,2
225
45
15
3
Rural (3) 93
0,3
100
30
10
3
N=310
Ʃ=87,5
Ʃ=8,5
EJERCICIO 2 2 ( ) ℎ ℎ = ℎℎ2 + 2 8,5 = 2 87,5 + 2 310
EJERCICIO 2
72,25 = 1 + 0,2823 72,25 = 1,2823 = 56,34 El n total será de 56 hogares.
EJERCICIO 2
Calcular tamaños de los estratos:
= ∙ = ∙ = ∙
16 + 20 + 20 = 56 = n
, = 56 ∙ , = 16,46 = 16
3 = 56 ∙ 8,5 = 19,77 = 20 3 = 56 ∙ 8,5 = 19,77 = 20
EJERCICIO 2 Interpretación “Para
poder estimar con un nivel de confianza del 95,5% y con un error de estimación del 6%, la muestra adecuada será de 56 hogares, 16 del pueblo A, 20 del pueblo B y 20 del pueblo C.”
EJERCICIO 2 – AFIJACIÓN PROPORCIONAL VS. ÓPTIMA DE VARIANZA Afijación
Comparar muestras y estratos muestrales obtenidos:
nh1
Proporcional 34
Óptima 16
nh2
14
20
nh3
20
20
n
68
56
Al calcular el número de muestra necesario, observamos que si utilizamos el muestreo estratificado óptimo podemos utilizar una muestra menor que con el muestreo estratificado proporcional. Esto permite reducir costos sin disminuir el nivel de confianza. Además, la distribución entre los distintos estratos es distinta al utilizar afijación óptima. De esta forma, el pueblo A, que tiene el mayor peso, no cuenta esta vez con la mayor cantidad de hogares en la muestra, justamente porque tiene la menor varianza.
EJERCICIO 3
En vistas al diseño de un plan de seguridad escolar, se necesita conocer la media de asaltos que sufren estudiantes de establecimientos de Enseñanza Media de una ciudad. Se selecciona establecimientos según nivel socio-económico (alto, medio, bajo) de las comunas en que se ubican; para ello, puesto que se ha verificado diferencias importantes en cuanto a dispersión, se utiliza afijación óptima. El estrato formado por las comunas de alto nivel socioeconómico cuenta con 12 establecimientos de Enseñanza Media; el estrato de nivel medio tiene 19 establecimientos, y el estrato de nivel bajo cuenta con 25. La muestra seleccionada consta en la tabla.
EJERCICIO 3 Estrato
Alto Medio Bajo
N° de establecimientos
2 5 3
N° de asaltos durante el último año por establecimiento 24 – 21 31 – 36 – 25 – 27 – 28 19 – 26 –24
Estime la media poblacional de asaltos a estudiantes de Enseñanza Media durante el último año con un intervalo de confianza de 95,5%. Comente los resultados.
EJERCICIO 3
ME afijación óptima de varianza intervalo de confianza para medias.
N= 56 NhA = 12 NhM = 19 NhB =25 n= 10 nhA = 2 nhM = 5 nhB =3 N.C. = 95,5% = Z = 2
2 2 ( ) ± ∝/2 ∙ ℎ ℎ ℎ ℎ = 2 ( ) =
EJERCICIO 3
Calcular media, varianza y desviación estándar por estrato: Alto
Xi 24 21
(Xi- )2 2,25 2,25
Ʃ=45
Ʃ=4,5
Medio
Xi 31 36 25 27 28
(Xi- )2 2,56 43,56 19,36 5,76 1,96
Bajo
Xi 19 26 24
(Xi- )2 16 9 1
Ʃ=69
Ʃ=26
ℎ = =22,5 Ʃ=147 Ʃ=73,2 4,5 ℎ = 2 = 2,25 73,2 =29,4 = = 14,64 = ℎ ℎ 5 = 2,25 = 1,5 = 14,64 = 3,826
ℎ = =23 ℎ = 263 = 8,67 = 8,67 = 2,94
EJERCICIO 3
Calcular pesos de los estratos
=
12 = 56 = 0,214
=
19 = 56 = 0,339
=
25 = 56 = 0,446
EJERCICIO 3 Estrato
Nh
nh
yh
sh2
sh
wh
yhwh
Alto
12
2
22,5 2,25 1,5
Medio
19
5
29,4 14,64 3,83 0,339 9,967
Bajo
25
3
23
N=56 n=10
0,214 4,815
whsh
whsh2
0,321
0,4815
1,2983 4,96 7 1,3112 8,67 2,94 0,446 10,258 3,867 4 1
Ʃ=25,04 Ʃ=2,93 Ʃ=9,31
EJERCICIO 3 = = 25,04 2 ℎℎ2 ( ) ℎ ℎ ± ∝/2 ∙ 25,04
±2∙
, ,
, 25,04 ± 2 ∙ 0,1663
EJERCICIO 3 ± 2 ∙ 0,8585 0,1663 25,04 ± 2 ∙ 0,6922 25,04 ± 2 ∙ 0,832 25,04 ±1,664 25,041,664 = 23,38 25,04+1,664 = 26,7 25,04