EJERCICIOS DE EXAMEN: TEORIA DEL MUESTREO Y ESTIMACIÓN Ejercicio 1 En un estudio para comparar los pesos promedio de niños y niñas de sexto grado de educación primaria (en torno a los 10 años) se emplea una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen una distribución normal. El promedio de los pesos de todos los niños de sexto grado de esa escuela es de 45,46 Kg y su desviación típica es de 6,42 Kg, mientras que el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 38,56 Kg y su desviación típica es de 5,55 Kg. Si representa el promedio de los pesos de 20 niños y es el promedio de los pesos de una muestra de 25 niñas, calcule la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 10 Kg mayor que el de las 25 niñas. SOLUCIÓN Población 1 Niños; 1=45,46 Kg; 1=6,42 Kg Población 2 Niñas; 2=38,56 Kg; 2=5,55 Kg Las muestras de la poblaciones 1 y 2 son respectivamente: n1=20 y n2=25 Estamos ante un caso de una distribución muestral de diferencias de pesos pues se desea calcular una probabilidad de que la diferencia entre los pesos de las muestras de población 1 y de aquellos de las muestras de a población 2 sea al menos 10 kg mayor, es decir:
P X 1 X 2 10Kg
Se nos da dos poblaciones. Se computa un estadístico S1 para una muestra de tamaño n1 de la primera población y otro tanto con S2 para para la segunda población. Tomando las posibles combinaciones de las muestras de ambas poblaciones podemos obtener la distribución S1 –S2, llamada distribución muestral de diferencias:
S1 S 2 S1 S 2 S1 S 2 S21 S22 En cuanto a la variable tipificada:
Z
( X 1 X 2 ) ( 1 2 )
12 n1
22 n2
Substituyendo valores
P X 1 X 2 10 N Z 1,71 1 N Z 1,71 1 0,9564 0,0436 4,36% Z
(X 1 X 2 ) (μ1 μ2 ) σ 12 n1
σ 12 n2
10 (45,46 38,56 ) 6,42 2 5,55 2 20 25
1,7083 1,71
P X 1 X 2 10 0,0436 4,36%
Ejercicio 2 Los niveles de audiencia (en miles de personas) de una serie de televisión, medidos en 10 emisiones elegidas aleatoriamente, han sido los siguientes: 682, 553, 555, 666, 657, 649, 522, 568, 700, 552 Suponiendo que los niveles de audiencia siguen una distribución normal: a) Calcule la media y la desviación típica muestral. b) Calcular con un 95% de confianza un intervalo de confianza para la media. c) ¿Se podría afirmar que la audiencia media es de 600.000 espectadores por programa? La compañía productora del programa televisivo afirmó, durante las negociaciones para la venta del programa que este acapararía una audiencia fiel y que la desviación típica del número de espectadores sería de 15.000. d) Determine con un 95 % de confianza un intervalo de confianza para 𝜎 2 SOLUCIÓN Definimos X = «Nivel de audiencia (miles de personas)» 𝑉~𝑁(; ) a) A partir de la información„ que se suministra en el enunciado, se puede calcular la media y la desviación típica muestral: 𝑥̅ =
∑𝑛𝑖=1 𝑥𝑖 6.104 = = 610,4 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑒𝑠𝑝𝑒𝑐𝑡𝑎𝑑𝑜𝑟𝑒𝑠/𝑝𝑟𝑜𝑔𝑟𝑎𝑚𝑎 𝑛 10 𝑆2 =
2 ∑𝑛 𝑖=1 𝑥𝑖
𝑛
− 𝑥̅ 2 =
3.765.176 10
− (610,4)2 = 3.929,44 miles2
𝑆 = √𝑆 2 = √3.929,44 = 62,6852 𝑚𝑖𝑙𝑒𝑠
n 2 10 Sˆ 2 S 3.929,44 4366,044 n 1 10 1
Sˆ 2 4366,044 66,0761 miles de espectador es b) Se desea calcular un intervalo de confianza para la media. En el caso de pequeñas muestras (<30) se utiliza la distribución t de Student para el 95% de confianza es decir ˆ ˆ ˆ X tc S X tc S X tc S n n n El valor de tc se obtiene de la tabla t-Student para un P=(1-0,95)/2+0,95=1-(1-0,95)/2=0,975 y con = n-1=10-1 = 9 grados de libertad 𝑡𝑐 = 2,262|𝛼=0,975 𝜈=9
𝐼 = (610,4 − 2,262 ∙
66,0761 √10
; 610,4 + 2,262 ∙
66,0761 √10
)=
= (610,4 − 47,2647; 610,4 + 47,2647) = (563,1353 ; 657,6647) c) Contraste de hipótesis: como el valor 600 se encuentra dentro del intervalo de confianza construido, podemos decir, con un 95 % de confianza, que la audiencia media del programa es de 600.000 espectadores o, lo que es lo mismo, no se podría rechazar este hecho.
d) Se calcula el intervalo de confianza para la varianza a partir de las tablas de la distribución chi-cuadrado 2 inf
nS 2
2
2 sup ;
2 inf
(n 1) Sˆ 2
2
2 Sup
2 2 Para: 1-=0,95; =0,05, n =10 se calcula 𝜒𝑖𝑛𝑓 [/2=0.025], 𝜒𝑠𝑢𝑝 [1-/2=0,975] y =n-1=9 grados de libertad
02.025
nS 2
2
02.975;
02.025
(n 1) Sˆ 2
2
02.975
Consutando la tabla correspondiente
= 0,025 → 𝑃(2) = 0,025 → 2 = 2,70039 ≈ 2,7004 = 0,975 → 𝑃(2) = 0,975 → 2 = 19,02277 ≈ 19,0228
Chi-cuadrado =9 {
n 1 Sˆ 2 02,95
2
n 1 Sˆ 2 ; 9 4366,0444 2 9 4366,0444 I 02,05
19,0228
2,7004
2
I 2 2.065,6475 ; 14.551,3256 I 45,4494; 120,6289
2.065,6475 ; 14.551,3256
Ejercicio 3 Establecer el intervalo de confianza del 95% y del 99%, para la diferencia en las proporciones de alumnos de 2º de bachillerato que accede a la universidad procedentes de dos sistemas escolares distintos, si sabemos que:
Sistema escolar X: terminan 2º de bachillerato 600 alumnos; acceden universidad 90 alumnos.
Sistema escolar Y: terminan 2º de bachillerato 400 alumnos; acceden universidad 50 alumnos.
Ejercicio 4 Un investigador quiere estimar la media de una población usando una muestra suficientemente grande para que la probabilidad de que la media muestral no difiera de la media poblacional en más del 25% de la desviación típica sea 0,95. Hallar el tamaño de muestra necesario.
0,975 = F(0,25 √𝑛) 0,25 √𝑛 = 1,96 n > 61,46 n = 62
Ejercicio 5 La cantidad de azufre encontrado en plantas secas de mostaza, en mgr/Kg, sigue una distribución normal X. se ha observado una muestra de tamaño 9 con los siguientes resultados: 0,70
0,80
0,60
0,95
0,65
1,00
0,90
0,20
0,55
Si aceptamos como valor de σ el valor calculado de la estima insesgada de la desviación típica muestral, 𝑆̂. ¿Cuál sería el tamaño mínimo de la muestra que habría de ser considerada para que el intervalo de confianza al 95% para el nivel medio de azufre tenga una anchura inferior a 0,1 mgr/Kg? SOLUCIÓN n=9, 𝑥̅ = 0,7055; 𝑠 2 = 0,0541 𝑆̂2 =
𝑛 𝑛−1
𝑆2 =
9 9−1
0,0541 = 0,0609
𝑆̂ = 0,2468 Si aceptamos que 𝑆̂ = σ = 0,2468; la anchura del intervalo para un tamaño de muestra n de confianza al 95% es:
X zc
σ σ Anchura 2 z c n n
Cálculo de Zc: Con Tabla N(0;1) c=(1-)/2+=/2+0,5=0,95/2+0,5= 0,975 P(zZc) = c=0,975 Zc=1,96 2
Anchura 2 z c
2
σ 2 z c σ 2 1,96 0,2468 0,1 n 93,6 0,1 n 0,1
n 94
Ejercicio 6 Se sabe por experiencia que el tiempo obtenido por los participantes olímpicos de la prueba de 100 metros, en la modalidad de decathlon, es una variable aleatoria que sigue una distribución normal con media 12 segundos y desviación típica 1,5 segundos. Para contrastar, con un nivel de significación del 5%, si no ha variado el tiempo medio en la última Olimpiada, se extrajo una muestra aleatoria de 10 participantes y se anotó el tiempo obtenido por cada uno, con los resultados siguientes, en segundos: 13 12 11 10 11 11 9 10 12 11 a) ¿Cuáles son la hipótesis nula y la alternativa? b) Determine la zona de aceptación. SOLUCIÓN a) La hipótesis nula: H0 es; =12 y la hipótesis alternativa: H1 es: 12 b)
La zona de aceptación es el intervalo: z
2
n
; z 2
n
Con =12, =1,5, n=10 Con /2=0,05 Z/2=1,96 Tenemos por tanto la zona de aceptación: 1,5 1,5 ;12 1,96 12 1,96 11,0703;12,9297 10 10