Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
1.3 Teorema del Límite Central. El Teorema del límite central establece que, en condiciones muy generales, las sumas y medias de muestras aleatorias de mediciones extraídas de una población tienden a poseer una distribución aproximadamente normal. Suponiendo que lanzamos un dado equilibrado n = 1 vez. La variable aleatoria x es el número que se observa en la cara superior. Esta conocida variable aleatoria puede tomar seis valores, cada uno con probabilidad 1/6, y distribución de probabilidad se muestra en la grafica 1.4. La forma de la distribución es 3.5 plana o uniforme uniforme y simétrica simétrica respecto respecto a la media media
Grafica 1.4
0.18 0.16
Distribución de probabilidad de x, el número que aparece en la cara de un solo lanzamiento de un dado.
0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0
1
2
3
4
5
6
7
Ahora, si se considera una muestra de tamaño n = 2 de esta población; es decir, el lanzamiento de dos dados, las muestras se encuentran en la tabla 1.7. 1° Dado 2° Dado 1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
1° Dado 4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
2° Dado 1 2 3 4 5 6
Tabla 1.7
Caras superiores del lanzamiento de dos dados.
1 2 3 4 4 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Tabla 1.8
Suma de las caras superiores de dos dados.
La tabla 1.8 muestra la suma de las caras superiores de los dos dados, se muestran los 36 resultados posibles, cada uno con probabilidad 1/36. GRUPO 401C
1
Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
La tabla 1.9 muestra las sumas de las caras superiores de los dados dividida entre n = 2 para obtener un promedio. El resultado es la distribución muestral de x x i / n ,
posteriormente posteriormente estos datos datos se tabulan tabulan tabla 1.10 1.10 y aparecen aparecen en la grafica grafica 1.5. 1° Dado 2° Dado 1 2 3 4 5 6
x f i
1 1 1.5 2 2.5 3 3.5
1 1/36
2 1.5 2 2.5 3 3.5 4
1.5 2/36
3 2 2.5 3 3.5 4 4.5
4 2.5 3 3.5 4 4.5 5
2 3/36
5 3 3.5 4 4.5 5 5.5
2.5 4/36
6 3.5 4 4.5 5 5.5 6
Tabla 1.9
Promedio de las caras superiores de dos x x i / n dados.
3 5/36
3.5 6/36
4 5/36
4.5 4/36
5 3/36
5.5 2/36
6 1/36
Tabla 1.10 Distribución de probabilidad probabilidad del promedio del lanzamiento lanzamiento de dos dados.
0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0
1
2
3
4
5
Promedio de las caras superiores de dos dados
6
7
Grafica 1.5
Distribución muestral de x para n = 2 dados
Es conveniente observar la notable diferencia en la forma de la distribución muestral. Ahora su forma se parece un poco a una campana, pero todavía es simétrica respecto a la media 3.5.
GRUPO 401C
2
Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
Para n = 3 la distribución muestral de la grafica 1.6 presenta claramente la forma de campana característica de la distribución de probabilidad normal, aunque todavía está centrada en
3 .5
0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0
1
2
3
4
5
6
7
Grafica 1.6
Promedio de las caras superiores de tres dados
Distribución muestral de x para n = 3 dados
En la grafíca 1.7 salta a la vista que la distribución de x se distribuye de manera aproximadamente normal basada en una muestra tan pequeña como n = 4. Este fenómeno es el resultado de un importante teorema estadístico que se conoce como Teorema del límite central. 0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0 0
1
2
3
4
5
6
7
Grafica 1.7
Promedio de las caras superiores de 4 dados
Distribución muestral de x para n = 4
El Teorema del límite central se puede replantear para aplicarlo a la suma de las mediciones x pˆ la cual, conforme aumenta n, también tiene una distribución de la muestra
aproximadamente normal con media n y desviación estándar
n.
La contribución más importante del teorema del límite central radica en la inferencia estadística. Muchos estimadores que se usan para hacer inferencias acerca de los parámetros parámetros de la población población son sumas o promedios promedios de las mediciones mediciones de la muestra. Cuando el tamaño de la muestra es suficientemente grande, se puede esperar que estos estimadores tengan distribuciones muestrales que sean aproximadamente normales. Se puede describir entonces entonces el comportamiento comportamiento de estos estimadores en un muestro repetido y GRUPO 401C
3
Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
evaluar la probabilidad de observar ciertos resultados de la muestra por medio de la distribución normal. Estas probabilidades se calculan en términos de la variable aleatoria normal estándar. Estimador Estimador Media z Desviación e stándar El valor apropiado de n depende de la forma de la población de la que se toma la muestra y de cómo se requiera utilizar la aproximación. Sin embargo, estas pautas ayudarán:
Si la población muestreada es normal, entonces la distribución muestral de x también será normal, sin importar el tamaño de la muestra que elija. Se puede demostrar este resultado en forma teórica, pero no debe resistirse demasiado a aceptarlo sin demostración.
Cuando la población muestreada es aproximadamente simétrica, la distribución de x se vuelve aproximadamente aproximadamente normal para valores valores relativamente pequeños pequeños de n. Es importante recordar la rapidez con la que ( n = 3) la distribución “plana” en el ejemplo de los dados tomo forma de campana. Cuando la población muestreada está sesgada, el tamaño de la muestra n debe ser más grande, con por lo menos n 30 o n 30 antes que la distribución muestral de x se vuelva aproximadamente normal.
Estas pautas sugieren que, para muchas poblaciones, la distribución muestral de x será aproximadamente normal para tamaños de muestra moderados., una acepción a esta regla ocurre al muestrear una población binomial cuando p o q 1 p es muy pequeña.
¿Cómo calcular las probabilidades para la media de la muestra x ? Si se conoce que la distribución muestral de x es normal o aproximadamente normal, se puede describir el comportamiento de la media x al cual la probabilidad de observar ciertos valores de x en el muestreo repetido. 1. Se localiza y se calcula X
2. Se describe el evento de interés en términos de x , se localiza el área apropiada en la curva normal.
3. Se convierten los valores necesarios de x a valores de z por medio de : z Con reemplazo x z
n
x X
Sin reemplazo
x
z
N n
n
N 1
4. Utilizar la tabla I del apéndice I para calcular la probabilidad.
GRUPO 401C
4
Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
Ejemplo 1.11 Los resistores de cierto tipo tienen resistencias que en promedio da 200 ohms, con una desviación estándar de 10 ohms. Si se utilizan 25 de ellos en un circuito. a) Encuentre la probabilidad de que la resistencia promedio de los 25 resistores esté entre 199 y 202 ohms. b) Encuentre la probabilidad de que la resistencia promedio de los 25 resistores esté entre 197 y 201 ohms.
Solución a) Sea z =
x
la variable estandarizada donde x1 = 199 ,
200
y
n
n
10 25
z1 = 199 200 = -
= 2, con esto el valor de z 1 será
10
0.5
25
Ahora para x 2 = 202 ,
200
y
z2 =
n
=
10 25
= 2, con esto el valor de z 2 será
202 200 = 1.0 10
25 En la tabla I del apéndice I se puede encontrar que él área sombreada de la curva.
Con esto la probabilidad pedida es
P (199 x 202 ) = P (-0.5 = 0.1915 + 0.3413 = 0.5328 P (199 x
z 1.0 )
202 ) = 0.5328
GRUPO 401C
5
=
Unidad I DISTRIBUCIONES MUESTRALES
b) Sea z =
x
Paquete Didáctico
la variable estandarizada donde x1 = 197 ,
200
y
n
=
n
10 25
= 2, con esto el valor de z 1 será
z1 = 197 200 = -1.5 10
25
Ahora para x 2 = 201 ,
200 y
z2 =
n
=
10 25
= 2, con esto el valor de z 2 será
201 200 = 0.5 10 25
Con esto la probabilidad solicitada es
P (197 x 201 ) = P ( - 1.5 z 0.5 ) = 0.4332 + 0.1915 = 0.6247 P (197 x
201 ) = 0.6247
Ejemplo 1.12 Se dispone de los datos de producción de trigo por hectárea de 101 chacras. La media es 15 quintales por hectárea y la desviación estándar de de 4. Determinar la probabilidad de seleccionar una muestra de tamaño 25 con una media (muestral) menor o igual a 13.5 quintales.
Solución N 101 x 15 4 n 25
x
N n
n
N 1
4
25
P ( X 13.5) P ( Z
101 25 101 1
0.6974
13.5 15 ) P ( Z 2.15) 0.0158 0.6974
GRUPO 401C
6
Unidad I DISTRIBUCIONES MUESTRALES
GRUPO 401C
Paquete Didáctico
7
Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
Problemas que deberán resolver los alumnos
Ejercicios 1.3 1. Considere que X es la variable aleatoria que indica el número de caras y sea E el experimento que consiste en lanzar 100 veces una moneda homogénea. Utilice el teorema del límite central para estimar. x 46) a) P ( x b) P (42 x 46) c) P (64 x 75)
2. Se toman muestras de 46 observaciones de una máquina de acuñar monedas conmemorativas. El espesor promedio de las monedas es 0.24 cm, con una desviación estándar de 0.015 cm. a) ¿Es la población normal? Justifica tu respuesta. b) ¿Qué porcentaje de medias de la muestra quedarán en el intervalo 0.20 0.004 cm? c) ¿Cuál es la probabilidad de obtener la media de muestra que se desvíe más de 0.005 cm. de la media del proceso? 3. El 77% de los habitantes en la zona metropolitana viven en el D.F y el resto en el área conurbana. Si 1250 personas asisten a un concierto y esta cantidad se considera una muestra aleatoria, ¿cuál es la probabilidad de que el número de personas que viven en la zona conurbana y que asisten al concierto sea menor a 278? 4. Suponga que se selecciona una muestra aleatoria de n = 5 observaciones de una población que esta normalmente normalmente distribuida, distribuida, con una media igual a 1 y desviación desviación estándar igual a 0.36 a) Encuentra la probabilidad de que x sea mayor que 1.3 b) Encuentra la probabilidad de que la media muestral x sea menor que 0.5
GRUPO 401C
8
Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
c) Estima la probabilidad de que la media de la muestra se desvíe de la media de la población 1 por más de 0.4
5. Suponga que se elige una muestra aleatoria de n = 25 observaciones de una población normalmente distribuida, con media igual a 106 y desviación estándar igual a 12. a) Encuentra la probabilidad de que x sea superior a 110 b) Calcula la probabilidad de que la media de la muestra se desvíe de la media media de la población por no más de 4.
6. Para una población normal con media igual a 20 y desviación estándar de 4, para una muestra de tamaño 9, calcula: a) P ( X 17) b) P ( X 21.5) c) P ( X 22) d) P ( X 18.33) e) P (20.5 X 23.8) f) P (18 X 22) 7. La dieta que utiliza una granja para la engorda de pollos produce animales que pesan en promedio promedio 1950 gramos con con una desviación desviación estándar estándar de 220 gramos. Una Una franquicia franquicia de pollos rostizados rostizados ha selecciona seleccionado do al azar 30 30 pollos, calcula calcula la probabilida probabilidad d de que: a) La media del peso de los 30 pollos sea menor que 1900 gramos b) El peso medio medio sea por por lo menos de de 2 kilogramos. kilogramos. c) El peso medio este entre 1850 y 2000 gramos. 8. Según los datos del pasado, el producto promedio de trigo por acre es de 14 bushels y la desviación estándar es de cuatro, con una población de 300 bushels y una distribución normal. Cuál es la probabilidad de seleccionar una muestra de tamaño 64 con una media muestral: a) Menor o igual a 12.5 bushels? b) Mayor o igual a 15.0 bushels? c) Entre 12.5 y 15 bushels? 9. Un grupo de 100 estudiantes tiene una calificación promedio de 70 puntos con una desviación estándar de cuatro. Si se toma al azar una muestra de 16 estudiantes, ¿Cuál es la probabilidad de que la media muestral sea:
GRUPO 401C
9
Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
a) Mayor o igual a 72 puntos b) Menor o igual a 67 puntos c) Esté entre 67 y 72 puntos ¿Cómo calcular las probabilidades para la proporción muestral pˆ ?
1. Localizar los valores necesarios de n y p. 2. Comp Compro roba barr si si la la apr aprox oxim imac ació ión n nor norma mall a la la dis distr trib ibuc ució ión n bin binom omia iall ( np 5 y nq 5 ) es apropiada. 3. Describir el evento de interés en función de pˆ y localizar el área apropiada bajo la curva normal. pˆ p 4. Convertir los valores necesarios de pˆ a valores de z mediante z pˆ
Con reemplazo pˆ p z pq
Sin reemplazo pˆ p z pq N n
n
n
N 1
5. Usar la tabla I del apéndice I para calcular la probabilidad. 6. Cuando se usa la distribución normal para aproximar las probabilidades binomiales asociadas con x, se aplica una corrección de 0.5 para mejorar la aproximación. La corrección equivalente es 0.5 n
Ejemplo 1.13 En una encuesta se preguntó a 500 madres y padres acerca de la importancia de los deportes para muchachos y muchachas. muchachas. De los padres entrevistados, entrevistados, 55% estaba de acuerdo en que los géneros son iguales y deben tener las mismas oportunidades de participar en los deportes, ¿Cuál es la probabilidad de observar una proporción muestral tan grande o mayor que el valor observado pˆ 0.60 ?
Solución
GRUPO 401C
10
Unidad I DISTRIBUCIONES MUESTRALES
pˆ
Paquete Didáctico
pˆ 0.55
q 1 p
q 1 0.55 0.45
pˆ
n 500
(0.55)(0.45)
500
0.0222
0.5 0.5 0.001 n 500
P ( pˆ 0.60) P Z
(0.60 0.001) 0.55 2.20 0.0222
P pˆ 0.60 0.0139
Ejemplo 1.14 De 2000 consumidores, 40% piensa incrementar sus pedidos de lavadoras. ¿Cuál es la probabilidad probabilidad de una muestra aleatoria simple de 400 consumidores con una proporción de muestra igual o mayor a 46%? N 2000 pˆ
pˆ 0.40 pˆ
q 1 p
(0.40)(0.60)
2000 400
400
2000 1
0.021914
q 1 0.40 0.60
0.5 0.5 0.00125 n 400
n 400
P ( pˆ 0.46) P Z
(0.46 0.00125) 0.40 0.021914
2.6809
P pˆ 0.46 0.0037
GRUPO 401C
11
Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
Problemas que deberán resolver los alumnos
Ejercicios 1.4 1. En una población de familias, 20% se suscribe a la revista K. ¿Cuál es la probabilidad de seleccionar una muestra aleatoria de tamaño 225 con una proporción inferior a 16%? 2. En 1996 hubo una batalla en los tribunales, así como en el mercado entre Intel y Digital Equipment Corp. Por los avances técnicos que sustentaba el microprocesador Pentium de Intel. Digital acusó a Intel de “violación intencionada” de las patentes de Digital. Aunque el microprocesador Alfa de Digital era en ese entonces el más rápido del mercado, su velocidad sucumbió ante la influencia de la mercadotecnia de Intel. Ese mismo año, Intel abarcó 76% del mercado de microprocesadores. Suponiendo que se revisa una muestra aleatoria de n = 1000 ventas de computadoras personales y se anota el tipo de microprocesador instalado. Sea pˆ la proporción de computadoras personales con un microprocesador Pentium en la muestra. d)
¿Cuál es la probabilidad de que la proporción muestral de las PC con chips Pentium sea mayor que 80%? e) ¿Cuál es la probabilidad de que la proporción muestral de las PC con chips Pentium estén entre 75% y 86% 3. Según la revista Chance, el porcentaje promedio de dulces M&M color rojo en un paquete cualquiera de M&M es de 30% . sin embargo, este porcentaje varía, entre los diferentes tipos de dulces M&M empaquetados. Suponiendo que se selecciona al Azar un paquete de dulces M&M que contiene 55 dulces, determina la proporción de estos que son de color rojo. f) ¿Cuál es la probabilidad de que la proporción muestral de dulces rojo sea menor que 20%? g) ¿Cuál es la probabilidad de que la proporción muestral de dulces rojo sea mayor que 35%?
GRUPO 401C
12
Unidad I DISTRIBUCIONES MUESTRALES
Paquete Didáctico
h) ¿Dentro de que rango se encuentra la proporción muestral, aproximadamente del 95% de las veces? 4. Un grupo de 100 prospectos al Servicio Militar Nacional está en el sorteo; si el 40% de las bolas en la urna son blancas y el 60% son negras, calcula las siguientes probabilidades probabilidades para proporción proporción pˆ de jóvenes que serán reclutados para prácticas los fines de semana. a) P p 0.50 b) P p 0.375 c) P0.30 p 0.42 5. Considera los datos del problema 4, pero N = 4600 y n = 90, cuales será las probabilidades probabilidades de: a) P p 0.65 b) P p 0.23 c) P0.28 p 0.52
6. Se sabe que 20% de los estudiantes de una universidad está afiliados al Partido de la Revolución Democrática (PRD) Si se selecciona una muestra aleatoria de 110 estudiantes ¿Cuál es la probabilidad de encontrar 30 o más estudiantes que sean de PRD?
? En primavera deleito, en verano te refresco, en otoño te alimento y en invierno te cobijo.
El árbol
GRUPO 401C
13