Análisis Cuantitativo II II
Lilian Roxana Paredes Paredes López Lic. Est.M.Sc
PRUEBA DE HIPÓTESIS
El objetivo es dar algunos métodos que se usan para tomar decisiones sobre pobla poblacio ciones nes,, a parti partir r de los resultados de una muestra aleatoria escogida de esa se debe partir de población. Para llegar a tomar decisiones estadísticas afirmaciones o conjeturas con respecto a la población en el que estamos inte intere resa sado dos. s. Tale Tales s supo suposi sici cio ones, nes, pued puedes es ser ser verda erdade dera ras s o no. no. Una Una conj conjet etur ura a hech hecha a sobr sobre e una pobl poblac ació ión n o sobr sobre e sus sus pará arámetr metros os debe deberá rá ser ser some someti tida da a comp compro rob bació ación n expe experi rime men ntal tal c on el propósito de saber si los resultados de una muestra aleatoria extraída de esa pobl poblac ació ión, n, cont contra radi dice cen n o no tal conjetura Las hipótesis estadíst ic icas son cualquier af ir irm ac ación o conjetura que se hace acera de la distribución de una o más más pobla oblac cione ones. La afirm firma ación o conjet jetura pued uede refe referrirse rse bien a la form a o tipo de distribución de probabilidad de la población o bien referirse al valor o valores de uno o más parámetros de la distri distribu bució ción n conoc conocida ida su forma. su forma.
HIPÓTESIS NULA E HIPÓTESIS ALTERNATIVA H i p ót ót e s is is N u l a, denotada por Ho, es la prim era af irm ación que se va a som eter a prueba o compr comprob obac ació ión n expe experi rime ment ntal al para para rech rechaz azar arla la o no. no. Los Los resu result ltad ados os expe experi rime ment ntal ales es nos nos perm permit itir irá án seguir aceptándola como verdadera o si, por el contrario, debemos recha rechaza zarla rla como como tal. La aceptación de la hipótesis nula significa que los datos de la m uestra no proporcionan evidencia suficiente para refutarla. El rechazo significa que los datos de la mues muestr tra a pro proporc porcio iona nan n evidencia sufi sufici cien ente te de que que la hipó hipóte tesi sis s nula ula es falsa. es falsa. H i p ót ót e s is is A l t e rn rn a t i v a, denotada hipótesis nula es rechazada.
por H 1
ó Ha
es aquella que se acepta cuando la
Proce roced dimi imiento ento de la prueb ruebaa de hipótesis Prev Previa iame ment nte e debe debe form formul ular arse se el prob proble lema ma esta estadí díst stic ico, o, dete determi rmina narr la vari variab able le en estu estudi dio o y el método el método esta estadí díst stic ico o adec adecua uado do para para la solu soluci ción ón del del prob proble lema ma.. El proc proced edim imie ient nto o gener general al de la prueba de hipótesis de paráme parámetro tro se resu resume me en los los sig siguien uiente tes s pasos: 1 . Formular la hipótesis nula H O: = y la hipó hipóte tesi sis s alte altern rnat ativ iva a adec adecua uada da:: Ha: ó Ha : > ó Ha : < 2.
Espe Especi cifi fica carr el nive nivell de sign signif ific icac ació ión n:
3.
Sel Seleccion ionar la esta stadísti stica apr apropi opiada a usa usar en la prueba
4.
Estab tablece ecer la regl regla a de decisión, ón, determ termiinando la regi regió ón crít crítiica de la prueba la prueba
5.
Calcular el valor del estadístico de la prue ba ba a partir de los datos de la muestra.
α
Tomarr la dec decisión de rec rechaz hazar la hipót pótesi esis H O si e l valor d el el estadíst ic ico de la 6. Toma prue rueba est está en la regi región ón crít crític ica. a. En caso caso cont contra rari rio, o, no rech rechaz azar ar HO 7. Conclusión
Tip Tipos de pruebas: VALORES CRITICOS DE Z Niv Nivel de confianza Nivel Nivel de signi signific ficac ación ión (α) Para una prueba de una cola ola
90%
95%
99%
99.5%
99.8%
0.10
0.05
0.01
0.005
0.002
1.2817
1.645
2.327
2.575
2.88
Análisis Cuantitativo II
Lilian Roxana Paredes López Lic. Est.M.Sc
Para una prueba de dos colas
1.645
1.96
2.575
2.81
3.08
LOS DETALLES DEL PROCEDIMIENTO DE LAS PRUEBAS DE HIPOTESIS SE DESARROLLARA EN CLASE
PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL 1. Planteamiento de hipótesis: H0 : = 0 H0 : = 0 Ha: < 0 Ha: ≠ 0
H0 : = 0 Ha: > 0
2. Escoger el nivel de significación : α. 3. La estadística de prueba para n 30 es Z 4. La región crítica es R.C , zα
X µ0 σ / n
con distribución normal estándar.
donde z es tal que P Z zα α
5. Calculamos el estadístico de prueba
Z c
X µ0 σ / n
6. Decisión: Se decide aceptar o rechazar H 0 .Entonces se compara Z c con Z . Si Z c Zα Z ε , Z α
se rechaza H0 si Z c Zα Z ε Z α ,
no se rechaza H0 .
7. Conclusión :
EJEMPLO: 1. Un comprador de ladrillos cree que la calidad de los ladrillos está disminuyendo. De experiencias anteriores, la resistencia media al desmoronamiento de tales ladrillos es 200 kg, con una desviación típica de 10 kg. Una muestra de 100 ladrillos arroja una media de 195 kg. Probar la hipótesis, la calidad media no ha cambiado, contra la alternativa que ha disminuido.
Análisis Cuantitativo II
Lilian Roxana Paredes López Lic. Est.M.Sc
PRUEBA DE HIPOTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS En muchos problemas prácticos se está interesado en determinar si existe o no una diferencia significativa entre las medias X y Y de dos poblaciones o variables aleatorias X y Y. La prueba de hipótesis que comprenden dos medias, son las mismas que la de una sola media, salvo que se necesitan dos muestras, una de cada población. La hipótesis nula suele escribirse así, H0 : X = Y ó H0 : X - Y = 0 1. Planteamiento de hipótesis: H0 : X - Y = 0 H0 : X - Y = 0 H0 : X - Y = 0 Ha : X - Y < 0 Ha : X - Y ≠ 0 Ha : X - Y > 0 2. Escogemos el nivel de significación: 3. La estadística para la diferencia de medias poblacionales X - Y es la diferencia de medias muéstrales X Y . Si la población tiene distribución normal con desviaciones estándar σ y conocidas (o si las muestras son grandes n 30, m 30 aún cuando la población no tenga distribución normal), la distribución de X Y es normal con 2
media X - Y y varianza Z
n
x y σ
σ X µ
2
X
n X
X
2
σ Y
n
. Por lo tanto la variable aleatoria,
µ Y σ
2
Y
n Y
tiene una distribución normal estándar. 4. Región de aceptación o Rechazo.
5. Calculamos el estadístico de prueba. 6. Decisión: si x y R.C, se rechaza H o, en caso contrario se acepta. 7. Conclusión:
Análisis Cuantitativo II
Lilian Roxana Paredes López Lic. Est.M.Sc
Ejemplo. 1. 40 barras de acero fabricadas por un proceso A tiene una fuerza de ruptura media de 55, con desviación estándar muestral de 10, mientras que 38 fabricadas por un proceso B tienen una fuerza de ruptura media de 50, con desviación estándar muestral de 12. Supóngase la población de fuerzas de ruptura con la misma desviación estándar. Pruébese con nivel de significación del 5% la hipótesis que los dos procesos producen acero de la misma fuerza en contra de la posibilidad que no es así.
PRUEBAS DE HIPOTESIS RELATIVAS A PROPORCIONES Las pruebas de hipótesis con relación a proporciones son básicamente iguales a las relativas con medias. Consideremos el problema de probar la hipótesis que la proporción de éxitos en un proceso de Bernoulli (experimento binomial) es igual a un valor especifico. Es decir, queremos probar la hipótesis nula. :
=
Donde p es el parámetro de la distribución binomial. La hipótesis alternativa toma una de las siguientes formas, (a) H1 : p < po (b) H1 : p > p o prueba unilateral (c) H1 : p ≠ po prueba bilateral 1. Planteamiento de hipótesis Ho : p = p o Ho : p = p o H1 : p < po H1 : p ≠ po
Ho : p = p o Ha : p > po
2. Escoger el nivel de significación: α 3. Seleccionar el estadístico de prueba
= 4. Region de aceptación y rechazo: Para una prueba bilateral al nivel de significación α, la región critica es Z < Z α /2 ó
>
∝
2 . Para la alternativa unilateral p < po la región crítica es Z < z. Y para la alternativa p > p 0, la región crítica es Z > z 5. Calculamos el estadístico de prueba. 6. Decisión. Rechazar H0, si z pertenece a la región crítica, en otros casos acepte H0. 7.Conclusión:
Ejemplo. 1. El gerente de compras de la “Galería Minchola” , sospecha que al menos el 70% de los clientes de la tienda no están satisfechos con la atención que brindan los empleados de la galería . Para probar sus sospechas selecciona una muestra de
Análisis Cuantitativo II
Lilian Roxana Paredes López Lic. Est.M.Sc
500 clientes y encuentra que el 75% está insatisfecho con el servicio que brindan los empleados de la tienda. ¿Tiene razón el gerente?, use ∝ =0,01
PRUEBA DE HIPOTESIS PARA LA DIFERENCIA ENTRE DOS PROPORCIONES En este caso la hipótesis nula toma la forma H0: p1 - p2 = 0 La hipótesis alternativa toma una de las siguientes formas; p1 < p 2 ó p 1 > p 2 ó p 1 p2. Los parámetros p1 y p 2 son las proporciones de éxitos de las dos poblaciones bajo estudio. La estadística de prueba en la cual se base los criterios de decisión, es la variable aleatoria
p1 p2 que tiene una distribución aproximadamente normal cuando las muestras son grandes y la variable aleatoria. Para probar hipótesis de dos proporciones, cuando las muestras son grandes, se siguen los pasos siguientes; 1. Planteamiento de hipótesis: H0 : p1 = p2 Ha : p 1 < p 2
H0 : p 1 = p 2 H a : p1 ≠ p 2
H0 : p1 = p2 Ha : p1 > p2
2. Escoger un nivel de significación: 3. Selección del estadístico de prueba: =
̂ − ̂
− (
−
)
+
4. Región de Aceptación y Rechazo Z < - z, para la hipótesis alternativa p1 < p2 Z < - z, = z1- para la hipótesis alternativa p1 > p2 Z < - z/2 ó Z < - z/2 = z/2 para la hipótesis alternativa p1 p2 5 . Calculamos el estadístico de prueba =
̂ − ̂
− (
−
)
+
6. Decisión: Rechazar H0, si z pertenece a la región crítica; en otro caso aceptar H0. 7. Conclusión:
Ejemplo. 1. Una firma fabricante de cigarrillos distribuye dos marcas de cigarrillos. En una encuesta se encuentra que 56 de 200 fumadores prefieren la marca A y que 29 de 150 fumadores encuestados prefieren la marca B. ¿Se puede concluir al nivel de significación 0.06 que la marca A se vende más rápidamente que la merca B?
Análisis Cuantitativo II
Lilian Roxana Paredes López Lic. Est.M.Sc
PRACTICA DE PRUEBA DE HIPÓTESIS 1.
El organismo de control de cierto Concejo Municipal analiza una muestra de 36 paquetes de carne molida que produce la fábrica de embutidos “La única”. El rótulo en cada paquete dice: “contiene no más de 25% de grasa”. ¿Puede el organismo de control concluir que la carne que produce dicha fábrica tiene más de 25% de grasa, si la muestra da un contenido medio de grasa de 0,265 y una desviación estándar de 0,030? Use ∝=0,05.
2.
Las normas establecidas por las instituciones gubernamentales señalan que las cervezas de 620 ml no pueden contener más de 2mg/litro de alcohol .Para averiguar si están excediendo dicho límite , se selecciona una muestra de 300 botellas de 620 ml de cierta empresa y se encuentra que la media y la desviación estándar del contenido de alcohol por botella son 2,2 miligramos y 0,5 miligramos, respectivamente.(use un nivel de significación de 0,1)
3.
Una planta minero metalúrgica ha producido un promedio diario de 950 toneladas de mineral durante los últimos años. Al gerente de producción le gustaría saber si este promedio ha cambiado en los meses recientes. Se selecciona al azar 70 días de la base de datos y calcula la media aritmética y la desviación estándar de la producción en los 70 días resultando una media de 1000 toneladas y una desviación estándar de 120 toneladas. Pruebe la hipótesis apropiada con un nivel de significancia de 0,01.
4.
Un médico obstetra afirma que últimamente el porcentaje de embarazadas con anemia se ha incrementado, y supera el 30%. Con la finalidad de probar su afirmación selecciona aleatoriamente 300 embarazadas y encuentra que 100 de ellas presentan anemia. ¿Con un nivel de significación del 5%, se puede verificar que la afirmación del investigador es correcta?
5.
Los resultados de la última encuesta realizada por “Soporte en decisiones” arrojan que sólo el 10% votarían por candidato presidencial del partido “El anti imperialista”. El líder de este partido protesta por este resultado y afirma que las encuestas están siendo manipuladas para perjudicarlo y para demostrarlo ordena que los integrantes de su partido contraten un estadístico independiente para que dirija una encuesta a nivel nacional, con el fin de demostrar que la intención de voto a su favor es mucho mayor. El estadístico realiza una selección de 3000 votantes de un total de 16 900 000 y encuentra que 290 votaran por el candidato del partido “El anti imperialista” ¿Tiene razón el candidato del partido “El anti imperialista”?, use α = 0.02.
6.
El jefe del INEI afirma que la pobreza en el Perú ha disminuido y que actualmente se encuentra alrededor del 51%. Los especialistas en temas económicos no están de acuerdo con esa cifra y una universidad, con la finalidad de demostrar lo contrario selecciona aleatoriamente a 1500 familias a nivel nacional de un total de 12 000 000 y encontró que el 56% vivían en situación de pobreza. ¿Tiene razón el jefe del INEI? Use α=0.05.
Análisis Cuantitativo II 7.
Lilian Roxana Paredes López Lic. Est.M.Sc
Un fabricante desea comparar la tensión promedio de sus hilos con la de su más cercano competidor. S e observaron las tensiones de 60 hilos del fabricante y 80 hilos del competidor, y se obtuvo una tensión promedio igual a 105,5 N y desviación estándar igual a 12 en los hilos del fabricante, y una tensión promedio de 103 N y una desviación estándar igual a 15 e n los hilos de la competencia. ¿Existen suficientes evidencias para afirmar que hay diferencias significativas entre las tensiones de los hilos del fabricante y la competencia? Use α =0.1.
8.
Un informa estadístico indica entre otras cosas que el nivel de aptitud de los postulantes hombres y mujeres a la policía nacional son iguales en promedio, y cada una se distribuye en forma normal con
= 8,
= 7
respectivamente. Si dos muestras aleatorias de tamaños 20 y 25 escogidas de las poblaciones definidas, dieron los niveles promedios de aptitud 200 y 205 respectivamente, ¿Cree Ud. a nivel de significación 1%, que las medias de las 2 poblaciones son distintas?
9.
El actual presidente de la república y presidente a su vez del partido “Juro por los pobres”, afirma que el porcentaje de familias en extrema pobreza ha disminuido en alrededor del 5% con respecto a las familias en extrema pobreza que habían en el anterior gobierno, que dicho sea de paso fue dirigido por el partido “Honradez”. Una institución no gubernamental con la finalidad de verificar la afirmación del actual presidente, seleccionó dos muestras de familias de forma independiente, en la primera muestra de un total de 600 familias encontró que 320 vivían en extrema pobreza durante el pasado gobierno y en la segunda muestra de un total de 700 familias encontró que 360 vivían en extrema pobreza en la actualidad. ¿Existen suficientes evidencias que avalan la afirmación del presidente de la república? Use α=0.05.
10. Un financista afirmó el año pasado que existía una mayor probabilidad que una empresa de la región norte
obtenga utilidades al finalizar el año que una empresa de la región sur. Para corroborar su afirmación, al final del año pasado, selecciono una muestra aleatoria de 50 empresas de la región norte y encontró que 40 de ellas obtuvieron ganancias, y en una muestra de 90 empresas de la región sur encontró que 70 de ellas obtuvieron ganancias. ¿Qué puede decir acerca de la afirmación del financista a un nivel de significación del 10%?
Análisis Cuantitativo II
Lilian Roxana Paredes López Lic. Est.M.Sc