Misión Formar profesionales líderes competentes, con visión humanista y pensamiento crítico a través de la Docencia, la Investigación y la Vinculación, que apliquen, promuevan y difundan el conocimiento respondiendo a las necesidades del país.
Visión La Universidad Técnica de Ambato por sus niveles de excelencia se constituirá como un centro de formación superior con liderazgo y proyección nacional e internacional.
Misión Formar profesionales líderes competentes, con visión humanista y pensamiento crítico a través de la Docencia, la Investigación y la Vinculación, que apliquen, promuevan y difundan el conocimiento respondiendo a las necesidades del país.
Visión La Universidad Técnica de Ambato por sus niveles de excelencia se constituirá como un centro de formación superior con liderazgo y proyección nacional e internacional.
MISIÓN La Facultad de Contabilidad y Auditoría formará profesionales líderes competentes, con visión humanista y pensamiento crítico a través de la Docencia, la Investigación y la Vinculación, que apliquen, promuevan y difundan el conocimiento respondiendo a las necesidades del país.
VISIÓN La Facultad de Contabilidad y Auditoría como parte de la Universidad Técnica de Ambato por sus niveles de excelencia se constituirá como un centro de formación superior con liderazgo y proyección nacional e internacional.
Contenido 1.
Distribuciones de probabilidad discreta ....................................................................................... 6 1.1.
Propiedades de la distribución de probabilidad discreta ................................................... 6 ..................................................................................................................................... 7
2.
Valor esperado y varianza ............................................................................................................. 9 2.1.
Valor esperado E(x); u ........................................................................................................... 9 ................................................................................................................................... 10
3. Distribución de probabilidad Binomial .......................................................................................... 19 3.1.
Propiedades de un experimento binomial ........................................................................... 19
3.2.
Formula de la distribución binomial .................................................................................. 19
3.3.
Medidas de la distribución binomial .................................................................................. 20 ................................................................................................................................... 20
4.
Distribución de Poisson ................................................................................................................ 31 ................................................................................................................................... 31
5.
Distribución de Probabilidad Normal ........................................................................................ 36 5.1.
Distribución normal o campana de Gauss ......................................................................... 36
5.2.
Función de densidad de distribución normal..................................................................... 36
5.2.1. 5.3.
Características de la distribución normal ...................................................................... 36 Distribución normal estándar ............................................................................................. 37 ................................................................................................................................... 37
6.
Aproximación Normal de las Probabilidades Binomiales............................................................... 52 ................................................................................................................................... 52
7.
ESTADISTICA INFERENCIAL ................................................................................................ 57
8.
Muestreo ........................................................................................................................................ 58
Es todo el grupo de personas de quien el investigador necesita tener información. .............................. 58
8.1.
Pasos para desarrollar un plan de muestreo ...................................................................... 58 ................................................................................................................................... 60
8.2.
Muestreo aleatorio sistemático ............................................................................................. 65 ................................................................................................................................... 65
8.3.
Muestreo aleatorio Estratificado .......................................................................................... 66
Estimación Puntual ................................................................................................................................. 67 PRUEBAS ......................................................................................................................................... 69 8.1 Error de Muestreo ....................................................................................................................... 71
9.
Distribución muestral de la ..................................................................................................... 71 ................................................................................................................................... 72
10.
Distribución Muestral de ........................................................................................................ 78 Aplicaciones ................................................................................................................................... 79
11.
Estimación por intervalos ........................................................................................................... 86 APLICACIONES ................................................................................................................................ 86
12.
CONTRASTE DE HIPOTESIS ........................................................................................................ 93
12.1. Hipótesis Nula ........................................................................................................................... 94
12.2. Hipótesis Alternativa ................................................................................................................. 94 12.3.
Valor crítico del estadístico de prueba. Regiones .............................................................. 95
12.4.
Coeficiente/Nivel de Significancia: ..................................................................................... 96
12.5.
TIPOS DE ERROR ................................................................................................................. 97
12.2. PRUEBAS PARAMETRICAS – MUESTRAS GRANDES ................................................................... 97
Aplicaciones ................................................................................................................................. 100 13.
VALOR P ................................................................................................................................... 108
14. PRUEBA DE HIPOTESIS CUANDO NO SE CONOCE LA DESVIACION POBLACIONAL (Muestras Pequeñas) ............................................................................................................................................. 111
Aplicaciones ................................................................................................................................. 111 15.
ESTADISTICO DE PRUEBA EN LA PRUEBA DE HIPOTESIS PARA LA PROPORCION POBLACIONAL 119
Aplicaciones: ................................................................................................................................ 119 DISTRIBUCION DE DIFERENCIAS ENTRE DOS MEDIAS MUESTRALES (X1; X2) CONOCIENDO
130
Aplicaciones ................................................................................................................................. 130 DISTRIBUCION DE DIFERENCIAS ENTRE DOS PROPORCIONES MUESTRALES (P1; P2) ......................... 131 Aplicaciones .................................................................................................................................. 132 DISTRIBUCION DE DIFERENCIAS ENTRE DOS MEDIAS MUESTRALES CON DATOS MENORES A 30 “t” 139 Aplicaciones .................................................................................................................................. 139 ENSAYO DE HIPOTESIS EJEMPLO DE HIPOTESIS CON TRES VARIABLES ............................................... 141
1. Distribuciones de probabilidad discreta LA distribución de probabilidad discreta de una variable aleatoria describe como se distribuyen las probabilidades entre los valores de la variable aleatoria. En el caso de una variable aleatoria discreta que lo vamos a simbolizar (x). La distribución de probabilidad está definida por una función de probabilidad y vamos a denotar f(x). La función de probabilidad f(x) da la probabilidad de cada valor de la variable aleatoria. La distribución de probabilidad, indica la probabilidad de cada valor de una variable que está determinada por el azar, hay que saber distinguir entre los resultados que pueden ocurrir al azar y los “pocos comunes” en el sentido de que no tiene probabilidad de ocurrir al azar.
(Triola, 2009) Una variable aleatoria discreta tiene un número finito de valores o un número de valores contables, donde “contable” se refiere al hecho de que podría haber un número infinito de
valores, pero pueden asociarse con un proceso de conteo. (Triola, Estadistica , 2013)
1.1.
Propiedades de la distribución de probabilidad discreta a)
b)
≥0 1
1. La empresa TOYOTA (Carlos Larrea) tiene una venta de automóviles durante los últimos 300 días de operación. Los datos de ventas muestran que hubo 54 días en los que no se vendió ningún automóvil, 117 días en los que se vendió 1, 72 días en los que se vendió 2, 42 días en los que se vendió 3, 12 días en los que se vendió 4 y 3 días en los que se vendió 5. El experimento se realiza para 1 día de operación. Calcular la distribución de la probabilidad. X = # Autos x
F(x)
0
54/300
= 0.18
1
117/300
= 0.39
2
72/300
= 0.24
3
42/300
= 0.14
4
12/300
= 0.04
5
3/300
= 0.01 1
Ejercicios consultados
1. Describe, mediante una tabla x p la distribución del “número de caras” al lanzar 3 monedas. x
F(x)
0
1/8
= 0.13
1
3/8
= 0.38
2
3/8
= 0.38
3
1/8
= 0.13 1
2. En una lotería de 1000 números se reparten los premios siguientes:
A un número elegido al azar, 5000
Al anterior y al posterior, 1000
A los 99 que terminan en la misma cifra que el ganador, 10
Al resto de números nada x
F(x)
0
898
= 0.898
10
99
= 0.099
1000 2
= 0.002
5000 1
= 0.001
1000
1
3. Un profesor de idiomas tiene una clase con cuatro alumnos adultos. De los 100 días de clase, asisten 4, 3, 2, 1 o ninguno de ellos, calcular la distribución de la probabilidad. x
F(x)
0
3
= 0.03
1
9
= 0.09
2
17
= 0.17
3
48
= 0.48
4
23
= 0.23
100
1
4. Un jugador de básquet está a punto de tirar hacia la parte superior del tablero. La probabilidad de anotar o no anotar es: x
F(x)
0
1/2
0.50
1
1/2
0.50
+
1
5. Un jugador lanza un dado corriente. Si sale 1 o número primo, gana tantos cientos de euros como marca el dado, pero si no sale número primo, pierde tantos cientos de euros como marca el dado. Determinar la función de probabilidad y la esperanza matemática del juego X
F(X)
+100
1/6
0.16667
+200
1/6
0.16667
+300
1/6
0.16667
-400
1/6
0.16667
+500
1/6
0.16667
-600
1/6
0.16667
2. Valor esperado y varianza 2.1.
Valor esperado E(x); u
El valor esperado es un promedio ponderado de los valores que toma la variable aleatoria. Los pesos son las probabilidades. Es la media de una variable aleatoria discreta, es el resultado medio teórico de un número infinito de ensayos. Podemos considerar a esa media como el valor esperado, en el sentido de que constituye el valor promedio que esperaríamos tener si los ensayos pudieran continuar de manera indefinida. (Triola, 2013)
ó∶ 2.2. Varianza Var(x) Es un promedio ponderado de los cuadrados de las desviaciones de una variable aleatoria con respecto de su medida. Los pesos son las probabilidades
Fórmula:
La varianza es una medida estadística que cuantifica el nivel de dispersión o variabilidad de los valores de la variable aleatoria alrededor de la media. (Ojeda, 2007)
1) Calcular el valor esperado y la varianza del ejercicio anterior X
F(x)
x f(x)
0
54/300
= 0.18 0
2.25
* 0.18 = 0.405
1
117/300
= 0.39 0.39
0.25
* 0.39 = 0.0975
2
72/300
= 0.24 0.48
0.25
* 0.24 = 0.06
3
42/300
= 0.14 0.42
2.25
* 0.14 = 0.315
4
12/300
= 0.04 0.16
6.25
* 0.04 = 0.25
5
3/300
= 0.01 0.05
12.25
* 0.01 = 0.1225
. .
1
(x-u)^2 f(x)
1.5
1.25
2) Una ambulancia de voluntarios realiza de 0 a 5 servicios por día. A continuación se representa la distribución de probabilidad. x
F(x)
x f(x)
(x-u)^2 f(x)
0
0.10
0
0.3553
1
0.15
0.15
0.3154
2
0.30
0.60
0.0608
3
0.20
0.60
0.0605
4
0.15
0.60
0.3604
5
0.10
0.50
0.6503
1.00
2.45
1.8027
. .
Calcular el valor esperado del número de servicios y la desviación típica. x
F(x)
x f(x)
(x-u)^2 f(x)
0
0.10
0.00
6.0025
*
0.10
=
0.6003
1
0.15
0.15
2.1025
*
0.15
=
0.3154
2
0.30
0.60
0.2025
*
0.30
=
0.0608
3
0.20
0.60
0.3025
*
0.20
=
0.0605
4
0.15
0.60
2.4025
*
0.15
=
0.3604
5
0.10
0.50
6.5025
*
0.10
=
0.6503
1.00
2.45
2.0475
2.45 2.0475
Desviación = 1.4310
# Casas #Recamaras Rentadas
Propias
0
547
23
1
5012
541
2
6100
3832
3
2644
8690
4
557
3783
3) Los datos siguientes son el número de recamaras en casas rentadas y en casas propias de la provincia de Tungurahua. Los datos se representan en la siguiente tabla.
Elabore una distribución de probabilidad
Calcule el valor esperado y la varianza del número de recamaras en casas rentadas
Calcule el valor esperado y la varianza del número de recamaras en casas propias
# Casas #
Rentadas Propias Rentadas Propias E(X)
Recamaras
(X)
(Y)
E(Y)
Var (x)
Var(y)
0
547
23
0.0368
0.0014
0.0000 0.0000 0.1249
0.0117
1
5012
541
0.3373
0.0321
0.3373 0.0321 0.2391
0.1193
2
6100
3832
0.4105
0.2272
0.8210 0.4543 0.0102
0.1960
3
2644
8690
0.1779
0.5151
0.5338 1.5454 0.2386
0.0026
4
557
3783
0.0375
0.2243
0.1499 0.8970 0.1746
0.2573
14860
16869
1.00
1.00
1.842
0.5869
1.842 0.7874
2.929
0.7874
2.292 0.5869
4) La NBA lleva diversas estadísticas de cada equipo. 2 se refieren al % de tiros de campo hechos por un equipo, y él % de tiros de 3ptos hechos por un equipo. En parte de la temporada del 2004 el registro de tiros de 2ptos el registro de tiros de los 29 equipos de la NBA indicaba que la probabilidad de anotar 2ptos en un tiro de campo era 0.44 y que la probabilidad de anotar 3ptos en un tiro de campo era de 0.34 a) ¿Cuál es el valor esperado para un tiro de 2ptos de estos equipos?
.
x
F(x)
x f(x)
(x-u)^2 f(x)
0
0.56
0.00
0.4337
2
0.44
0.88
0.5519
0.88
=0.9856
5) Supóngase que se tiene una moneda normal y el jugador tiene tres oportunidades para que al lanzarla aparezca una cara. El juego termina en el momento en el que cae una cara o después de 3 intentos, lo que suceda primero. Si en el primero, segundo o tercer lanzamiento aparece cara el jugador recibirá $2, 4$ y 8$
respectivamente. Si no cae cara en ninguno de los 3 lanzamientos, pierde $20. Para determinar la ganancia o pérdida promedio después de un número muy grande de juegos, sea x la variable aleatoria que representa la cantidad que se gana o se pierde cada vez que se juega. Calcule el valor esperado. x
F(x)
E (x)
2
1
/
2
=
0.50
1.00
4
1
/
4
=
0.25
1.00
8
1
/
8
=
0.13
1.00
-20
1
/
8
=
0.13
-2.50
1.00
0.50
Ejercicios consultados
1. Dos vendedores de seguros de vida, A y B, visitan de 8 a 12 clientes potenciales por semana, respectivamente. Sean ‘X’ y ‘Y’ dos variables aleatorias que representan el número de sentidos seguros vendidos por A y B, como resultado de las visitas. Con base en una gran cantidad de información pasada, las probabilidades para los valores de ‘X’ y ‘Y’ son los siguientes: Calcule el valor esperado. X
F(x)
x f(x)
0
0.02
0.00
1
0.09
0.09
2
0.21
0.42
3
0.28
0.84
4
0.23
0.92
5
0.12
0.60
6
0.04
2.87
7
0.01
5.74
8
0.00
11.39
E(x)
22.87
2. La distribución de probabilidad de reclamaciones por daños pagados de la compañía XYZ en seguros contra choques se muestra en la siguiente tabla
Emplee el pago esperado por choque para determinar la prima de seguro contra daños que permitiría a la empresa salir sin perdidas
La aseguradora cobra una tarifa anual de 260.00 por cubrir los choques. ¿Cuál es el valor esperado del seguro contra choques para un asegurado?
x
F(x)
x f(x)
0
0.90
0.00
400
0.04
16.00
1000 0.03
30.00
2000 0.01
20.00
4000 0.01
40.00
6000 0.01
60.00
1.00
166
3. Se ha obtenido la siguiente tabla de distribución de probabilidad para el número de llamadas telefónicas llegadas a una ventral en un milisegundo. Calcular el valor esperado y la varianza X
F(x)
x f(x)
(x-u)^2 f(x)
0
0.37
0.00
0.3626
1
0.37
0.37
0.0000
2
0.18
0.36
0.1836
3
0.06
0.18
0.2424
4
0.02
0.08
0.1812
1.00
0.99
0.9699
E(x): 0.99 Varianza: 0.9699
4. Se desea comprar una acción y mantenerla durante un año en espera de que exista ganancia de capital. Se requiere elegir entre dos empresas A y B; para ambas el precio de venta de cada acción es de 10.000 pesetas, obteniéndose unos dividendos de 500 pesetas. A continuación se presentan las distribuciones de probabilidad para el precio en el próximo año estimado para cada tipo de acción. Calcular los precios esperados por acción de las empresas A y B X
F(x)
x f(x)
(x-u)^2 f(x)
2,500
0.05
125.00
169650625 * 0.05
= $8,482,531.25
5,000
0.07
350.00
110775625 * 0.07
= $7,754,293.75
7,500
0.10
750.00
64400625
* 0.10
= $6,440,062.50
10,000 0.05
500.00
30525625
* 0.05
= $1,526,281.25
12,500 0.10
1250.00
9150625
* 0.10
= $915,062.50
15,000 0.15
2250.00
275625
* 0.15
= $41,343.75
17,500 0.12
2100.00
3900625
* 0.12
= $468,075.00
20,000 0.10
2000.00
20025625 * 0.10
= $2,002,562.50
22,500 0.12
2700.00
48650625 * 0.12
= $5,838,075.00
25,000 0.14
3500.00
89775625 * 0.14
= $12,568,587.50
15525.00
Var(x)
$46,036,875.00
5. Se ha hallado la distribución de probabilidad de que un número determinado de máquinas de una fábrica pusieran fallar en un día. Las probabilidades para 0, 1, y 2 máquinas fallidas son: 0.3, 0.6, y 0.1 respectivamente. Calcule la varianza y el valor esperado. x
F(x)
x f(x)
(x-u)^2 f(x)
0
0.30
0.00
2.56 * 0.30
= 0.77
1
0.60
0.60
0.36 * 0.60
= 0.22
2
0.10
0.20
0.16 * 0.10
= 0.02
1.00
0.80
2.56 * 1.00
= 2.56
1.60
Var(x)
3.56
E(x)= 1.60
6. Un analista de marketing asocia la siguiente distribución probabilística a las ventas mensuales X de un determinado ordenador. Calcule la varianza. Y el valor esperado. x
F(x)
x f(x)
(x-u)^2 f(x)
0
0.02
0.00
13.84 * 0.02
= 0.28
1
0.08
0.08
7.398 * 0.08
= 0.59
2
0.15
0.30
2.958 * 0.15
= 0.44
3
0.19
0.57
0.518 * 0.19
= 0.10
4
0.24
0.96
0.078 * 0.24
= 0.02
5
0.17
0.85
1.638 * 0.17
= 0.28
6
0.10
0.60
5.198 * 0.10
= 0.52
7
0.04
0.28
10.76 * 0.04
= 0.43
8
0.01
0.08
18.32 * 0.01
= 0.18
1.00
3.72
Var(x)
2.84
E(x)= 3.72
7. En la producción de un artículo se aplica soldadura y para eso se usan tres diferentes robots. La probabilidad de que la soldadura sea defectuosa varía para cada uno de los robots, así como la proporción de artículos que cada uno procesa, de acuerdo a la siguiente tabla: calcule la varianza. Art. x
Procesados F(x)
x f(x)
(x-u)^2 f(x)
1
18%
0.18
0.180
1.488 * 0.18
= 0.27
2
42%
0.42
0.840
0.048 * 0.42
= 0.02
3
40%
0.40
1.200
0.608 * 0.40
= 0.24
1
1.00
2.22
Var(x)
0.53
PRUEBAS
1) La demanda de un producto, por parte de Industrias Caroline, varía enormemente de mes a mes. La distribución de probabilidad que se presenta en la tabla siguiente, basada en los datos de los dos últimos años, muestra la demanda mensual de la empresa. Probabilidad
300
0,20
60
400
0,30
120
500
0,35
175
600
0,15
90
1,00
445
Demanda Unitaria(x)
a) Si la empresa basa las órdenes mensuales en el valor esperado de la demanda mensual, ¿Cuál será la cantidad ordenada mensualmente por la empresa para este producto? Valor Esperado
Ε445
b) Suponga que cada unidad demandada genera $70 de ganancia y que cada unidad ordenada cuesta $50. ¿Cuánto ganará o perderá la empresa en un mes si coloca una orden con base en su respuesta al inciso a y la demanda real de este artículo es de 300 unidades? Utilidad o pérdida de la empresa:
Valor esperado ×Costo de unidad ordenada445 ×$ 50$ 22.250 Valor de demanda real ×Costo de unidad demandada 300 ×$ 70$ 21.000 $ 21.000 ×$ 22.2501.250
2) Según una encuesta, 95% de los suscriptores de The Wall Street Journal Internacional Edition tiene una computadora en casa. Para esos hogares, se dan las distribuciones de probabilidad para computadoras portátiles y de escritorio. a) ¿Cuál es el valor esperado de la cantidad de computadoras por familia para cada tipo? b) ¿Cuál es la varianza de la cantidad de computadoras por familia para cada tipo?
Probabilidad
#
computadoras Portátil
De
Portátil De
escritorio
Portátil De
escritorio
escritorio
0
0,47
0,06
0,00
0,00
0,1865
0,1210
1
0,45
0,56
0,45
0,56
0,0616
0,0988
2
0,06
0,28
0,12
0,56
0,1126
0,0942
3
0,02
0,10
0,06
0,30
0,1123
0,2496
1,00
1,00
0,63
1,42
0,473
0,5636
VALOR ESPERADO Portátil
Ε0,63 Ε1,42 0,473 0,5636
De escritorio
VARIANZA Portátil
De escritorio
3. La NBA saca una estadística de 29 equipos en donde la probabilidad de hacer una canasta de 2 puntos es de 0,51 y la probabilidad de hacer una canasta de 3 puntos es de 0,28. a) ¿Cuál es el valor esperado para un tiro de 3 puntos de estos equipos?
Puntos
Probabilidad
0
0,72
0,00
0,28
0,84
1,00
0,84
3
Valor Esperado en un tiro de 3 puntos
Ε 0,84 3. Distribución de probabilidad Binomial Es una distribución de probabilidad binomial discreta y está relacionada con un experimento de pasos múltiples, al que se le llama experimento binomial. Si P es la probabilidad de que un solo ensayo ocurra un evento (llamado la probabilidad de éxito) y q=1-p es la probabilidad de que este evento no ocurra en un solo ensayo ( llamado probabilidad de fracaso). (Murray & Larry, 2009)1 1) El experimento consiste en una serie de n ensayos idénticos 2) En cada ensayo hay 2 resultados posibles el éxito y el fracaso 3) La probabilidad de éxito (p), no cambia de un ensayo a otro en consecuencia, la probabilidad de fracaso (q) es 1-p, tampoco cambia de un ensayo a otro 4) Los ensayos son independientes
3.2.
Formula de la distribución binomial
−
(x) = probabilidad de éxitos en n ensayos
= combinación
1
(Murray & Larry, 2009)
! ó: !! n = número
de ensayos
p = probabilidad de éxito q = probabilidad de fracaso
Lanzamiento de una moneda 5 veces
Ensayos
1
2
3
4
5
Resultados X
S
S
X
X
n=5
3.3. Medidas de la distribución binomial Dentro de la distribución binomial tenemos las siguientes medidas. Media
u= N.P
Varianza
Var(x) = N.p.q
Coeficiente de sesgo Coeficiente de curtosis
∝ .. ∝ 316. . .
1) Hallar la probabilidad de que al lanzar una moneda 3 veces, aparezca a) 3 caras b) 2 caras c) 1 cara d) 3 cruces
1⁄8 3⁄8 3⁄8 1⁄8
e) Probabilidad de obtener por lo menos 1 cara n=3
x = # caras
p = 0.5
q = 0.5
3 1 1⁄8 1 3 1⁄8
2 3 14 1⁄2 2 3⁄8
13 12 1⁄4 1 3⁄8 ≥ ≥110,1 25
01 1⁄8 1 0 1⁄8
a)
b)
c)
d)
e)
0.875
2) Hallar la probabilidad de que al lanzar un dado 5 veces aparezca 3 x=0
n= 5
a) Ninguna vez
5 1 5 0 06 6
p= 1/6
q= 5/6
0 1∗1∗0. 4 019 0 0.4019
00.5981
b) Al menos una vez
≥1 10 ≥110.4019 5 1 5 4 46 6 4 50.0008 40.0033 c) Cuatro veces
d) Calcular la probabilidad de
obtener por lo menos tres veces
3 1[0 1 2] 3 10.40190.4019 0.1609 3 0.0353
3) El 5% de los camioneros del Ecuador son mujeres. Suponga que se selecciona al azar 10 camioneros, para una encuesta acerca de las condiciones de trabajo
n= 10
p= 0.05
q= 0.95
a) ¿Cuál es la probabilidad de que 2 de los camioneros sean mujeres?
21000.050.95 2450.0025 0.9025 2 0.1015 b) Todos sean hombres
0 100 0.050.95 0110.5987
0 0.5987 c) Al menos 1 mujer
1 [ 0] 1 [ 0.5987] 0.5987 4) Hallar la probabilidad de que en una familia con 4 hijos haya: n= 4
p= 0.5
q= 0.5
a) Al menos 1 hombre
≥ 1 1 2 3 4 ≥ 1 0.250.37500.250.0625 ≥ 1 0.9375 ≥ 1 1[0 0] ≥ 1 10.06250.0625 625 ≥ 1 0.8750 b) Al menos 1 hombre y 1 mujer
5) De entre 2000 familias con 4 hijos. ¿Cuántos sabe esperar que tengan? n= 2000
a) Al menos 1 hombre
. 2000 0.9375 1875 . 2000 2000 0.37575 b) 2 hombres
p= 0.5
q= 0.5
750 . 2000 2000 0.0625 625 125
c) Ninguna mujer
6) Si el 20% de los pernos producidos por una maquina son defectuosos, determinar la probabilidad de que entre 4 pernos elegidos al azar n=
4
p=
0.20
q=
a) 1 sea defectuoso
1 41 0.2000.800 1 0.4096 0 40 0.2000.800 0 0.4096 ≥ 2 0 1 2 ≥ 2 0.4096 0.4096 0.1636 ≥ 2 0.9828 b) Ninguno sea defectuoso
c) A lo mucho 2 sean defectuosos
d) 3 sean correctos n= 4
p=0.8
3 43 0.8000.200
q= 0.2
x= 3
0.80
3 4 0.5120 1200.0.200 3 0.4096 7) El 40% de las personas que viajan por negocio, llevan un teléfono celular o una computadora portátil. En una muestra de 15 personas n= 15
p= 0.40
q= 0.60
a) ¿Cuál es la probabilidad de que por lo menos 5 tengan 1 teléfono celular o portátil?
≥ 5 1[ 1[0 1 2 3 4] ≥ 5 10.00050.00470.02190.06340.1268 ≥ 5 0.7827 b) ¿Cuál es la probabilidad de que 12 de los viajeros no tengan ni celular ni portátil? n= 15
p= 0.40
q= 0.60
x= 3
3 153 0.4000.600 3 455 455 0.0640 6400.0.0022 022 3 0.0641 c) ¿Cuál es la probabilidad de x<2 tengan un teléfono celular o portátil?
< 2 0 1 < 2 0.0050.0047 < 2 0.0052 Ejercicios consultados
1. Una institución universitaria establece nuevos métodos de aprendizaje y de evaluación con el resultado donde el 85% de alumnos aprueban todas las asignaturas. Supongamos que se seleccionan 8 estudiantes de dicho plantel.
a) Cuál es la probabilidad de que 3 aprueben n= 8
x=3
p=0.85
q=0.15
p=0.15
q=0.85
3830.850.15 356∗0.6141∗0.000076 3 0.0028
b) De que tres pierdan n= 8
x=3
3 83 0.150.85 3 56∗0.0034∗ 0.4437 30.0845
0800.150.85 01∗1∗0. 2 725 00.2725
c) Por lo menos 2 pierdan alguna asignatura n= 8
x≥2
p=0.15
q=0.85
≥21[01] ≥2 10.27250.3847 ≥210.6572 ≥20.3428
1810.150.85 18∗0.15∗0.3206 10.3847
2. Supongamos el lanzamiento de 12 monedas o una moneda lanzada 12 veces. ¿Cuál es la probabilidad de obtener? a) Exactamente 4 caras X= 4 caras
n=12
p=1/2
4 124 0.500.50 466∗0.00098∗0.25 4 0.0162
q= ½
b) Exactamente 10 caras X= 10 caras
n=12
p=1/2
q= ½
1012100.500.50 4 660.000980.25 4 0.0162 ≥21[01] ≥2 1 [0.00020.0028] ≥2 10.0032 ≥20.9968 ≤91[101112] ≤9 1[0.016 0.00290.0002] ≤9 1 [0.0191] ≤90.9809
c) Por lo menos 2 caras
d) Máximo 9 caras
1112110.500.50 1112∗0. 0 0049∗0. 5 0 11 0.0029
3.
01200.500.50 01∗1∗0. 0 002 0 0.0002 11210.500.50 1 12∗0. 1 50∗0.00048 0.00288
1012100.500.50 1066∗0.00097∗0.25 100.016005 1212120.500.50 121∗0. 0 0024∗1 12 0.00024
Si sabe que 9 de cada 10 personas tienen caries al tomar al azar un grupo de 5 personas ¿Cuál es la probabilidad de que? a) 4 tengan caries X= 4 caras
n=5
p=0.90
4 54 0.900.10 4 5∗0.6561∗0.10 4 0.3281 ≥2 1 [ 0 1] ≥21[0.000010.0005] ≥2 10.00005 ≥20.99995
b) Por lo menos 2 tengan caries
q=0.10
0500.900.10 01∗1∗0. 0 0001 1 1510.900.10 15∗0. 9 0∗0. 0 001 1 0.00001
0.00045
c) Por lo menos 2 no tengas caries por lo menos 1 tenga caries X= 2 caras
n=5
p=0.10
2 52 0.100.90 2 10∗0.01∗0.729 2 0.729 ≥110 ≥1 10.00001 ≥1 0.99999
q=0.90
d) Por lo menos uno tenga caries
4. Si el 20% de los estudiantes de la universidad pierden el año y se toman al azar un grupo de 6 estudiantes ¿Cuál es la probabilidad de que? a) Máximo 2 aprueben X≤2
n=6
p=0.80
q=0.20
≥2 0 1 2 ≥2 0.000060.00140.01536 0.01682
0600.800.20 01∗1∗0. 0 0006 0 0.00006
b) Exactamente 2 aprueben
1610.800.10 16∗0.80∗0.0003 1
2()0.800.20 2 0.01536
c) Ninguno apruebe
0 0.00006
0.0014
2620.800.20 215∗0.64∗0.0016 2 0.01536
5. Harry Ohme está a cargo de la sección electrónica de una gran tienda departamental. Se ha dado cuenta que la probabilidad de que un cliente que solamente está curioseando compre algo es de 0.3. Suponga que 15 clientes visitan la sección de electrónica a cada hora. a) ¿Cuál es la probabilidad de que al menos una de las personas que se encuentra curioseando compre algo en una hora? X≥1
n=15
p=0.30
q=0.70
≥1 10 ≥110.0047 ≥1 0.9953
01500.300.70 01∗1∗0. 0 047 0 0.0047
b) ¿Cuál es la probabilidad de que al menos 4 personas que se encuentra curioseando compre algo en una hora?
≥4 1[0 1 2 3] ≥4 1 [0.00470.03050.09160.1700] ≥410.2968 ≥40.7031
c) ¿Cuál es la probabilidad de que ninguna de las personas que se encuentra curioseando compre algo en una hora?
0 0.0047
d) ¿Cuál es la probabilidad de que no más de 4 personas que se encuentra curioseando compre algo en una hora?
≤4 0 1 2 3 4 ≤4 0.00470.03050.09160.17000.2186 ≤40.5155
PRUEBAS
1) De entre 1000 familias con 4 hijos cuantas cabe esperar que tengan un hombre o dos mujeres. Datos: n= 4 x= 1 p= 0,50 q= 0,50
4 ∗− 1 10,5 ∗0,5− 1 ∗ 1000∗0, 2 50, 3 750 1000∗ 0, 6 250 625 0,25
Datos: n= 4 x= 2 p= 0,50 q= 0,50
4 ∗− 2 20,5 ∗0,5− 2 4 ∗− 1 10,5 ∗0,5− 1 0,3750
0,25
4. Distribución de Poisson Es una variable aleatoria discreta para estimar el número de veces que sucede en hecho determinado. En un cierto intervalo de tiempo, se utiliza para número de llegadas de automóviles, numero de fugas. Número de tuberías entre otros. La distribución de Poisson es una distribución de probabilidad discreta que se aplica a las ocurrencias de algún suceso durante un intervalo específico. La variable x es el número de veces que ocurre un suceso en un intervalo. (Triola, 2009)
4.1.
Propiedades de un experimento de Poisson 1) La probabilidad de ocurrencia.- Es la misma para cualquiera de dos intervalos 2) La ocurrencia o no ocurrencia.- En cualquier intervalo es independiente
∗!
FORMULA ES:
f(x)= Probabilidad de x ocurrencias λ= Es el valor esperado o número medio de ocurrencias
e= Constante matemática que vale 2.7182 X= variable aleatoria
λ
λ
∝= √
∝=+
1) Si la probabilidad de que un individuo sufra una reacción negativa ante una inyección de cierto suero es de 0.001. hallar la probabilidad de que entre 2000 individuos a) Exactamente 3 tengan reacciones negativas
∗ f(3)= ! ∗. f (3)=
λ=N*P λ= 2000*0.001 λ= 2
Compruebe su respuesta
f (3)=
.
f (3)= 0.1804 b) Más de 2 de ellos tengan reacciones negativas f(x≥2)= 1 – [f(0)+f(1)] f(x≥2)= 1 – [0.13534 + 0.27068 ] f(x≥2)= 1 – [0.40602 ] f(x≥2)= 0.59398
2)
− 2 ∗ 0 0! 0 1∗0.113534 0 0.13534
1 2 ∗1! − 0 2∗0.113534 0 0.27068
En cierta área de EEUU resulta en promedio afectada por 6 huracanes al año. Encuentra la probabilidad de que para cierto año, esta área resulte afectada por: a) Menos de 4 huracanes
<4 0 1 2 3 <4 <40.1512
= 0.0025+0.00149+0.0446+0.0892
2 6 ∗2! − 2 36∗0.00247875 2 2 0.04461753918
3 6 ∗3! − 3 216∗0.00247875217 6 3 0.08923507836
1 6 ∗1! − 1 6∗0.00247875 1 1 0.01487251306 0 6 ∗0! − 0 1∗0.00247875217 1 0 0.00247875217
b) Cualquier cantidad mayor a 6 y menor a 8 huracanes
∗! −. f(7)= f(7)=
f(7)= 0.1377
Compruebe su respuesta
Ejercicios consultados
1. Una empresa de seguros de automóviles tiene concertados 3825 pólizas de vehículos sin ningún accidente en los últimos 12 años. Se desea conocer la probabilidad de que sean 10 los nacidos el día de San Cristóbal (patrono de los automóviles) con el fin de establecer un descuento en sus pólizas N= 3285 f(10)=
P= 1/365 = 0.003
!∗
λ=N*P λ=3285*0.003 λ= 9
Compruebe su respuesta
f(10)= 0.1186
2. En una empresa la cantidad promedio de llamadas que llegan al computador entre las 2 y las 4 de la tarde es de 2.5 por minuto. Encuentre la probabilidad de que en determinado minuto haya. a) 0 llamadas
.∗! . ∗. f(0)= f(0)=
f(0)= 0.0821
b) Una llamada entrante
.∗! . .∗. f(1)= f(1)=
f(1)= 0.2050
c) Exactamente 2 llamadas
.∗! . .∗. f(2)= f(2)=
f(2)= 0.2565
Compruebe su respuesta
3. Una secretaria comete dos errores por página, en promedio. ¿Cuál es la probabilidad de que en la siguiente página cometa? a) 4 o más errores
λ= 2
0 1 2 3
f(x≥4)= 1- [
]
f(x≥4)= 1- [0.1353+0.2707+0.2707+0.1804] f(x≥4)= 1- 0.8571234605 f(x≥4)= 0.1429
0 2 ∗0! − 0 1∗0.1353352832 1 0 0 1353352832 2 2 ∗2! − 2 4∗0.21353 2 0.27076705665 .
1 2 ∗1! − 1 2∗0.11353 1 0.2706705665 3 2 ∗3! − 3 8∗0.61353 3 0.1804470443
b) Ningún error f(0)= 0.1353
4. La señorita Berger es ejecutiva del Coast Bank and trust. A partir de sus años de experiencia, calcula que la probabilidad de que un solicitante no pague un préstamo inicial es de 0.025. el mes pasado realizo 40 préstamos. N= 40 λ=N*P P= 0.025 λ=40*0.025 λ= 1
a) Calcule la probabilidad de que no se paguen 3 prestamos
∗! ∗. f(3)= f(3)=
f(3)= 0.0613 b) Cuál es la probabilidad de que por lo menos no se paguen 3 préstamos.
0 1 2
f(x≥3)= 1- [
]
f(x≥3)= 1 – (0.36788+0.36788+0.18394) f(x≥3)= 1 – 0.9196997 f(x≥3)= 0.0803
0 1 ∗0! − 0 0.36788
1 1 ∗1! − 1 0.36788
2 1 ∗2! − 2 0.18394
PRUEBAS 1) Los pasajeros de las aerolíneas llegan al azar e independientemente a la sección de documentación a un gran aeropuerto internacional. La frecuencia promedio de llegadas es de 10 pasajeros por minuto. a) ¿Cuál es la probabilidad de no llegadas en el intervalo de un minuto?
! − 10 2, 7 183 0 0! 0 10,0100045 00,000045
6060 10 0 Datos
=10
b) ¿Cuál es la probabilidad de no llegadas en un intervalo de 15 segundos?
! −, 2, 2, 5 7 183 0 0! 0 10,10821 00,00821
: 1560 10 2,5
5. Distribución de Probabilidad Normal (Variable aleatoria continua) La distribución de Probabilidad normal tiene gran cantidad de aplicaciones en donde la variable aleatoria puede ser el peso, la estatura, puntuaciones de exámenes, entre otras. Según Luis Rodríguez Ojeda (2007) La distribución normal es la piedra angular de la teoría estadística moderna. Conocida y estudiada desde hace mucho tiempo, es utilizada para describir el comportamiento aleatorio de muchos procesos que ocurren en la naturaleza y también realizados por los humanos
5.1.Distribución normal o campana de Gauss
u= media -5
-4
-3
-2
-1
0
1
2
3
4
5
ó 5.2.Función de densidad de distribución normal
ó 3.1416 ℮
− 1 − σ√ 2 ℮
5.2.1. Características de la distribución normal 1. Dos parámetros media (u) 2. El punto más alto de la curva normal es (u); esta coincide con mediana y media
3. La media de la distribución puede tener valores, negativos, positivos o cero 4. La distribución normal es simétrica en donde el sesgo es igual a cero 5. La desviación estándar determina que tan plana o atachada es la curva normal 6. Las probabilidades correspondientes a la variable aleatoria normal, se denomina el área bajo la curva, en donde el total de área es 1 7. El área bajo la curva de cualquier distribución normal.
5.3.Distribución normal estándar
La distribución normal estándar, tiene media (u) igual a cero y desviación típica ( ) es igual a 1, para lo cual se asigna la letra (Z) y se calcula las probabilidades en base a la tabla. Entonces la función de densidad o el área bajo la curva es:
√ ℮
1. Hallar el área bajo la curva normal, en cada uno de los siguientes ejercicios: a) Entre Z = 0 y Z = 1,2
-2.5
-2
-1 -0.5
P = 0.3849
b) -0.68 ≤ Z ≤ 0
0 0.5
1 1.5
2 2.5
-2.5
-2
-1 -0.5
0 0.5
1 1.5
2 2.5
0.2518 c) -0.41 ≤ Z ≤ 2,21
-2.5
-2
-1 -0.5
0 0.5
1 1.5
2 2.5
10 ;2.210.4864 20 ; 0.46 0.1772 120.6636 d) 0.81 ≤ Z ≤ 1,94
-2.5
-2
-1 -0.5
0 0.5
1 1.5
2 2.5
10 ;0.81 0.4738 20 ;1.940.2910 210.1828
e) A la izquierda de Z = -0,6
-2.5
-2
-1 -0.5
0 0.5
1 1.5
2 2.5
0͢ 0.6 0.2258 0.50.2258 0.2742 2. Construir la gráfica de distribución normal, con la escala de
;
y
también la escala de X con los siguientes valores. Se tiene que la descarga de la página web se distribuye normalmente con una media de 7 segundos y una desviación estándar de 2 segundos. Calcular el tiempo de descarga de 9 segundos en unidades estandarizadas. Datos: Distribución normal
7 972 1 -2
-1
3
5
2
0 u=7
1
2
9
11
9
3. El peso medio de 500 estudiantes varones de cierta universidad es de 151 libras y la desviación típica es de 15 libras. Se supone que los pesos están normalmente distribuidos, hallar cuantos estudiantes pesan: a) Entre 120 y 155 libras b) Más de 185 libras c) Exactamente 160 libras Datos:
1 − 2 − 10.4808 2 0.1064 0.48080.1064
151
15
a) 120 ≤ X ≤ 155
= -2,07 = 0,27
= 0.5872
Número de estudiantes: N (0.5872)
-2
-1
0
1
2
500 (0.5872) = 2894 b) X ≥ 185
1 − 10.4884 0.5 0.4808
= 2.27
Pt = 0.0116
Número de estudiantes: N (0.0116) 500 (0.0116) = 6
-2
-1
0
1
2
c) X = 160
1 .− 2 .−
= 0.57 = 0.63 -2
-1
0
1
2
P (z1)= 0.2157 P (z2)= 0.2357 Pt = 0.2157 – 0.2357 Pt = 0.02
Número de estudiantes = N (0.02) 500 (0.02) = 10
4. Sea X una variable aleatoria que sigue una distribución normal N (
,
; calcular
la probabilidad cuando la variable aleatoria es mayor o igual a 80. Sabiendo que la media de la población es de 50 y la desviación típica es de 10. Z=
DATOS:
50 10 ≥80 X
Z=
− Z=
-3
-2
−
P(z)= (0.4987) P(z)= 0.5 - 0.4987
3
P(z)= 0.0013
-1
0
1
2
3
5. El peso de una manzana de una huerta siguen una ley normal con una media de 150 gr. Y una desviación típica de 20 a) Qué porcentaje de estas manzanas tendrá un peso inferior a 115 gr.
Datos:
150 20 x≤115
− − Z= Z=
z
Z= -1.75
x
-1,75
-3
-2
-1
115
0
1
2
3
P (z)= 0.5-0.4599 P (z)= 0.0401 ------- x 100= 4%
b) Hallar la probabilidad de una manzana de este huerto, elegida al azar tenga un peso comprendido entre 165 y 220 gr. Datos:
150 20 c)
165 d) ≥x≤ 220
− − Z1=
− − Z2=
Z1=
Z2=
Z1= 0.75
Z2= 3.5
P(Z1)=0.2734
P (Z2)= 0.4998
PT= 0.4998-0.2734 PT= 0.2264
z
-3
-2
0,75
-1
0
3,5
1
2
3
6. El diámetro de las cabezas de un tornillo sigue una distribución normal con una media de 5.5 milímetros y una varianza de 0.69 milímetros cuadrados. Se sabe que los tornillos son aprovechados, si su diámetro esta entre 4.3 y 7.1 ¿Cuál es el porcentaje de tornillos aprovechables?
− .−. Z1= .
Datos:
5. 5 0. 06.644 a)
− .−. Z2= .
Z1=
b)
Z2=
Z1= - 1.5
4.3 ≥x≤ 7.1
Z2= 2
P(Z1)=0.4332
P (Z2)= 0.4772
PT= 0.4332 + 0.4772 PT= 0.9104
z
-1,5
-3
-2
-1
0
1
2
3
7. Las puntuaciones en un test de biología fueron 0, 1, 2, 3…..10 Según el número de respuestas correctas entre las 10 preguntas. La nota media fue de 6.7 y la de desviación típica de 1,2.
Supuesto que las notas estuvieron normalmente
distribuidas. a) Determinar el 10% de estudiantes que tuvo 6 puntos
Datos:
6.7 1.2 X=6
X1= 6 + 0.5
X2= 6-0.5
X1= 6.5
X2= 5.5
− .−. Z1= . Z1=
Z1= -0.17
P(Z1)= 0.0675 PT= 0.3413 – 0.0675 PT= 0.2738
− .−. Z2= .
Z2=
Z2= -1
P (Z2)=0.3413
z
-3
-0,17
-2
-1
0
1
2
3
b) La nota máxima del 10% más bajo P=0.40 Z= -1.28
0,40
0,50
0,10
0,50
X=Z +
X= (-1.28) (1.2) + 6.7 X= 5.16 c) La nota mínima del 10% más alto de la clase P=0.40 Z= 1.28
X=Z +
0,40
0,50
X= (1.28) (1.2) + 6.7
0,10
0,50
0,10
X= 8.24
8. En la universidad se realiza una encuesta en donde se evalúa la enseñanza de la matemática educativa y se encontró que la media es de 7.5 y la desviación típica de 1.2 se supone de las notas están normalmente distribuidas. a) Cuál es la probabilidad de estudiantes que obtuvieron 8 puntos Datos:
7.5 1.2
X1= 6 + 0.5
X2= 6-0.5
X1= 6.5
X2= 5.5
X=8
−
Z1=
−
Z2=
z
0,83 -3
-2
-1
0
1
2
3
Z1=
..−.
Z2=
..−.
Z1= 0.83
Z2= 0
P(Z1)= 0.2967
P (Z2)=0
b) Cuál es el porcentaje de los estudiantes que obtuvieron 6 puntos Datos:
7.5 1.2 X=6
X1= 6 + 0.5
X2= 6-0.5
X1= 6.5
X2= 5.5
− .−. Z1= .
− .−. Z2= .
Z1=
Z2=
Z1= -0.83
PT= 0.4525- 0.2967 PT= 0.1558--------(x100)
Z2= -1.67
P(Z1)= 0.2967
PT= 15.58%
P (Z2)=0.4525
z
-1,67
-3
-2
-1
-0,83
0
1
2
3
c) Cuál es la nota en donde el porcentaje fue de 23.27%
23.27 ÷ 100= 0.2327 P=0.2327 Z= -0.62
26,73%
50%
X=Z +
X= (0.62) (1.2) + 7.5
23,27%
X= 8.24
9. Una persona debe tener una puntuación en el 2% superior de la población en una prueba de calificaciones. Si las puntuaciones tienen una distribución
normal con una media de 100 y una desviación típica de 15 que puntuación debe obtener una persona para ser miembro de un tribunal.
48%
2%
98%
Z
0
P = 0.48
U = 100
Z = 2.05
= 15
− 2. 0 515 100
= 130.75
Ejercicios consultados
Determinar el porcentaje del área de la curva de distribución normal. 1. 2A la derecha de Z=0.47 P= 0.1808 Pt=0.5 - 0.1808 Pt=0.3192
0,47
-3
-2
-1
0
1
2
3
2. A la derecha de Z= -1.13 P= 0.3708 Pt=0.5+0.3708
-1,13
-3
-2
-1
0
1
2
Pt=0.8708 2
(Sanchez, Octavio., Probabilidad y estadistica, Tercera edicion, 2009, págs. 204-2009)
3
3. Entre Z=0.54 y Z=1.91 P1=0.4719 P2=0.2054
0,54
Pt= 0.4719-0.2054
-3
-2
-1
0
1,91
1
2
3
Pt= 0.2665
4. A la izquierda de Z=0.81 P=0.2910 Pt= 0.5+0.2910 0,81
Pt= 0.7910
-3
-2
-1
0
1
2
3
5. La estatura promedio de los empleados de una empresa muy grande es de 1.65 m , con una desviación estándar de 6.2 m. Supón una distribución normal y determina que porcentaje de empleados miden: Datos:
1. 6 5 6.2
0,5
a) Más de 1.57 m
..−.
Z1=
-1,29
-3
Z1= -1.29
-2
-1
0
1
2
3
P=0.4015 Pt= 0.4015 + 0.5 Pt=0.9015----------x100 ---> 90.15% b) Menos de 1.70 m
..−.
Z1=
Z1=0.81
0,81
-3
-2
-1
0
1
2
3
P= 0.2910 Pt= 0.5+0.2910 Pt=0.7910
79.10%
c) Entre 1.57 m y 1.70 m
..−.
..−.
Z1=
Z2=
Z1= -1.29
Z2= 0.81
P1= 0.4015
P2=0.2910
Pt=0.4015+0.2910 Pt= 0.6925
1,29
Pt= 69.25%
-3
-2
0,81
-1
0
1
2
3
6. Supón que el monto promedio de compras por cliente de una empresa es de $128.45 y una desviación estándar de $18.26. Determina la probabilidad de que un cliente compre: Datos:
a) Más de $100
−. .
Z1=
128. 4 5 18.26
0,5
-1,56
-3
Z1= -1.56
-2
-1
0
1
2
P= 0.4406 Pt= 0.5+ 0.4406 Pt=0.9406 b) Más de $150
−. .
Z1=
Z1= 1.18
P= 0.3810
1,18
-3
-2
-1
0
1
2
3
3
Pt= 0.5+ 0.3810 Pt=0.8810 c) Menos de $120
−. .
Z1=
Z1= -0.46 P= 0.1772 Pt= 0.5+
0,46
-3
-2
-1
0
1
2
3
Pt=0.9406
7. El tiempo necesario para arreglar la transmisión de un automóvil en un taller de servicios se distribuye normalmente con una media de 45 min. Y una desviación estándar de 8.0 min. El mecánico planea comenzar la reparación del automóvil después de 10 min que el vehículo sea entregado y le comunica al cliente que el auto estará listo en una hora en total. ¿Cuál es la probabilidad de que el mecánico esté equivocado? Datos:
45 8. 0 mi n 50 − .
0,62
-3
-2
-1
0
1
2
3
Z1=
Z1= 0.62 P= 0.2324 Pt= 0.5 – 0.2324 Pt=0.2676
8. En una población estudiantil el coeficiente de inteligencia es 52 iy su desviación típica 8. Si ponemos que la población se distribuye normalmente, averiguar el porcentaje de gente tiene un C.I superior a 60.
Datos:
6052 1 8 0,50,3413 0,1587100 , % 0,3413
-2
-1
0
1
2
9. Deseamos conocer el porcentaje de alumnos comprendidos entre las puntuaciones 40 y 75. Se sabe que la media es 50 y la desviación típica 80. Datos
≤≤ − − , ,
− − , ,
-2
-1
0
1
2
Para calcular de desviacion estandar, media https://www.easycalculation.com/es/statistics/standard-deviation.php
3
4
PRUEBAS
1) La cantidad promedio de precipitación pluvial en Dallas, Texas, durante el mes de abril es 3.5 pulgadas. Suponga que se puede usar una distribución normal y que la desviación estándar es 0.8 pulgadas. a) ¿Qué porcentaje del tiempo la precipitación pluvial en abril es mayor que 5 pulgadas?
53,0,8 5 1,0,58 1, 8 8
Datos
3,5 0,8 ≥5 1,88
-3
-2
-1
0
1
2
3
P=0.4699
Pt=0.5-0.4699 Pt=0.0301-----------> 3.01% b) ¿Qué porcentaje del tiempo la precipitación pluvial en abril es menor que 3 pulgadas?
33,0,8 5 0,0,85
Datos
3,5 0,8 ≤3
Z= -0.63
P=0.2357 Pt= 0.5-0.2357 Pt=0.2643 -----------26.43%
-0,63
-3
-2
-1
0
1
2
3
2. La cantidad promedio de precipitación pluvial en Dallas, Texas, durante el mes de abril es 3,5 pulgadas (The Worl Almanac, 2000). Suponga que se puede usar una distribución normal y que la desviación estándar es 0,8 pulgadas. a. ¿Qué porcentaje del tiempo la precipitación pluvial en abril es mayor a 5 pulgadas? b. ¿ Qué porcentaje del tiempo la precipitación pluvial en abril es menor a 3 pulgadas?
.≥ − −,, 1,88 =,−,=, =,∗=,% -2
-1
0
1
2
Datos:
3,5 0,8
≤
b.
− −,, 0,63 =,−,=,
,∗,%
-2
-1
0
1
2
6. Aproximación Normal de las Probabilidades Binomiales Para realizar estos ejercicios se tiene como parámetros, la probabilidad y el número de aciertos en donde asociados con una distribución normal se tiene que:
U = NP u=
1. En una distribución de probabilidad binomial P = 0.20 y N = 100 a) ¿Cuál es la media y la desviación típica?
P = 0.20 N = 100 U = NP = 20 u=
1000.200.80
= 4
b) ¿Cuál es la probabilidad de exactamente 24 éxitos? X = 24
1 .− 2 .−
= 0.88 = 1.13
P (z1) = 0.3106 P (z2) = 0.3708 Pt = 0.3106 – 0.3708
2. La tasa de desempleo es de 5.8% según el INEC suponga que se selecciona aleatoriamente una muestra de 100 personas a) ¿Cuál es el número esperado de quienes están desempleados y además cual es la varianza? P = 0.0580
u = np = 5.8 (valor esperado)
N = 100
u = (100) (0.0580) (0.9420) u = 5.46 (varianza)
b) ¿Cuál es la probabilidad de que por lo menos 4 estén desempleados? N = (µ; ) N = (5.8; 2.34)
√ 5.46
= 2.34 (desviación típica)
1 −..
= -0.77
P = 0.2794 Pt = 0.5 + 0.2794 = 0.7794 -2
-1
0
1
2
Ejercicios consultados 1. 3Un cierto equipo electrónico está formado por 100 componentes conectados. Si
cada componente tiene una probabilidad de 0.02 de romperse cuando el equipo es lanzado en un cohete, hallar la probabilidad de que al hacerlo se rompan 10 o más componentes.
1000.02 100∗0.02∗0.98 = 1.96
√ 1.96 −.. = 1.4
=
Datos: N = 100 P = 0.02 N (u; )
. = 7.12
2. Supongamos que un tirador tiene probabilidad de 0.4 de acertar en la diana. Hallar
la probabilidad de que después de realizar 20 disparos halla acertado al menos 4 lanzamientos.
σ 20∗0.4 ∗0.6 √ 4.8 −.. ..
N (u; )
= 4.8
Datos: P = 0.4 Q = 0.6 N = 20
= 2.19
=
= 1.64
P= 0.4495 + 0.5 Pt = 0.9495
3
Lorente, J., (2006).Aproximación de la distribución Binomial a la Normal
3. Una máquina produce componentes que son defectuosos en un 10%. Se elige al azar una muestra de estos 50 componentes. Calcular las probabilidades de que: a) Como exactamente 6 componentes estén defectuosos
50∗0.10∗0.90
√ 4.5 −..
= 4.5
Datos: N =50 P = 0.10 N (u; )
= 2.12
=
.. = 2.69
0.4964
4. Un examen tipo test consta de 40 preguntas a contestar verdadero o falso. El examen se aprueba si se contesta correctamente al menos 25 preguntas. Un alumno responde al examen al azar. Halla la probabilidad de aprobar el examen
√ 10 − . 0.4429 = 3.16
=
. = 1.58
Datos: N = 40 P = 0.5 Q = 0.5
40∗0.5 ∗0.5 = 10
5. El 5% de los libros prestados en una biblioteca de un centro escolar son técnicos. Si
se toman los últimos 500 préstamos, calcula la probabilidad de que se hayan prestado entre 25 y 30 libros técnicos.
√ 23.75 ..− −.. 0.0398 ..− .. 0.3708
= 4.87
=
=
= -0.10
= 1.13
Pt = 0.0398 + 0.3708 = 0.4106
Datos: N = 500 P= 0.05 Q = 0.95
500∗0.05∗0.95
= 23.75
VAMOS A NECESITAR LA TABLA Z DE DISTRIBUCIÓN NORMAL http://www.disfrutalasmatematicas.com/datos/distribucion-normal-estandar.html PRUEBAS
1) Muchos problemas de producción se relacionan con la unión exacta de partes de maquinarias con flechas, que caben en el orificio de una válvula, un diseño en particular requiere de una flecha con un diámetro de 22 milímetros, pero las flechas con diámetros entre 21,9 mm y 22,01 mm son aceptables. Suponga que el proceso de manufactura fabrica flechas con diámetros que se distribuyen normalmente con una media de 22,002 mm y con una desviación de 0,005 mm para este proceso cual es: a) La proporción de flechas con un diámetro entre 21,9 mm y 22 mm Datos
22, 0 02 0, 0 05 21,9≤≤22 21, 9 22
0 02 2222, 0,005 −,, 0,4 20,4 ∞≈0,5 0,4 0,1554
0 02 21,90,22, 005 0,0,010502 20,4
b) ¿Cuál es el diámetro que será solo el 8% de las flechas superior? Datos
22, 0 02 0, 0 05 0, 1, 4412
1,410,00522,002 22,0091 2. El precio promedio de las acciones que pertenecen a S&P500 es de $30 y la desviación estándar es de 8,20 (Business Week, Special Annual Issue, primavera de 2003). Suponga que los precios de las acciones están distribuidos normalmente. ¿De qué el precio de las acciones de una empresa no sea mayor a $20?
≥ ≤ − − −, 1,22 −, 1,22 = , = −, =,−,=, =,−,=, -2.5
-2
-1 -0.5
0 0.5
1 1.5
2 2.5
-2.5
-2
-1 -0.5
Datos:
30 8,2
0 0.5
1 1.5
2 2.5
7. ESTADISTICA INFERENCIAL N = tamaño de la población
Población
Parámetros
= desviación típica (población) U = media
Muestra
P = proporción
s o f a r g í d a t s E
N = tamaño de la muestra S = desviación típica de la muestra
media de la muestra proporción de la muestra
8. Muestreo Es un proceso de obtener una información de un conjunto de toda la población.
Ventajas del muestreo Costos reducidos
Mayor rapidez
Más posibilidades
Los elementos pueden ser: productos almacenes, personas, familias, entre otras.
Población Es todo el grupo de personas de quien el investigador necesita tener información.
8.1.
Pasos para desarrollar un plan de muestreo
1) Definir la población de interés Especificar las características de los individuos, cosas, clientes, tiendas, etc; de quien se necesita la información para satisfacer la investigación.
2) Identificar un marco de referencia del muestreo Consiste en hacer una lista de todos los elementos de la población, de donde se van a seleccionar las unidades para la muestra. Realizar una lista en forma ascendente (a – z) y numerar a cada uno de ellos.
3) Seleccionar un método de muestreo ALEATORIO
SITEMATICO MUESTREO PROBABILISTICO ESTRATIFICADO PROPORCIONAL CONGLOMERADO
TIPOS DE MUESTREO
NO PROPORCIONAL
CASUAL
MUESTREO NO PROBABILISTICO
INTENCIONAL
CUOTAS
4) Determinar el tamaño de la muestra, utilizando las siguientes fórmulas.
Fórmulas para estimar la proporción
Fórmulas para estimar la media
N= tamaño de la población n= tamaño de la muestra
Z= el nivel de confianza, se trabaja con el 95%, 99% o 90% P= probabilidad q= probabilidad de fracaso E= error de la muestra
5) Ejecutar el plan operacional de la muestra
1. Se desea calcular la muestra de un establo de 5000 vacas para determinar cuál de ellas son vacas lecheras con un error del 5% y un nivel de confianza del 95% Datos: N=5000 E= 0.05 N.C= 0.95 p=0.5 Q=0.5
1. 9 6 55000 05 1.960.50. 0.550.50000. 0.94802 60412. 5 356.75 357
2. Calcular el número de promedio de estadística descriptiva del cuarto ingeniería financiera “A” de toda la población 29.
Datos: N=29 E= 0.20 N.C= 1.96 p=0.5
a. Definir la población
1. 9 6 52920 1.960.50. 0.550.290. 2.27.120485 13.1 3 14
1) 7
2) 7
3) 7
4) 8
5) 7
6) 7.3
7) 7.1
8) 7.2
9) 7.1
10) 7.3
11) 7.1
12) 7.5
13) 7
14) 7.45 15) 7
16) 7
17) 7.2
18) 7.5
19) 8.3
20) 7.0
21) 7
22) 7
24) 9.9
25) 7
26) 7
27) 7.5
28) 7.5
29) 8.7
23) 7
b. Seleccionamos la muestra con una tabla aleatoria 7
7.1
7.2
7.1
7.5
8.3
7
7
7
7
7
7
7.5
7
c. Sacamos la media
. = 7.19
ẋ=
3. Se desea estimar el peso promedio de los sacos que son llenados con un nuevo instrumento en una industria. Se conoce que el peso de un saco que se llena con este instrumento es una Variable aleatoria con una distribución normal. Si se sabe que la desviación típica y el peso son de 0,5 kg. Determinar el tamaño de la muestra aleatoria con una probabilidad del 95% y el modularmente en -0,1 kg.
0,5
Datos:
N.C=95% z=1,96 E=0,1
.,, 96.04
parámetro se diferencia
n=96
4. Se desea calcular la muestra para realizar un estudio del nivel de nutrición de una cierta población para lo cual se sabe que la población es de 6000 personas. Un estudio anterior revela que la probabilidad de nutrición fue de 0,8 trabajando con un nivel de confianza del 90% y un error de muestreo del 8%. Calcular el tamaño de la muestra. Datos: z=1,645 E=0,08 P=0,8 N=6000 N.C=90% z=16
1, 6 45 260000,8 1,6450,80,0,820,6000 67
5. Un biólogo quiere estimar el precio promedio de las personas casadas en el estado de Virginia. Un estudio anterior de 10 personas casadas mostro que la desviación estándar de sus precios es de 12,2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 94% de confianza y que el error de estimación es de 4 libras
Datos:
12, 2
N.C=94%= 0,47 z=1,88 E=4
,, 33
6. Determine el tamaño de la muestra necesario para estimar una proporción poblacional a un nivel de confianza del 98% con un error del 5% además se sabe que en una muestra pilota se obtuvo una probabilidad de 0,2 Datos N.C= 98% z=2,38 E=5% = 0,05 P=0,2 q=0,8
2, 3 3 0,0,0520,8 347,45 348 Ejercicios consultados
1. 4Un auditor desea tener un nivel de confianza del 95%, para que la verdadera proporción de error de error de exceda del 2%. Si la población es muy grande, ¿Qué tamaño tendrá la muestra que va a tomarse, si el auditor estima que la proporción de error es del 5%? Datos N.C=95% z=1.96 E=2% =0.02 P=0,5 q=0,5
1. 9 6 0,0,0250,5 456,19 457
2. En un día, la producción de tarjetas perforadas por una persona se encuentra en una gaveta. Se desea estimar el porcentaje de tarjetas que tiene menos error, mediante una muestra aleatoria simple. ¿qué tamaño de muestra es necesario si se piensa que el porcentaje del 8%? Se acepta un error estándar del 3% y confianza del 95%.
Datos N.C=95% z=1.96 E=3% =0.03 P=0,08 q=0,92
4
1. 9 6 0,0,00280, 92 314.15 315
Martinez,Ciro.(2005). Estadistica y muestreo, (Decimo segunda ed.). Bogota: Ecoe Ediciones
3. El mantenimiento de cuentas puede resultar demasiado costoso, si el promedio de compra por cuenta baja de cierto nivel. El gerente de un gran almacén por departamentos desea estimar el promedio de lo comprado mensualmente por los clientes, con un error de $2500, y una probabilidad aproximada de 0.95. ¿Cuántas cuentas deberá seleccionar, si sabe que la desviación estándar es de $30000, la cual fue obtenida de los balances mensuales de las cuentas de crédito? Datos N.C=95% z=1.96 E=2500
30000
1. 9 6 30000 2500 553.19 554
4. Una firma constructora desea estimar la resistencia promedio de las barras de acero utilizadas en la construcción de edificios de apartamentos. ¿Qué tamaño de muestra se requiere para garantizar que habrá un riesgo de solo 0.001 de sobrepasar un error de 5 kg. O más en la estimación? La desviación estándar de la resistencia de este tipo de barras se estima en 50 libras. Datos P=1-0.0001= 0.999 E=5 kg 10 libras
50
3. 2 7 2500 10 267.32 26
P=0.999/2 P= 0.4995 Z= 3.27
5. 5Wally Simpleton esta postulado para gobernador. El desea estimar dentro de 1
punto porcentual la proporción de personas que votaran por él. También desea tener el 95% de confianza en sus hallazgos. ¿Qué tan grande debería ser la muestra? 5
Webster,Allen.(2004). Estadistica aplicada a los negocios y la economia, (tercera ed.).Colombia:Mc Graw Hill
1. 9 6 0,0,0150,5 9.604 10
Datos N.C=95% z=1.96 P=0.5 q=0.5 E=0.01
8.2.
Muestreo aleatorio sistemático
En el muestreo sistemático, los elementos son seleccionados de la población dentro de un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio. El muestro sistemático difiere del muestreo aleatorio simple en que cada elemento tiene igual oportunidad de ser seleccionado, pero cada muestra no tiene la posibilidad igual de ser seleccionada. (levin & Rubin, 2010)6
1. Se tiene una población formada por 100 elementos se realiza el cálculo de las muestras y se obtiene con una muestra de 25 elementos. Calcular el muestreo aleatoriamente sistemático Utilizamos tabla de números aleatorios
Datos: N=100 n=25 R=
6
4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
(levin & Rubin, 2010)
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
El muestreo aleatorio estratificado se usa para estimar parámetros de poblaciones muy heterogéneas; consiste en la separación de las unidades de la población en grupos. Estos grupos se llaman estratos. De cada estrato se obtiene una muestra aleatoria simple, y los estimadores de los parámetros de la población se estiman como combinaciones de los estimadores en cada estrato. (levin & Rubin, 2010)7
2. En la fábrica coca cola sucursal quito hay 600 trabajadores queremos tomar una muestra de 20 trabajadores se sabe que hay 200 trabajadores en la planta de ensamblaje. 150 en el departamento de empaque, 150 en el departamento de proceso y 100 trabajadores en publicidad
A=200 B=150 C=150 D=100
= 6,67 = 7 = 5 =5 = 3
Ejercicios consultados 7
(levin & Rubin, 2010)
Nota: Se aplicó regla de tres
Datos N=600 n=20
1. Se tiene una población formulada por 50 elementos se realiza el cálculo de las muestras y se obtiene con una muestra de 10 elementos. Calcular el muestreo aleatoriamente sistemático R=
Datos:
5
N=50 n=10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Estimación Puntual
xEstimador puntual de la media μ sEstimador puntual de la desviacion tipica poblacional σ PEstimador puntual de la proporcion poblacional ̅ ∑ # 1 Ejercicios consultados 1. A Joe Jackson, un meteorólogo que trabaja para la estación de televisión WDUI, le gustaría informar sobre la precipitación pluvial promedio para ese día en el noticiero de la tarde. Los datos siguientes corresponden a las mediciones de precipitación pluvial (en centímetros) para 16 años en la misma fecha, tomados al azar.
años
precipitación Aceptación
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16
0,47
Si
0,010
0,27
No
0,010
0,13
No
0,057
0,54
Si
0,029
0
Si
0,136
0,08
No
0,083
0,75
Si
0,145
0,06
Si
0,095
0
No
0,136
1,05
No
0,464
0,34
Si
0,001
0,26
No
0,012
0,17
Si
0,040
0,42
Si
0,003
0,50
Si
0,017
0,86
No
0,241
5,9
1,480
∑ 3559 12 296,583
∑ 18266,11 917 40,751
̅ 1112 0,917
2. El National Bank of Lincoln quiere determinar el número de cajeros disponibles durante las horas pico del almuerzo los viernes. El banco ha recolectado datos del número de personas que entraron al banco los viernes de los últimos 3 meses entre
las 11 a.m y la 1 p.m. Utilice los siguientes datos para encontrar las estimaciones puntuales.
banco
# de personas
Aceptación
x1
242
No
2979,340
x2
275
Si
465,840
x3
289
Si
57,507
x4
306
Si
88,674
x5
342
Si
2062,674
x6
385
Si
7817,507
x7
279
Si
309,174
x8
245
Si
2660,840
x9
269
Si
760,840
x10
305
Si
70,840
x11
294
Si
6,674
x12
328
Si
987,007
3559
∑ 3559 12 296,583 ̅ 1112 ̅0,917 PRUEBAS
18266,917
∑ 18266,11917 40,751
1. Calcular los estimadores puntuales, con el siguiente conjunto de datos, que hace referencia a los sueldos y capacitación de un curso (1 = capacitado; 0 = no recibe la capacitación). SALARIOS
CAPACITACIÓN
436.85 388.72 712.28 761.31 836.59 203.8 620.22 654.29 852.86 821.06 799.93 216.88 526.22 717.27 601.93 538.96 610.66 821.62 345.32 810.72 389.26 640.24 875.3
0
∑ . ̅616.621 ∑−− =
S=
1 0 0 0 0
436. 8 5 616. 6 21 388. 7 2 616. 6 21 712. 2 8 616. 6 21 761. 3 1 616. 6 21 836. 5 9 616. 6 21 203. 8 616. 6 21 620. 2 2 616. 6 21 654. 2 9 616. 6 21 852. 8 6 616. 6 21 821. 0 6 616. 6 21 799. 9 3 616. 6 21 216. 8 8 616. 6 21 526. 2 2 616. 6 21 717. 2 7 616. 6 21 601. 9 3 616. 6 21 538. 9 6 616. 6 21 610. 6 6 616. 6 21 821. 6 2 616. 6 21 345. 3 2 616. 6 21 810. 7 2 616. 6 21 389. 2 6 616. 6 21 640. 2 4 616. 6 21 875.3 616.621
= 32317.612 = 51938.866 = 9150.644 = 20934.907 = 48386.361
= 170421.178
1 1
= 12.953
= 1418.954 = 55808.865 = 41795.305
1 1 1 0
= 33602.189 = 159792.867
0
= 8172.341
1
= 10130.221
0
= 215.825
1
= 6031.23
0
= 35.534 = 42024.59 = 73604.233
1 0 1
= 37674.422
0
= 49568.124
1 0
= 557.857
= 66914.825
14182.29
̅ 1123 ̅0,478
S=
.−
S = 204.552 8.1
Se puede calcular el error de muestreo cuando se conocen los parámetros de la población
∈.
Parámetros – estadígrafos
| | | ̅| | |
Error de muestreo de población = Error de muestreo de la media =
Error de muestreo de la varianza=
9. Distribución muestral de la
La distribución muestral de la media es la distribución de probabilidades de todos los valores de la media muestral para ello se aplica el teorema de limite central en donde cualquier distribución de datos se puede aproximar a la distribución normal cuando n tiende a infinito (n=30) Valor esperado
∈μ
Nota: con 30 muestras se aproxima a una distribución normal es decir
El valor esperado de la media muestral Va hacer igual a la de la media poblacional. Cuando el valor esperado de un estimador puntual es igual al parámetro poblacional se dice que el estimador puntual es insesgado.
Desviación estándar de la muestra
̅
La desviación estándar de la media muestral depende de que si la población es finita o infinita
√ =
Esta fórmula se utiliza cuando:
La población es infinita
≤0.05 = −− ∗ √
Nota: la forma de distribución muestral se aproxima a la distribución normal gracias al teorema de límite central por lo cual se aplica las probabilidades vistos en la tabla de z tipificados.
1. Una población tiene una media de 200 y una desviación estándar de 50. Se tomara una muestra aleatoria simple de tamaño 100 y se usará la media de la muestra para estimar la media de la población. a) ¿Cuál es el valor esperado de la media? b) ¿Cuál es la desviación estándar de la media muestral? c) Determine la distribución muestral de la media
Datos: µ = 200 = 50 n = 100
d) ¿Qué indica la distribución muestral?
a) E( ) = µ E( ) = 200
b)
√ = √ = 5 =
c) N ( µ;
)
N (200; 5)
2. Una población tiene una media de 200 y una desviación estándar de 50. Suponga que se selecciona una muestra aleatoria simple de tamaño 100 y que se usa estimar µ.
para
a) ¿Cuál es la probabilidad de que la media de la muestra quede a ±5 de la media de la población? b) ¿Cuál es la probabilidad de que la media de la muestra quede a ±10 de la media de la población?
a)
− 1 − − 2 − 0.3+413 0.3413 P0.4−772 0.4772 0.4772 0.4772 = -1
P1=0.3413
= 1
Pt =
b)
= 0.6826
Datos: µ = 200 = 50 n = 100
20.3413
= 2
= -2
Pt =
= 0.9544
3. Una muestra aleatoria de tamaño 50, se selecciona de una población con desviación =10. Calcular el error del valor estándar de la media. a) Cuando el tamaño de la población es 5000 b) Cuando el tamaño de la población es 500 a)
0.01
≤ 0.05
√ √ 0. 1 −− ∗ √ − ∗ √ − = 1.4142
b)
≥ 0.05
0.9996 * 1.4142 = 1.34
Datos: = 10 n = 50
4. La media del precio por galón de gasolina es de $1.20. suponga que la media de la población del precio por galón es u=1.20 y que =0.10. Se selecciona una muestra de 50 gasolineras a) ¿Cuál es la probabilidad de que la muestra aleatoria simple produzca una media de la muestra al menos de $0.02 de la media de la población?
a)
− 1 .−..√ 10.−0080 2 .−..√ 20.0.4222 0.0080 0.4222
= -0.02
Datos: µ = 1.20 = 0.10 n = 50
= 1.4186
Pt =
= 0.5302
5. La distribución de la temperatura del cuerpo humano en la población tiene una media de 37 grados y desviación típica de 0.85°. Se elige una muestra de 105 personas, calcular la probabilidad de que la media sea menor a 39.9°
− .√ .− .−
Datos: µ = 37° = 0.85° n = 105
= - 1.21
P = 0.3869 Pt = 0.1131
6. El coeficiente intelectual de los estudiantes, se distribuye normalmente con una media de 100 y desviación típica de 11 a) Si elegimos una persona al azar. Calcular la probabilidad que su coeficiente intelectual esté entre 100 y 103
b) Se elige al azar una muestra de 25 personas. Calcular la probabilidad de que la media de sus coeficientes intelectuales esté entre 100 y 103
a)
− √ 0− 2 √ 20.27 0.1064 − √ − √ 0.4131
Datos: µ = 100 = 11 n = 1; 25
Z1= 0
Pt = 0.1064 b)
= 0
P=0
= 1.36
7. El programa de pruebas universitarias de la oficina estadounidense reportó una calificación SAT de la media de la población con un u=1017 también se sabe que la desviación estándar es de 100 ¿Cuál es la probabilidad de que una muestra aleatoria de 75 estudiantes produzca una media de la muestra de calificación SAT que quede a menos de 10 de la media de la población?
1 − √ -0.87
P= 0.3078
− √ 0.87
P = 0.3078
Pt= 0.3078+0.3078
Datos: µ = 1017 = 100 n = 75
Pt=0.6156 8. La renta promedio mensual, para un departamento de 2 recamaras en California es de 982,00. Suponga que la media poblacional también es de 982,00 y la desviación estándar es de 210,00 ¿Cuál es la probabilidad de que una muestra aleatoria de 40 departamentos, de 2 recamaras dé 1 renta mensual promedio dentro de ± 100,00 de la media poblacional?
− √ − √
= 3.01
Datos: µ = 982 = 210 n = 40 x-u = ±100
P= 0.4987
= -3.01
P= 0. 4987
Pt = 0.4987+0.4987 Pt=0.9974 E ercicios consultados
1. 8Si X está distribuida normalmente con media 5 y desviación típica 2, hallar P (X > 8).
=
√
Datos: u= 5 =2
√ = . = 0.70
σ σ
=
2. Cierto tipo de pieza para automóvil tiene un promedio de duración de tres años, con una desviación estándar de 0,5 años. Suponga que las duraciones de las piezas son normalmente distribuidas y encuentre la probabilidad de que una pieza determinada tenga un tiempo de duración de más de 3,5 años. 8
Levine, D., Krehbiel y Berenson M., (2006). Estadistica para la administracion ($ta ed).
Mexico: Pearson Prentice Hall
Datos: µ=3 = 0.5 n = 3.5
c)
− 1 ..− 10.−4678 2 ..− 20.4678 0.46780.4678 = 1.85
= -1.85
Pt =
= 0.9356
3. Una fábrica de alimentos empaca productos cuyos pesos están normalmente distribuidos con media de 450 gramos y desviación estándar de 20 gramos. Encuentre la probabilidad de que un paquete escogido al azar pese entre 425 y 486 gramos.
− 1 − √ 10.−3944 2 − √ 20.4641 0.46410.3944
Datos:
= -1.25
µ = 450 = 20
= 1.8
Pt =
= 0.8585
4. 9En un proceso industrial el diámetro de una arandela es muy importante. El comprador establece en sus especificaciones que el diámetro debe ser de 3,0 +0,01mm. La condición es que no acepta ninguna arandela que se salga de estas especificaciones. Se sabe que en el proceso el diámetro de las arandelas tienen distribución normal con media de 3,0 mm y una desviación estándar de 0,005mm. ¿Qué porcentaje de arandelas será rechazado? (Sol: 4,56%)
− 9
Datos: µ= 3.0 mm = 0.005 mm
Anderson, D., Sweeney T., (2008). Estadistica para la administracion y economia (10ma edicion) México: CENGAGE Learning
1 ..−.√ 10.4772
= 2
5. El peso medio de 5 estudiantes varones de una universidad es de 68,5 Kg. y la desviación típica es de 10 Kg. Suponiendo que los pesos están distribuidos normalmente, cual es la probabilidad de que los estudiantes pesen más de 75 kg.
− 1 −.√
= 2.90
10. Distribución Muestral de
10.4981
Datos: n=5 µ = 68.5 Kg = 10 Kg
X = Variable aleatoria continua o número de elementos de la muestra n = Tamaño de la muestra
Valor esperado E
Población Finita
Población Infinita
1 1 0.05
1
Forma de la distribución muestral de
La fórmula se aproxima a la distribución normal; entonces se trabajará con la tabla de probabilidades de Z. además debe cumplir con 2 condiciones:
1. np ≥ 5 2. n(1- p) ≥ 5
̅
1. Se selecciona una muestra aleatoria simple de tamaño 100, de una población con P = 0.40
a) ¿Cuál es el valor esperado de ?
E( )=P E ( ) = 0,40
b) ¿Cuál es la desviación estándar de ?
1 . −.
= 0.049
c) Describa la distribución muestral de N (P;
)
N (0.40; 0.049) 2. La proporción de una población es de 40%. Se tomara una muestra aleatoria simple de tamaño 200 y se usará la proporción de la muestra para estimar la de la población.
a) ¿Cuál es la probabilidad de que la proporción muestral esté a ± 0.03 de la proporción poblacional? Datos: n = 200 p = 0.40
− . −.
= 0.035
1 1 0.40.3.03540
2 2 0.30.70.03540
= 0.86
P1= 0.305
= - 0.86
P2 = 0.3051
3. Suponga que la proporción poblacional es de 0.55. determine el error estándar de la proporción ( ), para tamaño de muestra de 100, 200, 500 y 1000. ¿Cuál es el análisis acerca del error estándar de la proporción al aumentar el tamaño de la proporción?
100 − . −. 200 − . −. 500 − . −. 1000 − .−.
= 0.050 = 0.035 = 0.022 = 0.016
4. La proporción poblacional es de 0.30 ¿Cuál es la probabilidad de que una proporción muestral este a ± 0.04 de la proporción poblacional, para los siguientes tamaños de muestra?
a) n=100
±..
= 0.87
P = 0.3078 (x2) = 0.6156
b) n=200
±..
= 1.25
P= 0.3944 (x2) = 0.7888
c) n=500
±..
= 1.90
P= 0.4713 (x2) = 0.9426
d) n=1000
±..
= 2.67
P= 0.4962 (x2) = 0.9924 5. El presidente de distribuidores Díaz, cree que el 30% de los pedidos a su empresa provienen de clientes nuevos. Se va a usar una muestra aleatoria simple de 100 pedidos para estimar la proporción de clientes nuevos.
a) Suponga que el presidente está en lo correcto y P = 0.30 ¿Cuál es la
distribución muestral de para este estudio?
− ..
≥0. 5 1≥0. 5 10010.30≥0. 5
= ±1.09
P= 0.3621 (x2) Pt = 0.7242 P = 0.30
Ejercicios consultados 1. Suponga que tenemos una población con una proporción P= 0.40 y una muestra aleatoria de tamaño n= 100 extraída de la población.
a) ¿Cuál es la probabilidad de que la proporción muestral sea superior a 0.45? b) ¿Cuál es la probabilidad de que la proporción muestral sea inferior a 0.29?
c) ¿Cuál es la probabilidad de que la proporción muestral esté comprendida entre 0.35 y 0.51?10
− . −.
= 0.035
Autor: Mario F. Triola Edición: 11 Año: 2013 Estadística pg:328 doi: https://www.biblionline.pearson.com/Pages/BookRead.aspx 10
1 1 0.40.3.03540
= 0.86
P1= 0.305
2 2 0.30.70.03540
= - 0.86
P2 = 0.3051
2. Suponga que tenemos una población con una proporción P= 0.25 y una muestra aleatoria de tamaño n= 200 extraída de la población.
a) ¿Cuál es la probabilidad de que la proporción muestral sea superior a 0.31? b) ¿Cuál es la probabilidad de que la proporción muestral sea inferior a 0.14? c) ¿Cuál es la probabilidad de que la proporción muestral este comprendida entre 0.24 y 0.40?
− . −. 1 1 0.40.3.03540
= 0.039
= 0.85
P1= 0.3154
2 2 0.30.70.03540
= - 0.85
P2 = 0.3154
3. Suponga que tenemos una población con una proporción P= 0.60 y una muestra aleatoria de tamaño n= 100 extraída de la población.
a) ¿Cuál es la probabilidad de la proporción muestral sea superior a 0.52? b) ¿Cuál es la probabilidad de que la proporción muestral sea inferior a 0.46? c) ¿Cuál es la probabilidad de que la proporción muestral este comprendida entre 0.47 y 0.53?11 d)
11
−
Newbold. P, Carlson W, Thorne B; Pearson, Sexta edición, Estadística para Administración y Economía, pg. 276
e) f)
. −. 1 1 0.40.3.03540
= 0.035 h)
= 0.86
g) P1= 0.3051
i)
2 2 0.30.70.03540
= - 0.86
j) P2 = 0.3051
4. Un gerente de un gran grupo de hospitales cree que el 30% de todos los pacientes genera facturas que se cobran con 2 meses de retraso como mínimo. Se toma una muestra aleatoria de 300 pacientes.
a) ¿Cuál es el error típico de la proporción muestral que generará facturas que se cobrarían con 2 meses de retraso mínimo? b) ¿Cuál es la probabilidad de que la proporción muestral sea inferior a 0.25? c) d) e)
− . −. 1 1 0.40.3.03540
= 0.043
= 0.25
f) P1= 0.2456
g)
h)
2 2 0.30.70.03540
= - 0.25
i) P2 = 0.2456
5. Una empresa está considerando la posibilidad de sacar una nueva emisión de bonos convertibles. La dirección cree que los términos de la oferta serán atractivos para el 20% de todos sus accionistas actuales. Suponga que está en lo cierto. Se toma una muestra aleatoria de 130 accionistas actuales
a) ¿Cuál es el error típico de la proporción muestral que piensa que esta oferta es atractiva? b) ¿Cuál es la probabilidad de que la proporción muestral este comprendida entre 0.18 y 0.22? c)
−
d) e)
. −. 1 1 0.40.3.03540 2 2 0.30.70.03540
= 0.035
= 0.86
f) P1= 0.305 g)
h)
i) P2
= - 0.86
=
0.3051
11. Estimación por intervalos Parámetro: [g.l ; N.c] N.C =
90%
95%
99%
N.S =
10%
5%
1%
̅ ∓∝ √ 1. Una muestra aleatoria simple de 40 elementos, dio como resultado una media muestral de 25, la desviación estándar de la población es S Datos: n= 40 x= 25
σ ̅ √ =5
a) ¿Cuál es el error estándar de la media? = 0.7906
b) Con 95% de probabilidad o nivel de confianza, ¿Cuál es el margen de error? N.C = 95%
̅ ∓∝ √ ̅ ∓1.96 √
= ± 1.55
[23.45; 26.55]
2. Una muestra aleatoria simple de 50 artículos originó una media de muestra de 32 y una desviación estándar de 6. Datos:
n= 50 = 32 =6
a) Determine un intervalo de confianza del 90% para la media de la población
∓1.645 √ 65050 32 ∓1.396 [30.604; 33.396]
b) Calcule un intervalo de confianza del 95% para la media de la población
∓1.96 √ 65050 32 ∓1.663
[30.337; 33.663]
c) Determine un intervalo de confianza del 99% para la media poblacional
∓2.575 √ 65050 32 ∓2.185
[29.815; 34.185] 3. Una muestra de 60 artículos tuvo una media de 80 y una desviación estándar de 15. Datos: n= 60 = 80 = 15
a) Determine el intervalo de confianza a un 95%
∓1.96√ 156060 80 ∓3.796
[76.204; 83.796]
b) Suponga que la media y la desviación estándar se obtuvieron de una muestra de 120 artículos. Determinar el intervalo de confianza del 95%
∓1.96√ 15120120 80 ∓2.684
[77.316; 82.684]
c) ¿Cuál es el efecto de mayor tamaño de la muestra sobre la estimación del intervalo de una media de la población? Si la muestra es más grande, el intervalo de la media de la población es más cercana. 4. Se informa que el intervalo de confianza es del 95% para una media de población es de [122 a 130]. Si la media de la muestra es 126 y la desviación estándar de la muestra es de 16.07 ¿Qué tamaño de muestra se utilizó en la determinación? Datos: Z = 1.96 = 126 = 16.07
∝ √ 4 1.96 .√ 4 .√ 4 √ ͢
(31.4972)2 = (4
)2
992.073 = 16(n)
.
n= 62
Valores referenciales de Z
90% 95% 99%
->
1.645
-> ->
1.96 2.576
5. Los ingresos semanales promedio de las personas que trabajan en varias industrias aparecieron en cierta revista. Esos ingresos para quienes trabajan en ciertos servicios fueron de 369$ Suponga que este resultado, se basó en una muestra de 250 personas y que la desviación estándar = 50$. Calcular el intervalo de confianza de 95% para la población de ingresos semanales promedio de personas personas que trabajan trabajan en los servicios. servicios. Datos: N= 250 S= 50 Z= 1.96 = 369
∓ ∝ √ 369 ∓1.96 √
369 ± 6.198
[363.790; 374.208] EJERCICIOS CONSULTADOS 1. Se pide a 814 adultos que contestaron un cuestionario acerca de sus ideas sobre el estado general de la USA a esta pregunta contestaron SI 562 adultos. Datos: N= 814
a) ¿Cuál es la estimación puntual de la proporción poblacional que contestaron dicha encuesta?
= 0.69
b) ¿Cuál es el margen de error a un 92% de NC?
∓ 1
0.69∓1.75 . −. 0.69 ∓0.028 c) ¿Cuál es el margen de error a un 88%?
0.69∓1.555 . −. 0.69 ∓0.025
∓ 1
2. En una encuesta del Instituto de investigaciones se analizó las razones por los que los pequeños empleadores ofrecen un plan de retiro para sus empleados 33 veces se revisa la razón en ventaja competitiva en reclutamiento y retención. Datos: Z= 2.17 P = 0.33 E = 0.03
a) ¿Qué tamaño de muestra se recomienda si un objetivo de la encuesta es estimar la proporción de pequeños empleadores con diseño con un margen de error 3% y un 97% de nivel de confianza?
− . ..−. .. = 1.156 b) Inciso A con N.C 98%
− . ..−.
..
= 1.334
3. En una encuesta de ventas al detalle que realizo American Exprés se encontró que el 16% de los consumidores utilizan internet para comprar regalos durante la temporada vacacional en la encuesta participaron 1285 clientes. ¿Cuál es el margen de error y cuál es la estimación del intervalo a un N.c del 92%? Datos: P = 0.16 n= 1285 92% = 1.75
∓ 1 0.16∓1.75 .−.
0.16 ± 0.018
(0.142; 0.178) 4. El tiempo de traslado al trabajo, para residentes de las 15 ciudades más grandes de los EEUU según una encuestadora. Se emplea una muestra aleatoria de San Francisco y se determina que 6.25 minutos es el valor de la planeación de la desviación poblacional. Datos: E=2 NC = 99% -> 2.576 N= 15 = 6.25
a) Se desea estimar la media de la población, con 2 minutos de margen de error, ¿Qué tamaño de la muestra se debe usar a un nivel de confianza del 99%?
2. 6. 5 76 2 5 2 64.80 ≅65 5. La cantidad de horas que duermen los tungurahuenses cada noche varía mucho desde 12% de la población que duerme menos de 6 horas hasta 6% que duerme más de 8 horas. Se coge una muestra con respecto a las horas de sueño por noche. 6.9 7.6 6.5 6.2 5.3 7.8 7.0 5.5 7.6 6.7 7.3 6.6 7.1 6.9 6.0 6.8 6.5 7.2 5.8 8.6 7.6 7.1 6.0 7.2 7.7
0.0016 0.5476 0.1296 0.4356 2.4336 0.8836 0.0196 1.8496 0.5476 0.0256 0.1936 0.0676 0.0576 0.0016 0.7396 0.0036 0.1296 0.1156 1.1236 3.0276 0.5476 0.0576 0.7396 0.1156 0.7056
a) ¿Cuál es el estimador puntual de la media poblacional?
Σ 6.86 b) Determine el intervalo de confianza al 95% S = 0.78
∓ √ 6.86 ∓2.064 .√ ∓
6.86 0.322
(6.538; 7.182)
12. ¿Qué es una hipótesis?
Suposición posible o imposible de algo para sacar una consecuencia
Proposición no demostrada que se admite para orientar investigaciones y experimentos
Explicación no basada en pruebas, es decir, sin ser suficientemente demostrada
Conjetura de la cual se parte para poder explicar racionalmente la causa real de un hecho
Hipótesis Estadística Es una conjetura o una suposición que se realiza respecto a una población, concretamente, con respecto a un parámetro de la población el cual cuantifica una característica de ella.
Hipótesis Estadística
Hipótesis Nula (Ho )
Hipótesis Alternativa (H1 )
Supone que no hay diferencia entre el estadístico y el parámetro
Supone que existe diferencia entre el estadístico y el parámetro
12.1. Hipótesis Nula
Es una aseveración en el sentido de que un parámetro poblacional tiene un valor específico. Es el punto de partida de la investigación. Generalmente en su interpretación se utiliza la frase “no existe diferencia”. Se denota (Ho)
Por ejemplo, se realiza una investigación sobre el costo de los desayunos en el cafetín de la ULA – Táchira. Alguien puede llegar a afirmar que los estudiantes invierten un promedio de 12 bolívares. Hipótesis nula: El gasto promedio es de 12 Bs.
Ho: µ = 12 Bs.
12.2. Hipótesis Alternativa Es cualquier hipótesis que difiera de la hipótesis nula Si se toma el ejemplo anterior, se podría afirmar tres alternativas: 1) Que los estudiantes invierten en sus desayunos en la ULA-Táchira un promedio diferente a 12 Bs. 2) Que la inversión de los estudiantes en promedio es menor a 12 Bs. 3) Que los estudiantes invierten en promedio más de 12 Bs en sus desayunos en el cafetín de la ULA-Táchira Hipótesis Alternativas:
i.
El gasto promedio es diferente de 12 Bs. (µ ≠ 12 Bs.)
ii.
El gasto promedio es menor de 12 Bs. (µ ˂ 12 Bs.)
iii.
El gasto promedio es mayor de 12 Bs. (µ > 12 Bs.)
Las hipótesis Nula y Alternativa
Una hipótesis nula siempre asegura que no hay diferencia entre el estadístico y el parámetro.
Aunque solo se cuente con la información que proporciona la muestra, la hipótesis nula se escribe en términos del parámetro de la población.
Si una hipótesis nula es considerada falsa, algo debe ser cierto, es cuando se considera la hipótesis alternativa.
La metodología de las pruebas de hipótesis está diseñada para analizar la aceptación o rechazo de hipótesis nulas, sin embargo, no rechazar una hipótesis nula, no es prueba de que sea cierta.
Nunca se puede probar que una hipótesis nula sea correcta, porque la decisión se basa solo en la información que aporta la muestra, y no en la información de toda la población.
La hipótesis nula Ho es la hipótesis que se prueba siempre
La hipótesis alternativa H 1 se formula opuesta a la hipótesis nula, y es la conclusión de apoyo si se rechaza la hipótesis nula.
12.3. Valor crítico del estadístico de prueba. Regiones
Es el valor del estadístico de prueba en su correspondiente distribución en el muestreo (Z, t, x2, F) y que divide a dicha distribución en dos regiones: una de aceptación de la hipótesis nula y otras(s) de rechazo de la hipótesis nula.
Region de no rechazo
Región de
Región de
rechazo
rechazo Valor crítico
Valor crítico
Posibles riesgos en la toma de decisiones El hecho de utilizar estadísticos muestrales para tomar decisiones sobre parámetros poblacionales, incide en el hecho de correr riesgos al establecer conclusiones incorrectas. Dichas decisiones incorrectas reciben el nombre de error tipo I y error tipo II
Un error tipo I ocurre si la hipótesis nula H 0 es rechazada cuando realmente es cierta y no debe rechazarse. La probabilidad de que ocurra un error tipo I se denota por
P(Error tipo I) = P(Rechazar H 0 / H0 es verdadera) =
Un error tipo II ocurre si la hipótesis nula H 0 no se rechaza cuando realmente es falsa y debe rechazarse. La probabilidad de que ocurra un error tipo II se denota por
P(Error tipo II) = P(No rechazar H 0 / H0 es falsa) =
12.4. Coeficiente/Nivel de Significancia:
Se define como la probabilidad de cometer un error tipo I en una prueba estadística. Se
denota por la letra griega . Se debe especificar antes de realizar la prueba de hipótesis y queda bajo control directo de quien investiga o realiza la prueba. Por lo general se asumen los valores de 0.05 y 0.01. En si es la probabilidad de rechazo y no rechazo de la hipótesis nula. Cuando se multiplica por 100 se habla de nivel de confianza y los valores más usados son 5% y 1%
Coeficiente de confianza: Se define como la probabilidad de que la hipótesis nula H 0 no sea rechazada cuando realmente es cierta y no se debe rechazar. Es el complemento de la probabilidad de
cometer un error tipo I, por lo tanto se denota por (1 – ). Al multiplicarse por 100 se obtiene el nivel de confianza.
Riesgo : Se define como la probabilidad de cometer un error tipo II. Se le llama también nivel de riesgo del consumidor. Depende de la diferencia entre el valor hipotético y el valor real del parámetro poblacional.
Potencia de una prueba: Se define como la probabilidad de rechazar la hipótesis nula H 0 cuando realmente es
β
falsa y debe rechazarse. Es el complemento (1 – ) de la probabilidad de un error tipo II. También se le llama poder de una prueba estadística.
Probabilidad de cometer error tipo I (nivel de significancia)
Coeficiente de confianza
Z crítico
12.5. TIPOS DE ERROR Hipótesis Verdadera (Ho) Decisión Decisión Aceptar a Ho correcta Rechazar a Ho
∝ β
Error Tipo I
Falsa (Ho) Error tipo II Decisión correcta
: Nivel de significancia que indica la probabilidad máxima con la que se puede
cometer un error del tipo I : Nivel de significancia que indica la probabilidad máxima con la que se puede
cometer un error del tipo II
Pruebas estadísticas 1) Escala de intervalo o razón Paramétricas
2) Se ajusta a la curva normal 3) Varianzas iguales
Pruebas 1) Escala ordinal o por rangos No paramétricas
2) Su distribución es libre 3) Menos supuestos para cumplr
12.2. PRUEBAS PARAMETRICAS – MUESTRAS GRANDES
Ensayo de dos colas
Se aplica cuando se está interesado en los valores extremos a ambos lados del parámetro, es decir, en las dos colas de la distribución Por ejemplo para un nivel de significancia del 5%, se tiene:
Region de no rechazo
Región de
Región de
rechazo
rechazo -Z = -1.96
Z= 1.96
Ensayo de una cola, extremo derecho Se aplica cuando se está interesado en los valores extremos a un solo lado del parámetro, es decir, en una cola, extremo derecho de la distribución. Por ejemplo para un nivel de significancia del 5%, se tiene:
Region de no rechazo
Región de rechazo Z= 1.645
0.05
Ensayo de una cola, extremo izquierdo Se aplica cuando se está interesado en los valores extremos a un solo lado del parámetro, es decir, en una cola, extremo izquierdo de la distribución. Por ejemplo para un nivel de significancia del 5%, se tiene:
Region de no rechazo
Región de rechazo 0 05
Z
1 645
VALORES CRITICOS DE “Z” DE MAYOR USO Zc Prueba de una cola Prueba de Dos colas
1%
5%
10%
+ 2.33 ó - 2.33 + 2.58 ó - 2.58
+ 1.645 ó - 1.645 + 1.96 ó - 1.96
+ 1.28 ó - 1.28 + 1.645 ó - 1.645
Procedimiento para probar hipótesis (Enfoque tradicional) Formular H1
Tipo de prueba
Formular Ho
1. Plantear la Hipótesis
¿Varianza ? Ecuación
2. Seleccionar un nivel de significancia ( )
3. Calcular el estadístico de prueba
4. Establecer una regla de decisión
5. Tomar una decisión
Rechazar la hipótesis nula y aceptar la hipótesis alternativa H1
Aceptar la hipótesis nula Ho
1. El gerente del Hotel Relax afirma que la media de las cuentas de los huéspedes, en un fin de semana, es de $600 dólares o menos. Un empleado del departamento de contabilidad del hotel notó que recientemente los cargos totales en las cuentas de huéspedes han aumentado. EI contador usara una muestra de cuentas de fin de semana para probar la afirmación del gerente.
a) ¿Cuál de las siguientes formas de hipótesis se debe usar para probar la afirmación del gerente?
: ≤600 1: >600 b) ¿Qué conclusión es la adecuada cuando no se pueda rechazar Ho? El gerente tiene la razón de que los huéspedes tienen en sus cuentas
≤
600
c) ¿Qué conclusión es la adecuada cuando sí se puede rechazar Ho? El contador demostró que tenía la razón, por lo tanto los huéspedes tienen más de 600 en sus cuentas. 2. EI gerente de una agencia automotriz desea implantar un nuevo plan de bono con objeto de aumentar el volumen de ventas. En la actualidad, la media del volumen de ventas es de 14 automóviles vendidos por mes. El gerente desea llevar a cabo una investigación para ver si el nuevo plan de bono aumenta el volumen de ventas. Para reunir datos acerca del plan, se permitió que un grupo de vendedores trabajen con él durante un periodo de un mes.
a) Formule las hipótesis nula y alternativa que sean más adecuadas para este caso.
: ≤14 1: >14
b) Comente la conclusión a que se llegaría cuando no se pueda rechazar Ho El gerente seguirá vendiendo menos de 14 automóviles por mes.
c) Comente la conclusión a la que se llegaría cuando si se pueda rechazar Ho El plan de bonos se lleva a cabo por lo que incrementarán sus ventas.
3. Una operación en una línea de producción debe Llenar cajas con detergente hasta un peso promedio de 32 onzas. Periódicamente se selecciona una muestra de cajas llenas, que se pesan para determinar si están faltas 0 sobradas de Llenado. Si los datos de la muestra llevan a la conclusión de que les falta 0 sobra detergente, se debe parar la línea de producción, y hacer los ajustes necesarios para que el llenado sea correcto.
a) Formule las hipótesis nula y alternativa que ayuden a decidir si es conveniente parar y ajustar la línea de producción 0 no.
: 32 1: ≠32
b) Comente la conclusión y la decisión cuando no se puede rechazar Ho. La línea de producción no se pararía ya que el llenado de detergente es el adecuado
c) Comente la conclusión y la decisión cuando sí se puede rechazar Ho. Las cajas con detergente no se llenan correctamente y la línea de producción necesita ajustes. 4. En una encuesta Nielsen se obtuvo la estimación de que la media del número de horas de ver la TV por familia es de 7.25 horas diarias. Suponga que en esta encuesta participaron 200 familias. Hace 10 años, la media de ver la TV era de 6.70 y los datos tuvieron una desviación estándar de 2.5 horas. Si considera que los datos se distribuyen normalmente y si emplea un alfa de 0.01, podría aseverar que el promedio de horas de ver la TV ha aumentado en los últimos 10 años.
a) Formule las hipótesis con un nivel de significancia de 1% 1) Plantear la hipótesis
: ≤6.7 1: >6.7
b) ¿Cuál es el valor crítico del estadístico de prueba y cuál es la regla de rechazo? 2) Nivel de significancia
∝ 0.01
Z crítico Z ᾳ 2.33
c) Calcule el valor del estadístico de prueba 3) Calcular el estadístico de prueba
√
.√ −. .
= 3.11
4) Establecer la regla de decisión
>∝
Rechazo Ho y se acepta H1
3.11 > 2.33 (Verdadero)
d) ¿Cuál es su conclusión? 5) Toma de decisión Se acepta H1 en consecuencia el promedio de familias que ve televisión es mayor a 6.7 horas diarias. 5. La empresa ABC, vigiló a los usuarios de internet en 7 países: Australia, Gran Bretaña, Canadá, Francia, Alemania, Japón y EEUU. Según las cifras de medición recientes los usuarios estadounidenses ocupan el 1° lugar en el uso de internet con un promedio de 13 horas por mes. Suponga que un estudio e seguimiento en el que participan 145 usuarios de internet Canadienses la media muestral fue de 10.8 horas por mes y la desviación estándar muestral fue de 9.2 horas.
a) Formular la hipótesis si la muestra sustenta la conclusión de que los usuarios de internet canadienses tienen una media poblacional menor que el promedio estadounidense de 13 horas por mes con un nivel de confianza del 99% ¿Cuál es la conclusión?
1) Plantear la hipótesis
: ≥13 1: <6.7
2) Nivel de significancia
∝ 0.05 3) Calcular el estadístico de prueba
√
.√ .−
= -2.88
4) Establecer la regla de decisión
<∝
Rechazo Ho y se acepta H1
-2.88 < -1.645 (Verdadero) 5) Toma de decisión Rechaza Ho y se acepta H1 que dice que el promedio de número de horas utilizadas de internet es menor a 13 horas diarias.
Ejercicios consultados: 1. El consejo universitario informa que el número promedio de estudiantes de nuevo ingreso en las universidades es de 6000. En un periodo reciente de inscripciones. Se tomó una muestra de 32 universidades con una media muestral de los estudiantes de nuevo ingreso de 5812 y una desviación estándar muestral de 1140.¿Estos datos indican un cambio en el número medio de estudiantes de nuevo ingreso?
a) Formule las hipótesis Ho: µ=6000 H1: µ≠6000
b) ¿Cuáles son los valores críticos de la prueba?
α=0.05
G.l= n-1
z.c
z.c
G.l=28 tα=Ttabla(α=0.025; G.l=28)= 2.048
-2,048
0
2,048
c) Calcular el valor estadístico de la prueba
t =
̅− µ √
t =
− √
= -0.89
d) ¿Cuál es su conclusión? No hubo ningún cambio es decir el número de estudiantes que ingresan a las universidades.
Acepto Ho:
e) Que puede decir acerca del valor P P ≤ α/2
Es decir no tuvo ningun cambio con el nuevo grupo de estudiantes que ingreso a la universidad
2P ≤ α
(0.855; 1.313) 2(0.20; 0.10) ≤ 0.05 (0.40; 0.20) ≤ 0.05 (falso)
2. La Employment and Training Administration informa que la prestación media del seguro de desempleo es de $245/semana. Un investigador del estado de Virginia anticipo que datos muéstrales indicaran que la prestación media semanal del seguro de desempleo en el estado de Virginia es menor que la media de todo el país. a) De las hipótesis adecuadas de manera que el rechazo de Ho favorezca la afirmación del investigador. Ho: H1:
<
≥ 245
245
b) En una muestra de 29 individuos la media muestral encontrada fue de $231 y la desviación estándar muestral fue $80. ¿Cuál es el valor p?
α=0.05
G.l= n-1 G.l=28 tα=Ttabla(α=0.05; G.l=28)= -1.701
t =
̅− µ
t =
√
− √
= -0.94
P≤α
(0.855; 1.313) (0.20; 0.10) ≤ 0.05 (falso)
Se acepta Ho
c) Si α=0.05 ¿Cuál es su conclusión? En el estado de Virginia la prestación semanal del seguro de desempleados es mayor que al de todo el país. 3. El consumo anual per cápita de leche es de 21.6 galones. Usted cree que en el oeste medio el consumo de leche es mayor y desea fundamentar su opinión. En una muestra de 16 personas de Webster city, pueblo del oeste medio , la media muestral del consumo anual fue de 24.1 galones y la desviación estándar es s=4.8. a) Elabore una prueba de hipótesis que se pueda usar para determinar si el consumo medio anual en Webster city es mayor que la media nacional Ho:
µ ≤ 21.6
H1: µ
> 21.6
b) Con α=0.05 cuales son los valores críticos de prueba.
Datos
21. 6 0. 0 5 =24.1 48
n=16 α=0.05
G.l= n-1 G.l=15 tα=Ttabla(α=0.05; G.l=15)= -1.753
t ≥ tα se rechaza
c) Calcule el valor estadístico de prueba
̅− µ
t =
√
t =
.−. √
= 0.21
d) Cuál es su conclusión En el oeste el consumo de leche es menor a 21.6 galones 4.
12Una
muestra de 25 observaciones tiene una media de 42.0 y una desviación de
8. Trabajando con un nivel de significancia del 1%. ¿Existe razón para rechazar la hipótesis de la media de la población es de 46.0?1 Datos:
̅ 42
n=25
µ=46
8
f) Formule las hipótesis Ho: µ=46 Ho: µ≠46
g) ¿Cuáles son los valores críticos de la prueba? z.c
z.c
α=0.01
G.l= n-1
2,492
0
2,492
G.l=24 tα=Ttabla(α=0.01; G.l=24)= 2.492
h) Calcular el valor estadístico de la prueba
t =
̅− µ √
t =
− √
= -2.5
i) ¿Cuál es su conclusión? Se rechaza Ho y se acepta H1 es decir que la media de la población de observadores no es 46 5. Un fabricante desea hacer público, a fin de aumentar sus ventas, que el contenido de nicotina de sus cigarrillos tienen un promedio inferior a los 22mg.
12
Martinez, C. (2012). Estadistica y muestreo. Bogota: ECOE.
Una oficina gubernamental de salud y del medio ambiente realiza un análisis de 10 cigarillos y obtiene los contenidos de nicotina para cada uno, siendo de:
∑
21
24
18
0.36 12.96
16 5.76
22
23
19.36 2.56
20 6.76
20 0.16
24
16 0.16
19.36
a) Calcular la hipótesis Ho: H1:
<22 =22
b) Con α=0.05. ¿Cuáles son los valores críticos para el estadístico de prue ba? α=0.05
G.l= n-1 G.l=9 tα=Ttabla(α=0.05; G.l=9)= -1.833
c) Calcule la media muestral
̅ 20410 20.4
d) Calcule la desviación muestral
̅ ∑ 1 80.4 101 2.99 e) Calcule el valor del estadístico de prueba
t =
̅− µ √
t =
..− √
= -1.69
12.96
f) Conclusión: El contenido de nicotina en el tabaco es diferente es decir que el investigador no está en lo cierto
Un valor P es una probabilidad que aporta una medida de una evidencia suministrada por la muestra contra la hipótesis nula. Valores P pequeños indican una evidencia mayor contra la hipótesis nula Valor P Es la probabilidad de que se obtenga un valor del estadístico del contraste que sea al menos tan extremo (≤ o ≥) como el observado, suponiendo que Ho sea cierta .13
Regla para el rechazo utilizando valor P Rechazo Ho
≤∝ 1. El nuevo palo de golf ERC de aleación de titanio de Callaway Golf Company fue calificado como “ilegal” porque promete tiros de salida que superan el
estándar de la USGA, Golf Digest comparo las distancias actuales de tiros de salida con el palo ERC y un palo aprobado por la USGA con una distancia promedio poblacional de 280 yardas para el tiro de salida. Usando nueve palos de prueba, la distancia promedio del tiro inicial con el palo ERC fue de 286.9 yardas. Conteste las preguntas siguientes suponiendo una desviación estándar muestral de 10 yardas para la distancia de tiro de salida. a) Formula la hipótesis nula y alternativa que permita determinar si el nuevo palo de golf ERC tiene una distancia promedio poblacional del tiro de salida mayor que 280 yardas b) En promedio ¿cuantas yardas más viajo la pelota de golf con el palo ERC? c) Con
0. 0 5
¿Cuál es el valor crítico para la prueba y cuál es la regla de
rechazo?
d) Calcule el valor del estadístico de prueba e) ¿Cuál es su conclusión? f) ¿Qué puede decir acerca del valor de p?
≤280 >280
a) Ho=
Datos
280 0. 0 5
H1=
=286.9 S=10
b) t =
n=9
t=286.9 – 280 = 6.9
c)
0. 0 5
G.L= n-1 G.L =9-1 = 8
1.86 −√ .√ − 2.07 ≥ ℎ 2,07≥1,86 280 t
d) Calcular el valor estadístico de la prueba t
e)
Se rechaza Ho y se acepta H1 que dice que el palo de golf no va a recorrer
>
f) Está en el intervalo (1.860; 2,306) entonces el valor de P esta entre 0,05 y 0,025
2. Las ganancias promedio poblacionales por acción para corporaciones de servicios financieros, como American Express fueron de $3. En 2001, para una muestra de 10 corporaciones de servicios se obtuvieron los datos siguientes de ganancias por acción: 1.92
2.16
3,63
3.16
4.02
3.14
2.20
2.34
3.05
2.38
a) Formula las hipótesis nula y alternativa que permitan determinar si las ganancias promedio poblacionales por acción en 2001 difieren de los tres dólares informados en el 2000 Ho=
3 ≠3
H1=
0. 0 5 0. 0 5
b) Con
¿Cuáles son los valores críticos para la estadística de prueba, ¿ y
cuál es la regla de rechazo? Datos
3 0. 7 0 0. 0 5
G.L = n-1
=2.8
G.L =10-1 G.L =9
t Regla de rechazo
⁄2 1.833
n=10
≤t ⁄2 ⋀≥ t ⁄2 ∑ 2.8 − − , 0,70 Se rechaza Ho
c) Calcule la media muestral =
=
d) Encuentre la desviación estándar muestral
e) Calcule el valor del estadístico de prueba
−√ ..√ − t
= -0.90
f) ¿cuáles s su conclusión?
Que se acepta Ho no hay diferencia porque -0.90 cae en la zona de aceptación g) ¿qué puede decir acerca del valor de P?
0,20;0.10 20.40;0.20 0.40;0,20 ≤0.05
h) Calcular el intervalo de confianza y dar su conclusión
± ⁄2 √ 2.8±2.262 .√ ±0.50
(2.30; 3.30)
METODO DEL INTERVALO DE CONFIANZA PARA PROBAR UNA HIPOTESIS BILATERAL
Paso 1: seleccionar de la población una muestra aleatoria simple y emplear el valor de la media muestral ( ) para obtener un intervalo de confianza para la media poblacional (µ)
Paso 2: si el intervalo de confianza contiene el valor hipotético µ o, NO SE RECHAZA Ho. Caso contrario se rechaza Ho.
14. PRUEBA DE HIPOTESIS CUANDO NO SE CONOCE LA DESVIACION POBLACIONAL (Muestras Pequeñas)
En palabras de (Anderson, Sweeney, & Williams, 2008). Como
es desconocida
corresponde a la situación en que no se tiene una estimación de la desviación estándar poblacional antes de tomar la muestra, la muestra se usa para obtener una estimación tanto de µ como de
.
Por tanto para realizar una prueba para la media poblacional en el
caso en que no se conoce
̅
la media muestral se usa como estimación de µ y la
desviación estándar muestral S se usa como estimación de µ . Se utiliza las mismas fórmulas de z con la diferencia que ahora el estimador es t (student) y se cambia la desviación poblacional por s. para prueba bilateral también se usa el intervalo con el estimador (t). Para cálculos de las proporciones en esta prueba t de student o este estimador (t), los valores P no se pueden calcular, con exactitud en consecuencia se va a trabajar con un intervalo para aplicar la regla del P valor. Cuando sea una prueba bilateral el valor de P se multiplica por 2. Para calcular el valor de P se sigue los siguientes pasos: PASO 1: Se ubica en la fila correspondiente los grados de libertad PASO 2: el valor calculado de P se trata de ubicar dentro de un intervalo en dicha fila PASO 3: se observa la probabilidad en la parte superior y se da valor de P aproximado
2. El nuevo palo de golf ERC de aleación de titanio de Callaway Golf Company fue calificado como “ilegal” porque promete tiros de salida que superan el
estándar de la USGA, Golf Digest comparo las distancias actuales de tiros de salida con el palo ERC y un palo aprobado por la USGA con una distancia promedio poblacional de 280 yardas para el tiro de salida. Usando nueve palos de prueba, la distancia promedio del tiro inicial con el palo ERC fue de 286.9 yardas. Conteste las preguntas siguientes suponiendo una desviación estándar muestral de 10 yardas para la distancia de tiro de salida. g) Formula la hipótesis nula y alternativa que permita determinar si el nuevo palo de golf ERC tiene una distancia promedio poblacional del tiro de salida mayor que 280 yardas h) En promedio ¿cuantas yardas más viajo la pelota de golf con el palo ERC? i) Con
0. 0 5
¿Cuál es el valor crítico para la prueba y cuál es la regla de
rechazo?
j) Calcule el valor del estadístico de prueba k) ¿Cuál es su conclusión? l) ¿Qué puede decir acerca del valor de p?
≤280 >280
g) Ho=
H1=
h) t =
t=286.9 – 280 = 6.9
i)
0. 0 5
G.L= n-1 G.L =9-1 = 8
1.86 −√ .√ − 2.07 ≥ ℎ 2,07≥1,86 t
j) Calcular el valor estadístico de la prueba t
k)
Datos
280 0. 0 5 =286.9 S=10 n=9
Se rechaza Ho y se acepta H1 que dice que el palo de golf no va a recorrer
280
>
l) Está en el intervalo (1.860; 2,306) entonces el valor de P esta entre 0,05 y 0,025
2. Las ganancias promedio poblacionales por acción para corporaciones de servicios financieros, como American Express fueron de $3. En 2001, para una muestra de 10 corporaciones de servicios se obtuvieron los datos siguientes de ganancias por acción: 1.92
2.16
3,63
3.16
4.02
3.14
2.20
2.34
3.05
2.38
i) Formula las hipótesis nula y alternativa que permitan determinar si las ganancias promedio poblacionales por acción en 2001 difieren de los tres dólares informados en el 2000
3 ≠3 0. 0 5 0. 0 5
Ho=
H1=
j) Con
¿Cuáles son los valores críticos para la estadística de prueba, ¿ y
cuál es la regla de rechazo? Datos z.c
G.L = n-1
z.c
3 0. 7 0 0. 0 5 =2.8
G.L =10-1 1,833
G.L =9
t Regla de rechazo
0
⁄2 1.833
≤t ⁄2 ⋀≥ t ⁄2 ∑ 2.8
Se rechaza Ho
k) Calcule la media muestral =
1,833
=
l) Encuentre la desviación estándar muestral
n=10
−− , 0,70 m) Calcule el valor del estadístico de prueba
−√ ..√ − t
= -0.90
n) ¿cuáles s su conclusión?
Que se acepta Ho no hay diferencia porque -0.90 cae en la zona de aceptación o) ¿qué puede decir acerca del valor de P?
0,20;0.10 20.40;0.20 0.40;0,20≤0.05
p) Calcular el intervalo de confianza y dar su conclusión
± ⁄2 √ 2.8±2.262 .√ ±0.50 2.8
(2.30; 3.30)
EJERCICIOS CONSULTADOS 14
Ejemplo 1. El consejo universitario informa que el número promedio de estudiantes
de nuevo ingreso en las universidades es de 6000. En un periodo reciente de inscripciones. Se tomo una muestra de 32 universidades con una media muestral de los estudiantes de nuevo ingreso de 5812 y una desviación estándar muestral de 1140.¿Estos datos indican un cambio en el número medio de estudiantes de nuevo ingreso? j) Formule las hipótesis Ho: µ=6000 H1: µ≠6000
Datos
6000 0. 0 5 =5812 1140
n=29
k) ¿Cuáles son los valores críticos de la prueba? 14
Anderson, D., Sweeney, D., & Williams, T. (2008). Estadistica para administracion y economia (10a. ed.). Mexico: CENAGE Learning.
α=0.05 z.c
G.l= n-1
z.c
G.l=28 tα=Ttabla(α=0.025; G.l=28)= 2.048
-2,048
0
2,048
l) Calcular el valor estadístico de la prueba
t =
̅− µ √
t =
− √
= -0.89
m) ¿Cuál es su conclusión? No hubo ningún cambio es decir el número de estudiantes que ingresan a las universidades.
Acepto Ho:
n) Que puede decir acerca del valor P P ≤ α/2
Es decir no tuvo ningún cambio con el nuevo grupo de estudiantes que ingreso a la universidad
2P ≤ α
(0.855; 1.313) 2(0.20; 0.10) ≤ 0.05 (0.40; 0.20) ≤ 0.05 (falso)
Ejercicio 2: La Employment and Training Administration informa que la prestación media del seguro de desempleo es de $245/semana. Un investigador del estado de Virginia anticipo que datos muéstrales indicaran que la prestación media semanal del seguro de desempleo en el estado de Virginia es menor que la media de todo el país. d) De las hipótesis adecuadas de manera que el rechazo de Ho favorezca la afirmación del investigador. Ho: H1:
<
≥ 245
245
e) En una muestra de 29 individuos la media muestral encontrada fue de $231 y la desviación estándar muestral fue $80. ¿Cuál es el valor p? α=0.05
G.l= n-1
z.c
G.l=28 tα=Ttabla(α=0.05; G.l=28)= -1.701
t =
̅− µ
t =
√
− √
-1,701
= -0.94
P≤α
(0.855; 1.313) (0.20; 0.10) ≤ 0.05 (falso)
Se acepta Ho
f) Si α=0.05 ¿Cuál es su conclusión? En el estado de Virginia la prestación semanal del seguro de desempleados es mayor que al de todo el país.
Ejercicio 3. El consumo anual per cápita de leche es de 21.6 galones. Usted cree que en el oeste medio el consumo de leche es mayor y desea fundamentar su opinión. En una muestra de 16 personas de Webster city, pueblo del oeste medio , la media muestral del consumo anual fue de 24.1 galones y la desviación estándar es s=4.8. e) Elabore una prueba de hipótesis que se pueda usar para determinar si el consumo medio anual en Webster city es mayor que la media nacional Ho:
µ ≤ 21.6
H1: µ
> 21.6
Datos
21. 6 0. 0 5 =24.1 48
f) Con α=0.05 cuales son los valores críticos de prueba.
n=16 α=0.05
G.l= n-1 G.l=15
z.c
z. A.
tα=Ttabla(α=0.05; G.l=15)= -1.753 1,753
t ≥ tα se rechaza
g) Calcule el valor estadístico de prueba
̅− µ
t =
t =
√
.−. √
= 0.21
h) Cuál es su conclusión En el oeste el consumo de leche es menor a 21.6 galones 15Ejercicio
4: Una muestra de 25 observaciones tiene una media de 42.0 y una
desviación de 8. Trabajando con un nivel de significancia del 1%. ¿Existe razón para rechazar la hipótesis de la media de la población es de 46.0?1 Datos:
̅ 42
n=25
µ=46
8
o) Formule las hipótesis Ho: µ=46 Ho: µ≠46
p) ¿Cuáles son los valores críticos de la prueba? z.c
z.c
α=0.01
G.l= n-1
2,492
0
2,492
G.l=24 tα=Ttabla(α=0.01; G.l=24)= 2.492
q) Calcular el valor estadístico de la prueba
t =
̅− µ √
t =
− √
= -2.5
r) ¿Cuál es su conclusión? Se rechaza Ho y se acepta H1 es decir que la media de la población de observadores no es 46
Ejercicio 5: Un fabricante desea hacer público, a fin de aumentar sus ventas, que el contenido de nicotina de sus cigarrillos tienen un promedio inferior a los 22mg. Una 15
Martinez, C. (2012). Estadistica y muestreo. Bogota: ECOE.
oficina gubernamental de salud y del medio ambiente realiza un análisis de 10 cigarrillos y obtiene los contenidos de nicotina para cada uno, siendo de:
∑
21
24
18
0.36 12.96
16 5.76
22
23
19.36 2.56
20 6.76
20
24
0.16
16 0.16
19.36
g) Calcular la hipótesis Ho: H1:
<22 =22
h) Con α=0.05. ¿Cuáles son los valores c ríticos para el estadístico de prueba? α=0.05 z.c
G.l= n-1
z. A.
G.l=9 tα=Ttabla(α=0.05; G.l=9)= -1.833
i) Calcule la media muestral
-1,833
̅ 20410 20.4
j) Calcule la desviación muestral
̅ ∑ 1 80.4 101 2.99 k) Calcule el valor del estadístico de prueba
t =
̅− µ √
t =
..− √
= -1.69
12.96
l) Conclusión: El contenido de nicotina en el tabaco es diferente es decir que el investigador no está en lo cierto m) Que puede decir acerca del valor P. P≤ α
(1.383; 1.833) (0.10; 0.05) 0.05) ≤ 0.05 (FALSO)
Se acepta Ho es decir que el nivel del cigarrillo es diferente a 22 15. ESTADISTICO DE PRUEBA EN LA PRUEBA DE HIPOTESIS PARA LA PROPORCION POBLACIONAL
Según (Anderson, Sweeney, Sweeney, & Williams, 2008) En esta sección se muestra como realizar la prueba de hipótesis para la proporción poblacional p. mediante Po se denota la proporción poblacional las tres formas de una prueba de hipótesis hipótesis para la proporción proporción poblacional poblacional son las siguientes 16:
Cola derecha
Cola izquierda
Bilateral
Ho:
Ho:
Ho:
H1:
≥ <
H1:
≤ >
H1:
≠
1. El centro NN para el desarrollo de la fuerza de trabajo encontró que 40% de los usuarios de internet recibieron más de 10 mensajes de correo electrónico por día en el año 2000, en el 2001 se repitió un estudio similar acerca del uso del correo electrónico. El propósito del estudio fue ver si aumento el uso de email. a) Formule H0 y H1 para determinar si ocurrió un incremento en la proporción de usuarios de internet Ho:
Ho:
P≤0.40
>
P 0.40
b) Con α= 0,05 cuál es el valor crítico y cuál es el valor de rechazo Z ≥ Zα Se rechaza Ho
z.c
z. A.
1,645
c) Si en una muestra de 420 usuarios se encontró que 188 reciben más de 10 mensajes
ṗ 188420 ṗ0,4476
ṗ ℎ DATOS P= 0,40 n = 420
ṗ1 1 4 0 0,0,04,44760, 010, 4 0 420 1. 9 9
=
2. Un estudio realizado por Consumer Reports indica que 64% de los clientes de los supermercados piensa que los productos de las marcas de los supermercados son tan buenos como las marcas nacionales. Para investigar si estos resultados aplican a sus propios productos, un fabricante de salsa de tomate de una marca nacional, preguntó a los integrantes de una muestra si consideraban a las salsas de tomate de las marcas de los supermercados tan buenas como la marca nacional a) Formule las hipótesis para determinar si el porcentaje de clientes de los supermercados que considera a las salsas de tomate de las marcas de los supermercados supermercados tan buenas como la marca nacional difiere de 64%. Ho: P ≥ 0.64
H1: P
< 0 64
b) Si en una muestra de 100 clientes 52 opinan que las marcas de los supermercados son tan buenas como las marcas nacionales, ¿cuál es el valor-p?
DATOS P= 0,64 n = 1000 h = 52
z.c
-1,645
Z ≤ Zα Se rechaza Ho
c) Con α = 0.05, ¿cuál es la conclusión?
ṗ ℎ ṗ ṗ0, 5 2
ṗ− −. ....
= 2.5
d) ¿Le dará gusto esta conclusión al fabricante de la marca nacional de salsa de tomate? Explique. P= 0.5-P(z=-2.5) P= 0.5- 0.4938
Se rechaza Ho: P≤α 0.0062 ≤ 0.05
P= 0.0062 Se rechaza H0 en consecuencia la salsa de tomate de supermercado con la salsa de tomate nacional son diferentes en sus porcentajes.
3. Drugstore.com fue la primera compañía en ofrecer ventas al menudeo de medicamentos por internet. A los clientes de Drugstore.com se dio la oportunidad de comprar productos para su salud, belleza, cuidado personal, bienestar y reabastecimiento farmacéutico vía internet. Al final de 10 meses de operación, la compañía informo que 44% de las órdenes fueron de clientes que ya habían comprado antes. Suponga que Drugstore.com utilizara una muestra de
órdenes de clientes cada trimestre para determinar si la proporción de órdenes de clientes repetidos cambio desde P= 0,44 inicial. a) Formule la hipótesis nula y alternativa Ho: P=0.44 H1: P≠ 0.44
b) Durante el primer trimestre se observaron 205 clientes repetidos en una muestra de 500 órdenes ¿Cuál es el valor ṗ? ¿Cuál es su conclusión con α= 0,05?
ṗ ṗ 205500 ṗ0, 4 1
z.c
-1,96
ṗ 1 10,44 00,,44410, 4 4 500 1, 3 5
z.c
0
1,96
EJERCICIOS CONSULTADOS 171.
Considere la prueba de hipótesis siguiente:
0:≤0,75 1:>0,75 Se seleccionó una muestra de 300 elementos. Calcule el valor-p y establezca su conclusión para cada uno de los resultados muéstrales siguientes. Use α = 0.05.
a.
ṗ−
80,75 00,,76510, 7 5 300 2, 8 Se rechaza H0 y se acepta H1
ṗ− 20,7575 00,,77510, 300 1,20 b.
Se acepta H0 y se rechaza H1
ṗ− 00,75 00,,77510, 7 5 300 2,00 c.
Se rechaza H0 y se acepta H1
z.c z. A.
-1,645
ṗ− 70,75 00,,77510, 7 5 300 0, 8 0 d.
Se acepta H0 y se rechaza H1
2: Un estudio realizado por Consumer Reports indica que 64% de los clientes de los supermercados piensa que los productos de las marcas de los supermercados son tan buenos como las marcas nacionales. Para investigar si estos resultados aplican a sus propios productos, un fabricante de salsa de tomate de una marca nacional, preguntó a los integrantes de una muestra si consideraban a las salsas de tomate de las marcas de los supermercados tan buenas como la marca nacional a) Formule las hipótesis para determinar si el porcentaje de clientes de los supermercados que considera a las salsas de tomate de las marcas de los supermercados tan buenas como la marca nacional difiere de 64%.
0:0,64 1:≠0,64
b) Si en una muestra de 100 clientes 52 opinan que las marcas de los supermercados son tan buenas como las marcas nacionales, ¿cuál es el valor-p?
ṗ ℎ ṗ 10052 ṗ0, 5 2 c) Con α = 0.05, ¿cuál es la conclusión?
Se rechaza H0 en consecuencia la salsa de
z.c
zona de aceptacion
0
-1,96
z.c
1,96
3: Antes del Super Bowl de 2003, la ABC pronosticó que 22% de la audiencia por televisión expresaría interés por ver uno de sus próximos programas: 8 Simple Rules, Are You Hot? y Dragnet. Durante el Super Bowl, la ABC pasó comerciales sobre estos programas de televisión. Al día siguiente del Super Bowl, una empresa de publicidad tomó una muestra de 1 532 espectadores que los vieron, de los cuales 414 afirmaron que verían alguna de las series promovidas por la ABC. a) ¿Cuál es la estimación puntual de la proporción de espectadores que después de ver los comerciales sobre los programas de televisión dijeron que los verían? Ho:
P = 0.22
H1:
P ≥ 0.22
b) Con α α = 0.05, determine si la intención de ver los programas de la ABC aumentó significantemente después de ver los comerciales.
ṗ ṗ ṗ0, 2 7
zona critica
zona de aceptacion
ṗ 1 70,22 00,,22210, 2 2 1532 4, 7 2
1,645
c) ¿Por qué tales estudios son valiosos para las empresas y los negocios de publicidad? Se rechaza Ho en consecuencia los programas de la ABC aumentaron significativamente después de ver los comerciales.
4: De acuerdo con un estudio realizado por el Census Bureau´s American Housing Survey, cuando una persona se muda de casa, el factor principal en la elección de su nuevo domicilio es que esté cerca de su trabajo (USA Today, 24 de diciembre de 2002). Según datos de 1990 de la Census Bureau, se sabe que 24% de la población de personas que se muda de casa da una “ubicación cercana a su trabajo” como el factor principal en
la selección de su nuevo domicilio. Considere que en una muestra de 300 personas que se mudaron de casa en 2003, 93 lo hicieron para estar más cerca de su trabajo. a) Formule la hipótesis: Ho: P ≤ 0.24
H1: P
>0.24
b) ¿Cuál es la conclusión de la investigación? Use α = 0.05.
ṗ ℎ ṗ 30093 ṗ0, 3 1
zona critica
zona de aceptacion
1,645
ṗ− 10,2424 00,,23410, 300 2, 8 4
Se rechaza H0 en consecuencia hay más personas que buscan un domicilio cercano a su trabajo
185.
Por estadísticas que se tienen, se ha podido establecer que por lo menos el 40% de
los jóvenes toman regularmente Coca-Cola, cuando tienen sed. Una muestra aleatoria de 450 jóvenes reveló que 200 de ellos solían tomar dicha bebida, cuando tenían sed. ¿Cuál podría ser su conclusión al nivel de 1% acerca de lo que muestran las estadísticas?
0, 4 444% :0, 4 0 :≠0, 4 0 ∝ 0,01 ,,−,, 1,71
n=450
1)
0,56 −
2)
∝ 0,005
3) 3)
z.c
4)
2,58
z.c
0
2,58
Z= Se ubica en la zona de aceptación, luego al nivel de 5% la conclusión a la que se llega es la de aceptar el 40% que arrojan las estadísticas; por lo tanto, no hay razón para rechazarlas. 196:
Un gerente de una compañía afirma que el porcentaje de atrasos en las horas de
llegada al trabajo cobija al 25% de sus empleados. Solicita al jefe de personal la revisión de 40 tarjetas marcadas con las horas de llegada, en la quincena y encuentra que 8 han llegado tarde. Al nivel del 5% ¿hay razón para concluir que el gerente está exagerando?
0,20
40
:0, 2 5 :<0. 2 5 ∝0,05
z.c
1)
-1,645 18
Martinez, C. (2012). Estadistica y muestreo. Bogota: ECOE.
2) 3)
,−,0,20, 80,40 ,, 0,79
4) Se ubica Z=-0,79 en la zona de aceptación; por lo tanto podemos concluir que a nivel de 5% el gerente no exagera
7: Una empresa al seleccionar su personal lo somete a un concurso de entrenamiento. Por experiencia el 76% de los aspirantes aprueban el curso. Se efectúan ciertos cambios en el programa para el cual se inscriben 40 y 24 lo aprueban. ¿Podría afirmarse que los cambios introducidos reducen la selección?
0,60 : 0,76 : <0,76 ∝0,01 ̅ − 7 6 0,60,00, 6400,4
∝1%
1) 2)
z.c
z. A.
3)
1,645
4)
Como -2,07 cae en la región de aceptación, la selección no se reduce con los cambios introducidos, al nivel de 1%
Z= -2.7
8. Se dice con frecuencia que la población de funcionarios públicos que tienen el hábito de fumar en horas de trabajo, es de 42%. La oficina gubernamental de salud desea realizar una campaña a fin de disminuir este porcentaje, para ello debe comprobarlo; así que decide realizar una investigación de muestreo a 25 funcionarios, encontrando que 13 de ellos fuman. ¿A nivel del 1% la oficina puede aceptar el porcentaje del 42% como indicador?
42%
0,52 25 124
1) 2) 3) 4)
: 0,42 : ≠0,42 ∝0,01 , −, ,, 0. 9 8
z.c
-2,58
z.c
0
2,58
5) Conclusión: Si hay razón para aceptar el 42% como indicador de fumadores en horas de trabajo al nivel del 1%
9. El distribuidor de una máquina afirma, que el máximo de elementos defectuosos por hora que presenta su funcionamiento es del 3%. En una determinada hora se toma como muestra 20 artículos producidos, los que a su vez son sometidos a control, encontrando un artículo defectuoso. ¿Al nivel del 5%, se podrá
decir que el porcentaje de
defectuosos es superior al señalado por el distribuidor? Datos:
3% 0, 0 55% 20 :0, 0 3 :>0, 0 3 , −, ,, 0.4 1)
∝0,05 z.c
z. A.
1,645
2)
3) Conclusión : Con este resultado no se puede concluir, que el porcentaje de defectuosos sea superior al señalado por el distribuidor, al nivel del 5%
DISTRIBUCION DE DIFERENCIAS ENTRE DOS MEDIAS MUESTRALES (X1; X2) CONOCIENDO
Esta prueba está indicada en aquellos casos cuando se quiere establecer si la diferencia entre dos medidas muestrales, extraídas de dos poblaciones independientes, es significativas o si una media es mayor o menor que otra.
Son ejemplos, cuando se quiere probar ¿si la accidentalidad vehicular es mayor en la población femenina que en la masculina? ¿Si hay alguna diferencia en los hábitos de fumar de los hombres y mujeres? ¿Si la duración de un producto de la marca A es diferente a la de la marca B? Como se observa, estos interro antes encierran en la com aración entre dos oblaciones Mediante varios ejemplos, indicaremos el proceso a seguir en la realización de pruebas de diferencias cuando dos muestras son grandes (mayores a 30) o cuando se dan las desviaciones típicas poblacionales, en este último caso no nos interesa los tamaños muestrales, pues los procesos son iguales, solo que las varianzas poblacionales son sustituidas por las varianzas muéstrales.
̅−+
ó
2122 −+
1. Supongamos que la empresa desarrollo un curso de entrenamiento para sus técnicos, formando dos grupos y aplicando métodos distintos de entrenamiento. Los dos grupos se consideran homogéneos en capacidad. El primer grupo lo componen 36 técnicos que obtuvieron un puntaje de 6 (en una escala de 0 a 10 puntos) y una desviación típica de 4 puntos y el segundo grupo de 40 técnicos cuyo promedio fue 8,2 y desviación típica de 4,3 puntos. ¿Se puede concluir que el método aplicado al segundo grupo al primero? Nivel 1%
Paso 1: Formular la hipótesis
: ≤15 : >15 Paso 2: Análisis punto critico Regla
z.c
< ℎ
z. A.
-2,33
α= 0,01
Paso 3:
2 468, 4,3 36 40 Z= -2,43
Conclusión: Como el valor calculado cae en la zona de aceptación se acepta Ho no existe diferencia significativa que el método B sea superior al método A DISTRIBUCION DE DIFERENCIAS ENTRE DOS PROPORCIONES MUESTRALES (P1; P2)
Se ha dicho en repetidas ocasiones, que las proporciones son utilizadas como medidas aplicadas a características cualitativas (atributos). La prueba de hipótesis, como en los casos anteriores, implica el uso de la distribución normal, que nos permite establecer si hay o no alguna diferencia entre dos proporciones, obtenidas en dos poblaciones independientes, o si un grupo tuvo una proporción mayor que el otro.
− 1122
Aplicaciones
1. En una encuesta se preguntó sobre los hábitos de lectura, utilizando una muestra aleatoria de 350 señoras que trabajan y otra muestra independiente de 325 que no lo hacen. En el primer caso, 105 manifestaron que estaban suscritas a cierto tipo revista. En el segundo, la respuesta fue de 130 que no estaban suscritas ni mostraban interés por ninguna revista, argumentando la falta de tiempo. ¿Al nivel del 1% se podrá afirmar que las señoras que trabajan leen menos que las señoras que trabajan?
: 12 : 1 <2
̅ ℎ 105350 0,3231 130325 0,40
Regla
< ℎ −+ 0, 4 0 0,32310,0,36231 769 0, 4 00, 6 0 350 325
α=0.01
z.c z. A.
-2,33
z= -2,73 Conclusión: Como cae en la zona de rechazo Ho ha afirmado que las madres que trabajan leen menos.
EJERCICIOS CONSULTADOS Ejemplo 1: Durante el 2003 los precios de la gasolina alcanzaron record de precios altos en 16 estados de Estados Unidos (The Wall Street Journal, 7 de marzo de 2003). Dos de los estados afectados fueron California y Florida. La American Automobile Association encontró como precio medio muestral por galón $2.04 en California y $1.72 por galón en Florida. Use 40 como tamaño de la muestra de California y 35 como
tamaño de la muestra en Florida. Suponga que estudios anteriores indican que la desviación estándar poblacional en California es 0.10 y en Florida 0.08.
a) ¿Cuál es la estimación puntual de la diferencia entre los precios medios poblacionales por galón en California y Florida?
ẋ1ẋ2 2,041,72 0,32
DATOS ẋ = 2,04 n = 40 ʃ = 0,10
DATOS ẋ = 1,72 n = 35 ʃ = 0,8
b) ¿Cuál es el margen de error con un 95% de confianza?
95% 5% 1, 9 6
zona critica
zona de aceptacion
1,96
c) ¿Cuál es la estimación por intervalo de 95% de confianza para la diferencia entre los precios medios poblacionales por galón en California y en Florida?
2 2 ẋ1ẋ2± 2 2 0 , 1 0 0, 8 2,041,72±1,96
40 35 0,32±0,27 0,05;0,59
Ejemplo 2: Arnold Palmer y Tiger Woods son dos de los mejores golfistas de todos los tiempos. Para comparar a estos dos golfistas en los datos muestrales siguientes se proporcionan los resultados de puntuaciones del hoyo 18 durante un torneo de la PGA. Las puntuaciones de Palmer son de la temporada de 1960 y las de Woods son de la temporada de 1999 (Golf Magazine, febrero de 2000).
Use los resultados muestrales para probar la hipótesis de que entre los dos jugadores no hay diferencia en las medias poblacionales de las puntuaciones del hoyo 18. a) Con una desviación estándar poblacional de 2.5 para ambos golfistas, ¿cuál es el valor del estadístico de prueba?
ẋ−ẋ + 5 6 69, 29,5569, 2,5 112 84 1, 0 8 ≤ ⁄2 2≤ 2,50,3599≤0,01 0,2802≤0,01
DATOS ẋ = 69,95 n = 112 =25
DATOS ẋ = 69,56 n = 84 ʃ = 2,5
b) ¿Cuál es el valor-p?
c) Si α = 0.01, ¿cuál es su conclusión?
z.c
zona de aceptacion
-2,58
0
z.c
2,58
Se acepta H0 en consecuencia no existe una diferencia entre los dos golfistas
Ejemplo 3: En una encuesta de BusinessWeek/Harris se pidió a los ejecutivos de empresas grandes su opinión acerca de sus perspectivas económicas para el futuro. Una de las preguntas era: ¿Piensa usted que en los próximos 12 meses aumentará en su empresa el número de empleados de tiempo completo? En esa encuesta 220 de 400 ejecutivos contestaron sí, mientras que en la encuesta realizada el año anterior, 192 de 400 respondieron sí. Encuentre un intervalo de confianza de 95% para estimar la diferencia entre las proporciones en estas dos encuestas. Dé su interpretación de la estimación por intervalo.
DATOS n = 200 h = 220
ṗ ṗ 220400 ṗ0, 5 5
0:12 1:1≠2 ṗ ℎ ṗ 192400 ṗ0, 4 8 11ṗ1ṗ2 22 1 2 ,,−,+,
0, 0 5
= 1.99
DATOS n = 400 h = 192
Se rechaza H0 en consecuencia no hay diferencias en las perspectivas de la empresa
z.c
zona de aceptacion
-1,96
0
z.c
1,96
Ejemplo 4: En un estudio de la American Automobile Association se estudió si era más probable que conductores hombres o mujeres se detuvieran para solicitar indicaciones sobre cómo llegar a una dirección (AAA, enero de 2006). En el estudio se preguntaba: “Si usted y
su cónyuge van en su automóvil y se pierden, ¿se detiene para preguntar por la dirección que busca?” En una muestra representativa se encontró que 300 de 811 mujeres dijeron que
sí se detenían para preguntar y 255 de 750 hombres dijeron que sí se detenían para preguntar. a) La hipótesis de investigación afirmaba que era más probable que las mujeres se detuvieran para preguntar por la dirección. Formule la hipótesis nula y alternativa para este estudio.
0:12 1:1>2 b) ¿Cuál es el porcentaje de mujeres que dijeron detenerse para preguntar por la dirección?
ṗ ṗ 300811 ṗ0, 3 737%
DATOS n = 811 h = 300
c) ¿Cuál es el porcentaje de hombres que dijeron detenerse para preguntar por la dirección?
a.
ṗ
DATOS n = 750 h = 255
ṗ 255750 ṗ0, 3 434% d) Pruebe la hipótesis usando α = 0.05. ¿Cuál es el valor -p y cuál es la conclusión a la que esperaría usted que llegara la asociación?
11ṗ1ṗ2 22 1 0,2370,34 0,3710,37 0,3410,34 811 750 1, 2 4 ≤ ,50,3925≤0,05 0,1075≤0,05
zona critica
zona de aceptacion
1,645
Se acepta H0 en consecuencia las mujeres se detienen más que los hombres
Ejemplo 5: El Bureau of Transportation de Estados Unidos vigila la puntualidad de la llegada de los vuelos de las 10 principales aerolíneas de ese país (The Wall Street Journal, 4 de marzo de 2003). Los vuelos que llegan con no más de 15 minutos de retraso se consideran a tiempo. Los siguientes son datos estadísticos del Bureau pertenecientes a enero de 2001 y a enero de 2002. Enero 2001 En una muestra de 924 vuelos, 742 llegaron a tiempo. Enero 2002 En una muestra de 842 vuelos, 714 llegaron a tiempo. a) Dé una estimación puntual de la proporción de vuelos que llegaron a tiempo en 2001.
ṗ ℎ
DATOS
ṗ 742924 ṗ0,803
n = 924 h = 742
b) Suministre una estimación puntual de la proporción de vuelos que llegaron a tiempo en 2002.
ṗ ℎ ṗ 714842 ṗ0,848
DATOS n = 842 h = 714
c) Sea p la proporción poblacional de los vuelos que llegaron a tiempo en 2001 y p2 la proporción poblacional de los vuelos que llegaron a tiempo en 2002. Plantee las hipótesis a probar para determinar si la puntualidad de las principales líneas aéreas mejoró en este periodo de un año.
0:12 1:1>2
d) Si α = 0.01, ¿cuál es su conclusión?
ṗ−ṗ+ 0,80310,0,8803030, 0,88484810,848 924 842 2, 48
zona critica
zona de z. A. aceptacion
-2,33
Se rechaza Ho en consecuencia no mejoro la puntualidad de las aerolíneas
DISTRIBUCION DE DIFERENCIAS ENTRE DOS MEDIAS MUESTRALES CON DATOS MENORES A 30 “t”
De acuerdo con el teorema de Limite Central, cuando ambas variables presentan tamaños muestrales (n1 y n2) superiores a 30, tendrán un comportamiento similar a la distribución normal, por lo tanto aplicamos Z. En el caso, que ambos tamaños muestrales sean menores o iguales a 30, se aplicara la distribución “t” de Student, utilizando diferentes fórmulas de
acuerdo a la forma en la que se dé la información. Cuando el ejercicio se suministra información para cada una de las observaciones muestrales, es preferible calcular una varianza común para las dos muestras, siendo:
∑− ∑− 2 Con el resultado obtenido al aplicar la formula anterior, nos permite calcular el error estándar para la diferencia entre las medias muestrales
̅ ²²
Aplicaciones 1: Un fabricante de cigarrillos analiza el tabaco de dos marcas diferentes, para determinar
el contenido en nicotina y obtiene los resultados siguientes (en miligramos):
Marca A: 24
26
25
22
23
Marca B:
28
25
29
26
27
¿Los resultados anteriores, señalan que existe una diferencia en el contenido medio de nicotina en ambas marcas? Siendo
∑− 10
∑− 10
1010 208 2, 5 552 ̅−= 25,5 2,55 √ 1 1 1. 2. α= 0,05
: : ≠ z.c
z.c z. A.
-1,96
̅−= 1 . 2
0
3.
µ=
µ= 5+5-2=8
1,96
ENSAYO DE HIPOTESIS EJEMPLO DE HIPOTESIS CON TRES VARIABLES
Se aplican tres métodos diferentes de enseñanza a estudiantes de primer año de universidad en tres paralelos, Luego de haber recibido la misma materia se aplica un test de conocimiento a todos los alumnos, se procede a extraer muestras en cinco alumnos de cada paralelo. Probar la hipótesis de que el rendimiento medio de los tres grupos de alumnos es el mismo, es decir no hay diferencia en el rendimiento de los alumnos con respecto al método de enseñanza, con un nivel de significación de 1%.
Cuadro De Resultados MÉTODO A
TOTAL:24
²
²
MÉTODO B
MÉTODO C
²
6
1,14
8
4
5
1
6
1,44
7
1
8
16
2
7,84
4
4
4
0
7
4,84
5
1
2
4
3
3,24
6
0
1
9
18,8
TOTAL:30
10
TOTAL:20
30
Xa= 4,8
Proceso
Xb= 6
4, 9 2
Xc= 4
Con tres variables el estimador a utilizarse es el ANALISIS DE VARIANZA O RAZON “b”
1. PLANTEO DE HIPÓTESIS 1.1 Modelo lógico: Ho: El rendimiento medio de los alumnos en los tres grupos es el mismo cualquier sea el método de enseñanza que se aplique.
H1: El rendimiento medio de los tres grupos difiere significativamente con relación al método de enseñanza
1.2 Modelo Matemático: Ho: H1:
→0 ≠ ≠ →0
1.3 Estimador estadístico
²² ² ² ² 1 ²∑ ² ∑ ²∑ 1233 ∑ ∑123 123
2. NIVEL DE SIGNIFICACIÓN α= 0,01
F1= D1/D2 (Ft= Valor de f obtenido de la tabla) D1= Grados de libertad entre clases n-1------ 3-1=2 D2= Grados de libertad dentro de clases: n1-n2-n3-3-------5-5+5-3=12 Ft=2/12= 6,93 3. REGLA DE DECISIÓN: Se acepta la hipótesis nula si el valor de la razón “F” al calcularse es igual o menor a
6,93 caso contrario se acepta la hipótesis alternativa de la investigación
4. CÁLCULO DE LA RAZON “F”
²² 544.93 9 3 54.84.93 564. 31 10.13 8 1030 18,5553 4,9 10,4,193 F=2,07
5. CONCLUSIÓN FINAL Ft= 6,93 >Fc=2,07 y de acuerdo con lo establecido en la regla de decisión, se acepta la hipótesis nula, es decir, no hay diferencia significativa en el rendimiento medio de los estudiantes frente a los métodos de enseñanza cualquier diferencia es producto de muestreo
Para la resolución de problemas planteados y de conformidad con la hipótesis estadística estipulada, es necesario trabajar con frecuencias observadas, que se les obtiene con la investigación en que se detecta que el mecanismo predominante de explotación por parte de los parientes es el castigo con el cual obligan a la actividad mendicante de los niños.
Proceso Planteo de hipótesis Ho: el castigo y la recompensa son mecanismos que por igual emplean los parientes con los niños mendicantes H1: el castigo es el mecanismo predominante de explotación que los parientes emplean para obligar a los niños a la actividad mendicante, en el parque x de la ciudad y
Estimador estadístico Se dispone de información obtenida como producto de la investigación realizada a toda la población que se encontraba en el momento de aplicar la encuesta, (población flotante para la prueba de hipótesis que se tiene frecuencias, es recomendable utilizar la prueba de Chi-cuadrado ( ) que permite determinar si el conjunto de frecuencias observadas ajustan a un conjunto de frecuencias esperadas o teóricas y se aplica la formula
∑
1. Nivel de significancia y regla de decisión: α= 0.05
G.l: (c-1) (f-1) → (2-1) (3-1) = 2
Se acepta la hipótesis nula si el valor a calcularse de 5.99; caso contrario se rechazo
Prueba de hipótesis Chi cuadrado X2
es menos al valor de
tabular =
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente especificada como el modelo matemático de la población que ha generado la muestra. Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada (Ei=n·pi , donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o intervalo de valores según la hipótesis nula). El estadístico de prueba se basa en las diferencias entre la Oi y Ei y se define como:
Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la práctica se tolera un máximo del 20% de frecuencias inferiores a 5.
2. Calculo de “Chi - cuadrado” CASTIGO Mañana: 10 – 12 Tarde: 14 - 17 Noche: 18 - 22 TOTAL
datos obtenidos de la investigación
28 (28.54) 69 (78.1) 93 (83.36)
RECOMPENSA 10 (9.46) 35 (25.9)
TOTAL 38 104
18 (27.64)
111
190
63
253
Los valores que se encuentran en paréntesis (
) son las frecuencias esperadas; se
calcula multiplicando los totales marginales y dividido para el gran total. Ejemplo: (190) (38) /253 = 28.54 1. Tabla de frecuencias observadas (O) y esperadas (E)
O Frecuencias observadas
E Frecuencias esperadas
28 69 93 10 35 18
28.54 78.1 83.36 9.46 25.9 27.64
0.01 1.06 1.11 0.03 3.2 3.26
8. 7 7
6. CONCLUSION El valor de
8.77>5. 9 9
y de conformidad a lo establecido en la regla de
decisión se rechaza la hipótesis nula y se acepta la hipótesis alterna, es decir, se confirma que el castigo como mecanismo de explotación que los parientes ejercen sobre los niños mendicantes. No normales
Tipos de datos
Independientes
U de MannWithney
Dependientes
Wilcoxon
Peor
Igual
Mejor
Tratamiento 1
7
28
115
Tratamiento 2
15
20
85
Tratamiento 3
10
30
90
Tratamiento 4
5
40
115
La prueba chi ve si hay independencia o relación entre las variables
Nivel de Educación Primaria
Secundaria
Universidad
Solteros
14
54
65
Casados
15
34
45
Viudos
3
43
34