“Año del Dialogo y la Reconciliación Nacional” UNIVERSIDAD NACIONAL DE CAJAMARCA Norte de la Universidad Peruana Fundada por Ley 14015 el 13 de febrero de 1962
Análisis de Varianza “ESTADISTICA APLICADA” MANUEL CÓRDOVA ZAMORA Facultad: Ingeniería. Escuela Académica: Ingeniería Civil. Asignatura: Estadística Aplicada. Catedrático: Dr. Miguel Ángel Macetas Hernández. Alumnos: JUAREZ TASILLA, Elmer Roberto ROJAS HONORES, Diego Manuel ZELADA REVILA, Edson Fernando
Ciudad Universitaria - Julio del 2018
ANÁLISIS DE VARIANZA 1. Tres lotes pilotos de 5 cerdos cada uno escogió escogió un ingeniero para realizar realizar durante tres meses de prueba de alimentación. El lote 1 recibió el método de alimentación alimentación A, el lote 2 el B y el lote 3 el C. los rendimientos de los métodos de alimentación medidos como el peso final (en kilogramos) de los cerdos se resumen en la siguiente tabla de análisis de varianza a) Describa la variable dependiente y el modelo de este este ANOVA. b) ¿existe evidencia de una diferencia significativa significativa entre los tres tipos tipos de alimentación? Plantee las hipótesis nula y alternativa, describa la estadística y la región de rechazo de la hipótesis nula al nivel de significación α=0.05 y finalmente tome la decisión completando
previamente la tabla ANOVA
SOLUCIÓN a) La viable dependiente dependiente = X es el rendimiento pues esta depende del método de alimentación que les sea aplicado b) H : µ =µ =µ H : Una µₓ es diferente
₀₁ ₁ ₂ ₃
Fuente de Varianzas Tipos de Alimentación Error Total
SC
GL
MC
377.733
2
188.8665
217.2 594.933
12 14
18.1 206.9665
10.4346133
Métodos de Alimentación: 3 N° de Cerdos por métodos: 5 N° de Cerdos totales: 15
Sabemos que: α=0.05
3.89 10.435
Al calcular el Ft obtenemos: Además, Tenemos que: que:
Entonces al saber eso observamos que:
>
Por lo tanto, al saber esto decimos que: Se rechaza la hipótesis nula
ANÁLISIS DE VARIANZA 1. Tres lotes pilotos de 5 cerdos cada uno escogió escogió un ingeniero para realizar realizar durante tres meses de prueba de alimentación. El lote 1 recibió el método de alimentación alimentación A, el lote 2 el B y el lote 3 el C. los rendimientos de los métodos de alimentación medidos como el peso final (en kilogramos) de los cerdos se resumen en la siguiente tabla de análisis de varianza a) Describa la variable dependiente y el modelo de este este ANOVA. b) ¿existe evidencia de una diferencia significativa significativa entre los tres tipos tipos de alimentación? Plantee las hipótesis nula y alternativa, describa la estadística y la región de rechazo de la hipótesis nula al nivel de significación α=0.05 y finalmente tome la decisión completando
previamente la tabla ANOVA
SOLUCIÓN a) La viable dependiente dependiente = X es el rendimiento pues esta depende del método de alimentación que les sea aplicado b) H : µ =µ =µ H : Una µₓ es diferente
₀₁ ₁ ₂ ₃
Fuente de Varianzas Tipos de Alimentación Error Total
SC
GL
MC
377.733
2
188.8665
217.2 594.933
12 14
18.1 206.9665
10.4346133
Métodos de Alimentación: 3 N° de Cerdos por métodos: 5 N° de Cerdos totales: 15
Sabemos que: α=0.05
3.89 10.435
Al calcular el Ft obtenemos: Además, Tenemos que: que:
Entonces al saber eso observamos que:
>
Por lo tanto, al saber esto decimos que: Se rechaza la hipótesis nula
2. La empresa P&C P&C que maneja 15 merados quiere comparar la efectividad de tres tipos e publicidad usados para sus mercados. Se asignaron 5 de estos mercados al azar a cada uno de los tres tipos distintos de publicidad con el propósito de estudiar el impacto de los carteles en las ventas. Al cabo de un mes, el monto de las ventas X (en miles de dólares) de cada uno de los cinco mercados asignados a cada uno de los tipos de publicidad dieron los siguientes resultados:
2 96,698 ∗∗2
Ventas totales para cada tipo de publicidad:
.
= 400,
2.
= 425 y
.
= 375
Al nivel de significancia de 0.05, ¿proporcionan estos datos suficiente evidencia para inferir que los promedios de ventas son iguales para los tres tipos de carteles?
SOLUCIÓN Planteamos la hipótesis:
: µ µ2 µ
Hacemos una tabla con los datos dados MERCADOS
TIPOS DE PUBLICIDAD 1
2
TOTAL 3
MEDIAS DE LOS BLOQUES
1 2 3 4 5
400-(a+b+c+d)
425-(e+f+g+h)
375-(i+j+k+l)
TOTAL
400
425
375
MEDIAS
80
85
75
= 80 ∗∗ = 80 1∗ = 85 2∗ = 75 3∗
=
∗∗
1200 80
Sacamos el valor de c, el cuál será: C=96000 Sacamos los valores de SCT, SCE Y SCA
2 = ∑∑2 =∑ ∗ SCT
698
SCA
250
SCE = ECT - SCA SCE
448
TABLA ANOVA FUENTE DE SUMA DE VARIACIÓN CUADRADOS PUBLICIDAD ERROR TOTAL
250 448 698
GRADOS MEDIAS RAZÓN F DE CUADRATICAS CALCULADA LIBERTAD 2 125 3.34821429 12 37.33333333 14
RC = {F (2,12)>3.89} FCAL= 3.35 P=P [F (3,12)>3.35] F (3,12) (5%)=3.89>3.35 RPTA: Al ver que cumple que el F de la tabla es mayor que F(cal) podemos aceptar la hipótesis nula Por lo tanto
: µ µ2 µ
Se cumple SCA = 250 SCE = 448 SCT = 698 P = P[F>3.35] = 0.07
3. Para comparar el rendimiento de una variedad de uva un Ingeniero diseño un experimento con tres métodos de cultivo en una de las viñas de San Antonio en San Martin. Se escogieron tres terrenos de siembra de iguales características en las que se sembró el mismo número de plantas por pacerla de la nueva variedad de uva. El lugar B de 6 parcelas no se abonó. El lugar A de 5 parcelas se abonó con abono ecológico casero y el lugar C de 7 parcelas se abonó con abono industrial comercial. La primera cosecha ha dado las siguientes estadísticas e kilogramos de uva. X: Rendimiento en kilogramos
Modos de Cultivo
Tamaño de Muestra
Total
Medias
A
5
450
90
B
5
400
80
C
5
500
100
Desviación estándar de X, igual a 10. a) Al nivel de significación
0. 0 5
, ¿Se podría inferir que los promedios
de rendimiento por modos de cultivo de la uva son significativamente diferentes? b) Si se concluye hay diferencias significativas en los promedios de rendimiento por modos de cultivo. ¿Cuál modo de cultivo se debería seguir? Aplique el método de comparaciones múltiples de Benferroni para pares de medias con nivel de confianza de al menos 95%.
SOLUCIÓN a)
1) Hipótesis Ho:
1 = 2 = 3
H1:
Son diferentes
2) De los datos tenemos: 1 2 3 4 5 Total
A 90 90 90 90 90 450
X^2 8100 8100 8100 8100 8100 40500
B 80 80 80 80 80 400
X^2 6400 6400 6400 6400 6400 32000
C 100 100 100 100 100 500
X^2 10000 10000 10000 10000 10000 50000
Número Modos de de cultivo Parcelas A 5 B 6 C 7 total 18
Tamaño de muestra 5 5 5 15
Total
Medias
450 400 500 1350
90 80 100 270
3) Aplicando las formulas hallamos SCT, SCI y SCE:
Donde: SCT SCI SCE J J-1 N N-J
1400.00 1000 400.00 3 2 15 12
4) Calculo de Medias Cuadráticas:
Donde: MCI = MCE = 5) Estadístico de contraste:
F = 14.999
SCI /( J-1) SCE / (NJ)
500 33.33
Suma de Cuadrados 40500 32000 50000 122500
6) Regla de Decisión Rechazar Ho, si
1 , ...5 2,2 =
3.89
7) Decisión: Puesto que el estadístico F cae en la zona critica, se rechaza Ho con un nivel de confianza del 95%. Podemos concluir que las medias del rendimiento no son iguales. 4. Un fabricante va adquirir una de cuatro marcas de componentes A, B, C
y D, disponibles en experimento de un factor completamente aleatorio con cinco unidades de cada componente para cada una de las marcas. En una prueba de laboratorio con simuladores obtuvo las siguientes estadísticas de vida útil en días: el mercado, para determinado sistema. El análisis estadístico encargado del estudio, diseño un X: Vida útil
Marca de Componentes A B C D
Tamaño de Muestras 5 5 5 5
Total 454 397 506 450
Desviación estándar S x = 8,2671
0. 0 5
a) Al nivel de significación , ¿se podrá inferir que la marca de la componente es un efecto en el rendimiento de las mismas? b) ¿Qué marca de componente debería adquirir el fabricante? Use el método de intervalos de pares de medias de Bonferroni con nivel de confianza global de al menos 95%. SOLUCIÓN b) I.
II. A 90.8 90.8 90.8 90.8 90.8 454
Planteamos: Ho:
1 = 2 = 3
H1:
Son diferentes
De los datos tenemos:
X^2 8244.64 8244.64 8244.64 8244.64 8244.64 41223.2
B 79.4 79.4 79.4 79.4 79.4 397
X^2 6304.36 6304.36 6304.36 6304.36 6304.36 31521.8
C 101.2 101.2 101.2 101.2 101.2 506
X^2 10241.44 10241.44 10241.44 10241.44 10241.44 51207.2
D 90 90 90 90 90 450
X^2 8100 8100 8100 8100 8100 40500
Marca de componentes A B C D total III.
Tamaño de muestras 5 5 5 5 20
Total
Media
Suma de Cuadrados
454 397 506 450 1807
90.8 79.4 101.2 90 361.4
41223.2 31521.8 51207.2 40500 164452.2
Aplicando las formulas hallamos SCT, SCI y SCE:
Donde: SCT SCI SCE J J-1 N N-J IV.
1298.55 1189.75 108.80 4 3 20 16
Calculo de Medias Cuadráticas:
Donde: MCI = MCE =
SCI /( J1) SCE / (NJ)
396.58 6.80
V.
Estadístico de contraste:
VI.
F = 58.322 Regla de Decisión Rechazar Ho, si
1 , ...5 3, =
3.252
Donde F = 58.322 > 3.252 VII. Decisión: Puesto que el estadístico F cae en la zona critica, se rechaza Ho con un nivel de confianza del 95%. Podemos concluir que las medias del rendimiento no son iguales. 5. Un investigador médico realizó una evaluación a profesionales que trabajan en forma dependiente en diferentes áreas para ver si alguna de estas es más propensa a producir stress. Usó un cuestionario de 20 preguntas de 4 opciones cada una en donde pueden marcar de 1 a 5. Los puntajes obtenidos de 20(nivel bajo de stress) a 100(nivel elevado de stress) se resumen en la siguiente tabla:
Economistas Ingenieros Docentes universitarios
Tamaño de las muestras 10 10 10
Media 56.5 45.6 60.3
Desviación Estándar 1.780 1.897 1.947
a) ¿Se puede inferir que no existe diferencia significativa entre los puntajes promedios de stress de los ingenieros y docentes universitarios? Utilice la probabilidad de error tipo I igual a 0.05. b) Pruebe la hipótesis que afirma que no existe diferencia significativa en el stress que ocasiona el trabajo de estas profesiones. Use nivel de significación a=0.05. c) Si existiera diferencia significativa entre los promedios, ¿cuál de estas profesiones produce mayor stress?
SOLUCIÓN a)
1) Formulación de Hipótesis : :
22 ∝0.2 05 ˄ 01118 2 ..0.05,18 8.869 2) Estadígrafo de prueba
3) Toma de decisión: Las varianzas son iguales, entonces se rechaza b)
.
1) Formulación de Hipótesis
∃0 01,,3 : :
2) Análisis de Varianza- tabla ANOVA Tamaño de las muestras Economistas 10 Ingenieros 10 Docentes 10 universitarios
Media Desviación Estándar 56.5 45.6 60.3
1.780 1.897 1.947
2 ̅ 2 565 456 603
31954.184 20829.586 36398.808
5.601 72.818 38.028
1624 89182.3578 116.447
∑ ∗ 56.5∗10565 2 45.6 ∗10456 60.3∗10603 ∑2 [2 +2]∗
2 [1.7802 +56.52]∗1031954.184 22 [1.8972 +45.62]∗10089.586 2 [1.9472 +60.32]∗1036398.808 16430 8791.533 8918.5788791.533159.4667 10∗116.4471164.4667 159. 4 6671164. 4 66795 2 159.3014667 43.499 3 30
3) Resultados:
4) Tabla ANOVA: Fuentes de Suma de Varianzas Cuadrados Tratamiento 1164.467 Error 95 Total 1259.467
Grado de Libertad 2 27 29
Medias Cuadráticas 582.233 3.519
Razón F calculada 165.47678
5) Nivel de significancia:
∝0.05 ˄ 165.4767 . . 0.05,,7 . >165.4767 ..165.4767,3,16 >165.4767 .
6) Región Critica: R.C= [F (2,27)>3.35] 7) Toma de decisión: Se rechaza Ho. c) La que produce mayor estrés es la profesión de Docentes Universitarios.
45.6<56.5<60.3 2 < <
6. El proyecto académico de un ingeniero es el diseño de un experimento a fin de determinar el rendimiento de 4 variedades de papa sin tener en cuenta la influencia de la fertilidad de las tierras de cultivo. Las 20 parcelas de igual fertilidad que le fueron asignadas los dividió en 4 grupos de 5 parcelas cada una. A cada grupo de parcelas le asignó una variedad distinta de papa escogida al azar, resultando un diseño completamente aleatorizado. Los rendimientos medidos en kilogramos de las cinco variedades por parcela se dan en la tabla que sigue: V1 V2 V3 V4 55 52 53 52 53 58 55 50 60 50 57 51 52 60 51 49 53 52 54 53 a) Defina la variable dependiente, los niveles del factor, el modelo del diseño y los supuestos del modelo. b) Compare descriptivamente las medias de los rendimientos utilizando un método gráfico. c) Estime el efecto que produce la variedad 3 en el valor medio global del rendimiento. d) Al nivel de significación del 5%, ¿se puede inferir que existen diferencias significativas entre las producciones medias de las 4 variedades de papa?
SOLUCIÓN 1) Formulación de Hipótesis:
2 ∃ : :
2) Análisis de Varianza – Tabla ANOVA:
3) Nivel de Significancia:
∝0.05 ˄ Fo1.55 F INV.F.CD0.05,3,16 . PFo>1.55 DIST.F.CD1.55,3,16 >. .
4) Región Critica:
R.C= [F (3,16)>3.35] 5) Toma de decisión: Se acepta Ho. 7. Para comparar el tiempo empleado en realizar una tarea específica bajo tres procedimientos, un investigador diseñó un experimento seleccionado al azar tres muestras independientes de 10 operarios cada una y asignó al azar un procedimiento a cada muestra. Los tiempos registrados en segundos se dan en la tabla que sigue: P1 P2 P3 13.45 22.81 18.92 19.1 20.69 21.32 20.73 24.4 25.93 23.6 26.86 19.07 13.45 22.37 20.98 23.29 19.98 26.4 14.93 20.98 28.04 17.07 24.08 23.44 13.65 18.35 18.47 18.79 17.22 25.42 Además, la desviación estándar de la variable dependiente es igual a 4.0072 a) Describa la variable dependiente, el factor y sus niveles. El modelo del diseño y sus supuestos. Además, describa si hay indicios de diferencias significativas entre los tres procedimientos. b) ¿Existe diferencia significativa entre los promedios de tiempos empleados por los procedimientos 2 y 3? Utilice el nivel de confianza 0.95. c) Realice una prueba de hipótesis global de los promedios de los tres procedimientos, al nivel se significación α = 0.05.
d) ¿Cuál de los procedimientos empleados es óptimo? Aplique el método de intervalos de pares de medias de Bonferroni con nivel de confianza al menos 96% y el método de rangos de Duncan con nivel se significación 0.05.
SOLUCIÓN a) Variable independiente: X = Tiempo, en segundos, para realizar una tarea específica. Variable dependiente o factor: A = Procedimientos Niveles o Tratamientos: Son los procedimientos P1, P2 y P3. El modelo de este ANOVA está dado por:
-
+ +
, i = 1,2,3
j = 1, 2, …,10.
- Supuestos:
b) COMPARACIÓN POR BONFERRONI
Entonces:
2
c)
∙
P1 13.45 19.1 20.73 23.6 13.45 23.29 14.93 17.07 13.65 18.79
A = Procedimientos P2 22.81 20.69 24.4 26.86 22.37 19.98 20.98 24.08 18.35 17.22
P3 18.92 21.32 25.93 19.07 20.98 26.4 28.04 23.44 18.47 25.42
TOTALES
ni = r MEDIAS
∙
178.06 10
217.74 10
227.99 10
∙ ∙
=623.79
30
=62.379
17.806
21.774
22.799
De los datos se obtiene: SCT = 465.66123 SCA = 139.08566 SCE = 326.57557
-
Hipótesis: -
2 ∃ :
Contra: -
:
Estadística y región critica: Fuente de Variación Máquinas Error Total -
Suma de Cuadrados 139.08566 326.57557 465.66123
Grados de Libertad 2 27 29
Medias Cuadráticas 69.54283 12.09539148
.;2;2 0.05139 5.75>0.05139
Razón F Calculada 5.750
DECISIÓN: Dado que , se debería rechazar con probabilidad de error tipo I igual a 0.05, por lo tanto, el f actor procedimiento tiene efecto significativo sobre el tiempo necesario para realizar una tarea específica. d) Utilizando el método de intervalos de pares de medias de Bonferroni con nivel de confianza al menos 96%:
Entonces:
<2
Utilizando el método de rangos de Duncan con un nivel de significación 0.05:
<2 < 17.806<1.774<.799 2..,3,7. 9 345 7 3.09
Ordenamos las medias de menor a mayor:
-
-
Se obtienen los rangos estudentizados:
-
Calculamos los rangos mínimos significativos:
-
Para p=3
-
Para p=2
1.0109539 1.0998 2 .3.90345∗1. 0 9983. 74 9∗1.09983.3984 2 1.05<3.74 1.77417.8063.968 <2
son significativamente
diferentes. Entonces:
8. La empresa de transporte terrestre CARGA va adquirir una de 4 marcas de neumáticos que hay en el mercado. El ingeniero de pruebas de la empresa diseñó un experimento escogiendo al azar seis neumáticos de cada marca de características similares. En el laboratorio de pruebas, con una carga específica simulada, observó la duración de cada neumático hasta que se deteriore. Los datos redondeados en miles de kilómetros se dan en la tabla que sigue: N1 N2 55 63 53 67 50 55 60 62 55 70 65 75 Al nivel de significación del 5%
N3 48 50 59 50 47 61
N4 59 68 57 66 71 73
¿Indican estos datos que las marcas de los neumáticos producen efectos significativos en el rendimiento?
SOLUCIÓN
De los datos se obtiene: -
Hipótesis: -
SCT = 37322.625 SCA = 36553.125 SCE = 729.5
2 ∃ :
Contra: -
:
Estadística y región critica: Fuente de Variación Marca de Neumáticos Error Total -
Suma de Cuadrados
Grados de Libertad
Medias Cuadráticas
Razón F Calculada
36553.125 769.5 37322.625
3 20 23
12184.375 38.475
316.683
.;;2 3.10 316068>3.10
Decisión: Dado que , se debería rechazar con probabilidad de error tipo I igual a 0.05, por lo tanto, el f actor procedimiento tiene efecto significativo sobre el tiempo necesario para realizar una tarea específica. 9. Un promotor inmobiliario está considerando invertir en su centro comercial a construirse en el sector medio de una capital del interior del país, Se evalúan 4 ciudades: Arequipa, Iquitos, Piura y Trujillo, en donde es muy importante el nivel de los ingresos mensuales de las familias. Con este fin se diseñó una prueba de hipótesis de medias múltiples, seleccionando una muestra aleatoria de ingresos familiares en cada una de las cuatro ciudades. Los ingresos mensuales observados en dólares son los siguientes: X:Ingresos mensuales Arequipa Iquitos Piura Trujillo 610 710 560 500 560 730 610 400 490 660 470 500 550 610 510 500 460 580 500 620 400 650 Además, la desviación estándar de la variable dependiente es igual a 90.3193,
a) Describa el modelo de este diseño de experimento y sus supuestos. b) Aplique la prueba (a priori) DMS (o LSD) al nivel de significación 0.05, para determinar los pares de medias que son significativamente diferentes. c) Al nivel de significación del 5% ¿producen efectos significativos en la variabilidad de los ingresos los niveles del factor ciudad?. Si su respuesta es afirmativa use la prueba (a posteriori) de rangos de Duncan para determinar la ciudad donde se debería construir el centro comercial.
SOLUCIÓN a)
grafica de ingresos promedio 700 600 500 400 300 200 100 0 1
2
3
4
La grafica nos muestra que las medias muestrales no difieren mucho entre si y tampoco están muy alejadas de la media general. b)
ES ∗ 1 + 1 2, ± ∗
Intervalos de aceptación
A continuación, se muestra las siguientes tablas obtenidas al usar las formulas antes mencionadas: X1 552.5 ES 44.67 X2 634 2.101 tₒ X3 571.4 ni=4 n j =7 X4 466.7
Medias muéstrales Diferencia Xi
X j 1
Xi-X j -81.5 -18.9 85.8 62.6 167.3 104.7
2 3 4 3 4 4
2 3
IC al 95% límite límite inferior superior -175.35 12.35 -112.75 74.95 -8.05 132.57 -31.25 156.45 73.45 261.15 10.85 198.55
De donde: µ1=µ2; µ1=µ3; µ1=µ4; µ2=µ3; µ2>µ4; µ3>µ4
c) Análisis de varianza Origen de Suma de las cuadrados variaciones
Grados de libertad
Promedio de los cuadrados
F
Probabilidad
Valor crítico para F
3
26631.68
5.24
0.009
3.160
18
5078.56
Entre 79895.04 grupos Dentro de 91414.05 los grupos Total 171309.09
21
De donde: SCA=79895.04 SCE=91414.05
SCT=171309.09 MCE=5078.56
Aplicando Duncan: α=0.05
k=4
∑ =5.266 = ..2 =31.0548
f=18
n=
r 2=2.97
r 3=3.12
r 4=3.21
R2= (2.97) * (31.0548) =92.2327 R3= (3.12) * (31.0548) =96.8909 R4= (3.21) * (31.0548) =99.6859 Por lo tanto: µ4 =µ1 <µ3 =µ2
F cal= 5.24
10. Un proceso de producción que consiste de 4 líneas está controlado si las líneas utilizan el mismo tiempo promedio (en segundos) antes que las unidades producidas caigan a una bandeja. Cada cierto periodo un Ingeniero realiza el control de los tiempos de producción por línea del producto, si una línea está fuera de control, pasa a mantenimiento. En un reciente control de las líneas de producción se escogió una muestra aleatoria de tiempos de producción ( x ) por unidad en cada línea, observándose los datos de la tabla que sigue: Al nivel de significación del 5%, Muestras Muestra Muestra Muestra Muestra 1 2 3 4 15 10 20 16 12 12 18 18 14 14 20 16 14 13 22 15 15 18 21 14 20 18 12 19 17 20 14 Además, Sx=3.199. Se supone homocedasticidad. a) ¿Cree usted que se debería realizar el mantenimiento a alguna de las líneas de producción? b) Si su respuesta en el inciso a) es afirmativa, ¿a cuál de las 4 líneas se debería realizar el mantenimiento? Aplique de rangos de Duncan. c) ¿Cree usted que se viola el supuesto de homecedasticidad? Utilice un paquete de cómputo para resolver este inciso.
SOLUCIÓN a) Hₒ=µ1=µ2=µ3=µ4
⁆µ≠ RESUMEN Grupos
Columna 1 Columna 2 Columna 3 Columna 4
Cuenta Suma
6 9 8 4
84 130 158 65
Promedio
Varianza
14 14.44 19.75 16.25
1.2 10.53 1.93 1.58
ANÁLISIS DE VARIANZA Origen de Grados Promedio Suma de las de de los cuadrados variaciones libertad cuadrados
Entre grupos Dentro de los grupos Total
157.60
3
52.53
108.47
23
4.72
266.07
26
De donde: SCA=157.60 SCE=108.47
F
Valor crítico Probabilidad para F
11.14
0.00
3.03
SCT=266.07 MCE= 4.72
Por lo tanto, si se debe realizar mantenimiento de las líneas de producción. b) Aplicando Duncan: α=0.05
n=
∑ =6.128
k=4
f=23
MCE=4.72
..22 =
=0.8776
Entonces: µ1=µ2 <µ4<µ3 Por lo tanto, se debe hacer mantenimiento a la línea 3. c) Prueba de homocedasticidad: 4.144 Grados de libertad: 3 y 23 Significancia = 0.017
11. El Decano del FACI desea estudiar el número de horas que los alumnos que los alumnos de los ciclos: 5,6,7 y 8, utilizan los terminales de computo de la universidad. Una muestra de usos por ciclo ha dado los siguientes tiempos en hora mensuales: CICLOS C5 C6 C7 C8 35 43 28 39 33 47 30 48 30 35 39 37 40 30 46 35 27 42 a) Defina la variable dependiente y estime el efecto que produce el séptimo ciclo. b) Describa la regla de decisión para probar globalmente la hipótesis nula de igualdad de las cuatro medias. ¿Cuál es la decisión estadística? Use . ¿Cuánto es la probabilidad P de la prueba? c) Si es adecuado, determine que ciclos difieren significativamente en el uso promedio de horas por ciclo de los terminales por computo. Use Duncan con .
0. 0 5 0. 0 5
SOLUCIÓN a) i. ii.
LA VARIABLE DEPENDIENTE ES: X= número de horas que los alumnos utilizan los terminales de computo.
∑ 35+33+30+40+35+4 43+37+35 6 15 156 35.83 2 8+30+39+30+7 3 3 41.61548 39+48+37+46 30. 8 5 5 4 1704 4.5
8 +4. 5 150. 8 1 35.83+41.68+30. 4 4 37.705 30.837.705
b) i.
Hipótesis:
::∃ 2 0. 0 5 .2. 15 6 15 3 2 ∙. 170 154 45 . 664 18 2 2 664 . 18 4494. ∑∑2 352 +332 +302 +⋯+ 372 +462 530 ∑∑()2 5304494.735.8 ∑∑ . 2 + 2 + + 4494.376.5 735.8376.5349.3 . 18.83 . 4.95 2. 2. 5.1635 ⁄ ~3, 1 4 : >.,, 3.344
ii.
Nivel de significancia: . De los datos se obtienen:
.
SCT=
SCA= SCE=
MCA= MCE= F A=
iii.
Estadística y Región Crítica La estadística es, prueba es:
FUENTE DE VARIACION HORAS ERROR TOTAL iv. v.
. La región critica de la
GRADOS SUMA DE MEDIAS RAZON F DE CUADRADOS CUADRATICAS CALCULADA LIBERTAD 386.5 3 128.83 349.3 14 24.95 F A=5.1635 735.8 17 Decisión: Dado que , se debe rechazar la , el factor horas influye en el uso de los terminales de computo. La probabilidad P de la prueba es, 0.013
5. 1 63>3. 3 44 [3,14 >5.163]
.2. 35. 8 3 6 41. 6 8 3 2 .. 30. 8 5 4.5 4 2. <68<4. 30. . 8<<35. . <83<41. . 5 0. , 0 5 4 14 2 ..,3,1144 3.3.0138 .4,14 3.7 √ ⁄ ∑ 16 + 13 +4 15 + 14 57604 4057 4.⁄95 .434 4057 2 3. 0 3×. 4 347. 3 75 3. 1 8×. 4 347. 7 40 3.7×.4347.959 . 5 30.8.<35.<8.3<41. < 2.6<8<4. .. .. 6.11.67<7. 7>7.794059 2 2.. .2. 10. 8 8>7. 7 40 40 0. 8 <7. 3 75 4.105 57 .2. .. 5. 8 5<7. 3 75 5.03<7.375 c)
I.
II.
III.
Rangos mínimos significativos
Para tamaños diferentes de muestras:
IV.
Comparaciones múltiples de rangos de Duncan
Significativa No Significativa Significativa No Significativa No Significativa No Significativa
Duncan:
12. En EGC de la PUCP se va evaluar la efectividad ef ectividad de tres métodos diferentes de enseñanza de Matemática I: El método grupal (A), el tradicional (B) y el aprendizaje basado en problemas (ABP). Del semestre anterior se ha escogido una muestra aleatoria de calificaciones finales para cada método de enseñanza cuyos resultados se dan en l a tabla que sigue: METODOS A B 132 17 14 16 12 16 13 17 12 17 15 13 11 14
ABP 10 11 15 10 14 13 10 13 11 14 13 10 a) Al nivel de significancia ¿indican los datos obtenidos que no existen diferencias significativas entre los tres métodos de enseñanza?. b) Realice un ordenamiento ordenamiento de efectividad efectividad de los tres métodos métodos aplicando aplicando el método de rangos de Duncan al nivel de .
0. 0 5
0. 0 5
SOLUCIÓN a) i.
Hipótesis:
ii.
Nivel de significancia: .
:: ∃ 2 0. 0 5 .2. 104 8 96 6 2 ∙. 144 1 344 6 2 2 344 . 6 4551.3895 De los datos se obtienen:
.
∑ ∑2 132 +142 +12 + ⋯ + 132 +102 4678 ∑ ∑()2 46784551.38516.615 ∑ ∑ . + + 2 4551.38564.615 16.61564.6156 . 2 3.3075 2 2 .696 2. 2. 11.9835 ⁄ ~ ~ , 3 3 : > .,2,2 3.4
SCT=
SCA= SCE=
MCA= MCE= F A= iii.
Estadística y Región Crítica La estadística es, prueba es:
FUENTE DE VARIACION METODOS ERROR TOTAL
SUMA DE CUADRADOS 64.615 62 126.615
iv. v. b) 1)
. La región critica de la
GRADOS DE MEDIAS RAZON F LIBERTAD CUADRATICAS CALCULADA 2 32.3075 23 2.696 F A=11.9835 25
11.98>3.4 [,3>11.985]85] 0.000 .2. 13 8 16 6 2 1 1
Decisión: Dado que , se debe rechazar la el factor método influye en la enseñanza de matemática I. La probabilidad P de la prueba es,
.
. < . < 2. 1<13<16
,
2)
0. ,0 5 ,
33 2 ..,3,333 ..797 3) Rangos mínimos significativos
√ ⁄ ∑ 18 + 163+ 11 439 8 ..6896 0.58 2 . 7 7×0. 5 81. 6 06 .9×0.581.693 1<13<16 . < . < 2. 2.2. .. 3>1. 6 93 4>1. 6 06 2. . 1<1. 6 06 < 2 79 8 Para tamaños diferentes de muestras:
4) Comparaciones múltiples de rangos de de Duncan Duncan
Significativa Significativa No Significativa
Duncan:
13. Dieciséis empleados nuevos del grupo “BANC” fueron distribuidos aleatoriamente en 4 grupos distintos de cuatro empleados cada uno. A cada grupo se le asignó aleatoriamente un tiempo de entrenamiento antes de realizar cierta tarea. Los resultados de dicha tarea en tiempos correspondientes se dan en la siguiente tabla: Grupo 1: 1 hora 25 19 22 20 86 4
ENTRENAMIENTO Grupo 2: 1.5 Grupo 3: 2 hora hora 14 7 26 10 17 9 15 11 72 37 4 4
Grupo 4: 2.5 hora 8 7 9 4 28 4
a) Antes de saber los resultados resultados de la prueba global de comparaciones comparaciones (ANOVA) realice una una prueba de significación, significación, por partes e medias muéstrales, utilizando intervalos de confianza al 95 % y prueba de hipótesis con = 0.05 Asuma los supuestos de este modelo de diseño de experimentos si fuera necesario. b) Al nivel de significación significación 0.001, ¿Se debería rechazar rechazar la hipótesis nula nula que afirma que no son significativas las diferencias observadas en los promedios de los cuatro grupos? En caso de rechazar la hipótesis nula, ¿Qué grupo realizará el trabajo en tiempo óptimo? Utilice Duncan con = 0.01 SOLUCIÓN a) Las hipótesis hipótesis a probar son: 1) Con respecto respecto a tratamientos (Número (Número de Grupo)
⋯
= = = = = (El Número de Grupo NO influye de manera significativa en el Tiempo de Entrenamiento) = ≠ (Al menos un Número de Grupo influye de significativa en la resistencia del material)
2) Con respecto respecto a bloques (Tipo de Entrenamiento) Entrenamiento)
⋯
= = = = = (El Tipo de Entrenamiento NO influye de manera significativa en el Tiempo de Entrenamiento) = ≠ (Al menos un Tipo de Entrenamiento influye de manera significativa en el Tiempo de Entrenamiento)
3) Resultados:
4) Conclusiones:
I) Como p valué para el Número de Grupo = 0.690 > 0.05, Se Acepta H0 y Se concluye que el Número de Grupo NO influye de manera significativa en el Tiempo de Entrenamiento. II) Como p valué para el Tipo de Entrenamiento= 0.001 < 0.05, Se Rechaza H0 y Se concluye que al menos un Tipo de Entrenamiento, influye de manera significativa en el Tiempo de Entrenamiento.
b)
Totales Xi ni=r Medias X
ENTRENAMIENTO Grupo 2: 1.5 Grupo 3: 2 hora hora 14 7 26 10 17 9 15 11 72 37 4 4 18 9.25
Grupo 1: 1 hora 25 19 22 20 86 4 21.5
1) ordenamos las medias de menor a mayor X4 < X3 < X2 < X1
2) se obtienen los valores en la tabla de Duncan Dato:
= 0.05
r p = r (p,f) r 2 = r 0.05(2,12) = 3.08 r 3 = r 0.05(3,12) = 3.77 r 4 = r 0.05(4,12) = 4.20
Grupo 4: 2.5 hora 8 7 9 4 28 4 7
223 16 13.94
3) Se obtiene los rangos mínimos significativos:
× 6.3964 × × × × × × Rp = r p
Dónde:
=
= 1.26455
R2 = r 2 1.26455= 3.08 1.26455= 3.8948 R3 = r 3 1.26455= 3.77 1.26455= 4.7673 R4 = r 4 1.26455= 4.20 1.26455= 5.3111 4) Se contrastan las diferencias entre pares de medias muestrales comparando el rango de p medias adyacentes. P = 4, rango de las 4 medias adyacentes: X1 – X4 = 21.5 – 7 = 14.50
P = 3, rango de las 3 medias adyacentes: X1 – X3 = 21.5 – 9.25 = 12.25 X2 – X4 = 18 – 7 = 11.00
P = 2, rango de las 2 medias adyacentes: X1 – X2 = 21.5 – 18 = 3.50 X2 – X3 = 18 - 9.25 = 8.75 X3 – X4 = 9.25 – 7 = 2.25
5) Comparaciones múltiples de Duncan X1 – X4 = 14.50 > R4 = 5.3111
SIGNIFICATIVA
X1 – X3 = 12.25 > R3 = 4.7673
SIGNIFICATIVA
X2 – X4 = 11.00 > R3 = 4.7673
SIGNIFICATIVA
X1 – X2 = 3.50
< R2 = 3.8948
NO SIGNIFICATIVA
X2 – X3 = 8.75
> R2 = 3.8948
SIGNIFICATIVA
X3 – X4 = 2.25
< R2 = 3.8948
NO SIGNIFICATIVA
6) Análisis: X4 7
X3
X2
X1
9.25
18
21.5
µ4 = µ3 < µ2 = µ1 Por lo tanto, los grupos que realizan el trabajo en tiempos más óptimos son el grupo 4 y el grupo 3 14. Veinte personas que experimentaban fiebres de 38 grados o más fueron divididos en grupos de 6 personas cada uno y a cada grupo se le administró una marca de tableta distinta para aliviar el mal. El número de horas contadas hasta bajar la fiebre luego de administrar la tableta se da en la siguiente tabla: TABLETAS TABLETA 2 TABLETA 3 11 6 5 4 3 7 3 5 4 6 2 2
TABLETA 1 5 3 8 4 2 6
TABLETA 4 12 10 9 8 7 8
a) Pruebe al nivel de significación = 0.05, la hipótesis de que el promedio del número de horas hasta aliviar el mal es el mismo para la cuatro marcas de tabletas. ¿cuál es la decisión con = 0.01? b) Sí rechaza la hipótesis de igual efectividad. ¿Cuál de las cuatro tabletas es la más eficaz? Use el método de Rangos de Duncan al 5%
SOLUCIÓN a) Las hipótesis a probar son: 1) Con respecto a tratamientos (Número de Grupo)
⋯
= = = = = (El Número de Grupo NO influye de manera significativa en el Número de horas hasta bajar la fiebre) = ≠ (Al menos un Número de Grupo influye de significativa en el Número de horas hasta bajar la fiebre)
2) Con respecto a bloques (Tipo de Tableta)
⋯
= = = = = (El Tipo de Tableta NO influye de manera significativa en el Número de horas hasta bajar la fiebre)
= ≠ (Al menos un Tipo de Tableta influye de manera significativa en el Número de horas hasta bajar la fiebre) 3) RESULTADOS
4) CONCLUSIONES I)
Como p valué para el Número de Grupo = 0.100 > 0.05, Se Acepta H0 y Se concluye que el Número de Grupo NO influye de manera significativa en el Número de horas hasta bajar la fiebre.
II)
Como p valué para el Tipo de Tableta = 0.005 < 0.05, Se Rechaza H0 y Se concluye que al menos un Tipo de Tableta, influye de manera significativa en el Número de horas hasta bajar la fiebre.
b) TABLETA 1 5 3 8 4 2 6 Totales Xi ni=r Medias X
TABLETAS TABLETA 2 TABLETA 3 11 6 5 4 3 7 3 5 4 6 2 2
TABLETA 4 12 10 9 8 7 8
28
28
30
54
140
6
6
6
6
24
4.67
4.67
5
9
5.83
1) Ordenamos las medias de menor a mayor X1
≤
X2 < X3 < X4
2) Se obtienen los valores en la tabla de Duncan Dato:
= 0.05
r p = r (p,f) r 2 = r 0.05(2,20) = 2.95 r 3 = r 0.05(3,20) = 3.58 r 4 = r 0.05(4,20) = 3.96 3) Se obtiene los rangos mínimos significativos:
Rp = r p
Dónde:
× × ×
×
. =
× × ×
= 1.24967
R2 = r 2 1.24967= 2.95 1.24967= 3.6865 R3 = r 3 1.24967= 3.58 1.24967= 4.4738 R4 = r 4 1.24967= 3.96 1.24967= 4.9487
4) Se contrastan las diferencias entre pares de medias muestrales comparando el rango de p medias adyacentes.
P = 4, rango de las 4 medias adyacentes: X4 – X1 = 9 – 4.67 = 4.33 P = 3, rango de las 3 medias adyacentes: X4 – X2 = 9 – 4.67= 4.33 X3 – X1 = 5 – 4.67 = 0.33 P = 2, rango de las 2 medias adyacentes: X4 – X3 = 9 – 5 = 4 X3 – X2= 5 - 4.67= 0.33 X2 – X1 = 4.67 – 4.67 = 0
5) Comparaciones múltiples de Duncan
X4 – X1 = 4.33
< R4 = 4.9487
NO SIGNIFICATIVA
X4 – X2 = 4.33
< R3 = 4.4738
NO SIGNIFICATIVA
X3 – X1 = 0.33 < R3 = 4.4738
NO SIGNIFICATIVA
X4 – X3 = 4
< R4 = 4.9487
NO SIGNIFICATIVA
X3 – X2= 0.33
< R3 = 4.4738
NO SIGNIFICATIVA
X2 – X1 = 0
< R2 = 3.6865
NO SIGNIFICATIVA
6) Análisis X2
X3
X4
X1
4.67
4.67
5
9
µ4 = µ3 = µ2 < µ1 Por lo tanto, la tableta más eficaz seria la tableta 1
15. la estructura financiera de una firma se refiere a la forma en que se dividen los activos de la empresa por debe y haber, y el apalancamiento financiero se refiere al porcentaje de activos financiados por deuda. En un estudio financiero se firma que el apalancamiento financiero puede utilizarse para aumentar la tasa de rendimiento sobre la inversión, es decir que, los accionistas pueden recibir rendimientos más altos con la misma cantidad de inversión gracias a su uso. Los siguientes datos muestran las tasas de rendimiento utilizando 3 diferentes niveles de apalancamiento financiero
:
Niveles de rendimiento Control Bajo Medio Alto 4.6 2 7 7.9 2 7.4 4.5 6.8 6.8 1.8 11.6 5.8 4.2 3.2 6 9.2 1.6 4 6.8 11 a) ¿Existen diferencias reales entre las medias de los cuatro niveles de rendimiento al nivel de significación 1%, y al 5%? b) ¿Son las tasas medias de rendimiento en los niveles de apalancamiento financiero bajo, medio y alto más altas que la de nivel de control? SOLUCIÓN a) Gráfica de las medias muestrales. Interval Plot of rendimiento vs Niveles de rendimiento 99% CI for the Mean 12
10
8
o t n e i m 6 i d n e r
4
2
0 A
B
C
M
Niveles de rendimiento The pooled standard deviation was used to calculate t he intervals.
La variable dependiente es:
:
Asociada a la variable dependiente o factor nivel de rendimiento, cuyos tratamientos son: control (C), Bajo (B), Medio (M) y Alto (A)
Sea
las medias de los niveles de rendimiento
1. 2.
∶ 2 1∶No todas las son iguales
2 2 114. . 0 65.08 ∑∑2 4.62 +2 +⋯+112 813.8 ∑∑ 2 813.865.08 161.74 2 2 2 2 19. +18. 4 +35. 9 +40. 7 . 78.4 5 161.7478.483.3 Fuente de Variación
Suma de Cuadrados
Nivel de rendimiento Error Total
78.42 83.32 161.74
Grados Medias Razón F Pde Cuadráticas Calculada Value Libertad 3 16 19
26.14 5.2
5.02
∼3,16 { 3,16 >3.01 }
0.0012
La estadística de la prueba es:
[>5. 0 ] 0.01> 0.01
Dado que , se acepta la , y se concluye que las medias de los cuatro niveles de rendimiento son iguales.
Interval Plot of rendimiento vs Niveles de rendimiento 95% CI for the Mean
10 9 8
o t n e i m i d n e r
7 6 5 4 3 2 1 A
B
C
M
Niveles de rendimiento The pooled standard deviation was used to calculat e the intervals.
b)
∶ 2 1∶ 2 2 114. . 0 65.08 ∑∑2 4.62 +2 +⋯+112 813.8 No todas las
son iguales
2 813.865.08 161.74 2 2 2 2 19. +18. 4 +35. 9 +40. 7 . 78.4 5 161.7478.483.3 [>5. 0 ] 0.01< 0.05
Dado que , se rechaza la , y se concluye que no todas las medias de los cuatro niveles de rendimiento son iguales.
16. La importadora “Drogasa” quiere compara la eficiencia de tres medicinas para el tratamiento de la rinitis alérgica en adultos mayores de 50 años. Para esto diseño un experimento seleccionando 3 pacientes mayores de 50 años que sufren la enfermedad. A cada paciente escogido se le suministro las tres medicinas A, V y C en periodos distintos del ataque de la enfermedad registrándose el número de días que tardaron en recuperarse. Los datos se registraron en el siguiente diseño de un factor (medicina) aleatorizado por bloques (pacientes). Paciente 1
B A C
18 23 17
Paciente 2
C B A
15 25 28
Paciente 3
A C B
16 16 22
a) Al nivel de significación 0.05 ¿es válido concluir que no existen diferencias significativas en los tiempos promedios de días de recuperación de los pacientes? b) ¿Fue correcto incluir a los pacientes como una fuente de variación en el diseño del experimento?
SOLUCIÓN a) La variable dependiente es:
: í ó
ℬ + + +
El factor es pacientes Los bloques son los tipos de medicinas El modelo de este diseño de experimento es:
Cálculos de los datos
2 2 180 . ∗ 3∗3 3600 12 84.63682 17 2 2 2 1 67 + 65 + 48 2 3600 7. 6 67 . 3 = 2 582 +682 +542 1 ℬ 360034. 6 67 . 3 = +ℬ64.667 Las sumas de cuadrados, los grados de libertad, los cuadrados medios y las F calculadas se resumen minitab
Sea pacientes -
tiempos promedios de días de recuperación de los
Hipótesis
∶ 2 1∶ No todas las
-
-
son iguales
Región de rechazo Se rechazara Ho con un nivel de significancia
.,2,
0. 0 5 > , si
Decisión Dado que , se debe aceptar la Ho y concluir con probabilidad de error tipo I, , los tiempos promedios de recuperación de los pacientes son iguales; es decir:
.5<.,2, 6.94 0. 0 5
2
b)
-
Hipótesis
∶ 1∶ No todas las
-
-
son iguales
Región de rechazo Se rechazara Ho con un nivel de significancia si
Β >.,2, Β 1.07<.,2, 6.94
0. 0 5
,
Decisión Dado que , se debe aceptar la Ho y concluir con probabilidad de error tipo I, , que fue correcto incluir a los pacientes como una fuente de variación en el diseño del experimentos los tiempos promedios de recuperación de los pacientes son iguales.
0. 0 5
17. 18. 19. La empresa agroindustrial ARROZSA, estudia el efecto de 4 clases de fertilizantes A, B, C y D en el rendimiento de la producción de arroz. Para esto, diseño un experimento dividiendo el terreno del cultivo en tres bloques 1, 2,3 con cuatro parcelas homogéneas de cada uno, asignado aleatoriamente los fertilizantes de cada uno de los bloques para conseguir aso un diseño de bloques completamente aleatorizado. El rendimiento, medido en kilogramos por parcela, se da en la siguiente tabla: 1 C 39.9 A 40.1 B 41.1 D 42.1
2 D 43.4 B 42.9 A 42.2 C 42.3
3 B 42.7 D 42.9 C 41.4 A 41.9
a) Describa la variable dependiente y el modelo de este diseño de experimento. b) ¿proporcionan estos datos suficiente evidencia de alguna diferencia significativa en la medida de los rendimientos de los fertilizantes? ¿si es, así ¿cuál de los fertilizantes es el mejor? c) Si un analista opina que fue innecesario dividir los terrenos en bloque considerarlos como fuente de variabilidad de la producción. Solo bastaba con comparado con el efecto de los fertilizantes sobre la producción aplicando un diseño o factor completamente aleatorio. estaría de acuerdo usted con el analista.
SOLUCIÓN a) La variable dependiente es: X= efecto de fertilizantes A, B, C, D Asociada a variable dependiente o factor a= terreno del cultivo en tres bloques 1, 2,3 con cuatro parcelas homogéneas de cada uno.
∝
El modelo de este ANOVA está dado por : Xij=µ+ i+
Donde, i= µi -µ es el efecto de los fertilizantes
ij
i=1, 2, 3,4
b) Tabla ANOVA los datos se obtienen: Fertilizantes A
1 40.1
Tipos 2 42.2
B C D TOTAL DE BLOQUE X
41.4 39.9 42.1
42.9 42.3 43.4
164.5
172.8
Total Xi
n=r
124.2
3
42.7 41.4 42.9
127 123.6 128.4
3 3 3
171.9
503.2
12
3 41.9
Medias
41.4 42.333333 3 41.2 42.8 167.73333 3
Cálculos:
2 2 X.. 503 n 1 1100.85333 ΣΣx2ij1113.76 SCTΣΣx^ij2C1.90666667 SCA ΣXir. C5. SCBΣx.J^/kC516.571666 SCESCTSCB+SCA0.534666667 varianza1.173333333 SCTn1Sx^1.90666667 Otra forma de obtener SCT
La suma de los cuadrados de libertad, los cuadrados medios y las F calculadas se resumen.
Suma de cuadrados
Fuente de variación A=fertilizante 5.2 Bloques 7.172 Error 0.53466667 Total 12.9066667
Grados de libertad 3 2 6 11
Medias Razón F calculada cuadráticas 1.73333333 F A =19.4513716 FB = 40.2418953 3.586 0.08911111
a) Se quiere contrastar la hipótesis nula: Ho: αi = 0, para todo i=1, 2, 3,4
H1: una de las αi no es nulo b) La región de rechazo: Se rechazará Ho el nivel de significación α=0.05, si F A>F0.95, 3,6
Decisión: Dado que Fa=19.451, P [F (3.6)>19.451]=0.002 c) Se tiene, además: FB= 40.241 con un nivel de significación = 0.00. Se establece que el diseño por bloques es el adecuado. 20. El gerente de ventas del grupo “M ercados” realizó un estudio estadístico para comparar volumen de ventas dirás de sus cuatro mercados. Para esto diseño un experimento considerando solo las ventas de los días jueves, viernes, sábado y domingo de días de semana como una posible fuente de variabilidad en el monto de las ventas. Los mercados 1, 2, 3,4fueron asignados al azar a los 4 jueves, 4 viernes, a los 4 sábados y los 4 domingos consiguiendo así un diseño aleatorio por bloque. Las ventas dirías EN MILES DE SOLES SE DAN en la tabla que siguen Días Jueves viernes sábado Domingo 42(3) 55(1) 61(2) 40(4) 50(1) 52(3) 44(4) 60(2) 35(4) 59(2) 46(3) 52(1) 62(2) 38(4) 54(1) 50(3) A un nivel de significación α=0.05
a) ¿muestras estos datos que existe muestras significativas en los volúmenes de las ventas promedios delas 4 sucursales? SI ES ASI ¿Cuál sucursal vende más? b) ¿ha sido adecuado considerar a los días como una fuente de variabilidad en monto de las ventas en las 4 sucursales? c) Si los días no considerados no afectan a la variabilidad en el monto de las ventas en las sucursales, rediseñe el experimento sin considerar como fue la variabilidad alas días. Con este modelo, ¿cuál de las sucursales vende más? ¿use la prueba del rango de Duncan?
SOLUCIÓN Tabla ANOVA Datos Días Total. MERCADOS Jueves viernes sábado Domingo A 126 55 122 160 463 B 50 156 176 120 502 C 140 118 138 52 448 D 124 152 54 150 480 TOTAL DE 440 481 490 482 1893 BLOQUE X.j Media bloque X.j 44 48.1 49
4 4 4 4
Medias Xi. 115.75 125.5 112 120
16
473.25
n=r
Cálculos.
2 X.. C n 3889664.6853637 250765 21080.01 .^/958.48 1/.^41.50 +80.03 1^1080.01 Otra forma de obtener SCT:
Las sumas de cuadrados los grados de libertad los cuadrados medios y las F calculadas se resuman: Suma de Grados de medias Razón F Fuente de cuadrados libertad cuadráticas calculada variación A=fertilizante 958.48 3 95.848183 35.9298375 bloques 41.50 9 4.61117071 1.72855248 error 80.02946 15 2.66764867 total 1080.01183 27 c) Se quiere contrastar la hipótesis nula: Ho: αi = 0, para todo i=1, 2, 3,4, j=1,2
H1: una de las αi no es nulo La región de rechazo: Se rechazará Ho el nivel de significación α=0.05, si Fa > F0.95, 3,047
Decisión: Dado que Fa=19.451, P [F (3.6)>19.451]=0.002 Además: Fb= 31.56 con un nivel de significación = 0.00. con 5% µ4<µ3<µ2<µ1. 21. El decano de estudios generales ciencias de la PUCP quiere saber si son los niveles de evaluación de cursos y/o el conocimiento de los alumnos que producen la variabilidad en las notas finales que obtienen. Para esto, se diseñó un experimento de dos factores sin réplicas, escogiendo 4 alumnos al azar del tercer nivel que cursaron las materias: matemática (M), estadística (E), física (F) y lengua (L), observando las calificaciones siguientes: CURSOS Alumno 1 2 3 4
M 14 13 11 12
E 13 18 16 15
F 14 15 13 112
L 16 19 18 16
A) ¿podemos concluir que los cursos presentan la misma dificultad? Si no es así, ¿Cuál de estos cursos es más difícil? Use Bonferroni con nivel de confianza al menos del 95% y Duncan 5%. B) ¿son los alumnos un factor de variabilidad significativo de las notas finales obtenidas? Utilice el método de la probabilidad P.
SOLUCIÓN Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN
Cuenta
Suma
Promedio
Varianza
1 2 3 4
4 4 4 4
57 65 58 55
14.25 16.25 14.5 13.75
1.583 7.583 9.667 4.250
M E F L
4 4 4 4
50 62 54 69
12.5 15.5 13.5 17.25
1.667 4.333 1.667 2.250
ANÁLISIS DE VARIANZA Origen de Grados Promedio Suma de las de de los cuadrados variaciones libertad cuadrados
14.188 53.688 15.563 83.438
Filas Columnas Error Total
3.000 3.000 9.000 15.000
4.729 17.896 1.729
Valor Probabilidad crítico para F
F
2.735 10.349
0.106 0.003
Tenemos sacando la tabla de cuadrados: SCA SCB SCE SCT a)
53.688 14.188 15.563 83.438
0 :
Tenemos un rango de1-4 Según la tabla
10,349
con grados de libertad 3,9,
Tenemos P [F (3,9)>10,349]=0.003 Como la probabilidad es menor que 0.05 entonces se rechaza.
UTILIZAMOS EL METODO DE BONFERRINI
Calculamos los siguientes datos necesarios: n= 6 a= 0.013 1-(a)/2 = 0.994 n-k = 12.000 2.934 error= 2.228 Tabla de diferencias de medias
12.5
15.5
-3
15.5
13.5
2
-0.228
13.5
17.25
-3.75
-5.978
17.25
12.5
4.75
2.522
-
L.inf
L.sup
-5.228
-0.772
xe-xm
4.228 xe-xf -1.522 xf-xl 6.978 ul-xm
3.863 3.863
Del cuadro calculamos que:
<, 2, 222 , < 0 .735 con
b)
,
con
y
, Duncan, subconjunto homogéneo
con
Tenemos una hipótesis
:
El rango de trabajo es de 1-4 Según la tabla
con grados de libertad 3,9,
Tenemos P [F (3,9)>2.735]=0.106 entonces no se rechaza. 22. Cuatro operarios del grupo “construye” realizan la misma tarea de construir paredes de ladrillo en tiempos iguales. El grupo quiere determinar si hay alguna diferencia significativa en el metraje promedio debido a la habilidad de los operarios y/o debido al horario. Para esto diseñaron un análisis de varianza de dos factores sin replicas, registrando los siguientes datos en metros cuadrado de pared construida por cada operario en tres horas cualesquiera: Operarios
2
Horas 10-11 am 2-3 pm 4-5 pm
3.0 1.8 2.4
3.5 2.1 2.5
3.2 2.0 2.4
3.3 1.9 2.4
a) Plantea la hipótesis nula y alternativa para determinar si existen diferencias significativas en el metraje construido debido a los operarios. b) Plantee la hipótesis nula y alternativa para determinar si existen diferencias significativas en el metraje construido debido a los horarios. c) Si existen diferencia en alguno de los dos factores, ¿Qué pares de niveles de este, producen las diferencias? Utilice el método de Duncan. Use un nivel de significancia =0.01 en todas las pruebas
SOLUCIÓN Cálculo del análisis de datos RESUMEN Cuenta
10-11 am 2-3 pm 4-5 pm
Suma
4.0000 13.0000 4.0000 7.8000 4.0000 9.7000
Promedio Varianza
3.2500 1.9500 2.4250
0.0433 0.0167 0.0025
3.0000 3.0000
7.2000 8.1000
2.4000 2.7000
0.3600 0.5200
3.0000 3.0000
7.6000 7.6000
2.5333 2.5333
0.3733 0.5033
ANÁLISIS DE VARIANZA Origen de las variaciones Filas
Suma de cuadrados 3.46166667
Grados de libertad 2
Promedio de los cuadrados 1.73083333
Columnas
0.13583333
3
0.04527778
Error
0.05166667
6
0.00861111
Total
3.64916667
11
Probabilidad
Valor crítico para F
201
3.1803E-06
5.14325285
5.25806452
0.04074402
4.75706266
F
Resumen del cuadro SCA SCB SCE SCT
0.136 3.462 0.052 3.649
a) Operarios(A), Tenemos como hipótesis, donde i va de 1-4 De la tabla se ha calculado y con grados de libertad 3,6 También calculamos P [F>5.258]=0.04, por lo cual se acepta b) Horas (B), Tenemos y tiene un rango 1, 2,3 Según la tabla tenemos con grado de libertad 2,6 Calculamos P [F>210]=0.000 por lo cual se rechaza . c) Duncan por horas:
: 5. 58,
:
2 < <
10,
23. La firma confecciones quiere saber si las perdidas en porcentajes de producción defectuosa producida, dependen de las líneas de producción y/o de los tipos de materia prima de sus proveedores. Para esto, el ingeniero a cargo del control, diseño un experimento de dos factores sin replicas asignando a cada una de las 5 líneas de producción L 1, L2, L3, L4 y L5 una de las 4 materias primas: M 1, M2, M3, M4 por día. Los porcentajes de producción defectuosa por día se dan en la tabla que sigue: Líneas de producción Materias primas M1 M2 M3 M4
L1 2.3 2.8 3.2 3.6
L2 2.5 2.7 3.0 3.8
L3 3.0 3.5 3.7 4.0
L4 3.2 3.8 3.9 4.3
L5 4 4.2 4.3 4.5
a) Defina la variable dependiente y el modelo de ANOVA. b) ¿Son significativamente diferentes los promedios de porcentajes de
producción defectuosa debido a las líneas de producción? Si es así ¿cuál es la línea de mayor producción defectuosa? Use el método de rangos de Duncan. c) ¿Son significativamente diferente los promedios de porcentajes de producción defectuosa debido a las materias primas? Si es así, ¿Cuál es la materia prima optima? Use Duncan. En todas las pruebas use el nivel de significación
SOLUCIÓN
0. 0 5
a)
Origen de las variaciones Filas Columnas Error Total
Suma de cuadrados SCB=2.8255 SCA=4.718 SCE=0.362 SCT=7.9055
ANÁLISIS DE VARIANZA Grados Promedio de de los libertad cuadrados F 3 0.942 31.22 4 1.180 39.10 12 0.030 19
Valor crítico Probabilidad para F 5.978E-06 3.490 8.606E-07 3.259
b)
1. H0:
0 , 1,,3,4,5
2. se calculan las medias y se proceden a ordenar de menor a mayor. Líneas de producción Promedio L1 2.98 L2 3 L3 3.55 L4 3.8 L5 4.25 3.
0. 0 5
, k=5, f= 12
R2=r 0.05 (2, 12) =3.08 R3=r 0.05 (3, 12) =3.23 R4=r 0.05 (4, 12) =3.33 R5=r 0.05 (5, 12) =3.36 Se calculan los rangos mínimos significativos:
∗ 0.0430 0.0866 2 3.08∗ 0.08660.68 3.3 0.08660.80 3.33∗ 0.08660.88 3.36∗ 0.08660.91
Las muestras adyacentes se tienen:
Se realiza una comparación entre las medias y los rangos mínimos:
medias 5y4 5y 3 5y 2 5y1 4y3 4y2 4y1 3y2 3y1 2y1
0.45 0.7 1.25 1.28 0.25 0.8 0.83 0.55 0.58 0.02
comparación de rangos de Duncan > 0.29 significativa > 0.29 significativa > 0.29 significativa > 0.29 significativa < 0.29 no significativa > 0.29 significativa > 0.29 significativa > 0.28 significativa > 0.28 significativa < 0.268 no significativa
Podemos afirmar que:
c) 1. H0:
39.1 [>39. 1] 0 2 < < 0 , 1,,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor. materias primas Promedio M1 3 M2 3.4 M3 3.62 M4 4.04 3.
0. 0 5
, k=4, f= 12
R2=r 0.05 (2, 12) =3.08 R3=r 0.05 (3, 12) =3.23 R4=r 0.05 (4, 12) =3.33 R5=r 0.05 (5, 12) =3.36
Se calculan los rangos mínimos significativos:
∗ 0.0530 0.077 2 3.08∗ 0.0770.37 3.3∗0.0770.49 3.33∗ 0.0770.56
Las muestras adyacentes se tienen:
Se realiza una comparación entre las medias y los rangos mínimos: medias 4y3 4y2 4y1 3y2 3y1 2y1
comparación de rangos de Duncan 0.42 > 0.26 significativa 0.64 < 0.26 significativa 1.04 > 0.26 significativa no 0.22 > 0.25 significativa 0.62 > 0.25 significativa 0.40 > 0.237 significativa
Podemos afirmar que:
31. [>31.]0 <2 <
24. Para evaluar 4 sistemas de administración de archivos de diseño un experimento con 4 operadores de procesamiento de palabras a quienes se les observo el tiempo X necesario, en minutos, para aprender a usar cada uno de los siguientes sistemas de administración de archivos. Los tiempos observados se dan en la tabla que sigue: operadores B1 B2 B3 B4
sistemas de administración de archivo A1 A2 A3 A4 390 402 392 385 380 403 394 385 377 411 399 380 370 404 400 384
Además, Sx= 11.5181 ¿Existen alguna diferencia significativa en la media del tiempo, a) ¿Debido a los sistemas de administración de archivos? b) ¿Debido a los operadores? c) ¿Cuál de los sistemas es el más adecuado? Use el método de rangos de Duncan. En todas las pruebas use el nivel de significación
SOLUCIÓN
0. 0 5
Realizamos el cuadro ANOVA: ANÁLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados
Filas
SCB= 18.5 SCA= 1671.5 SCE= 300 SCT= 1990
Columnas Error Total
A) 1. H0:
Grados Promedio de de los libertad cuadrados
F
Probabilidad
3
6.167
0.185
0.904
3.863
3 9 15
557.167 33.333
16.715
0.001
3.863
0 , 1,,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor: Sistemas de administración Promedio de archivos A1 379.25 A2 383.5 A3 396.25 A4 405 3.
0. 0 5
, k=4, f= 9
R2=r 0.05 (2, 9) =3.20 R3=r 0.05 (3, 9) =3.34 R4=r 0.05 (4, 9) = 3.41
Valor crítico para F
Se calculan los rangos mínimos significativos:
∗ 33.3333 3.33 2 3.0∗ 3.3310.66 3.34∗3.3311.1 3.41∗ 3.3311.36
Las muestras adyacentes se tienen:
Se realiza una comparación entre las medias y los rangos mínimos: Medias 4y3 4y2 4y1 3y2 3y1 2y1 Podemos afirmar que:
Comparación de rangos de Duncan 8.75 21.50 25.75 12.75 17.00
< > > > >
11.36 11.36 11.36 11.12 11.12
4.25
<
10.36
16.715 [>16.715]0.001 < 2
no significativa significativa significativa significativa significativa no significativa
A) 1. H0:
0 , 1,,3,4
2. se calculan las medias:
Sistemas de administración Promedio de archivos A1 379.25 A2 405 A3 396.25 A4 383.5 3.
0. 0 5
, k=4, f= 9
R2=r 0.05 (2, 9) =3.20 R3=r 0.05 (3, 9) =3.34 R4=r 0.05 (4, 9) = 3.41 Se calculan los rangos mínimos significativos:
∗ 33.3333 3.33 2 3.0∗ 3.3310.66 3.34∗3.3311.1 3.41∗ 3.3311.36
Las muestras adyacentes se tienen:
Se realiza una comparación entre las medias y los rangos mínimos: medias 4y3 4y2 4y1 3y2 3y1 2y1
comparación de rangos de Duncan 8.75 21.50 25.75 12.75 17.00
< > > > >
11.36 11.36 11.36 11.12 11.12
4.25
<
10.36
no significativa significativa significativa significativa significativa no significativa
Podemos afirmar que:
a) 1. H0:
16.715 [>16.715] 0.001 < 2 0 , 1,,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor: Sistemas de administración Promedio de archivos A1 379.25 A2 383.5 A3 396.25 A4 405 3.
0. 0 5
, k=4, f= 9
R2=r 0.05 (2, 9) =3.20 R3=r 0.05 (3, 9) =3.34 R4=r 0.05 (4, 9) = 3.41 Se calculan los rangos mínimos significativos:
∗ 33.3333 3.33 2 3.0∗ 3.3310.66 3.34∗3.3311.1 3.41∗ 3.3311.36
Las muestras adyacentes se tienen:
Se realiza una comparación entre las medias y los rangos mínimos: medias 4y3 4y2 4y1 3y2 3y1 2y1
comparación de rangos de Duncan 8.75 21.50 25.75 12.75 17.00
< > > > >
11.36 11.36 11.36 11.12 11.12
4.25
<
10.36
Podemos afirmar que:
b) 1. H0:
16.715 [>16.715] 0.001 < 2 0 , 1,,3,4
2. se calculan las medias:
Operadores ´Promedio O1 O2 O3 O4 3.
0. 0 5
, k=4, f= 9
R2=r 0.05 (2, 9) =3.20 R3=r 0.05 (3, 9) =3.34 R4=r 0.05 (4, 9) = 3.41
389.5 390.5 391.75 392.25
no significativa significativa significativa significativa significativa no significativa
Se calculan los rangos mínimos significativos:
∗ 33.3333 3.33 2 3.0∗ 3.3310.66 3.34∗3.3311.1 3.41∗ 3.3311.36
Las muestras adyacentes se tienen:
Se realiza una comparación entre las medias y los rangos mínimos: medias 4y3 4y2 4y1 3y2 3y1 2y1 Podemos afirmar que:
comparación de rangos de Duncan no 0.50 < 11.36 significativa no 1.75 < 11.36 significativa no 2.75 < 11.36 significativa no 1.25 < 11.12 significativa no 2.25 < 11.12 significativa no 1.00 < 10.36 significativa
0.185 [>0.185]0.904 2
c) El más adecuado sería el sistema A 4.
25. La empresa de “Torneados metálicos” diseño un experimento de dos factores con tres replicas para determinar si existen diferencias significativas en la cantidad de piezas producidas debido a las máquinas y debido a los operarios. Se emplearon dos operarios y cada uno de ellos utilizo cada una de las tres máquinas para procesar el producto en tres periodos iguales de tiempo. Los valores promedios de las cantidades de piezas producidas para cada combinación de los niveles de los factores se dan en la tabla que sigue: OPERARIOS
MAQUINAS M1
M2
M3
O1
102.33
130.00
114.33
O2
114.00
142.67
126.67
Y la tabla ANOVA resultante es: Fuente de Sumas de Grados de Medias variabilidad cuadrados Maquinas
2392.33
Operario
672.22
Libertad
Estadísticas
cuadráticas
F
Interacción 0.778 Error Total
3190.000
a) Realice una grafica lineal de medias y analice descriptivamente la existencia podría o no de interacción entre los dos factores considerados. b) ¿Es significativa la interacción entre los factores considerados? ¿Qué puede decir de los efectos de las máquinas y de los operarios? c) ¿Qué maquina y operario tienen mayor rendimiento? Utilice el método de rangos de Duncan donde sea posible aplicar. Aplique el nivel de significación α=5% en todas las pruebas.
SOLUCIÓN a) Gráfica lineal de medias para la interacción entre los dos factores considerados.
Interacción de Medias 160 140 120 100 80 60 40 20 0 M1
M2
M3
MAQUINAS O1
O2
Según la gráfica nos podemos dar cuenta de que descriptivamente no existe ningún tipo de interacción entre los operarios y sus máquinas correspondientes. b)
Antes de realizar el proceso para elaborar la tabla ANOVA, describiremos los siguientes datos:
... ̂# . # # # # #
Previo a pasar al desarrollo realizaremos la prueba de hipótesis H0= No hay interacción entre los operarios con sus respectivas máquinas. H1= Existe interacción entre los operarios con sus respectivas máquinas. N=
18
n=
3
ni=
9
n j=
6
y..=
121,667
Donde: N= # de datos * # de réplicas n= # de réplicas ni= # de réplicas * # de filas n j=# de réplicas * # de columnas Ahora teniendo en cuenta la tabla de valores de las cantidades producidas por los dos factores, procedemos a sacar los promedios: _Para los operarios: Promedio de O1 Promedio de O2 _Para las máquinas: Promedio de M1 Promedio de M2 Promedio de M3
̂1. ̂. .1 . .3
115,553 127,78
108,165 136,335 120,5
La tabla ANOVA cuenta con todas las sumas de cuadrados menos con la del ERROR, entonces:
+++
14.67
La tabla ANOVA quedaría de la siguiente manera: Fuente de
Sumas de
Grados de
Medias
Estadísticas
variabilidad
cuadrados
Libertad
cuadráticas
F
Maquinas
2392,33
2
1196,165
115,1340
Operario
672,22
1
672,22
64,7029
Interacción
0,778
2
0,389
0,0374
Error
124,67
12
10,3893
Total
3190
17
Para realizar el contraste de hipótesis, para ello recurrimos a la tabla de distribución F:
FcriticoF,, Máquinas
3.89
Operario
4.75
Interacción 3.89 Como: Fmáquinas>Fcrítico, rechazamos la H0 Como: Foperario>Fcrítico, rechazamos la H0 Como: Finteracción
Primero ordenamos de forma creciente las medias
< < 2 108.165<10.5<136.335 , 2 ,,1 ,3,1
Con la tabla Duncan obtenemos:
3,08 3,23
Los rangos mínimos y significativos:
∗ 6 R2=
4,0529
R3=
4,2503
Contrastamos las diferencias entre pares de medias muéstrales comparando el rango de medias adyacentes con el valor critico de mínimo significación. Para p=3 Para p=2
2 2
Entonces concluimos en que:
> 4,503 >2 4,0,59 >2 4,0,59
28,17 15,835 12,335
< <2
Completamos la información con el siguiente cuadro:
Rendimiento de las Máquinas 160 140 120 100 80 60 40 20 0 1
2 PROMEDIO
3 M1
26. Para seleccionar la mejor semilla de maíz y el mejor fertilizante la empresa “AGROSA” diseñó un experimento de dos factores con cuatro réplicas en
terrenos de igual fertilidad. El terreno se dividió en 24 pares iguales. Cada combinación de tipo de semilla y tipo de fertilizante se asignaron a cuatro pares iguales. Los rendimientos obtenidos en kilogramos se dan en la tabla siguiente: Semilla de Maíz
Fertilizante
A1
3530 313
B1 B2
A2
A3
3835 3736 4043 394
335 309
333 3640
334 3538
a) Realice una gráfica de medias y el análisis descriptivo de interacción. b) ¿es significativa la interacción observada entre los tipos de maíz y tipos de fertilizante? Utilice el método de la probabilidad P. c) ¿Se debería seguir analizando el efecto de los dos factores?
SOLUCIÓN a) gráfica de medias y el análisis descriptivo de interacción
INTERACCION ENTRE MAIZ Y FERTILIZANTE 180 160 140 120 100 80 60 40 20 0 A1 Fertilizante
A2
A3
Semilla de Maíz Series1
Series2
Series3
Series4
De la gráfica observamos claramente que si existe interacción entre ambos factores
b)
Primero realizamos la prueba de hipótesis: H0= No hay interacción entre los cultivos de fertilizante y maíz. H1= Existe interacción entre los cultivos de fertilizante y maíz. Proponemos un cuadro estadístico descriptivo para facilitarnos el manejo de los datos: FACTOR B
FACTOR A
TOTAL
MEDIA
N
A1
B1
150
37,5
4
B2
122
30,5
4
Total
272
34
8
B1
146
36,5
4
B2
164
41
4
Total
310
38,75
8
B1
131
32,75
4
B2
149
37,25
4
Total
280
35
8
B1
427
35,5833
12
B2
435
38,5833
12
Total
862
37,0833
24
A2
A3
TOTAL
Cuya desviación estándar va a ser igual a: 3,90001858 Con los datos obtenidos, comenzamos a realizar los cálculos para la tabla ANOVA:
Primero para el SST:
1×2 2 ∙ ∙
349,833333 30960,1667
Luego empezamos con las sumas de cuadrados para los factores:
2 1 × ∙ ∙ =
100,3333
2 1 × ∙ ∙ =
2,6667
Lo mismo hacemos con la Interacción:
2 ∙ 2 ++ = =
176,3333
Para el error tenemos que la SSE es igual a:
++
70,5
Con los datos anteriores ya podemos completar la tabla ANOVA para su respectivo análisis: Fuente de
Sumas de
Grados de
Medias
Estadísticas
variabilidad
cuadrados
Libertad
cuadráticas
F
S. MAIZ
100,3333
2
50,1667
12,8085
FERTILIZANTE
2,6667
1
2,6667
0,6809
INTERACCION
176,3333
2
88,1667
22,5106
ERROR
70,5
18
3,9167
TOTAL
349,8333
23
Para realizar el contraste de hipótesis, para ello recurrimos a la tabla de distribución F:
FcriticoF,, FS. Maíz
3.55
Ffertilizante 4.41 Finteracción 3.55
Ahora ya podemos realizar el contraste de hipótesis: S. MAIZ
Como: Fmaiz>Fcrítico, entonces: Rechazamos Ho
FERTILIZANTE Como: FfertilizanteFcrítico, entonces: Rechazamos Ho c)
Ya no sería necesario realizar un análisis de rango para la comprobación del contraste de hipótesis, ya que tanto gráfica como analíticamente se ha comprobado la validez de la hipótesis. 27. El grupo de mercados ¨P&C¨ quiere saber el efecto que la publicidad y la promoción pueden ejercer sobre la venta de uno de sus productos de consumo popular. Las ventas en miles de dólares durante un m es, de 16 mercados escogidos al azar en un experimento diseñado en dos factores con cuatro replicas se dan en la tabla que sigue: publicidad Promoción Con descuento Sin descuento
Con propaganda 110.5 105.4 90.7 95.8 50.4 45.8 40.6 44.9
Sin propaganda 80.5 78.6 60.8 65.8 35.8 40.1 20.7 25.7
a) Realice una gráfica de medidas y el análisis de interacción. b) ¿es significativa la interacción observada? c) Si no existe interacción entre promoción y publicidad, pruebe si existe efecto de los factores en forma independiente. Si existe efecto alguno de los factores sobre las ventas, haga un análisis de los mejores modos de venta.
SOLUCIÓN a) Grafico:
Gráfica de medidas
120
con propaganda
100
sin propaganda
80 60 40 20 0 0
1
2
3
4
5
6
El grafico podemos observar que no existe una intersección entre las líneas por lo tanto concluimos no hay indicios de interacción b) De la siguiente tabla obtenemos los datos
117.49 1938.01 80803 990.801 :, 0 , :∃,, 0
Interacción entre promoción y publicidad:
Efecto alguno de los factores sobre las ventas:
∗ 3.047 :8. 0777 136.905
Análisis de los mejores modos de venta.
28. Con el fin de estudiar los efectos de tipo de carga y de las empresas que las transportan sobre el tiempo de reparto terrestre de cargas, la distribuidora ¨DOCASA¨ diseño un modelo de análisis de varianza de dos vías con réplicas. Cada una de las tres empresas terrestres: transporto una misma distancia cada uno de los tipos de carga , repitiéndose el experimento tres veces. Se registraron los siguientes tiempos en minutos.
,, 2,
,2
TRANSPORTE
2
Tipo de carga
140 145 135 135 136 134 90 92 88
2
130 128 132 125 126 124 83 82 84
Asumiendo que los factores en estudio son de efectos fijos. a) Realice una gráfica de medidas y el análisis descriptivo de la interacción. b) ¿Es significativa la interacción observada entre tipo de carga y de transporte? c) ¿son significativos los efectos de los tipos de carga? Si es así, ¿Cuál de los dos tipos de carga llega primero? d) ¿son todos significativos los efectos de las empresas? Si fuera así determine la empresa de transporte que utiliza el menor tiempo promedio
SOLUCIÓN a) Grafico:
Gráfica de medidas tipo de carga A1
tipo de carga A2
160 140 120 100 80 60 40 20 0 0
1
2
3
4
5
6
7
8
El grafico podemos observar que no existe una intersección entre las líneas por lo tanto concluimos no hay indicios de interacción b) De la siguiente tabla obtenemos los datos
8984.5 364.5 7 9
Interacción entre promoción y publicidad:
::∃,,,,00 Efecto alguno de los factores sobre las ventas:
∗ 0.75 :60. 075 711.58
Análisis de los mejores modos de venta.
29. La empresa "BATERIAS" estudia el diseño de una batería que no sea sensible a la temperatura ambiente. Para esto aprueba 3 materias distintas A1, A2, A3, bajo tres niveles de temperatura ambiente B1=Baja, B2=Media, B3=Alta, aplicando un diseño de experimento de clasificación de dos factores con 6 réplicas. La duración de las baterías, en niveles de horas, se da en la tabla adjunta: NIVELES DE T° B1
B2
B3
MATERIALES USADO EN LAS BATERIAS A1 A2 A3 1.1 0.9 1.2 1.3 1.1 1.2 1.3 1.1 1.3 1.2 0.7 1 0.9 1.2 1.7 1.4 1.3 1.5 1.6 1.7 1.5 1.2 1.4 1.3 1.2 1.3 1.4 1.3 1.5 1.7 0.9 1.2 1.1 0.9 0.7 1.1 1 1.2 1.3 1.2 1.2 1.1 1 1.2 0.9
0.9 1.4 1.3 1.6 1.5 1.4 1 0.9 1.1
a) Defina la variable dependiente y el modelo de este diseño de experimento b) Realice el análisis descriptivo de la interacción. c) ¿Es significativa la interacción muestral observada entre los factores: Materiales y Temperaturas d) ¿Son significativos los efectos debido a los materiales utilizados en las baterías?
SOLUCIÓN a) La variable dependiente es X=Diseño de una batería que no sea sensible a la temperatura ambiente El modelo del ANOVA de dos factores con replicas es:
+ + + +ԑ Donde i=1,2,3, j=1,2,3, k=1,2,3,4,5,6 b) FACTOR A A1
A2
A3
TOTAL
FACTOR B B1 B2 B3 TOTAL B1 B2 B3 TOTAL B1 B2 B3 TOTAL B1 B2 B3 TOTAL
SCA=0.096
SCB=1.379
SCI=0.226
SCE=1.367
SCT=3.068
G. L=2,2,4,45,53
TOTAL 6.2 8.1 6.5 20.8 7 8.6 6.7 22.3 7.6 9.1 5.8 22.5 20.8 25.8 19 65.6
MEDIA DESV.ESTAND. 1.0333 0.21602469 1.35 0.104880885 1.0833 0.116904519 3.4667 0.437810094 1.1667 0.150554531 1.4333 0.121106014 1.1167 0.147196014 3.7167 0.418856559 1.2667 0.27325202 1.5167 0.194079022 0.9667 0.175119007 3.75 0.642450049 3.4667 0.639831241 4.3 0.420065921 3.1667 0.439219541 10.933 1.499116703
N 6 6 6 18 6 6 6 18 6 6 6 18 6 6 6 18
ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados
Materiales Niveles de temperatura Interacción Dentro del grupo
1.379259259 0.095925926 0.226296296 1.366666667
2 2 4 45
Total
3.068148148
53
F
Probabilidad Valor crít ic o para F
0.68962963 22.70731707 1.52023E-07 0.047962963 1.579268293 0.21733653 0.056574074 1.862804878 0.133552632 0.03037037
3.204317292 3.204317292 2.578739184
c) Interacción:
0 ;1,,3 1,,3 : 0 ;1,,3 1,,3 ∗ 1.863 ;0.134
No hay interacción muestral entre los factores: Materiales y temperatura. d) MATERIALES (A):
:0 ; 1.579 0.17 Se acepta Ho
30. Con el fin de estudiar los efectos de tipo de carga y los efectos que puedan ocasionar las empresas que la transportan sobre el tiempo de reparto terrestre de cargas se diseñó un modelo de análisis de varianza con los tipo de cargas A1=Liquido ,A2= sólido y tres empresas de transporte terrestre B1,B2,B3,.Cada empresa transporto una misma distancia cada tipo de carga repitiéndose el experimento tres veces .Se registraron los tiempos en minutos y se procesaron obteniendo las siguientes estadísticas: NÚMERO TIPO DE CARGA TRANSPORTE DATOS A1 B1 3 A1 B2 3 A1 B3 3 A2 B1 3 A2 B2 3 A2 B3 3
DE MEDIAS 140 135 90 130 125 83
Desviación estándar de la variable dependiente= 22.9891279 a) Defina el modelo estadístico de este problema de ANOVA b) ¿Existe interacción significativa entre los factores considerados? ¿Qué puede decir de los efectos de tipos de carga y de las empresas de transporte?
SOLUCIÓN a) Tabla ANOVA F.DE SUMAS VARIABILIDAD CUADRADOS TIPO DE CARGA 364.5 TRANSPORTE 8539 INTERACCION 9 ERROR 72 TOTAL 8984.5
G.L 1 2 2 12 17
MEDIAS ESTADISTICA CUADRATICAS F 364.5 4269.5 4.5 6
60.75 711.5833333 0.75
b)
HIPOTESIS Se contrasta la hipótesis nula
:0 :0
No existe interacción; para i=1,2 ; j=1,2,3 para algún i≠ j (si existe interacción)
Estadística y región critica: F=MCAB/MCE= 0.75 RC= {F (2,12)>3.89} Decisión:
∗
=0.75<3.89 no deberíamos rechazar Ho al nivel de significación Dado que α=0.05. Esto es la interacción observada no es significativa.
Por tanto, no existe interacción entre los factores CARGAS y EMPRESAS DE TRANSPORTE TERRESTRE.
31. Para producir una prenda la firma de confecciones “JEANS” dispone de 4 máquina de marcas distintas ( que se supone producen con igual velocidad, de 3 fuentes distintas de materia prima que se supone de igual calidad.
Materia Prima
Máquinas A1
A2
A3
A4
B1
6 5
4 3
5 5
3 4
B2
2 1
3 2
1 2
2 2
B3
5 4
3 4
3 4
4 3
Para determinar si el porcentaje de producción defectuosa es la misma para las máquinas y para las materias primas, se realizó un experimento que consistió en operar cada marca de máquina con cada tipo de material durante 2 días resultando. Los porcentajes de unidades defectuosas producidas se dan en la tabla adjunta. a) Defina la variable dependiente y el modelo de este diseño de experimento. b) ¿Existe efecto de interacción significativa entre máquinas y materias primas? c) Si no existe interacción entre máquinas y materias primas, ¿es la calidad del producto igual debido a las máquinas? ¿Es la calidad del producto igual debido a las materias primas? d) ¿Cuál de estas materias primas es la óptima? Aplique el método de comparaciones de Duncan. Aplique el nivel de significación α=5% en todas las pruebas.
SOLUCIÓN a) La producción de la máquina es la variable dependiente X, pues depende de la materia prima, el modelo a usar en este experimento es el modelo de clasificación a dos factores con repetición.
Factor A
Factor B
Total
A1
B1
11
5.5
0.707
2
B2
3
1.5
0.707
2
B3
9
4.5
0.707
2
23
3.833
1.941
6
B1
7
3.5
0.707
2
B2
5
2.5
0.707
2
B3
7
3.5
0.707
2
Total
19
3.167
0.753
6
B1
10
5
0.000
2
B2
3
1.5
0.707
2
B3
7
3.5
0.707
2
20
3.333
1.491
6
B1
7
3.5
0.707
2
B2
4
2
0.000
2
B3
7
3.5
0.707
2
Total
18
3
0.894
6
B1
35
4.375
1.061
8
B2
15
1.875
0.641
8
B3
30
3.75
0.707
8
80
3.333
1.341
24
Total A2
A3
Total A4
Total
Media
Desviación Estándar
Realizamos los cálculos:
1 2 801 1.3412 2 2 80 ∗3∗4 66.67 1 ∑1. . 3 33 1 ∑1.. 2 1 = ( ) 6. 9 17 . = ++ *
= 27.083
= 5.00
= 41.333
N
Fuente de Grados de variabilidad Suma de cuadrados libertad A =Máquina 2.333 B= Materia Prima 27.083 AXB Interacción 6.917 Error 5.00 Total 41.333
3 2 6 12 23
Medias Cuadráticas F calculada 0.778 13.542 1.153 0.417
1.867 32.5 2.767
Contraste de Interacción: Hipótesis: Se contrasta la hipótesis nula:
: : 0 ú ó ~ 6,1 .767 .{.6,1 > 3.00} . .767 =0
Contra:
Estadística y región crítica:
Dado que
< 3.00 debemos aceptar la hipótesis nula al nivel de
significación α=0.05. La interacción observada no es significativa. Por lo tanto,
no existe interacción entre los factores máquina y materia prima.
Hacemos comparaciones múltiples por el método de Duncan Ordenamos las medias de menor a mayor
2 < < <
18 < 19 < 20 < 23 Obtenemos los rangos Estudentizados: -
4 1
α = 0.05
2 .,1 3.08
.3,1 3.3
.4,1 3.31 Calculamos los rangos mínimos significativos
∗ 2 3.08∗0.4571.406 3.3∗0.451.476 3.31∗0.4571.513 5 3 4 2 2 3 2 1 2 1 2 2 < =
El rango de las 4 medias adyacentes es dado que 1.513 < 5 concluimos que y son significativamente diferentes. Para los rangos de 3 medias adyacentes es y comparar estos dos rangos con se concluye que significativamente diferentes Para
los rangos de 2 medias adyacentes
. Al comparar estos tres rangos con
,
concluimos que
Al nivel de significación global de 0.05, podemos afirmar que: La materia prima adecuada es la B 2.
al son
,
32. El analista estadístico del grupo “Estudios del mercado” quiere comprobar si la región geográfica y/o los ingresos familiares influyen en las puntuaciones obtenidas en una prueba de razonamiento. Para esto, diseñó un experimento de dos factores con réplicas eligiendo al azar de cada una de 4 regiones, 6 jefes de familia con ingresos bajos, 6 con ingresos medios y 6 con ingresos altos. Los puntajes obtenidos en la prueba de razonamiento por las 72 personas se dan en la tabla que sigue: Región
Ingresos
Geográfica Alto Norte
Sur
Centro
Oriente
Medio
Bajo
10 15 16
17 14
12
16 14 18
15 13
11
14 12 16
12 09
12
13 12 15
18 13
10
17 16 17
16 15
11
15 11 15
13 12
09
14 16 17
17 11
12
14 10 19
11 15
08
17 13 17
18 16
13
15 14 18
12 12
13
14 13 17
20 15
08
16 11 16
15 14
11
a) Analice, descriptivamente, si existe o no, indicios de interacción entre ingresos y regiones. b) Defina la variable dependiente y el modelo de este diseño de experimento. c) Pruebe si es o no significativa la interacción muestral entre los factores región e ingresos. d) Si rechaza la hipótesis que afirma la existencia de interacción entre los factores región e ingresos, ¿produce algún efecto en la variabilidad de la prueba de razonamiento los niveles de ingresos familiares?, ¿y los niveles de las regiones?. Si su respuesta es afirmativa, ¿cuál de los niveles produce el mínimo efecto?. Aplique el método de rangos de Duncan. Tome las decisiones estadísticas con probabilidad de error tipo I igual a 0.05 en todos los casos.
SOLUCIÓN a) Los ingresos son la variable dependiente X, el modelo a usar en este experimento es el modelo de clasificación a dos factores con repetición. b) Factor A A1
A2
A3
Total
Factor B B1 B2 B3 B4 Total B1 B2 B3 B4 Total B1 B2 B3 B4 Total
Total
Desviación Estándar
Media 81 84 84 83 332 94 94 99 98 385 71 70 75 73 289
B1 B2 B3 B4 Total
N
13.50 14.00 14.00 13.83 13.83 15.67 15.67 16.50 16.33 16.04 11.83 11.67 12.50 12.17 12.04
246 248 258 254 1006
2.168 2.366 2.449 1.722 2.057 2.066 1.751 2.811 2.733 2.255 1.722 2.160 2.881 2.483 2.216
13.67 13.78 14.33 14.11 13.97
2.473 2.602 3.068 2.826 2.706
Realizamos los cálculos:
1 2 71 .7062 2 2 1006 7 14056.06 1 ∑1. 19.694 1 ∑1.. *
= 5.06
= 519.94
6 6 6 6 24 6 6 6 6 24 6 6 6 6 24
18 18 18 18 72
2 1 = ( ) 1. 8 61 . = ++ = 320.333
Fuente de Variabilidad A=Ingresos B= Región Geográfica AXB Interacción Error Total
Suma de cuadrados
Grados de libertad 192.694 5.056 1.861 320.333 519.944
Medias Cuadráticas F calculada 2 96.347 18.046 3 6 60 71
1.685 0.310 5.339
0.316 0.058
Contraste de Interacción: Hipótesis: Se contrasta la hipótesis nula:
: : 0 ú ó ~ 6,60 0.058 .{.6,60 > .5} . 0.058 =0
Contra:
Estadística y región crítica:
Dado que
< 2.25, debemos aceptar la hipótesis nula al nivel de significación α=0.05. La interacción observada no es significativa. Por lo tanto, no existe interacción entre los factores ingresos y región geográfica.
Hacemos el método de comparaciones múltiples por el método de Duncan. Región Geográfica
n
18 18 18 Significación
Subconjuntos Homogéneos 1 2 12.04 13.83 16.04 1.00
0.814
Podemos afirmar que el ingreso A 1 produce el mínimo efecto
33. La industria P&C que utiliza para su producción tres máquinas de marcas distintas 1, 2 y 3 y dos fuentes de materia prima A y B quiere saber si el número de unidades defectuosas resultantes es la misma para las tres máquinas y para las dos materias primas. P ara esto, el ingeniero a cargo del control llevo a cabo un experimento de la producción observando el número de unidades defectuosas, con cada una de las máquinas y con cada tipo de materia prima durante dos días y entre los resultados presentó el siguiente resumen descriptivo. Materia Máquinas Número De Datos Prima A 1 4 A 2 4 A 3 4 B 1 4 B 2 4 B 3 4
Media de unidades defectuosas 9.1 11.3 7.4 7.1 9.0 5.9
Desviación estándar de la variable dependiente= 1.8075 Fuente De Variabilidad Materia prima Maquinas Interacción Error total
Tabla ANOVA Suma De Grados De Medias Cuadrados Libertad Cuadráticas 22.427 49.480
Estadística F
2.580
a. Defina el modelo estadístico de este problema de ANOVA. Haga un gráfico de líneas de los factores máquina y materia prima e indique si, en forma descriptiva, se podría suponer o no interacción entre los dos factores considerados. b. ¿Es significativa la interacción entre los dos factores considerados? ¿Qué puede decir de los efectos de las materias primas y las máquinas en la producción defectuosa? Use el nivel de significación a=0.05 c. ¿Qué maquina produce menos unidades defectuosas? Con probabilidad de error tipo I, igual a 0.05
SOLUCIÓN
Es un modelo de clasificación doble con replica
Fuente De Variabilidad Materia prima Maquinas Interacción Error total
Suma De Cuadrados 22.427 49.48 0.653 2.58 75.14
Grados De Libertad 1 2 2 18 23
Medias Cuadráticas 22.43 24.74 0.3265 0.14 47.64
Se aprecia en el gráfico y los resultados que no hay interacción Hipótesis Se contrasta la hipótesis nula HO: (ab)y =0 (no existe interacción), para i=1,2,3, j=1,2,3 Contra:
H1: (ab)y 0 para algún i j(si existe interacción)
Estadística F 156.47 172.60 2.28
Estadística y región crítica
~
F=MCAB/MCE F(2.28); RC={(F0.95(2.28)< 3.76}
Decisión: Dado que FA*B=3.6<3.76, no rechazamos la hipótesis nula al nivel de significación del 0.05 entonces se dice que no hay interacción. Análisis De Varianza De Dos Factores Con Varias Muestras Por Grupo RESUMEN
1
2
3 Total
4 36.4 9.1 0.54
4 45.2 11.3 2.22
4 29.6 7.4 0.82
12 111.2 9.27 3.76
4 28.4 7.1 0.98
4 36 9 0.69
4 23.6 5.9 1.85
12 88 7.33 2.74
8 64.8 8.1 1.79
8 81.2 10.15 2.76
8 53.2 6.65 1.79
A
Cuenta Suma Promedio Varianza B
Cuenta Suma Promedio Varianza Total
Cuenta Suma Promedio Varianza
ANÁLISIS DE VARIANZA O. De las variaciones
Muestra Columnas Interacción Dentro del grupo Total
S. Cuadrados
Gl
22.43 1.00 49.5 2.0 0.7 2.0 21.3 18.00 93.86
23
P.cuadrados
F
22.43 18.95 24.7 20.9 0.3 0.3 1.18
Probabilidad
0.00 0.0 0.8
Valor F
4.41 3.6 3.6
De la tabla N° 2 se obtiene que: µ3< µ1< µ2 Entonces la máquina que produce menos defectos es la maquina número 3. 34. La empresa R&G realiza una investigación para determinar si el rendimiento de sus empleados está influenciado por el nivel capacitación y el turno de trabajo. Para realizar este estudio, se diseñó un experimento de dos factores: el factor A: capacitación del personal con tres niveles, A1= Buena, A2= Regular, A3= Ninguna, y el factor B: turno de trabajo con tres niveles, B1= Mañana, B2=Tarde, B3= Noche. En cada combinación de los niveles de capacitación y de turno, se midieron el rendimiento de cuatro trabajadores. En la medición de los rendimientos se utilizó un procedimiento cuyos resultados son tiempos en minutos, indicando que a menor tiempo mayor rendimiento. Los tiempos de rendimiento observados se dan en la tabla: B=Turnos B1 B2 B3
A=Capacitación A1 A2 A3 4 5 8 6 6 7 5 6 5 6 7 6 6 7 7 5 8 7 4 6 6 8 7 6 6 5 6 7 8 6 5 6 6 6 7 7
a) Realice una gráfica de líneas de las medias muéstrales, ¿indica la gráfica presencia de interacción los dos factores considerados? b) Al nivel de significancia de 0.05, ¿existe interacción entre el factor de capacitación y el factor turno de trabajo?
SOLUCIÓN a) La variable dependiente es X= Rendimiento de los empleados. Los factores que posiblemente influyen en el rendimiento son: A: capacitación del personal: A1= Buena, A2= Regular, A3= Ninguna B: turno de trabajo: B1= Mañana, B2=Tarde, B3= Noche El modelo del ANOVA de dos factores con replica es: Xijk = µ + ai + b j + (ab)y + Eijk Donde i=1, 2,3, j=1, 2,3, k=1, 2, 3, 4 Estadísticas descriptivas: Análisis de varianza de dos factores con varias muestras por grupo RESUMEN
A1
A2
A3
Total
B1
Cuenta Suma Promedio Varianza
2.00 2.00 2.00 9.00 11.00 13.00 4.50 5.50 6.50 0.50 0.50 4.50
2.00 12.00 6.00 0.00
2.00 13.00 6.50 0.50
2.00 13.00 6.50 0.50
12.00 71.00 5.92 1.17
2.00 13.00 6.50 0.50
2.00 13.00 6.50 4.50
2.00 15.00 7.50 0.50
2.00 13.00 6.50 0.50
12.00 77.00 6.42 1.36
2 12 6 0
2 13 6.5 0.5
2 15 7.5 0.5
2 13 6.5 0.5
12 75 6.25 0.75
6.00 38.00 6.33 1.07
6.00 38.00 6.33 1.07
6.00 43.00 7.17 0.57
6.00 39.00 6.50 0.30
B2
Cuenta 2.00 2.00 Suma 10.00 13.00 Promedio 5.00 6.50 Varianza 2.00 0.50 B3
Cuenta Suma Promedio Varianza
2 11 5.5 0.5
2 11 5.5 0.5
Total
Cuenta 6.00 6.00 Suma 30.00 35.00 Promedio 5.00 5.83 Varianza 0.80 0.57