Análisis de Varianza (ANOVA) 0 B J E T IVOS 1. Compre Comprender nder la la idea gener general al del anális análisis is de varianz varianzaa 2. Enuncia Enunciarr las caracte caracterís rístic ticas as de la distri distribuci bución ón F 3. Realizar Realizar una prueba prueba de hipótes hipótesis is para determinar determinar sí dos varianzas varianzas muestral muestrales es provienen provienen de proporc proporciones iones iguales. iguales. 4. Organiz Organizar ar datos datos en una una tabla tabla de ANOVA. ANOVA. 5. Realizar Realizar una prueba de hipótesis hipótesis entre tres tres o más medias medias de tratamiento. tratamiento. 6. Desarrollar Desarrollar intervalos intervalos de confianza confianza para la diferencia diferencia entre medias de tratami tratamiento ento
1 Introducción
En este capítulo se continúa el análisis de la prueba de hipótesis. Recuerde que en capítulo de hipótesis se analizó la teoría general de la prueba de hipótesis. Se descubrió el caso el que se seleccionó una gran muestra de la población. Se usó la distribución z (distribución normal estándar) a fin de determinar si era razonable concluir que la media calculada de una muestra específica provino de la población hipotética. Se probó si dos medias de muestra venían de poblaciones poblaciones iguales. iguales. También También se realizaron realizaron pruebas pruebas de una o dos muestras muestras para las proporciones proporciones,, usando una vez más las distribuciones distribuciones normales normales estándar estándar como estadística de prueba. Se describieron describieron métodos para realizar realizar pruebas pruebas en las que se supusieron poblaciones poblaciones normales, pero las muestras eran pequeñas (menos de 30 observaciones). En ese último caso se utilizó la distribución distribución t corno t corno estadística de prueba. En este capítulo se amplía aún más la idea de la prueba de hipótesis. Se describirá una prueba para la varianza y luego una que compar comparaa simult simultánea áneament mentee varios, varios, medios medios para para determi determinar nar si provie provienen nen de poblac poblacione ioness iguales. El análisis de Varianza (ANOVA): es un método para probar la igualdad de dos o más medias de población analizando varianzas de muestras
Panorama General
En las -secciones anteriores dedujimos procedimientos para probar la hipótesis de que dos medias de población son iguales (Ho:µ1=µ2) presentaremos un procedimiento para probar que tres o más medias de población son iguales. (Los métodos también pueden servir para probar si dos media población son iguales pero los métodos del capítulo anterior son más
eficientes.) una hipótesis nula típica será Ho:µ1=µ2=µ3=µ4; la hipótesis alternativa Al menos una media es diferente. El método que usaremos se basa en un análisis de las varianzas de muestra. El ANOVA se usa en aplicaciones como 'las siguientes: 1- Si medimos el nivel de cotinina (un indicador de presencia de nicotina) en tres diferentes grupos de personas (Como fumadores, no fumadores expuestos a humo de tabaco ambiental y no fumadores expuestos), -podemos realizar pruebas para determinar si tienen o no el mismo nivel. 2- Un ingeniero en ecología aplica una medida correctiva a diferentes empresas, podemos realizar pruebas para determinar si las empresas obtienen puntajes medios diferentes.
La distribución F La distribución de probabilidad que se utiliza en este capítulo es la distribución F. Recibió este nombre en honor a sir Ronald Fisher, uno de los fundadores de la estadística moderna. Esta distribución de probabilidad se usa como estadística de prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales, y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación simultánea de varias medias poblacional se conoce como análisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de los intervalos.
¿Cuáles son las características de la distribución F? 1. Existe una "familia" de distribuciones F. Un miembro específico de la familia determina por dos parámetros: los grados de libertad en el numerador y en el de denominador. La forma de la distribución se ilustra mediante la gráfica siguiente. Existe una distribución F para la combinación de 29 grados de libertad en el numerador y 28 el denominador. Existe otra distribución F para 19 grados en el numerador y 6 en el denominador. Observe que la forma de las curvas cambia a medida que lo hacen los grados de libertad. 2. La distribución F es una distribución continua. 3. F no puede ser negativa. 4. La distribución F tiene un sesgo positivo. 5. A medida que aumentan los valores, la curva se aproxima al eje X, pero nunca lo toca.
1
Comparación de dos varianzas poblacionales
En esta sección se utiliza la distribución F para probar la hipótesis de que la varianza de una población normal es igual a la varianza de otra población normal. Así, esta prueba es útil para
determinar si una población normal tiene una mayor variación que otra. Los ejemplos siguientes ilustran el uso de esta prueba: 1-
Se calibran dos máquinas para producir barras de acero de la misma longitud. Por lo tanto, las barras deben tener la misma longitud media. Se desea asegurar que, además de tener la misma longitud media, tienen una variación similar. 2- La tasa media de infecciones de dos tipos de gusanos puede ser la misma, pero puede haber mayor variación en un tipo que en otro. Una muestra de diez infecciones de gusanos conocidos y otros diez gusanos no conocidos, revelará la misma tasa de infección, pero es probable que haya mayor variación en la tasa de infección de gusanos conocidos. Del mismo modo, la distribución F se usa para validar suposiciones de ciertas pruebas estadísticas. Como ejemplo, recordar que la prueba t que se describió anteriormente se emplea para determinar si las medias de dos poblaciones independientes son diferentes. Para emplear esa prueba, es necesario suponer que las dos varianzas de la población son iguales. Independientemente de que se desee determinar si una población tiene mayor variación que otra, o bien para validar una suposición para una prueba estadística, primero se establece la 2
hipótesis nula. En este caso, la hipótesis nula es que la varianza de un población normal, s1 2
es igual a la varianza de la otra población normal, s 2 . La hipótesis alterna podría ser que las varianzas fueran distintas. Esta prueba de hipótesis se escribe:
H o : σ
2
1
Ha : σ
2
1
2
= σ 2 2
≠ σ 2
Para realizar la prueba, se selecciona una muestra aleatoria de n, observaciones de una población y una muestra de n2 observaciones de la segunda población. La estadística de 2
prueba es,
s1
2
2 s 2
2
, donde s1 y s 2 son las respectivas varianzas muestrales. Sí la hipótesis
nula es verdadera
H o : σ
2
1
2
= σ 2 el estadístico de prueba sigue la distribución F con ,
n1-1 y n2 - 1 grados de libertad. A fin de reducir el tamaño de la tabla de valores críticos, la mayor varianza muestral se coloca en el numerador; por lo tanto, el valor F de la tabla siempre es mayor a 1.00. Así, el valor crítico de la cola superior es el único que se requiere. El valor crítico de F se halla dividiendo a la mitad el nivel de significancia (α/2) y luego haciendo referencia a los números apropiados de los grados de libertad en la tabla. Un ejemplo ayudará a ilustrar. Ejemplo 1: Taxi “20 Negro” ofrecen un servicio de transporte desde el edificio de rectoría, al aeropuerto. Liliana, gerente, considera dos rutas. Una es por la carretera a palestina y la otra por la Av. Juan Pablo. Liliana desea estudiar el tiempo que se requiere para llegar al aeropuerto utilizando ambas rutas y luego comparar los resultados. Para ello, recolectó los siguientes
datos de muestra. Utilizando el nivel de significancia de 0.10, ¿existe diferencia en la variación en los tiempos de recorrido utilizando las dos rutas? Ruta
Tiempo Medio (minutos) 56 58
Palestina Juan Pablo
Desviación estándar
12 5
Tamaño de la muestra 7 8
Solución Liliana observó que los tiempos medios parecen ser muy similares, pero hay mayor variación, medida por la desviación estándar, en la ruta Palestina que por la Av. Juan Pablo. Esto en cierto modo es consecuente, con el conocimiento que tiene Liliana de las dos rutas; la ruta Palestina tiene más semáforos, en tanto que la Av. Juan Pablo es una carretera mas libre Sin embargo, la Av. Juan Pablo es varias millas más larga. Es importante que el servicio que se ofrece sea oportuno y consistente, por lo que decide realizar una prueba estadística para determinar si existe una diferencia real en la variación en ambas rutas. Se empleará el procedimiento habitual de prueba de hipótesis de cinco pasos. Paso 1: Se comienza estableciendo las hipótesis nula y alterna. La prueba tiene dos colas, porque se busca una diferencia en la variación en ambas rutas, No se trata de demostrar que una ruta tiene una mayor variación que la otra.
H o : σ
2
1
Ha : σ
2
1
2
= σ 2 2
≠ σ 2
Paso2. Se selecciona el nivel de significancia de 0.10 2
Paso3: El estadístico de prueba apropiada es
s1
2
s 2
que sigue la distribución F cuando Ho es
verdadera. Paso 4: El valor crítico se obtiene con base en la tabla. Debido a que se utiliza una prueba de dos colas, el nivel de significancia es 0.05, que se halla por α/2 = 0. 1 0/2 = 0.05. Existen n1 1 = 7 - 1 = 6 grados de libertad en el numerador y n2- 1 = 8 - 1 = 7 grados de libertad en el denominador. Para encontrar el valor critico, hay que moverse horizontalmente por la parte superior para el nivel de significancia de 0.05 a 6 grados de libertad en el numerador. Luego se baja por esa columna hasta el valor crítico que se encuentra en la fila de 7 grados de libertad en el denominador. El valor crítico es 3.87. Por lo tanto, la regla de decisión es: si la s12 relación de las varianzas de la muestra, es mayor a 3.87, la hipótesis nula se rechaza. s 22 Paso 5: Determine el valor estadístico de prueba tomando la relación de las dos varianzas muestrales. 2
PRUEBA PARA VARLANZAS IGUALES
F =
S 1
2
S
2
El valor calculado de la estadística F es 5.76, que se encuentra por
2
F =
S 1
=
2
S
12 5
2
2
2
= 5.76
Se rechaza la hipótesis nula y se acepta la alternativa. Se concluye que existe una diferencia en las variaciones en el tiempo de recorrido en ambas rutas. Como se observó, la práctica habitual es determinar la razón F colocando en el numerador la mayor de las dos varianzas. Esto obligará a la razón F a ser mayor que 1. 00. Y esto permite utilizar siempre la cola superior, o derecha, de la estadística F , evitando con ello la necesidad de tablas más extensas de F . Surge una pregunta lógica respecto de las pruebas de una cola. Por ejemplo, en el problema previo, suponga que se sospechara que la varianza de los tiempos utilizando la ruta de Palestina es mayor que la varianza de los tiempos sobre la ruta de la Av. Juan Pablo. Las hipótesis nula y alternativa se establecerían como:
H o : σ
2
1
Ha : σ
2
1
2
≤ σ 2 2
> σ 2
2
La estadística de prueba se calcula como
s1
2
s 2
a razón F será mayor que 1.00, de modo que
es posible utilizar la cola superior de la distribución F Bajo estas condiciones no es necesario dividir a la mitad el nivel de significancia. Debido a que la tabla sólo da los niveles de significancia 0.05 y 0.01, se está limitado a esos niveles para las pruebas de una cola 0.10 y 0.02 para las pruebas de dos colas, a menos que se consulte una tabla más completa.
Solución en el software Estadístico del MINITAB
Test for Equal Variances 90% Bonferroni confidence intervals for standard deviations Sample 1 2
N 7 8
Lower 7.73272 3.30587
StDev 12 5
Upper 26.4248 10.1764
F-Test (Normal Distribution) Test statistic = 5.76, p-value = 0.037
El valor de P es igual a .037 lo que significa que es menor al nivel de significancia del .10, esto indica que es significativo que si hay diferencia en las rutas al aeropuerto.
Ejemplo 2: ALTEC Chihuahua ensambla componentes eléctricos. Durante los últimos 10 días, Mario Duarte ha tenido un promedio de 9 rechazos con desviación estándar de 2 rechazos. El mismo lapso, Mónica Méndez promedió 8.5 rechazos con desviación estándar de 1.5 rechazos. Con un nivel de significancia de 0.05, ¿es posible concluir que hay más variación en el número de rechazos por día que se atribuye a Mario Duarte. Solución:
Sean los ensambles de Mario Duarte la población 1. Entonces:
Ho
: σ
1
≤ σ 2
Ha
: σ
> σ 2
2
2
1
2
2
gl1=10-1=9 gl2=10-9=9 Ho se rechaza si F>3.18
F
=
S
2
S
2
1
2
2.0 =
1.5
2
2
=
1.78
Ho no se rechaza. La variación es la misma para ambos empleados SUPOSICIONES DE ANOVA Otro uso de la distribución F es la técnica del análisis de varianza (ANOVA), en la que se comparan tres o mas medias maestrales para determinar si provienen de poblaciones iguales. Para utilizar esta técnica, se supone lo siguiente: 1.- Las poblaciones tienen una distribución normal 2.- Las poblaciones tienen desviaciones estándar (σ) iguales 3.- Las muestras se seleccionan de manera independiente Cuando se cumplen estas condiciones, se utiliza F como estadístico de prueba, ANOVA tuvo sus inicios en la agricultura y muchos de los términos que se relacionan con ese contexto permanecen vigentes. En particular, se emplea el termino tratamiento para identificar las diferentes poblaciones que se examinan.
Experimento de un solo Factor Ejemplo 1: La Facultad de Zootecnia en su rancho desea utilizar la marca de fertilizante que produzca el máximo rendimiento de trigo por unidad de superficie. La facultad puede elegir entre tres tipos de fertilizantes A, B, C para empezar el experimento el campo de siembra se divide en 12 parcelas de igual tamaño, sembrándose al mismo tiempo y del mismo modo. La única diferencia en las parcelas es que la Facultad asigna al azar la marca A cuatro de ellas, cuatro a B y cuatro a C. al final de la temporada de cultivo la Facultad registra la cantidad de trigo que se produjeron en cada parcela.
Numero de tratamientos = 3 ( A, B, C) Resultados en Toneladas. A 55 54
B
C
66 76
47 51
59 56
67 71
46 48
¿Existe una diferencia en el numero medio de toneladas de trigo que se produjeron?
Total
A
B
C
Total
55 54 59 56 224
66 76 67 71 280
47 51 46 48 192
168 168 336 672 1344
Hipótesis: Ho: μ1 = μ2 = μ3 Ha: μ1 ≠ μ2 ≠ μ3 Fuente
gl
Tratamiento
k-1=3-1 =2
CM (Cuadrados Medios) SC Tratamient o gl Tratamient o
SC (Suma de Cuadrados) 2 2 2 2 2 ( x ) ∑ T n − ∑n = 2244 + 2804 + 1924 − (55 + 54 + 5912+ 66.... + 48) = (12544 + 19600 + 9216 ) − (40368 ) = (41360 − 40368 ) = 992 2
c
c
992 2
992 Error
(n-1)-(k1)=112=9
1082-992=90
n-1=121=11
90
∑
x
2
−
( ∑ x ) 2
(41450 ) −
n
90
= (55 2 + 54 2 + 59 2 + 66 2......... + 48 2 ) −
(696) 12
492
SC Error gl Error 9
Total
=
2
= (41450 ) −
484416 12
(55 + 54 + 59 + 66.... + 48) 2 12
=
= (41450 − 40368 ) = 1082
1082 K = numero de tratamientos n = Numero de datos T c2 = Total de la Columna al cuadrado nc = numero de datos de la columna
4.92
5.12
Buscar en la Tabla de F de .05 1(grados de libertad del Tratamiento) en el numerador y 9 (grados de libertad del Error)en el denominador
= 10
Fc (F calculada) CM Tratamient o CM error
492 10
= 4.92
4.92
Buscar en la Tabla de F de .05 1(grados de libertad del Tratamiento) en el numerador y 9 (grados de libertad del Error)en el denominador
5.12
Zona de Aceptación de Ho
Zona de Rechazo de Ho
4.92 cae en la zona de aceptación de Ho por lo que las medias son iguales. Conclusión: Se encontró evidencia estadística para concluir que no hay diferencia en el numero medio de toneladas de trigo que se produjeron por la aplicación de los diferentes tipos de fertilizantes
Ejercicio 1:
El jefe del departamento de Vialidad de la Ciudad de Chihuahua desea determinar si existe una diferencia en el numero medio de infracciones cometidos entre los cuatros sectores de la ciudad. Use un nivel de significancia de .05. ¿se puede concluir que existe una diferencia en el numero medio de infracciones? Sector 1 13 15 14 15 14
Sector 2 21 13 18 19
Determine: 1) Determine la hipótesis 2) Det ine el Cuad de ANOVA
Sector 3 12 14 15
Sector 4 16 17 18 15 20
Ejercicio 1:
El jefe del departamento de Vialidad de la Ciudad de Chihuahua desea determinar si existe una diferencia en el numero medio de infracciones cometidos entre los cuatros sectores de la ciudad. Use un nivel de significancia de .05. ¿se puede concluir que existe una diferencia en el numero medio de infracciones? Sector 1 13 15 14 15 14
Sector 2 21 13 18 19
Sector 3 12 14 15
Sector 4 16 17 18 15 20
Determine: 1) Determine la hipótesis 2) Determine el Cuadro de ANOVA 3) Grafique la decisión 4) Conclusión Ejercicio 2:
Power DXT es un nuevo limpiador de múltiples propósitos que se desea comercializar colocando exhibidores de ventas en tres lugares diferentes de varios supermercados. A continuación se ilustra el numero de botellas de 350 ml que se vendió en cada lugar del supermercado. Ubicación Cerca del Pan Cerca de la Cerveza Con los Demás Limpiadores
Ventas
20
15
24
18
12
18
10
15
25
28
30
32
Usando un nivel de significancia de .05. ¿existe diferencia en el numero medio de botellas que se vendió en los tres lugares? Determine: 1) Determine la hipótesis 2) Determine el Cuadro de ANOVA 3) Grafique la decisión 4) Conclusión
Ejercicio 3:
La información siguiente pertenece a una muestra. Pruebe la hipótesis de que las medias de los tratamientos son iguales. Utilice el nivel de significancia de .05 Tratamiento 1 8 6 10 9 12 10 8 7 12 5 14 16
Tratamiento 2 3 2 4 3 10 4 1 2 8 11 13 2 4
Tratamiento 3 3 4 5 4 4 8 9 10 10 10 11 12 14 15
Determine: 1) Determine la hipótesis 2) Determine el Cuadro de ANOVA 3) Grafique la decisión 4) Conclusión Ejercicio 4:
Se desea saber como varia la absorción media de humedad en el concreto de entre cinco diferentes mezclas de concreto.
Mezcla % 1 551 457 450 731 499 632
2 595 580 508 583 633 517
Determine: 1) Determine la hipótesis 2) Determine el Cuadro de ANOVA 3) Grafique la decisión 4) Conclusión
3 639 615 511 573 648 677
4 417 449 517 438 415 555
5 563 631 522 613 656 679
Diseño de Bloques Completos Aleatorizados Ejemplo 1:
Para el ensamble de un articulo en particular se están considerando cuatro maquinas diferentes que deben utilizarse seis operadores diferentes para comparar las maquinas.
Maquina 1 2 3 4 Total
1 42.5 39.8 40.2 41.3
2 39.3 40.1 40.5 42.2
Operador 3 4 39.6 39.9 40.5 42.3 41.3 43.4 43.5 44.2
5 42.9 42.5 44.9 45.9
6 43.6 43.1 45.1 42.3
Total
Ejercicio 1: El personal forestal utiliza arsénico orgánico como pesticida. La cantidad de arsénico que toma el cuerpo cuando se expone a estos pesticidas constituye un grave problema de salud. Es importante determinar con rapidez la cantidad de exposición de tal forma que se pueda cambiarse de tarea a un trabajador con un alto nivel de arsénico. Se realizo un estudio con los siguientes datos: Individuo 1 2 3 4
Empleado .05 .05 .04 .15
Analista Químico .05 .05 .04 .17
Laboratorista .04 .04 .03 .10
Se realice un análisis de varianza y pruebe la hipótesis de que no existe diferencia en los niveles de arsénico entre los tres métodos de análisis. Determine: 1) Determine la hipótesis 2) Determine el Cuadro de ANOVA 3) Grafique la decisión 4) Conclusión Ejercicio 2: Una planta de energía nuclear produce una gran cantidad de calor el cual en general se descarga en sistemas acuáticos. Este calor aumenta la temperatura del sistema acuático, lo que resultan una mayor concentración de clorofila a, lo cual, a su vez, extiende la estación de crecimiento. Para estudiar este efecto, se tomaron muestras de agua, cada mes, en tres diferentes estaciones durante un periodo de 12 meses. La estación A se ubico lo mas cerca posible de un punto de descarga de agua
potencialmente caliente, y la estación C, lo mas lejos posible de la descarga, y la B en el punto medio entre las dos estaciones A y C. Se registraron las siguientes concentraciones de clorofila a:
Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
Estación B
A 9.87 14.03 10.70 13.85 7.06 11.67 7.35 3.35 4.21 3.60 2.95 2.64
3.72 8.41 20.72 9.61 4.77 9.15 8.46 4.08 4.23 2.32 3.84 3.61
C 4.41 11.1 4.47 8.10 34.08 8.99 3.35 4.50 6.83 5.80 3.48 3.02
Realice un Análisis de Varianza y pruebe la hipótesis, a nivel de significancia de .05 de que no existe diferencia en las concentraciones medias de Clorofila a en las tres estaciones.
Determine: 1) Determine la hipótesis 2) Determine el Cuadro de ANOVA 3) Grafique la decisión 4) Conclusión Ejercicio 3: Los siguientes datos representan las calificaciones finales obtenidas por 5 estudiantes Materia Estudiante Matemáticas Ingles Computación Biología 1 68 57 73 61 2 83 94 91 86 3 72 81 63 59 4 55 73 77 66 5 92 68 75 87
Utilice un nivel de significancia de .05 para probar la hipótesis de que los cursos presentan la misma dificultad.
Ejercicio 4: Científicos idearon un experimento en el cual se aplicaron 5 diferentes tratamientos en 6 diferentes ubicaciones en un huerto de manzanas para determinar si existían diferencias significativas de crecimiento entre los tratamientos. El periodo de crecimiento medido en centímetros se registraron como sigue:
Tratamiento 1 2 3 4 5
1 455 622 695 607 388
2 61 444 50 493 185
Ubicaciones 3 4 215 695 170 437 443 701 257 490 103 518
5 72 82 56 650 263
6 501 134 373 262 622
Utilice un nivel de significancia de .01 y pruebe la hipótesis de que no hay diferencias entre las medias de tratamiento Determine: 1) Determine la hipótesis 2) Determine el Cuadro de ANOVA 3) Grafique la decisión 4) Conclusión
Análisis de Varianza de Dos Factores
Ejemplo 1:
En un experimento llevado a cabo para determinar cual de tres sistemas de misiles es preferible, se midió el promedio de consumo de los propulsores para 24 encendidos estáticos. Se utilizaron cuatro tipos diferentes de propulsores. En el experimento se observaron duplicados de promedios de consumo en cada combinación de los tratamientos. Los datos después de codificarse son:
Sistema de Misiles A1 A2 A3
B1
34 32.7 32 33.2 28.4 29.3
Tipo de Impulsor B2 B3
30.1 32.8 30.2 29.8 27.3 28.9
29.8 26.7 28.7 28.1 29.7 27.3
B4
29 28.9 27.6 27.8 28.8 29.1
Utilice un nivel de significancia de .05 para probar las siguientes Hipótesis 1.- Ho no existe diferencia en las tasas medias de consumo del propulsor cuando utilizan diferentes misiles 2.- Ho no existe diferencia en las tasas medias de consumo de los cuatro tipos de propulsor 3.- Ho no existe interacción entre los diferentes sistemas de misiles y los diferentes tipos de propulsor Ejercicio 1: Se llevo a cabo un experimento para estudiar el efecto de la temperatura y del tipo de horno en la vida de un componente en particular que esta probándose. Se están utilizando cuatro tipos de hornos y tres niveles de temperaturas. Se asignan aleatoria mente 24 piezas y se registran los siguientes datos.
Horno Temperatura
1
2
3
4
500
227 221 187 208 174 202
214 259 181 179 198 194
225 236 232 198 178 213
260 229 246 273 206 219
550 600
Utilizando un nivel de signifinacia de .05 pruebe la hipótesis de que
A) Temperaturas diferentes no tienen efecto sobre la vida del componente B) Diferentes hornos no tienen efecto sobre la vida del componente C) El tipo de horno y el nivel de temperatura no interactúan.
Ejercicio 2: Con objeto de averiguar la estabilidad de la vitamina C en concentrado de jugo de naranja congelado reconstituido que se almacena en un refrigerador por un periodo de hasta una semana. Tres tipos de concentrado de jugo de naranja congelado se probaron utilizando tres periodos diferentes de tiempo. Estos últimos se refieren al numero de días que transcurren desde que el jugo de naranja se mezcla hasta que se somete a la prueba. Los resultados, en miligramos de ácido ascórbico por litro, se registraron de la siguiente manera:
Marca
Tiempo (días) 3 49.4 42.8 49.2 53.2 48.8 44 44 42.4 48 48.2 47 49.6
0 52.6 49.8 54.2 46.5 56 49.6 48 48.4 52.5 51.8 52 53.6
Lala
Jumex
Paupau
7 42.7 40.4 48.8 47.6 49.2 42 44 43.2 48.5 45.2 43.4 47.6
Utilice un nivel de significancia de .01 para probar la hipótesis de que: a) No existe diferencia en los contenidos de ácido ascórbico entre las diferentes marcas de concentrado de jugo de naranja: SEEEPC queno existe tal diferencia (Pv=0.193) b) No existe diferencia en los contenidos de ácido debido a los diferentes periodos de tiempo:SEEEPC que sí existe diferencia en los contenidos de Ac. Ascórbico debido a las diferencias en el tiempo. c) Las marcas de concentrado de jugo de naranja y el numero de días que transcurre desde que el jugo se mezcla hasta que se somete a la prueba no interactúan.: SEEEPC que no existe interacción. General Linear Model: Ac. Ascorb. versus tiempo, marca Factor tiempo marca
Type fixed fixed
Levels 3 3
Values 1, 2, 3 1, 2, 3
Analysis of Variance for Ac. Ascorb., using Adjusted SS for Tests Source
DF
Seq SS
Adj SS
Adj MS
F
P
tiempo marca tiempo*marca Error Total
2 2 4 27 35
226.676 32.962 17.301 254.140 531.079
226.676 32.962 17.301 254.140
S = 3.06799
R-Sq = 52.15%
113.338 16.481 4.325 9.413
12.04 1.75 0.46
0.000 0.193 0.765
R-Sq(adj) = 37.97%
Unusual Observations for Ac. Ascorb. Obs 5 14
Ac. Ascorb. 56.0000 42.8000
Fit 50.5000 48.6500
SE Fit 1.5340 1.5340
Residual 5.5000 -5.8500
St Resid 2.07 R -2.20 R
R denotes an observation with a large standardized residual.
Two-way ANOVA: Ac. Ascorb. versus marca, tiempo Source marca tiempo Interaction Error Total S = 3.068
marca 1 2 3
tiempo 1 2 3
DF 2 2 4 27 35
SS 32.962 226.676 17.301 254.140 531.079
R-Sq = 52.15%
Mean 48.1000 46.6333 48.9500
Mean 51.2500 47.2167 45.2167
MS 16.481 113.338 4.325 9.413
F 1.75 12.04 0.46
P 0.193 0.000 0.765
R-Sq(adj) = 37.97%
Individual 95% CIs For Mean Based on Pooled StDev -+---------+---------+---------+-------(-----------*-----------) (-----------*-----------) (-----------*-----------) -+---------+---------+---------+-------45.0 46.5 48.0 49.5
Individual 95% CIs For Mean Based on Pooled StDev ------+---------+---------+---------+--(------*------) (------*------) (------*------) ------+---------+---------+---------+--45.0 47.5 50.0 52.5