EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
EXPERIMENTOS FACTORIALES COMPLETOS
Página 1 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
CONTENIDO
1. Diseño factorial de dos factores
2. Diseño factorial de dos factores
3. Comparaciones múltiples
Página 2 de 27
P. Reyes / Sept. 2007
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
1. Diseño factorial completo de 2 factores
Ul ingeniero decide probar los tres materiales de la cubierta, único factor controlable a tres niveles de temperatura (15, 70 y 125 °F) consistentes en el entorno de uso final del producto. Se prueban cuatro baterías a cada combinación de material de la cubierta y temperatura, y las 36 pruebas se ejecutan al azar. En la tabla 1 se presentan el experimento y los datos resultantes de duración observada de las baterías. En este problema, el ingeniero desea contestar las siguientes preguntas: 1. ¿Qué efecto tienen el tipo de material y la temperatura sobre la duración de la batería? 2. ¿Existe una elección del material que dé por resultado una duración uniformemente larga sin importar la temperatura?
Tipo de material 1
Temperatura °F 15 70 125 13 15 34 40 2 70 0 5 0 74 18 80 75 8 58
3
0 2 15 18 12 12 2 70 0 8 6 2 5 15 12 10 11 5 45
3
9 6 6 5 8 13 11 17 12 9 10 8 0 4 0 6 4 16 16 15 13 8 60 8
0
0
9
2
Tabla 1. Duración en horas para el ejemplo del diseño de una batería
Página 3 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Esta última pregunta reviste particular importancia. Existe la posibilidad de hallar un material que no sea muy afectado por la temperatura. De ser así, el ingeniero puede hacer que la batería sea robusta a la variación de temperatura en el campo. Éste es un ejemplo del uso del diseño experimental estadístico para el diseño de un producto robusto (o consistente), un importante problema de ingeniería. Este diseño es un ejemplo específico del caso general de un diseño con dos factores (bifactorial). Para pasar al caso general, sea Yijk la respuesta observada cuando el factor A se encuentra en el i-ésimo nivel (i -1, 2,..., n). En general, los datos observados se verán como en la tabla 2. El orden en el cual se toman las abn observaciones es aleatorio, de modo que éste es un diseño completamente aleatorizado.
Factor B 1
2
...
b
1
Y 111,Y112, ...,Y 11n
Y 121,Y 122, ...,Y 12n
...
Y 1b1,Y1b2, ...,Y 1bn
2
Y 211,Y212, Y 221,Y222, ...,Y 21n ...,Y 22n
...
Y 2b1,Y2b2, ...,Y 2bn
Factor A ...
...
...
...
...
a
Y a11,Ya12, ...,Y a1n
Y a21,Ya22, ...,Y a2n
...
Y ab1,Yab2, ...,Y abn
Tabla 2. Disposición general para un diseño bifactorial Las observaciones pueden describirse mediante el modelo estadístico lineal:
Página 4 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
i = 1 , 2 a, . Y i j= μk + τ +i β +j ( τ )βi j+ ε i j jk= 1 , 2 b, k = 1 , 2 n, En donde µ es el efecto medio general, τ i es el efecto del i-ésimo nivel del factor renglón A, β j es el efecto del j-ésimo nivel del factor columna B, (τ β )ij es el efecto de la interacción entre τ i y β j, ε ijk es el componente del error aleatorio. Inicialmente se supone que ambos factores son fijos y que los efectos de tratamiento se definen como desviaciones de la media general, por lo tanto.
∑a τi = 0; ∑b βj = 0 i=1 j=1
Se supone que los efectos de interacción son fijos y que se definen
( )
∑a τβ ij = 0 i=1
dé manera que:
. Hay un total de
abn
observaciones
porque se realizan n réplicas. En un diseño factorial de dos factores, tanto los factores (o tratamientos) de renglón como de columna tienen la misma importancia, específicamente el interés consiste en probar hipótesis acerca de la igualdad de los efectos de tratamiento de renglón, es decir: Ho :
τ1 = τ2
=
... τa
H1 : al menos una
τi
=
≠
0
0
Y de la igualdad de los efectos de tratamiento de columna: Ho :
β1 = β2
H1 : al menos
= ... βb = 0
una
β j
≠0
Página 5 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
También es interesante determinar sí los tratamientos de renglón y columna
interaccionan. En otras palabras, resulta conveniente
probar: Ho : (ττβ)i = 0 para toda i, j H1 : al menos una (ττβ)i ≠ 0
A continuación, se muestra cómo pueden probarse estas hipótesis usando un análisis de variancia bifactorial o bidireccional (de dos factores o en dos sentidos). Análisis Estadístico del Modelo de Efectos Fijos
S
ea Yi..; el total de las observaciones bajo el i-ésimo nivel del factor A; Y.j. El total de las observaciones bajo el j-ésimo nivel
del factor B, Yij. El total de las observaciones de la ij-ésima celda, e Y... el total general de todas las observaciones. Se definen Yi..;
Y.j.
y Yij.
y Y...
como los promedios de renglón, columna, celda y
general, respectivamente, matemáticamente:
b n Yi.. Y i . .= ∑ ∑ Y i j k Yi.. = ; i = 1 , 2 , . .a. , j= 1k = 1 bn a n
Y.j.
Y . j .= ∑ ∑ Y i j k Y.j. = ; j = 1 , 2 , . .b. , i= 1k = 1 an
Y . . . i = 1 , 2 , . .a. , Yij . = ; n j = 1 , 2 , . .b. ,
n
Y i j .= ∑ Y i j k k= 1
a b n
Y... Y . . .= ∑ ∑ ∑ Y i j k Y... = i= 1 j= 1k = 1 abn
La suma total de cuadrados corregida puede expresarse mediante: n
2
∑ ( ) − = = ∑ = ∑ = () ( ) ( − + − + − ∑ = ( ) ∑ ∑ ∑ () − + = = ∑ ∑ ∑ (= )( = = = b
a
i
j
1
k
Y i j k
1
1
a
i
a
i
b n
b
1 j
b
1 j
1
a
i
1
1
k
n
k
1
Y. . .
Y i . .
n
1
Y. . .
Y i k j
Y i j k
Y. . .
Y. . .
Y i j .
Y. . .
Y. j
Y. . .
2
2
Y i . .
Y. j .
Y i j .
Y. . .
a n
2
b
j
Y. j .
1
a
i
Y. . .
b
1 j
1
Página 6 de 27
n i
a
b
1 j
1
2
n
k
1
Y i k j
-
Y i j .
Y i j .
Y i . .
Y. j .
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Porque los seis productos cruzados del segundo miembro de la ecuación anterior son iguales a cero. Se observa que la suma total de cuadrados se ha descompuesto en una suma de cuadrados debida a los “renglones” o al “factor” A (SSA) en una suma de cuadrados debida a las "columnas" o al
factor B (SSB), en una suma de
cuadrados debida a la interacción entre A y B (SSAB), y en una suma de cuadrados debida al error (SSE): Analizando el último término del miembro derecho de la Ecuación anterior es posible observar que es necesario tener al menos dos réplicas (n ≥ 2) para poder obtenerla suma de cuadrados del error. Simbólicamente, la Ecuación anterior puede expresarse mediante:
S T = S A+ S B+ S A +S E Los grados de libertad asociados a cada suma de cuadrados son:
Página 7 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
Efecto
P. Reyes / Sept. 2007
Grados
de liberta d
A B Interacción AB Error Total
a-1 b-1 (a-1)(b-1) ab(n-1) abn-1
Esta descomposición del total de abn -1 grados de libertad para las sumas de cuadrados se puede justificar como sigue: Los efectos principales de A y B tienen a y b niveles, respectivamente, por lo tanto, tienen a -1 y b -1 grados de libertad como se muestra. Los grados de libertad de la interacción simplemente corresponden a los grados de libertad de cada celda (los cuales son iguales a ab -1) menos los grados de libertad de los dos efectos principales A y B en otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de cada una de las ab celdas hay n -1 grados de libertad entre las n réplicas, por lo tanto, hay ab(n -1) grados de libertad del error. Se observa que la suma de los grados de libertad de los términos del miembro derecho de la ecuación anterior es igual al total de los grados de libertad. Cada suma de cuadrados dividida entre sus grados de libertad produce una media de cuadrados. Los valores esperados de las medias de cuadrados son:
Página 8 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
E(MSA)
E(MSB)
E(MSB)
SSA = σ 2 = E a − 1
+
SSB = σ 2 + = E b −1
(a − 1)(b
= E
E(MSE)
SSAB
− 1)
= σ 2
P. Reyes / Sept. 2007
a bn ∑τi i=1 a −1
b an ∑ βj j=1
+
b −1 a b 2 n ∑ ∑ (ττβ ij i=1 j=1 (a − 1)(b − 1)
SSE = σ 2 ab(n −1)
= E
Hay que notar, que si las hipótesis nulas, las cuales consisten en proponer que no hay efectos de tratamiento de renglón, columna e interacción, son verdaderas, entonces MSA, MSB, MSAB y MSE son estimadores de σ 2. Sin embargo, si por ejemplo existen diferencias entre los tratamientos de renglón, entonces MSA será mayor que MSE. En forma similar, si hay efectos de tratamiento de columna o interacción, las medias de cuadrados correspondientes serán mayores que MSE. Por lo tanto, para probar el significado de ambos efectos principales, así como de su interacción, simplemente deben dividirse las medias de cuadrados correspondientes entre la media de cuadrados del error. Valores grandes de estas razones implican que los datos no concuerdan con las hipótesis nulas. Si se considera que el modelo estadístico es adecuado y que los términos del error ε ijk son independientes con distribuciones normales con variancia constante σ 2, entonces las razones de las medias de cuadrados MSA/MSE,
MSB/MSE
y MSAB/MSE tienen
distribución F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el numerador, respectivamente, y ab(n -1) grados de libertad en el denominador. Las regiones críticas corresponden al extremo superior de la distribución F. Usualmente la prueba se presenta en una tabla de análisis de variancia como la que aparece en la tabla 2.
Página 9 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Fuente de Variación
G.L. a-1
SS
Tratamientos SSA A
MS MS
A
SS
A
=
Fo MS
A
MS
E
MS
B
MS
E
MS
AB
a −1
Tratamientos SSB b - 1 B Interacción
SSA (a - 1)(b 1) B
=
MS
B
SS
B
b −1 MS AB = SS AB
MS
E
(a − 1)(b − 1)
Error
SSE ab(n-1)
MS B
=
SS E ab(n
Total
−1)
abn -SS 1
T
Tabla 2 ANOVA para el modelo bifactorial de efectos fijos Es posible obtener las fórmulas para calcular las sumas de cuadrados de la ecuación anterior. La suma total de cuadrados se calcula en forma usual mediante: SS T
a b n
= ∑ ∑ ∑ Y i=1 j=1k =1
2
ijk −
Y
2
...
abn
Las sumas de cuadrados para los efectos principales son:
a Y
2
SS A = ∑
i..
i =1 bn b Y
SS B = ∑
2
j=1 an
−
Y
2
...
abn .j.
−
Y
2
...
abn
Es conveniente obtener SSAB en dos etapas. Primero se calcula la suma de cuadrados entre los totales de las ab celdas, conocida como la suma de cuadrados debido a los "subtotales":
SSsubtotal
2 2 a b Y ij. Y ... es = ∑ ∑ − i=1 j=1 n abn
Página 10 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Esta suma de cuadrados contiene a la SSA y SSB. Por lo tanto, la segunda etapa consiste en calcular SSAB mediante:
S A SB s uS bS At SoS B =
−
−
La SSE se calcula por diferencia:
S SE S ST S SA B S SA S SB =
−
−
−
o b ie :n
S SE S ST S SS u b to t a le s =
−
Página 11 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Ejemplo: Más sobre el experimento de diseño de una batería. En la
tabla 3 se presenta la duración efectiva (en horas) observada en el ejemplo de diseño de una batería descrito en la anterior Los totales de renglón y de columna se indican en los márgenes de la tabla; los números subrayados son los totales de celda.
Tipo de Mat. 1
2
3
Y.j. =
Temperatura ( °F) 15 13 15 0 5 539 4 = 74 18 134.75 0 15 18 0 8 623 15 12 9 6 13 11 8 0 576 16 16 8 0 1738
70 34 40
125 2 70 22 0 80 75 9 8 58 2 13 12 2 70 6 2 47 5 10 11 9 5 45 6 5 8 17 12 9 10 4 0 58 6 4 15 13 3 8 60 0 9 2 1291 770
Yi.. 23 998 0
19 130 8 0
34 150 2 1 Y... = 379 9
Tabla 3. Duración (en horas) para el experimento de diseño de una batería Las sumas de cuadrados se calculan a continuación: 2 a b n Y ... 2 SS T = ∑ ∑ ∑ Y ijk − = i=1 j=1 k =1 abn 130
2
+ 155
2
+ 74
2
+ ... + 60
2
−
3799
2 =
77,646.97
36
Página 12 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
2 a Y i..
= ∑ i=1
SSmaterial 998
2
2
+ 1300
Y
−
bn
+ 1501
2
...
1738
2
2
−
2
b Y
= ∑ j=1
+ 770
2
.j.
an 2
−
−
539
2
ion
+ 229
2
Y
2
...
= = 39,118.72
36 2 a b Y ij.
= ∑∑ i=1 j=1
+ ... + 342
4
− 39,118.72
= 10,683.72
abn 2 3799
(3)(49 SSinteracc
2
3799 36
ura
+ 1291
=
abn
(3)(4) SStemperat
P. Reyes / Sept. 2007
−
n
Y
2
...
=
abn
2
−
3799
2
− 10,683.72
−
36
= 9,613.78
SS E = SS T − SS material − SS temperatur a − SS interaccio n SS E = 77,646.97 − 10,638.72 − 39,118.72 − 9,613.78 = 18,230.75
El análisis de variancia aparece en la tabla 4. Se concluye que existe una interacción significativa entre el tipo de material y la temperatura porque F0.05,4.27 = 2.73. Además, también son significativos los efectos principales del tipo de material y de la temperatura, porque FO.O5.2.27 = 3.35.
Página 13 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
Fuente de
P. Reyes / Sept. 2007
G.L
variación Tipo de material
SS 10,683.
Temperatura
72 39,118.
Interacción
72 9,613.7
Error
8 18,230.
. 2
MS 5,341.8
Fo 7.91
2
6 19,558.
28.9
4
36 2,403.4
7 3.56
27
4 675.21
35
77,646.
75
Total 97
Tabla 4. ANOVA para los datos de la duración de la batería Como auxiliar en la interpretación de los resultados de este experimento resulta útil la construcción de una gráfica de las respuestas promedio de cada combinación de tratamiento. Esta gráfica se muestra en la figura 1.
175 o i d e m o r p Yij. n o i c a r u D
150 125 100 Material tipo 3
75
Material tipo 1 Material tipo 2
50 25 15
70 125 Temperatura
Figura 1. Gráfica de respuesta vs temperatura Página 14 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
El hecho de que las rectas no sean paralelas indica una interacción significativa. En general, a menor temperatura mayor duración, independientemente del tipo de material.
Al variar la temperatura de baja a intermedia, la duración aumenta con el material tipo 3, mientras que disminuye con los materiales tipo 1 y 2,
Cuando la temperatura varía de intermedia a alta, la duración disminuye con los materiales tipo 2 y 3, mientras que con el tipo 1 esencialmente permanece sin cambio. Al parecer, el material tipo 3 da los mejores resultados si lo que se desea es menor perdida de duración efectiva al cambiar la temperatura.
Página 15 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
3. Comparaciones Múltiples
S
i el análisis de variancia indica que hay diferencia en el nivel medio de los renglones o columnas, resulta de interés llevar a
cabo comparaciones entre las medias individuales de renglón o columna para descubrir las diferencias específicas para esto, los métodos de comparación múltiple analizados en él capitulo anterior resultan útiles. A continuación, se ilustra la aplicación de la prueba de intervalos múltiples de Duncan a los datos de duración de las baterías del ejemplo 1. Se recordará que en este experimento la interacción resultó significativa. Cuando esto ocurre, las diferencias en las medias de un factor (por ejemplo el A) pueden ser ocultadas por la interacción AB. Un enfoque consiste en fijar el factor B en un nivel específico, y aplicar la prueba de intervalos múltiples de Duncan a las medias del factor A en ese nivel. Para ilustrar esto, supongamos que en el ejemplo 1 se desea detectar diferencias en el nivel medio de los tres tipos de material. Como la interacción es significativa, las comparaciones se realizan en un solo nivel de la temperatura, por ejemplo el nivel 2 (70 grados). Se supone que el mejor estimador de la variancia del error es la MSE obtenida de la tabla del análisis de variancia. Además, se utiliza la suposición de que la variancia del error experimental es la misma en todas las combinaciones de tratamientos. Los promedios de los tres tipos de material, organizados en arden ascendente son: Y12 . Y2 2 . Y3 2 .
=57.25 =119.75 =145.75
(m aterial
tipo
1)
(m aterial
tipo
2 )
(m aterial
tipo
3 )
El error estándar de estos promedios o medias de tratamiento es:
Página 16 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
S Y12. =
MSE
=
n
675.21
P. Reyes / Sept. 2007
= 12.99
4
Ya que cada promedio se calcula mediante n = 4 observaciones. Usando la Tabla VII del Apéndice se obtienen los valores de r0.05(2, 27) = 2.91 y de r0.05(3, 27) = 3.06. Los intervalos mínimos significativos son: R2 = r0.05(2,27) S Yi2. = (2.91)12.99) = 37.80 R3=r0.05(3,27) S Yi 2. = (3.26)(12.99) = 39.75 Y las comparaciones proporcionan: 3 vs. 1 = 145.75 – 57.25 = 88.50 >39.75(R3) 3 vs. 2 = 145.75 – 119.75 = 26.00 <37.80(R2) 2 vs. 1 = 119.75 – 57.25 = 62.50 >37.80(R2) Este análisis indica que en el nivel de temperatura de 70 grados, el voltaje medio producido por los materiales 2 y 3 es el mismo y que el voltaje medio del material 1 es significativamente menor que el producido por los materiales tipo 2 y 3. Si la interacción resulta ser significativa, el investigador puede comparar las medias de todas las ab celdas para determinar en cuáles hay una diferencia significativa. En este análisis las diferencias entre las celdas incluyen tanto los efectos principales como el efecto de interacción. En el ejemplo 1 este método producirá 36 comparaciones entre todos los posibles pares de medias de nueve celdas. Variabilidad del modelo
A
plicando el procedimiento general a los datos del voltaje de las baterías del
Página 17 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Ejemplo 1. Debe observarse que
SSModelo = SSMaterial + SStemperatura + SSinteracción SSModelo = 10,683.72 + 39,118.72 + 9613.78 = 59,416.22 Y que R2 = SSModelo/SS T = 59,416.22/77,646.97 = 0.765210 En otras palabras, cerca de 77% de la variabilidad en la caída del voltaje se explica por el tipo de material de las placas de la batería, por la temperatura y por la interacción entre el tipo de material y la temperatura. AComprobación
de la idoneidad del Modelo
ntes de poder adoptar las conclusiones del análisis de variancia, debe probarse la adecuación
del modelo supuesto. Como antes, la
herramienta principal es el análisis de residuos. Los residuos para el modelo factorial de dos factores son: eijk
ˆ ijk = Yijk − Y
Página 18 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Para los residuos del ejemplo 3.1 tenemos que: Tipo Temperatura grados Fahrenheit de 15 70 125 Mat. 1 130155- 12.5 134.75= 134.7 23.2 17.2 37.2 0 -4.75 5 5 5 5 =20.2 5 74180- 22.7 17.2 24.5 0.50 134.750 134.7 5 5 0 =-60.75 5 =45.2 5 2 -5.75 32.25 16.2 2.25 20.5 5 24.5 0 0 3.25 8.50 29.75 13.7 4.75 4.50 5 3 -6.00 28.2 10.5 18.5 34.00 5 25.7 0 0 5 24.00 16.00 4.25 6.75 3.50 25.5 0
J
X(J)
(j-
1
-60.8
1.
2
-37.5
4.
Tabla 5. Residuos para el ejemplo 1
Página 19 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Figura 2. Grafica de probabilidad normal e histograma de residuos para el ejemplo 1.
Página 20 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
Yij.
P. Reyes / Sept. 2007
Yij.
eij
134.75
-4.
134.75
-60.
Tabla 6. Residuos
Grafica de residuos vs Yijk(esti 60 40 20
eijk 0 0
50
100
150
-20 -40 -60
Figura 3. Gráfica de Residuos versus respuesta estimada -80
Estimador Yijk
Página 21 de 27
200
EXPERIMENTOS FACTORIALES COMPLETOS
Y ya que los valores ajustados son
P. Reyes / Sept. 2007
ˆ ijk Y
Yij.
=
(el promedio de las
observaciones en la ij-ésima celda), la Ecuación de residios se transforma en: eijk
Yijk
=
Yij .
−
Los residuos de los datos de duración de las baterías del ejemplo 1 se muestran en la tabla 6.
La gráfica de probabilidad normal y el
histograma de estos residuos no revelan algo que pudiera causar problemas, a pesar de que el residuo menor (-60.75 a 65 °F y para el tipo de material 1) parece alejarse de los demás. El valor estandarizado de este residuo es (-60,75)/ (675.21) 1/2 = - 2.34. Éste es el único residuo cuyo valor absoluto es mayor que dos. En la tabla 7 se presenta una gráfica de los residuos contra los valores ajustados ˆ ijk Y
. Esta gráfica muestra una ligera tendencia de la variancia de los
residuos a aumentar, a medida que aumenta el voltaje.
T. Mat eij 1
-4.
1
-6
T. Mat
Grafica de residuos vs. tipo de material 60 Tabla 7 Residuos del material 40 20 0 0
0.5
1
1.5
2
-20 -40 -60
Página 22 de 27
2.5
3
3.5
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Figura 4. Gráfica de residuos versus tipo de material
Temp. eij 15
-4.
15
-60.
Tabla 8 Residuos de Temperatura
Página 23 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
60 40 20 0 0 -20
20
40
60
80
100
120
140
-40 -60 Figura 5 Gráfica de residuos de temperatura versus tipo de material
-80 En la tabla 7 y figura 5 aparecenTemperatura las gráficas de los residuos contra el tipo de material y contra la temperatura, respectivamente. Ambas gráficas indican una ligera desigualdad en la variancia siendo quizá mayor la variancia de la combinación de 65 °F y tipo de material 1 que la de cualquier otra combinación. La celda correspondiente a 70 °F y el tipo de material es la que contiene ambos residuos extremos (-60.75 y 45.25). Estos dos residuos son los principales responsables de la desigualdad de la variancia detectada en las Fig. 7,8 y 9. Un examen posterior de los datos no reveló ningún problema obvio, como por ejemplo, errores en el registro de los datos y, por lo tanto, estas observaciones deben ser aceptadas como legítimas. Es posible que en esta combinación de tratamiento particular se produzcan voltajes ligeramente más erráticos que en las otras combinaciones.
Página 24 de 27
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
Sin embargo, el problema no es tan severo como para tener un efecto importante en el análisis y las conclusiones. Estimación de los Parámetros del Modelo
L
os parámetros en el modelo de análisis de variancia de clasificación en dos sentidos:
i = 1 , 2 a, . Yi j k= μ + τi + β j + ( τ β) i j+ ε j ik j = 1 , 2 b, . k = 1 , 2 n, . Pueden estimarse usando el método de mínimos cuadrados. Como hay 1 + a + b + ab parámetros del modelo que deben ser estimados habrá 1 + a + b + ab ecuaciones normales. No es difícil mostrar que las ecuaciones normales son:
μ :
a b n
τ i
b n
β j
: :
( τ β ) i j
a n
:
a
b
μ + b n ∑ τi + a n β j n ∑ 1 1 i= j=
ˆ
ˆ
b
ˆ
b
( μ + b n τi + n ∑ β j + n 1 j= j= 1
ˆ ˆ ˆ ˆ j + μ n∑ τ i + a n β n ˆ + ˆ i i a
a
1 =
1 =
nμ + nτi + nβ n( τ β j +
ˆ
ˆ
ˆ
Para mayor claridad se muestra el parámetro correspondiente a cada ecuación normal, a la izquierda de las Ecuaciones anteriores. Con el fin de obtener una solución óptima a las ecuaciones anteriores, tenemos que imponer las siguientes restricciones: Página 25 de 27
( τ β
) i j
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
a
∑ τi = 0 i=1 ˆ
b
∑ βj = 0 j=1 a
( )
b
( )
∑ τβ ij = 0 j = 1,2,..., b i=1 ∑ τβ
ij
=0
i = 1,2,..., a
j=1
Al aplicar estas restricciones, las ecuaciones normales se simplifican considerablemente y se obtienen las soluciones: μ = Y... ˆ
τi = Yi..− Y...
i = 1,2,..., a
ˆ
β j = Y.j .− Y... j = 1,2,..., b ˆ
i = 1,2,...,a ( e s t i m a d o) ( τβ r ) ij = Yij.− Yi. .- Y.j.+ Y... j = 1,2,...,b Estas soluciones son intuitivamente atractivas. Los efectos de los tratamientos de renglón se estiman mediante la diferencia entre el promedio del renglón y el promedio general; los efectos de los tratamientos de columna mediante la diferencia entre el promedio de la columna y el promedio general, y la ij-ésima interacción se estima restando el promedio general, el efecto del renglón i y el de la columna j al promedio de la ij-ésima celda. Usando la ecuación anterior puede determinarse el valor ajustado de Yijk mediante: ˆ ijk Y
=
ˆ ijk Y
=
ˆ ijk Y
=
μ ˆ
τ ˆi
+
Y ...
ˆ j β
+
(Yi..
+
(τβ )ij (el
+
Y...
−
estimador
) (Y.j. +
Y...
−
de τβ)
) (Yij. +
Yi..
−
Yij.
Página 26 de 27
Y.j.
−
Y ...
+
)
EXPERIMENTOS FACTORIALES COMPLETOS
P. Reyes / Sept. 2007
En otras palabras, la k-ésima observación de la ij-ésima celda se estima mediante el promedio de las n observaciones de dicha celda.
Suposiciones del análisis de varianza
A
l aplicar un análisis de varianza se hacen las
suposiciones
siguientes:
1. El proceso esta en control estadístico (estable). Esto es, se pueden repetir y las causas de variación se han eliminado. 2. La distribución de la población que se muestra es normal. 3. La varianza de los errores dentro de los k niveles del factor es la misma: Esto es, la variabilidad natural dentro de cada tratamiento es la misma de un tratamiento a otro.
Cuando se observa que no se puede suponer igual varianza (por ejemplo un proceso Poisson: donde la varianza varia con la media), se tiene
dos
opciones;
Transformar
los
datos,
o
pruebas
no
parametricas. En particular una prueba no parametrica que se usa es la Kruskal – Wallis.
Página 27 de 27