Métodos estadísticos Control y mejora de la calidad A lb e r t P rat B a r té s X a v ie r T o r t -M a r t o r e ll L la b ré s P e re G r im a C in t a s L o u r d e s P o z u e ta F e r n á n d e z
(20059) NUM. 2
80025 75540
A lfaom ega
20059
EDICIONS UPC
Métodos estadísticos Control y mejora de la calidad
TS156 P9 1 2 2000 E J . 5 (20059) B Z B . NUM. 2
Métodos estadísticos Control y mejora de la calidad A lb e r t P ra t B a rté s X a v ie r T o r t -M a r t o r e ll L la b ré s P e re G r im a C in t a s L o u rd e s P o z u e ta F e rn á n d e z
Obra galardonada por la UPC
lü EDICIONS UPC UNIVERSITAT POLITÉCNICA DE CATALUNYA
p ^ i%
¿060
Métodos Estadísticos. Control y mejora de la calidad Albert Prat Bartés, Xavier Tort-M artorell Llabrés, Pere G rima Cintas, Lourdes Pozueta Fernández ISBN 84-8301-222-7, edición original publicada por © Edicions UPC, S.L. Universitat Politécnica de Catalunya, Barcelona, España
Esta obra fue galardonada en el segundo concurso “Ajut a l’elaboració de m aterial docent" convocado por la UPC
© 2000 ALFAOMEGA GRUPO EDITOR, S. A. de C. V. Pitágoras 1139, Col. Del Valle 03100, México, D. F. M iem bro de la Cámara Nacional de la Industria Editorial Registro No. 2317 Internet: http://w w w .alfaom ega.com .m x Email: ventas@ alfaom ega.com .mx
ISBN 970-15-0452-6
Derechos reservados. Esta obra es propiedad intelectual de su autor y los derechos de publi cación en lengua española han sido legalm ente transferidos al editor. Prohibida su reproducción parcial o total por cualquier medio sin perm i so por escrito del propietario de los derechos del copyright. Edición autorizada para su venta en el continente americano. Prohibida su venta en España. Im preso en México - Printed in México
Presentación
D esde 1994 E dicions U PC ha venido desarrollando un extenso catálogo de obras de prom inente va lor didáctico, com o respuesta a la existencia de una im portante d inám ica cien tífico -técn ica de alta calidad generada en la U niversitat Politécnica de C atalunya (U PC ), concebidas por reconocidos aca dém icos. Estas obras son un m eritorio aporte para la com unidad universitaria. Los autores de los libros, en su m ayoría profesores titulares de la m ateria sobre la cual escriben, tienen un alto nivel profesional y estudios de postgrado en im portantes universidades de E uropa y E stados U nidos. Por otra parte, A lfaom ega G rupo Editor, cuya m isión com o em presa es la de editores com prom etidos con una m ejor form ación científica y tecnológica en los países H ispanoam ericanos, busca perm anen tem ente los m ateriales que m ejor respondan a las necesidades de nuestro tiem po, que de preferencia hayan sido concebidos en nuestra propia lengua, acordes a las necesidades de los centros de ed u ca ción superior de este continente. Nos com place presentar un convenio suscrito entre E dicions U PC y A lfaom ega G rupo E ditor para coeditar una serie de títulos seleccionados de esa prestigiosa institución, que p erm itirá a través de la cadena de distribución de A lfaom ega, ofrecer estos libros a un am plio universo de profesores y estu diantes de toda H ispanoam érica. L os editores
Prólogo
Cuando decidimos escribir este libro, lo hicimos con un objetivo fundamental: satisfacer las necesidades y expectativas, en cuanto a formación estadística, de los estudiantes de ingeniería y de todos aquellos técnicos, ingenieros y científicos que quieren utilizar métodos estadísticos para acelerar la adquisición de conocimientos. El proceso de detección de estas necesidades y expectativas ha sido largo pero extraordina riamente interesante. La principal fuente de información ha sido la experiencia adquirida por los autores durante las múltiples asesorías realizadas a todo tipo de organismos públicos y privados tanto nacionales como multinacionales. Este contacto intenso con la realidad, además de ser una fuente inestimable de temas para la investigación teórica y aplicada, permite la obtención de datos reales y la aplicación de los métodos estadísticos a problemas relevantes para el público a quien se dirige el texto. En este sentido, el capítulo 1 introduce al lector en la importancia actual de los conceptos de la calidad total y sitúa el papel de la estadística como uno de los tres pilares en los que se fundamentan dichos conceptos. Una de las constataciones realizadas por personajes de la talla de Deming y Juran es que un porcentaje muy elevado de problemas por mala calidad en la industria y los servicios se pueden resolver mediante la utilización masiva y sistemática de las herramientas que se explican en el capítulo 2. Los capítulos 3 y 4 presentan de forma conceptual y resumida los elementos básicos de la variabilidad y de su medida en la teoría de la probabilidad. Los resultados teóricos de estos dos capítulos constituyen la base en que se fundamentan los métodos estadísticos descritos en el texto. Los capítulos 5 y 6 contienen los métodos utilizados para comparar dos o más poblaciones, tanto para el caso de diseños totalmente aleatorizados como para los diseños en bloques completos aleatorizados. En la actualidad, las técnicas de diseño de experimentos, tanto en su versión clásica de diseños factoriales y factoriales fracciónales, como en su versión de métodos de Taguchi para el diseño de parámetros en ingeniería de la calidad, son de gran importancia en todo tipo de organizaciones industriales. A ellas hemos dedicado los capítulos 7, 8, 9 y 10. Finalmente, otra área de gran interés para el control y la mejora de la calidad es la de control estadístico de procesos (SPC) que se expone brevemente en el capítulo 11. Al final de cada grupo temático se proponen una serie de ejercicios que pretenden facilitar la compresión de los conceptos teóricos.
M ÉTODOS ESTADÍSTICOS. CO NTROL Y M EJORA DE LA CALIDAD
K
El enfoque del libro está también influenciado por las largas conversaciones y el trabajo en común de algunos de los autores con dos auténticos maestros de la estadística: George E. P. Box y el difunto William G. Hunter. Compartimos con ellos la idea de mantener al mínimo imprescindible el aparato matemático utilizado en el texto, e intentar que, a través de la utilización de datos reales, el lector pueda apreciar toda la complejidad del proceso iterativo de adquisición de conocimientos y en la resolución de problemas de interés para la industria y los servicios. Este libro es el resultado de muchos años de experiencia en la enseñanza de la estadística. Esta experiencia no se limita únicamente a los estudiantes de ingeniería en la Escola Técnica Superior de Enginyers Industriáis de Barcelona, y a los de la diplomatura de Estadística de la Facultat de M atemátiques i Estadística de la Universitat Politécnica de Catalunya, sino que se extiende a la enseñanza de la estadística en los múltiples cursos realizados a medida para ingenieros, economistas, técnicos, etc., en distintas empresas de una gran variedad de campos de actividad. Desearíamos que nuestro libro satisfaga realmente a nuestros lectores pero, como todo producto es mejorable, les estimulamos a que nos hagan llegar todo tipo de comentarios y sugerencias que permitan mejorarlo en ediciones futuras. Finalmente, deseamos manifestar nuestro agradecimiento a la Universitat Politécnica de Catalunya, a la cual pertenecemos, por concedemos un premio a la elaboración de material docente que ha facilitado la elaboración del presente texto, a los becarios Natalia Montolío y Santiago Fernández, que han colaborado en la recopilación de los problemas y la elaboración de las tablas que figuran en el libro, así como a Pia Margarit por su trabajo en la edición del primer original.
Albert Prat Xavier Tort-Martorell Pe re Grima Lourdes Pozueta
Contenido
1
El entorno de la calidad total
1.1
1.3 1.4
Evolución histórica del concepto de control de la c a lid a d ........................................................ 15 1.1.1 Inspección .........................................................................................................................16 1.1.2 Control estadístico de procesos (C .E .P )..........................................................................17 1.1.3 Calidad en la etapa de diseño ..........................................................................................18 Mantenimiento, mejora e innovación en la calidad ................................................................... 18 1.2.1 Conceptos básicos ........................................................................................................... 18 1.2.2 El ciclo PDCA como estrategia básica de los procesos de mejora continua ............. 20 Conceptos básicos de la gestión de la calidad total ................................................................... 21 Métodos estadísticos en la calidad total ..................................................................................... 23
2
Herramientas básicas para la mejora de la calidad
1.2
2.1 Plantillas para la recogida de datos ............................................................................................26 2.2 Histogramas .................................................................................................................................... 28 2.3 Diagramas de Pareto .................................................................................................................... 31 2.4 Diagramas causa-efecto ................................................................................................................34 2.5 Diagramas bivariantes .................................................................................................................. 36 2.6 Estratificación ................................................................................................................................41 Ejercicios ............................................................................................................................................. 42 Apéndice 2A Datos e información ......................................................................................................... 45
3
Causas y medidas de la variabilidad
3.1 3.2
Causas de la variabilidad ..............................................................................................................47 Medidas de la variabilidad ........................................................................................................... 49 3.2.1 Variabilidad en una muestra ............................................................................................50 Densidad de probabilidad. Variabilidad en la población . . . , ................................................. 50 Esperanza matemática y varianza ................................................................................................ 51 Función de distribución ................................................................................................................52 Caso discreto ..................................................................................................................................53
3.3 3.4 3.5 3.6
020053
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
---------------------------------------------------------------------------------------------------------------
JC
3.7
El caso bivariante ........................................................................................................................54 3.7.1 Variabilidad muestral ...................................................................................................... 54 3.8 Densidades de probabilidad conjunta y densidades marginales ...............................................54 3.8.1 Densidades m arginales.........................................................................................................55 3.9 Densidades condicionales e independencia de variables aleatorias ........................................ 55 3.10 Covarianza y coeficiente de correlación lineal ..........................................................................56 3.11 Esperanza matemática y varianza de combinaciones lineales de variables aleatorias .........58 3.12 Ejemplo del “helicóptero’’ ........................................................................................................... 59 Ejercicios .............................................................................................................................................62 4
Algunos modelos probabilísticos
4.1
La ley normal ............................................................................................................................... 66 4.1.1 Función de distribución .......................................................................................................68 4.2 La ley binomial ............................................................................................................................. 70 4.3 Ley de Poisson ............................................................................................................................. 72 4.4 Distribución de estadísticos en muestras aleatorias simples de poblaciones normales .........74 4.5 Distribución de Y (a 2 conocida) .................................................................................................. 75 4.6 La ley de Chi-cuadrado ................................................................................................................76 4.7 La ley t-Student ............................................................................................................................. 77 4.8 Distribución de S2 .........................................................................................................................79 4.9 Distribución de Y (a2 desconocida) ............................................................................................79 4.10 El caso de dos poblaciones normales independientes ...............................................................80 4.11 La ley F-Snedecor .........................................................................................................................81 4.12 Distribución del cociente de dos varianzas muéstrales ............................................................ 82 Ejercicios ............................................................................................................................................. 83 5 5.1
Com paración de dos tratam ientos
Caso 1: comparación de dos productos en un proceso de curtido de piel ............................. 85 5.1.1 Planteamiento del problema. Recogida de datos ............................................................ 85 5.1.2 Análisis exploratorio. Formalización del problema ........................................................86 5.1.3 R esolución............................................................................................................................. 87 5.2 Generalización del caso de la comparación de dos productos para el curtido: comparación de medias en diseños totalmente ateatorizados ................................................. 89 5.3 Caso 2: comparación de dos tratamientos superficiales para lentes ........................................ 91 5.3.1 Planteamiento. Recogida de los datos .............................................................................. 91 5.3.2 Análisis exploratorio ........................................................................................................... 91 5.3.3 R esolución............................................................................................................................. 92 5.4 Generalización del caso de la comparación de dos tratamientos superficiales de lentes: ......... comparación de medias en diseños en bloques aleatorizados ................................................. 93 5.5 Aleatorización y bloqueo, recapitulación .................................................................................94 5.6 Contraste de hipótesis. Formalización y limitaciones ...............................................................95 5.7 Un análisis alternativo: intervalos de confianza para la diferencia de medias ...................... 97 Ejercicios ............................................................................................................................................. 99 Apéndice 5A Test de comparación de medias cuando no puede asumirse la igualdad de varianzas poblacionales .................................................................................................................... 102 Apéndice 5B Pruébelo Ud. mismo. Comparación de dos tipos de helicóptero ............................... 103
EL ENTORNO DE LA CALIDAD TOTAL
n
6
Comparación de más de dos tratamientos: análisis de la varianza
6.1
Método gráfico de comparación de medias para poblaciones independientes .................... 106 6.1.1 Ideas básicas para la aplicación del método ....................................................................106 6.1.2 Requisitos de aplicación ................................................................................................... 108 6.1.3 Caso de la comparación de procedimientos de montaje. Aplicación del método . .110 6.2 Caso de la comparación de procedimientos de montaje con datos bloqueados. Hipótesis sobre el modelo de la respuesta ...............................................................................113 6.2.1 R esolución............................................................................................................................114 6.3 Método clásico de análisis de la varianza. Tabla A N O V A ...................................................... 117 6.3.1 Planteamiento de un caso y cuestiones previas .............................................................117 6.3.2 Construcción e interpretación de la tabla ANOVA en diseños totalmente aleatorizados .............................................................................................................. 118 6.3.3 Tabla ANOVA para diseños bloqueados ........................................................................ 121 Ejercicios ............................................................................................................................................124
7 7.1
Diseños factoriales
Necesidad de la experimentación ...............................................................................................127 7.1.1 Avance del conocimiento ................................................................................................. 127 7.1.2 Diferencia entre experimentar y analizar datos existentes ...........................................127 7.1.3 Modelos mecanicistas y empíricos ................................................................................. 129 7.2 Posibles estrategias experimentales .......................................................................................... 130 7.2.1 Estrategia secuencial ........................................................................................................130 7.2.2 Diseños factoriales frente a intuición ............................................................................... 131 7.2.3 Concepto de interacción ................................................................................................... 133 7.3 Variabilidad de la respuesta ........................................................................................................134 7.3.1 Variabilidad en el sistema de medición de la respuesta ............................................... 135 7.4 Diseños factoriales con las variables a dos niveles ................................................................. 135 7.4.1 Diseños factoriales a dos niveles ......................................................................................136 7.4.2 Matriz de diseño. Construcción ........................................................................................ 137 7.4.3 Aleatorización ..................................................................................................................... 138 7.4.4 Réplicas .............................................................................................................................. 139 7.5 Cálculo de los efectos ................................................................................................................. 140 7.5.1 Cálculo de los efectos a partir del cubo ...........................................................................140 7.5.2 Algoritmos de cálculo ........................................................................................................142 7.6 Significación de los efectos ........................................................................................................144 7.6.1 Significación cuando se dispone de réplicas ..................................................................145 7.6.2 Papel probabilístico normal ...............................................................................................147 7.7 Interpretación de resultados ........................................................................................................ 150 7.7.1 Cálculo de residuos. Diagnosis del modelo ....................................................................151 7.8 Diseños a dos niveles bloqueados .............................................................................................152 Apéndice 7A Relación entre los algoritmos de cálculo y el método de los mínimos cuadrados . .153 Apéndice 7B Papel probabilístico normal para diseños con ocho y dieciséis experimentos y casos prácticos ...............................................................................................................155 Ejercicios ............................................................................................................................................ 162
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD -------------------------------- —
8
------------------------------------------------------------------ :----
71
Diseños factoriales fracciónales
8.1
12
Utilidad y j ustificaciones ........................................................................................................... 165 8.1.1 Justificaciones .................................................................................................................... 165 8.2 Ejemplo introductorio. Cinco variables en dieciséis experimentos ......................................166 8.2.1 Confusión de los efectos .................................................................................................. 169 8.3 Construcción de diseños fracciónales y cálculo de las confusiones introducidas ................170 8.3.1 Construcción de diseños fracciónales ............................................................................170 8.3.2 Cálculo de las confusiones introducidas ....................................................................... 171 8.3.3 Concepto de resolución .................................................................................................... 172 8.4 Otros diseños fracciónales ............................................................................................................. 172 8.4.1 Medias fracciones ............................................................................................................. 172 8.4.2 Fracción complementaria ................................................................................................ 173 8.4.3 Diseños saturados ............................................................................................................. 175 8.4.4 Diseños intermedios .........................................................................................................177 8.5 Bloqueo .......................................................................................................................................... 179 8.5. 1 Bloqueo de factoriales completos .................................................................................. 179 8.5.2 Ejemplo de proceso químico ........................................................................................... 180 8.5.3 Factoriales completos divididos en más de dos bloques ...............................................182 8.5.4 Fracciónales divididos en bloques ...................................................................................183 8.6 Tablas de diseños fracciónales.................................................................................................... 184 8.7 Estrategia secuencial utilizando diseños fracciónales .................................................................187 8.7.1 Advertencias ...................................................................................................................... 188 8.7.2 Fracciones complementarias ........................................................................................... 188 8.7.3 Efecto bloque al añadir fracciones .................................................................................. 191 8.7.4 Adición de experimentos para conseguir clarificaciones puntuales ...........................191 Apéndice 8A Teoría de la proyección .................................................................................................. 195 Apéndice 8B Significación de las interacciones de dos factores ..................................................... 196 Ejercicios ...........................................................................................................................................198
9
Introducción a la metodología de superficie de respuesta
9.1 Introducción. Necesidad de modelos ..............................................................................................201 9.2 Grado de conocimiento y objetivos ................................................................................................202 9.3 Estrategias de la metodología de superficie de respuesta ............................................................ 203 9.4 Aproximación lineal a las condiciones óptimas ............................................................................206 9.5 Aproximación por el camino de máxima p e n d ie n te ..................................................................... 209 9.6 Aproximación cuadrática. Diseños centrales compuestos .......................................................... 212 9.7 Análisis canónico de la superficie .................................................................................................. 215 Ejercicios .......................................................................................................................................... 221 10
Diseño de productos robustos
10.1 10.2 10.3 10.4
Concepto de producto robusto ................................................... .............................................. 223 Variabilidad funcional ................................................................................................................224 Metodología del diseño ............................................................................................................. 225 Diseño de parámetros ..................................................................................................................226
EL ENTORNO DE LA CALIDAD TOTAL
n
10.5 Matriz de diseño .............................................................................................................................227 10.6 Ejemplo de producto robusto a ruido externo: suavizante ....................................................... 229 10.7 Ejemplo de producto robusto a ruido interno: tubo calefactor................................................ 236 10.8 Diseño de tolerancias ......................................................................................................................238 Apéndice 10A Función de pérdidas ........................................................................................................ 239 Apéndice 10B Método de Taguchi .......................................................................................................... 240 Ejercicios ............................................................................................................................................... 242 11
Control estadístico de procesos
11.1 11.2
Evolución del CEP y o b jetiv o s......................................................................................................243 Proceso en estado de control.......................................................................................................... 244 11.2.1 Comportamiento esperado de las observaciones individuales en un proceso en estado de control ...............................................................................................244 11.2.2 Comportamiento de la media de un proceso en estado de c o n tro l.............................. 246 11.3 ¿Qué es un gráfico de control? M etodología.............................................................................. 247 11.4 Gráficos de control para variables................................................................................................. 248 11.4.1 Gráficos X-R ........................................................................................................................ 249 11.4.2 Gráfico de observaciones individuales y gráfico de rangos móviles ......................... 251 11.4.3 Gráfico de medias m ó v ile s ................................................................................................. 252 11.4.4 Interpretación de los gráficos de control ........................................................................252 11.4.5 Estudios de capacidad ........................................................................................................ 255 11.5 Gráficos de control para atributos ...............................................................................................258 11.5.1 Gráfico P ............................................................................................................................... 258 11.5.2 Gráfico NP ...........................................................................................................................261 11.5.3 Gráfico C .............................................................................................................................263 11.5.4 Gráfico U .............................................................................................................................265 11.6 Otros gráficos de control ...............................................................................................................266 11.6.1 Gráfico CUSUM ................................................................................................................. 266 11.6.2 Gráficos EWMA ................................................................................................................. 269 11.7 Elprecontrol ....................................................................................................................................271 11.8 Gráficos de control para observaciones dependientes .............................................................. 272 Ejercicios ............................................................................................................................................... 274 Apéndice 1: Tablas estad ísticas............................................................................................................... 277 índice alfabético ........................................................................................................................................ 295 Bibliografía
299
Ei entorno de la calidad total
En este capítulo se justifica la importancia de la calidad de los productos y servicios como elemento estratégico para la competitividad de las organizaciones que los producen. El concepto de calidad que subyace a lo largo de este libro es el de que la calidad es inversamente proporcional a las pérdidas e inconvenientes de todo tipo que un producto o servicio provoca al usuario. Los métodos utilizados en la industria para asegurar la calidad de sus productos han evolucionado a lo largo del tiempo. En este capítulo se analiza críticamente dicha evolución y se refuerza la idea de que el mejor momento para considerar la calidad de un producto es cuando se está diseñando. A continuación, y siguiendo todavía en el ámbito de calidad de los productos (o servicios), se analizan tres clases de actividad que requieren distintos tipos de actitud por su distinta complejidad. Dichas actividades son las de mantenimiento o control de la calidad, actividades de mejora continua y, finalmente, las de innovación o creatividad. En el apartado 1.4 se discuten los aspectos culturales, organizativos e instrumentales necesarios para que la calidad sea un elemento básico en la gestión de las organizaciones, y para que éstas sean capaces de satisfacer a sus clientes tanto en calidad como en precio, plazo de entrega y servicio postventa de sus productos. Finalmente, y dado que este libro trata sobre métodos estadísticos para el control, la mejora y la innovación de la calidad, se discute el papel que tiene el método científico en general y la estadística en particular dentro de las organizaciones para el desarrollo de los tres tipos de actividad.
1.1 Evolución histórica del concepto de control de la calidad Desde sus orígenes, probablemente el ser humano ha considerado de vital importancia el disponer de productos de alta calidad. Es de suponer que el cazador que disponía de mejores flechas obtenía más y mejores presas y que este hecho no debía pasar inadvertido a nuestros antepasados. La organización del trabajo en la era industrial ha añadido otros puntos de vista acerca del producto tales como costes, plazo de entrega, servicio postventa, seguridad, fiabilidad, etc. La prioridad asignada a los diversos conceptos ha ido evolucionando con el tiempo. Así, por ejemplo, en situaciones en las que la demanda de productos ha sido muy superior a la capacidad de oferta, la gestión empresarial se ha orientado hacia la producción y ha dado alta prioridad a la
M É T O D O S E S T A D ÍS T IC O S . C O N T R O L Y M E JO R A D E LA C A L ID A D
------------------------------------------ ---------------------------------------------------------------------- — -----
DISEÑO 1980
PARA LA CALIDAD CONTROL
DE
1940
PROCESOS
IN SPE C C IO N
DISEÑO
FABRICACION
DISTRIBUCION
F ig . 1.1 H istoria d el co n tro l d e calid a d
K
productividad, m ientras que cuando la dem anda de ciertos productos ha sido m enor que la cap a cidad de oferta, la gestión se ha orientado hacia el c lien te y la calid ad h a sid o altam en te prioritaria. En la actualidad pocos discuten la im por tancia estratégica de la calidad com o factor de com petitividad industrial en una situación de fu e rte satu rac ió n y g lo b a liz a c ió n de los m ercados. P a ra le la m e n te , ta m b ién ha id o e v o lu c io n a n d o la e ta p a d e l d e s a rro llo de un p ro d u c to en la q u e se ha in te n ta d o a se g u ra r su c alid ad . D ic h a e v o lu c ió n e stá re p re se n ta d a en la fig u ra 1.1.
1.1.1 Inspección D urante el inicio de la era industrial la calidad de los productos se intentaba asegurar m ediante la inspección de los m ism os antes de ser enviados al m ercado. El m odelo conceptual del enfoque basado en la inspección es el de la figura 1.2.
F ig . 1.2 E n fo q u e co n cep tu a l d e la in sp e c c ió n
A la inspección, ya sea exhaustiva (100% ) objetivos: a) separar el producto defectuoso para ser b) advertir al responsable del proceso de defectuoso para que aquél pueda tom ar
o m ediante m uestreo estadístico, se le asignan dos reprocesado o desechado, y fabricación sobre la aparición del producto las m edidas de ajuste que estim e oportunas.
EL ENTORNO DE LA CALIDAD TOTAL
71
Es bien conocido el hecho de que la inspección, incluso si es al 100%, no cumple eficazmente el objetivo (a), debido a la fatiga del inspector entre otras causas. Pero aunque pudiésemos suponer una inspección perfecta, no se debe olvidar que el producto detectado como defectuoso ya ha sido producido y, por lo tanto, se han consumido recursos de mano de obra, materia prima, energía, etc que incrementarán el coste del producto. Además, en el producto considerado como aceptable puede existir una proporción elevada de unidades cuya calidad no se diferencie mucho de las unidades rechazadas, y el operario se puede desentender de la calidad confiando en la inspección. Si añadimos a lo anterior que la inspección es una actividad no productiva, y que en muchas organizaciones la estructura organizativa no facilita la comunicación necesaria para hacer posible la consecución del objetivo (b), se entiende que este enfoque para asegurar la calidad claramente no es adecuado.
1.1.2 Control estadístico de procesos (C.E.P.) Durante los años que precedieron al inicio de la II Guerra Mundial, y debido principalmente a los trabajos de W. Shewhart (1931), el aseguramiento de la calidad se desplazó a la etapa de fabricación de los productos. El esquema conceptual del C.E.P. (o S.P.C. en abreviación inglesa) es el de la figura 1.3.
REPASADO
DESECHOS MUESTREO SELECTIVO • Producto
PROCESO Fig. 1.3 M odelo conceptual del control estadístico de procesos
Se trata, esencialmente, de minimizar la producción de unidades defectuosas reduciendo el tiempo que transcurre entre la ocurrencia y la detección de algún desajuste en el proceso de fabricación, así como la identificación de las causas del mismo a fin de evitar su repetición. Este tipo de control, que se desarrolla en el capítulo 11 de este libro, se implementa mediante muestreo de características físicas del producto (longitud, peso, diámetro, etc.), o de variables del proceso (temperatura, presión de rodillo, etc.). Dado que el C.E.P. no conseguirá eliminar por completo la fabricación de unidades defectuosas, puede ser necesario mantener cierto grado de inspección final tal como se indica en la figura 1.3. Ahora, sin embargo, la inspección tiene como finalidad el separar el producto defectuoso.
M ÉTO D O S ESTA D ÍST IC O S. C O N T R O L Y M EJO R A D E LA C A L ID A D
K
1.1.3 Calidad en la etapa de diseño Tanto la inspección com o el C.E.P. son m ecanism os internos de la organización. Es por ello que, aunque en una cierta em presa funcionasen a la perfección tanto las inspecciones a la recepción de m aterias prim as com o las de producto acabado, así com o el control estadístico de los principales procesos de la m ism a, nada o m uy poco aportarían estos procedim ientos a algo tan im portante com o saber los problem as que los productos de la em presa en cuestión provocan a sus clientes cuando los utilizan, o por qué algunas personas utilizan productos de la com petencia, etc. Es por ello que, en la actualidad, el control de la calidad es una actividad globalizadora, que incluye, no sólo a todas las personas y procesos de una cierta em presa, sino tam bién a los proveedores y a los distribuidores, tal com o queda reflejado en la figura 1.4.
F ig . 1.4 M o d e lo co n cep tu a l d e la calid a d total
En esta figura destaca, en prim er lugar, que la calidad ha de venir determ inada por las necesidades y expectativas del cliente y no por necesidades internas de la propia organización. En segundo lugar se observa que el m ejor m om ento para asegurar la calidad de los productos o servicios es durante el diseño de los m ism os. Para ello es necesario, por un lado, actuar sobre los proveedores para poder m ejorar la calidad de los com ponentes no fabricados en la em presa y, por otro, la utilización de herram ientas com o el diseño de experim entos (D EX ) o el Q uality Function D eployem ent (QFD) para intentar que las expectativas de los clientes se introduzcan y optim icen en la etapa de diseño y prototipo.
1.2 M a n te n im ie n to , m ejo ra e in n o v a ció n en la ca lid a d 1.2.1 Conceptos básicos En el terreno de la calidad es conveniente distinguir tres tipos de actividades diferentes: m antenim ien to, m ejora continua e innovación. El lector puede encontrar una buena presentación de estos conceptos en el libro K aizen de Imai (1986). Por actividades de m antenim iento entendem os todas aquellas actividades tendentes a conservar los estándares tecnológicos, de gestión y de operación actuales. m antenim iento = estandarizar + control
1C
EL ENTORNO DE LA CALIDAD TOTAL
Parece recomendable que, antes de embarcarse en cualquier programa de mejora de la calidad, una empresa estandarice la mejor forma conocida de operar y se asegure de que todo el personal trabaja de acuerdo a dichos estándares. En nuestra opinión, los estándares deben ceñirse a las operaciones verdaderamente importantes, deben estar redactados de forma clara y ser comprendidos por el personal que debe seguirlos. El control del cumplimiento de dichos estándares es responsabilidad de la gestión de la empresa Por actividades de mejora continua (Kaizen en japonés) entendemos todas aquellas actuaciones dirigidas hacia la mejora constante de los estándares actuales. Tal como indica Bill Hunter, todo proceso u operación además de producto físico, genera información suficiente para mejorarlo. Hasta tal punto es cierta esta afirmación que es muy probable ¿ue cuando un estándar está en vigor más de seis meses sin ser modificado, ello sea debido a que no es seguido por nadie dentro de la propia organización. Las actividades de mejora constante se realizan mediante la secuencia (Plan, Do, Check, Action), es decir, planificar la mejora, implementarla, verificar sus efectos y actuar en función de los resultados de dicha verificación, tal como explicamos en el apartado 1.2.2. Creemos importante destacar que a toda mejora en los estándares operativos deben seguir actividades de mantenimiento, ya que de lo contrario es casi seguro que los efectos beneficiosos de la mejora desaparecerán rápidamente (ver figura 1.5). Por actividades de innovación entendemos aquellas actividades sistemáticas tendentes a la creación de productos/servicios con fun ciones, operadvidad, coste, etc., nunca experimentados antes. Uno de los activos intangibles que toda empresa debería incrementar, lo constituyen las metodologías y herra mientas que permiten utilizar los conoci mientos y la creatividad de todo el per sonal de la organización para crear nuevos productos que satisfagan con creces las necesidades y expectativas de los clientes potenciales. Cada una de las actividades que acabamos de describir requiere distinto nivel de conocimiento y de respon sabilidad por parte del personal que la Fig. 1.5 M antenimiento, mejora e innovación realiza. Así, por ejemplo, Imai (1986) considera que la distribución del tiempo de trabajo de los distintos niveles de responsabilidad en las distintas acti vidades se distribuye en Japón según el gráfico de la figura 1.6. Destacan el poco tiempo dedi cado a las actividades de mantenimiento (el día a día) por parte de la alta direc ción, y el tiempo que dedican capataces y trabajadores a las actividades de mejora Fig. 1.6 C oncepción japonesa de las funciones continua.
M É T O D O S E S T A D ÍS T IC O S . C O N T R O L Y M E JO R A D E L A C A L ID A D
7C
1.2.2 El ciclo PD CA com o estrategia básica de los procesos de m ejora continua D e sd e su p rim e ra v is ita a Jap ó n en 1950, D e m in g tra n s m itió a los e je c u tiv o s e in g e n ie ro s ja p o n e s e s que a sistía n a sus se sio n e s de c o n su lta la im p o rta n c ia tra n s c e n d e n ta l d e la in te ra c c ió n c o n sta n te e n tre I+ D , d iseñ o , fa b ric a c ió n y se rv ic io p o stv en ta. E sta id e a se g e n e ra liz ó en lo q u e d iv e rso s a u to re s (Im ai (1 9 8 6 ), Ish ik a w a (1 9 8 5 )) han lla m a d o el v o la n te de D e m in g , ta m b ié n c o n o c id o p o r el c ic lo P D C A (P la n , D o, C heck, A c tio n ). L a v e rsió n d e Ish ik a w a del c ic lo P D C A se e n c u e n tra en la fig u ra 1.7. D ET ER M IN A R E ste c ic lo es ú til p a ra a c tiv id a d e s O B JE T IV O S Y v ' SU M E D ID A \ tan d iv e rsa s c o m o la p la n ific a c ió n e s tra / TO M A RLA S D E T E R M IN A R \ / D EC ISIO N ES té g ic a de u n a e m p re sa , o la m e jo ra del p r o / M ÉTODOS \ / ADECUADAS / PA R A \ c eso de d istrib u c ió n del c o rre o in te rn o en / ALCANZAR \ v' O B JE T IV O S \ la m ism a. E n el c o n te x to q u e d is c u tim o s en e ste c a p ítu lo , se p ro p o n e el c ic lo P D C A EDUCAR Y / \ V E R IF IC A R (controlar) ENSEÑAR / \ • El plan c o m o la e stra te g ia a se g u ir en to d a a c ti N. í \ ■R esultados de soluciones \ • R esultados globales v id a d de m e jo ra c o n sta n te de los e stá n d a re s / e x iste n te s en u n a o rg a n iz a c ió n . \ . IM PL E M E N T A R N / T R A B A JO E n p rim e r lu g a r d eb e p la n ific a r se í. (P lan ) la m ejo ra. L a etap a de plan ificació n com prende, entre otras actividades: F ig . 1.7 E l c ic lo P D C A a) definición de los objetivos a alcanzar, b) definición de m edidas que p erm itan saber en un m om ento dado el nivel de cu m p lim ien to de sus objetivos, c) definición del equipo responsable de la m ejora, d) definición de los recursos o m edios necesarios p ara alcan zar los objetivos propuestos. E n segundo lugar aparece la ejecución (D o) de las tareas necesarias p ara im p lem en tar la m ejora. E n esta etapa es im portante co nsid erar la n ecesidad de ed u car y en tren ar al perso n al resp o n sab le de la im plem entación de la m ejora. L a om isión de esta actividad suele h acer fracasar una b u en a parte de los proyectos de m ejora. E videntem en te la fase de ejecución requiere la puesta en p ráctica de las m o dificaciones del producto o del proceso que han sido co n sid erad as co m o o portunas y efectivas por el equipo de trabajo. En tercer lugar tenem os la etapa de eva lu a ció n (C heck). E sta fase es de enorm e im portancia. Se trata de v erificar los resultados de la im p lem en tació n de la m ejo ra co m p arán d o lo s con los o bjetivos iniciales. Es im portante aclarar en este p u n to que, en general, no es suficiente ev alu ar los resultados finales. En efecto, si fuese cierto algo del tipo: “Si se aplica la solución Y deb ería o b ten erse el resultado X ” , no se trataría de verificar si se ha obtenido X sino tam bién si se ha ap licad o la solución Y. F inalm ente, en cuarto lugar, tenem os la etap a de a ctu a ció n (A ction). D e la etapa de verificación debe desp ren d erse la n ecesid ad de actu ar sobre el pro ceso para co rreg ir los aspectos que hayan m erecido una ev alu ació n negativa. L a actuación puede im p licar y m ejo rar el propio plan, po r ejem plo, fijan d o nuevos objetivos, o m ejorando el p ro ceso de educación del personal, o m odificando la asignación de recursos para el proyecto de m ejora, etc. U na vez com pletado el ciclo es im p o rtan te seg u ir dando v ueltas al volante PD C A , rep itien d o las cuatro etapas en un nuevo proceso de m ejora. Sólo m ediante esta p ersev eran cia puede u n a em p resa m ejorar realm ente todos los procesos y, en consecuencia, la calidad de sus p roductos y servicios.
EL ENTORNO DE LA CALIDAD TOTAL
K
1.3 Conceptos básicos de gestión de la calidad total Este libro no cuenta entre sus objetivos entrar en el detalle de las diferentes teorías existentes sobre la gestión de la calidad total, que se encuentran desarrolladas en las obras de Deming (1982), Juran & Gryna (1980) e Ishikawa (1985), entre otros muchos autores. De todas maneras, lo que tienen en común las teorías de estos pensadores de la calidad total es que ésta se asienta sobre tres pilares: cultura de la calidad, sistemas y recursos humanos, y utilización ¿e la estadística. Si en una organización falla alguno de estos tres pilares, será difícil, por no decir imposible, introducir la gestión de la calidad total. En la figura 1.8 se resume lo que el consultor norteamericano Brian Joiner llama la teoría Q. La cultura de la empresa respecto a la calidad es un pilar esencial. Hoy en día es difícil encontrar directivos en las organizaciones que no digan que para ellos, la calidad es lo más importante. Pero por -esgracia, los hechos no siempre concuerdan con estas afirmaciones. Es fundamental que los rropietarios o la alta dirección se involucren en la introducción de esta cultura de la calidad en sus empresas. • Calidad determinada por las necesidades y expectativas de los clientes • Calidad se mejora perfeccionando todos los procesos. No inspección • Obsesión por calidad de productos, procesos, vida laboral
CULTURA
M ETODO CIENTIFICO
UN SOLO EQUIPO
• Liderazgo alta dirección • Datos para la acción • Identificar problemas
• Involucración de todo el personal en los procesos de mejora
• Identificar las causas básicas
• Educación y entreno
• Implementar soluciones
• Educación para la calidad • Proveedores y vendedores
Fig. 1.8 La teoría Q de Brian Joiner
M É T O D O S E S T A D ÍS T IC O S . C O N T R O L Y M E JO R A D E L A C A L ID A D
X
D ic h a cu ltu ra e m p ieza p o r re c o n o ce r que la calid ad v ien e d efin id a p o r las n ecesid ad es y ex p ectativ as del cliente, y no p o r co n sid eracio n es in tern as de los d e p artam en to s de la em p resa. L a idea fu n d am en tal es que los pro d u cto s y serv icio s d eb en c u m p lir siem p re las esp e c ific ac io n e s del clien te e in clu so so rp re n d er al m ism o con p restacio n es en las que ni tan siq u iera h a b ía p en sad o . E s esta calid ac ex citan te (en la d en o m in ació n de K ano (1987)) la q u e p u ed e cap tar n u ev o s u su ario s y am p lia r la cuota de m ercad o de la org an izació n q ue sea cap a z de fa b ricar este tip o de p ro d u cto s. A d em ás, c u an d o se h ab la de clien te, h ay q u e te n e r en c u en ta q u e n o s referim o s, ta n to al cliente ex tern o o d e stin atario final de los p ro d u cto s y serv icio s, co m o al clien te interno. E n este sen tid o es im p o rtan te te n er p resen te q ue to d a u n id ad o p e ra tiv a d en tro de la e m p resa se carac te riz a p o r tener p ro v e e d o res (el p ro ceso an terior), te n er clien tes (el sig u ien te p ro ceso ) y re a liza r las operaciones p ro p ias de la u nidad. T odo p ro ceso debe, pu es, in te n ta r satisfa c er las ex p ectativ as del p ro ceso que le sig u e (cliente in tern o ) y, p o r desco n tad o , in ten tar n o crearle p ro b lem as o in co n v en ien cias. O tra id ea b á sic a en el aspecto cu ltu ral de las o rg an izacio n es es q u e la calid ad se m ejora ú n ic am en te m ejo ran d o to dos los p ro ceso s de la o rg an izació n . L a m e jo ra co n stan te de la calid ad es re sp o n sa b ilid a d de to d o el p ersonal. D e h ech o p o d ría d ecirse que en c u alq u ier d escrip ció n de las fu n cio n es de un p u e sto de trab ajo d eb ería fig u rar la d e m ejo rarlo co n stan tem en te. A ten d ien d o al elev ad o p o rcen taje d e co m p o n en tes en un p ro d u cto fin al q u e son co m p rad o s a p ro v eed o res ex tern o s, p ero que el clien te fin al aso ciará a la e m p resa que sitú a el p ro d u cto en el m ercado, se ha im p u esto la id ea de que es im p o rtan te a so c ia r a los p ro v eed o res en la resp o n sab ilid ad d e la m ejo ra de la calidad. E sta idea, q u e en la v ersió n de D em in g se d e b ería re a liz a r m ediante co la b o ra ció n e n tre p ro v eed o r y co m p ra d o r en b en eficio m u tu o y en c o n v en io s a larg o o m ed io plazo, no siem pre se ap lica con este en fo q u e y puede g e n erar im p o rtan tes ten sio n es e n tre las p a rte > in v o lucradas. L os d istrib u id o res p u ed en a p o rta r in fo rm ació n p ertin en te sobre el c o m p o rta m ie n to de los p ro d u cto s c u an d o están en m anos del clien te y, en co n secu en cia, a p o rta r a la e m p resa d ato s sobre las n ecesid ad es y ex p ectativ as del m ercad o que d eb erían ser satisfech as p o r los p ro d u cto s y serv icio s de la organización. F inalm en te, el te rc er p ila r lo c o n stitu y e la u tilizació n m a siva d el m éto d o cien tífico y m ás en c o n creto de la estadística. El lecto r h ab rá o b serv ad o que h em o s p u esto en c u rsiv a la p a lab ra m asiva. E n efecto , no se trata tan to de q u e un p o rcen taje re d u c id o del p erso n al u tilice m éto d o s estad ístico s altam en te co m p lejo s sino de que en to d a la o rg an izació n se u tilicen d ato s fiab les p a ra la to m a de d ecisio n es a to d o s los niveles C o m o d ecía B ill H unter, (1) si una o rg an izació n d esea m e jo ra r sus n iv eles actu ales de calid ad > p ro d u c tiv id a d debe actuar, es decir, to m a r d ecisio n es; (2) p ara to m a r d ecisio n es es n ecesario disponer de b u e n a in fo rm ac ió n y, (3) la e sta d ístic a es la d iscip lin a esp e c ializa d a en co n v ertir d ato s en in fo rm ació n . D e este sim ple ra z o n am ie n to se d esp ren d e la im p o rtan cia del te rc e r pilar. C reem o s co n v en ien te in sistir en la n ecesid ad d e la ex isten c ia de los tres p ilares en toda o rg an izació n que q u iera situ ar la calid ad en el cen tro d e sus activ id ad es, y que d esee m ejo rar su p ro d u c tiv id a d y sus co stes p o r el ún ico c am in o real, que es la m ejo ra d e la calidad. A sí, p o r ejem plo, d e poco serv iría que se u tilizasen g ráfico s de co n tro l o d iseñ o d e e x p erim en to s en u n a e m p re sa donde no e x istiera la c u ltu ra necesaria, o se q u isieran so lu cio n ar los p ro b lem as d e calid ad m ed ian te la in tro d u cció n de círcu lo s de calid ad sin q u e ésto s su p iesen u tiliz a r las h erram ien tas e stad ísticas básicas y sin que la alta d ire c ció n asu m iera la resp o n sab ilid ad en la reso lu ció n de los p ro b lem as q u e sólo ella p u d iese abordar. E s im p o rtan te in sistir en e sta id ea d ad o q u e el p resen te lib ro se re fie re ex clu siv am en te a m éto d o s e stad ístico s y el le cto r p o d ría deducir, e q u iv o cad am en te, que son só lo esto s m éto d o s los n ecesario s p ara m ejo rar la calid ad de los p ro d u cto s y serv icio s de una o rg an izació n .
X
EL ENTORNO DE LA CALIDAD TOTAL
1.4 M étodos estadísticos en la calidad total En este libro presentamos algunos de los métodos estadísticos más utilizados para la mejora y el : ?ntrol de la calidad de productos y servicios. No pretendemos ser exhaustivos y quedan fuera de este trabajo algunos métodos de uso muy extendido como la regresión múltiple, la fiabilidad y los experimentos con mezclas, entre otros. En el capítulo 2 se presentan algunas herramientas básicas, conocidas como las herramientas de Ishikawa, cuyo uso sistemático y masivo en toda la organización es suficiente para resolver un porcentaje muy elevado de problemas de calidad. Uso sistemático significa entender las organizacio nes como sistemas y tener en cuenta, por lo tanto, que una modificación o mejora en un cierto proceso Tjede influir en otros procesos de la organización. El lector deberá, pues, prestar más atención al _: ncepto de uso sistemático y, uso por parte de todas las personas con un enfoque claro de mejora de calidad, que en las técnicas o herramientas en sí mismas. En el capítulo 3, se estudian de manera conceptual algunas ideas básicas de la teoría de la probabilidad, tales como variable aleatoria, densidad de probabilidad y función de distribución y los — délos probabilísticos más usuales. El capítulo 4 se dedica al estudio de las distribuciones asociadas a muestras aleatorias simples de ^oblaciones normales, que constituyen la base teórica necesaria para el desarrollo del resto del libro. En el capítulo 5 se presentan los métodos basados en la t-Student para comparar dos 7»; ?,aciones. En la práctica es frecuente que un mismo producto sea fabricado en dos o más procesos iéndcos que funcionan en paralelo. Antes de mezclar las producciones de dos máquinas, deberíamos ¿seguramos de que, efectivamente, están trabajando con la misma media y desviación tipo. Esta . —probación puede hacerse mediante pruebas de significación basadas en la t-Student para diseños realmente aleatorizados. Otro tipo de problemas que se resuelven con los métodos de la t-Student para diseños en ■ :ques aleatorizados son, por ejemplo, comparar una población de individuos antes y después de *^rer sido sometida a un tratamiento, como podría ser un plan de formación. En el capítulo 6 se generalizan los métodos estudiados en el capítulo 5, al caso de comparar más je ¿os poblaciones. Dicha comparación se realiza mediante técnicas de análisis de la varianza que se presentan para el caso de diseños totalmente aleatorizados y para diseños en bloques aleatorizados. Los capítulos 7 y 8 están dedicados a la presentación de los conceptos y métodos para el diseño je experimentos con factores a dos niveles. Se estudian tanto los diseños factoriales como los — : riales fracciónales con o sin bloqueo. El capítulo 9 extiende los conceptos de los dos capítulos interiores al estudio de las superficies de respuesta. Las aportaciones de G. Taguchi al diseño de productos robustos y las posibles mejoras a sus métodos, son objeto de estudio en el capitulo 10. Finalmente el capítulo 11 se dedica al estudio del control estadístico de procesos.
Herramientas básicas para la mejora de la calidad
práctica habitual en todas las empresas fijar unos objetivos en cuanto a ventas, producción, stocks, ‘•eneficios, etc., y periódicamente ir comprobando si los resultados obtenidos coinciden con las prev isiones realizadas, para tomar las acciones correctoras oportunas en el caso de que las desviaciones •r'pecto a lo previsto sean importantes. Sin embargo, las acciones en cuanto a la mejora de la calidad se toman en muchas ocasiones - _ ^ndose en sensaciones, impresiones u opiniones, pero no en el análisis científico de datos objetivos. Cada vez está más extendida la idea de que los problemas de calidad deben ser atacados mediante la aplicación de métodos científicos de recogida y análisis de datos (estadística). Pero el uso zc esta práctica no debe quedar restringido a un grupo reducido de “expertos en calidad” sino que todo rersonal puede (¡y debe!) participar en el proceso de control y mejora de la calidad. Naturalmente, no todos deben aplicar las mismas técnicas. Por ejemplo, los planes de i ocrim entación para la optimización de productos (que se estudian con detalle en los capítulos 7 y 8 ic este libro) exigen la utilización de importantes recursos materiales y requieren un cierto nivel de especialización y conocimientos; por tanto, deben quedar en manos de los cuadros técnicos. No obstante, existen otras técnicas que sí deben ser conocidas y utilizadas por todo el personal a empresa. Estas técnicas se conocen con el nombre de “Las siete herramientas básicas de Ishikawa”, ya que ha sido este ingeniero japonés el que más ha promocionado su uso, primero en Japón. con notable éxito, y después en el resto del mundo. Existe unanimidad entre los expertos de más prestigio en temas de calidad respecto a que estas sencillas herramientas, bien utilizadas por parte de todo el personal de la empresa, permiten solucionar : n i mo al 90 % de los problemas de calidad que se presentan. Conviene, por tanto, tenerlas presentes ■ mentar su utilización. Las herramientas son: ► Plantillas para la recogida de datos. ► Histogramas. ► Diagramas de Pareto. ► Diagramas causa-efecto. ► Diagramas bivariantes. ► Estratificación. ► Gráficos de control. En este capítulo se presentan con detalle las seis primeras. A los gráficos de control, por su mayor envergadura, se les dedica el capítulo 11 de este libro.
M É T O D O S E S T A D ÍS T IC O S . C O N T R O L Y M E JO R A D E L A C A L ID A D
2.1 P la n tilla s p a r a la r e c o g id a d e d a to s N o es difícil su p o n er que p a ra m e jo ra r la calid ad se n ecesitan datos. P ero m uchas v eces los datos to m an de fo rm a d eso rd en ad a o m al d o cu m en tad a, h acien d o im p o sib le su an álisis posterior. O tras veces los datos son in co rrecto s p o rq u e se h an to m ad o de fo rm a d istin ta a la p rev ista, y las co n clu sio n es que se o b tien en a p a rtir de éstos c arecen de sen tid o p o r m u ch o esm ero que se p o n g a en su análisis. P o r tanto, la reco lecció n de d ato s d ebe efectu arse de m a n era c u id ad o sa y ex acta, y para ell n ad a m e jo r que u tiliz a r p lan tillas e sp ecialm en te d iseñ ad as p ara cad a caso. L os objetiv o s q ue se p reten d en con el u so de las p lan tillas son: ► fa c ilita r las tareas de rec o g id a de la in fo rm ació n , ► e v ita r la p o sib ilid a d de erro res o m alos en ten d id o s, ► p e rm itir el an álisis ráp id o de los datos. L as p lan tillas p ara la reco g id a de d ato s p u ed en ten er d istin tas fin alid ad es: co n tro la r u n a variable de u n proceso, lle v a r un control de p ro d u cto s d efectu o so s, e stu d iar la lo calizació n de d efecto s en un p ro d u cto , e stu d iar las cau sas que o rig in an los d efecto s o re a liza r la rev isió n g lo b al de un producto. L as fig u ras 2.1 a 2.4 m u estran alg u n o s ejem p lo s. C
o n t r o l d e s e r p e n t in e s
Id en tifica ció n F ech a: Línea: O perario:
T ipo: L ote: H o ja d e ruta:
T o ta l revisad o: D e fe c to s: T o ta l
T ip o Sold ad u ra P oro D efo r m a d o In co m p leto O tros N o ta s e in cid en cia s:
F ig . 2 .1 E je m p lo d e p la n tilla para e l c o n tr o l d e p r o d u c to s d e fe c tu o s o s . E l c o n o c im ie n to d e c u á le s so n lo s d e fe c to s q u e se p resen ta n m á s c o r r ie n te m e n te p erm ite dar p rio rid a d a la s a c c io n e s q u e s e d e b e n to m a r _
d ato s 1. 2.
3.
.
.
.
,
i
.
F ig . 2 .2 P la n tilla para la lo c a liz a c ió n d e p er :* e n g u a n te s d e g o m a . O b s é r v e s e la d ife r e n c ia q u e s u p o n e c o n o c e r la in fo r m a c ió n q u e acpn fig u r a r e s p e c t o a sa b e r q u e “ s e presenLax. m u c h o s p o r o s ” . (T o m a d o d e J.M . Juran M aruuu d e C o n tr o l d e C a lid a d )
L a e x p erien c ia d e m u estra que en la rec o g id a de co n v ien e seg u ir algunas reg las, éstas son: N o to m a r d atos si d espués no se v an a utilizar. P u ed e p arecer o b v io p ero es una costum bre bastan te arraigada. L os datos inú tiles sólo sirv en p ara d ificu lta r la lo calizació n de los útiles. A seg u rarse de que los d atos se to m an de fo rm a que se an álisis sea fácil, d e lo co n trario p ro b ab le que no se h a g a nunca. E n treten erse en el d iseñ o de la p lan tilla d e rec o g id a de datos es u n a de las activ id ad es m ás ren tab les que p u ed en realizarse. N o p asar los d atos “a lim p io ” . E s u n a p érd id a d e tiem p o y u n a fu en te de erro res. Es n e c e s a n : anotarlos de fo rm a clara y o rd en ad a a la prim era.
X
HERRAMIENTAS BÁSICAS PARA LA MEJORA DE LA CALIDAD
INSPECCIÓN FINAL - ACCESORIOS M ETÁLICOS
Semana: Máqui.
Año: Opera
Lun. M
o Golpe
- Raya
Realizado por: Mar. T
+ Grieta
M
Mié. T
M
A Rebaba
Juc. T
M
Total
Vie. T
M
T
M
T
* Otros
Comentarios:
Fig. 2.3 Esquema de plantilla de inspección para estudiar las causas que ocasionan los defectos
27
I i a
! -i
Fig. 2.4 Porción de la plantilla utilizada en una inspección técnica de vehículos
71
M ÉTODOS ESTAD ÍSTICO S. C O N TROL Y M EJORA DE LA CALIDAD
2.2 H istogram as En muchos casos, si los datos han sido tomados de forma correcta, las conclusiones que se pueden obtener a partir de los mismos son inmediatas. Si no es así, raramente se precisan análisis estadísticos complicados, suele bastar con una adecuada representación gráfica. La tabla de datos que figura a continuación corresponde a una muestra, tom ada aleatoriamente durante 20 días, del peso en gramos de cierto embutido que puede ser elaborado por dos máquinas distintas (1 y 2), que a su vez son atendidas indistintamente por dos operarios (A y B).
1
O PERA R.
1 2 3 4 5
A B B B A
220.3 215.8 220 .4 221.5 215.7
215.5 2 22.0 218.7 227 .0 225.3
219.1 2 18.9 2 18.6 219.5 2 23.0
219.2 213.6 2 19.6 222.5 2 18.0
2 20.3 216 .9 222 .9 223.1 216 .0
2 0 8 .0 2 13.4 219.7 215.3 2 10.9
214 .4 217.7 209.4 220.4 221.4
219.2 217.7 2 21.6 2 1 5 .6 2 1 0 .9
6 7 8 9 10
A A B B A
222.7 2 16.0 219.4 219.8 2 20.2
215.1 218.8 218.3 222 .6 219.5
219.6 217.9 216.7 219.1 2 2 2 .4
2 17.3 213 .0 224.1 217.7 219.9
212.1 2 16.9 2 16.2 216.2 222.9
2 1 3 .0 2 1 6 .0 2 1 8 .4 2 12.2 214.3
2 18.0 213.5 2 16.6 2 1 6 .9 219.1
216.5 219.2 214.9 214.9 216.7
11 12 13 14 15
B B B A A
2 1 8 .0 2 19.3 220 .0 223.9 218.1
223.9 2 19.6 214.1 2 2 0 .6 218.8
219 .6 218.8 224.3 219.5 218.4
221 .9 2 1 9 .9 21 7 .4 219.6 217.9
214.9 2 1 9 .0 2 1 8 .0 211.8 214.6
2 12.6 2 16.7 219.5 2 1 8 .2 2 1 5 .7
219.4 216.4 219.5 218.3 2 1 8 .0
212 .3 213.5 222.3 217 .4 216.4
16 17 18 19 20
B B A A
216 .9 217 .9 2 2 4 .2 214.1 221.1
221.6 225.7 216 .2 219.7 225 .0
2 20.6 2 2 2 .2 2 19.9 2 2 2 .4 222.7
2 22.6 216.1 2 20.4 224.5 2 22.2
215.6 212.5 215.8 213.7 212.5
220.4 2 14.6 2 19.9 209.7 217.5
217.3 209.7 216.5 216.9 217.4
2 1 6 .2 211.3 2 11.9 213.1 215.7
M Á Q U IN A
M Á Q U IN A
2
D ÍA
Tabla 2.1 D atos sobre el p eso (en gram os) de cierto em butido
Las especificaciones del peso son 220 ± 10 g, y últimamente se han detectado ciertos proble mas a este respecto. Veamos cuál sería el diagnóstico de la situación y la propuesta de medidas a tomar a la vista de estos datos. Cuando se trata, como en este caso, de analizar la dispersión que presentan unos datos, la representación gráfica más adecuada es el histograma. Para realizar un histograma se marcan una serie de intervalos sobre un eje horizontal, y sobre cada intervalo se coloca un rectángulo de altura proporcional al número de observaciones (frecuencia absoluta) que caen dentro de dicho intervalo. Si se pretende comparar varios histogramas construidos con distinto número de datos, es preferible que las alturas de los rectángulos sean proporcionales al porcentaje de observaciones en cada intervalo o al tanto por uno (frecuencia relativa). Utilizando la frecuencia relativa en el eje de ordenadas también se facilita la comparación entre el histograma obtenido y un determinado modelo teórico representado por una función densidad de probabilidad (véase el capítulo 3). En este caso se considera que la frecuencia relativa es proporcional al área definida por cada columna. Puede interpretarse la función densidad de probabilidad como la representación del histograma cuando el número de observaciones tiende a infinito y la anchura de los rectángulos tiende a cero.
X
HERRAMIENTAS BÁSICAS PARA LA MEJORA DE LA CALIDAD
En la figura 2.5 se han realizado dos histogramas con todos los datos (en total 160). En el mstograma de la izquierda se ha colocado la frecuencia absoluta en el eje vertical y en el de la derecha i. rrecuencia relativa. La única diferencia es la escala vertical, pero naturalmente las conclusiones que r pueden obtener son las mismas: El proceso está descentrado y se está produciendo un cierto porcentaje de unidades fuera de tolerancias (por defecto). A partir de estos histogramas no puede : - tenerse ninguna otra conclusión, pero la forma en que se han anotado los datos permite construir ■ :ogramas para las unidades producidas por cada operario y también por cada máquina. Tj
DATOS GLOBALES
Fig. 2.5 Histograma de los datos globales, colocando en el eje vertical la frecuencia absoluta y la frecuencia relativa
Los histogramas realizados por operario no revelan nada útil, pero los realizados por máquina ' r . r a 2.6) ponen de manifiesto el origen del problema. Mientras que la máquina 1 está centrada y srxkice dentro de tolerancias, la máquina 2 está descentrada, y esto es lo que produce que un cierto ?<:**: retaje esté por debajo del peso mínimo. MAQUINA I
T,
MÁQUINA 2
Ts
Fig. 2.6 Histogramas correspondientes a las unidades producidas por cada máquina
También pueden realizarse gráficos por operario y máquina, pero no revelan nada que no ya. No hay diferencias entre operarios, la diferencia está en las máquinas.
MÉTODOS ESTADÍSTICOS. C O NTROL Y M EJORA DE LA CALIDAD
n
Los histogramas que se han presentado han sido elaborados con ayuda de un paquete de software estadístico. En algunos casos, especialmente si son los operarios los que analizan los datos que ellos mismos recogen, puede ser más rápido y cómodo construir los histogramas a mano. En este caso, conviene seguir una sistemática adecuada como la siguiente: 1. Colocar los datos a representar en filas de aproximadamente 10 números. 2. Identificar y señalar el máximo y el mínimo de cada fila. 3. A partir del máximo y el mínimo de cada fila, localizar el máximo y el mínimo globales. 4. Calcular el rango (R) de los datos. R = Valor máximo - Valor mínimo Optar por un número de intervalos (k), en primera aproximación, utilizando la siguiente tabla:
N Ú M . D E DATOS
N Ú M . D E IN T E R V A L O S
<50 5 0 - 100 1 0 0 -2 5 0 >250
5 -7 6 - 10 7 - 12 1 0 -2 0
6. Determinar la amplitud (h) de los intervalos, haciendo: k y redondeando el valor obtenido a un múltiplo exacto de la precisión de los datos. 7. Fijar los límites de los intervalos. Para evitar el problema que se presenta al asignar un valor a un intervalo cuando dicho valor coincide con el extremo superior de un intervalo y el extremo inferior del otro, conviene fijar dichos extremos con una precisión igual a la mitad de la precisión de los valores. Así, si los datos se presentan con un solo decimal y los extremos de los intervalos son de la forma 2,15 - 2,35, está claro que los valores 2,2 y 2,3 deberán situarse en este intervalo, 2,4 en el intervalo siguiente, etc. 8. Rellenar la tabla de frecuencias, indicando el número de veces que aparecen datos dentro de cada uno de los intervalos definidos. 9. Construir el histograma. En la figura 2.7 se presentan varias formas de histograma que responden a patrones de comportamiento típico. El histograma 1 corresponde a la forma de campana habitual que representa la variabilidad debida a causas aleatorias. El histograma 2, con dos máximos diferenciados, responde a una distribución denominada bimodal y se presenta cuando están mezclados datos de distinto origen centrados en valores distintos. El histograma 3 se denomina, por su forma, sesgado a la derecha, y responde a la variabilidad que presentan ciertas variables que no siguen una ley normal, como los tiempos de vida. También puede representar una magnitud con un “cero natural”, como la tolerancia entre eje y cojinete. Al histograma 4 parece faltarle una parte y por ello se le llama censurado (en este caso, a la izquierda). No representa una variabilidad natural y por tanto hay que sospechar que se han eliminado algunos valores. Esto ocurre si después de la producción se realiza una inspección al 100 % para separar las unidades fuera de tolerancias. En los histogram as 5 y 6 aparecen datos que no siguen el patrón de com portam iento general (anom alías, errores, etc.). Su variabilidad puede atribuirse a alguna causa asignable que deberá ser identificada y elim inada.
X
HERRAMIENTAS BÁSICAS PARA LA MEJORA DE LA CALIDAD
Histograma 1
r
Histograma 2
O
H istograma 3
□
Histograma 4
tk 31 Histograma 5
Histograma 6
Fig. 2.7 Diversas formas típicas que pueden presentar los histogramas
1 3 Diagramas de Pareto muchos aspectos de cualquier actividad industrial (y también no industrial) susceptibles de En algunos casos, la mejora es obligada, pero el problema a abordar es de tal envergadura que imposible de resolver. Pensemos, por ejemplo, en una línea de envasado que sufre frecuentes por avería en alguno de los módulos (no siempre el mismo) de que está compuesta. Puede la necesidad de cambiar la línea entera, pero en muchas ocasiones ésta es una inversión que se va postergando. 5 apongamos que después de tomar datos durante seis meses, la información obtenida puede mediante la tabla 2.2.
020053
n
M ÉTODOS ESTADÍSTICOS. C O NTROL Y M EJORA D E LA CALIDAD
CAUSA
Mañ. Rotura hilo Cinta Vibrador T om illo sin fin A pelm azam iento Rotura saco Otros
T IE M P O D E PA R A D A
N Ú M . D E PA R A D A S
(1) (2) (3) (4) (5) (6) (7)
18 15 92 1 0 2 1
Tar. 24 10 88 6 1 1 0
S 42 25 180 7 1 3 1
M añ. 20 12 62 2 0 4 8
Tar. 31 10 68 8 1 1 0
2 51 22 130 10 1 5 8
Tabla 2.2 Núm ero de paradas y tiem po de parada en una línea de envasado
La información que contienen estos datos se manifiesta de forma más clara construyendo unos gráficos como los de la figura 2.8.
NÚMERO DE PARADAS
TIEMPO DE PARADA (horas)
Fig. 2.8 Diagram as de Pareto para el núm ero total de paradas y el tiem po de parada total
Estos gráficos se denominan “diagramas de Pareto” y ponen de manifiesto que, cuando se analizan las causas de un problema, en general son unas pocas las responsables de su mayor parte. A estas pocas se les llama causas fundamentales, al resto, que son muchas pero ocasionan una pequeña parte del problema se les denomina causas triviales. En el caso que estamos analizando, sólo dos causas han ocasionado en torno al 80 % del problema (el 79,7 % del tiempo de parada y el 85,7 % del número de paradas). Por tanto, éstas serán las primeras causas a atacar. Todo el esfuerzo debe concentrarse en la eliminación de las causas fundamentales, ignorando en principio las triviales, que ya serán atacadas más adelante. Los diagramas de Pareto pueden aplicarse a situaciones muy distintas con el fin de establecer las prioridades de mejora, y siempre reflejan el mismo principio de “pocas fundamentales y muchas triviales”. La construcción de estos diagramas puede realizarse siguiendo los pasos que a continuación se indican:
HERRAMIENTAS BÁSICAS PARA LA MEJORA DE LA CALIDAD
I
Plantear exactamente cuál es el problema que se desea investigar, qué datos serán necesarios, cómo recogerlos (no olvidar el diseño de la plantilla) y durante qué período. Tabular los datos recogidos. Si se trata de analizar las reclamaciones de clientes durante un año, dicha tabulación tendrá el aspecto que se indica en la tabla 2.3.
A
TOTAL
TA B U LA C IÓ N
C A U SA
m
m
B
m
m
C
m t
i
D
m
m
10 .............
-h+t
-Htr
i¡
m
mi
42 6
........... . m
E
INI
F
m
-Htr
m
Otras
m
m
mi
104 4
-Htr
20 14 200
TO T A L
Tabla 2.3 Tabulación de los datos recogidos para la relación de un diagrama de Pareto
Rellenar el formulario previo a la construcción del diagrama. Las causas deben ordenarse de mayor a menor importancia, situando “otras” siempre al final. Para los datos de la tabla anterior, el formulario tiene el aspecto que se indica en la tabla 2.4. X Iniciar la realización del diagrama dibujando los ejes. Se coloca un eje horizontal dividido en antas partes como causas figuran en el formulario anterior, y dos ejes verticales. El eje de la zquierda se marca desde 0 hasta el total (de reclamaciones, en este caso) y el eje de la derecha, - L i e sirve colocar los porcentajes, se marca del 0 al 100 %. 5 Construir el diagrama de barras. La altura de cada barra debe corresponder al número de :? >ervaciones correspondientes a cada causa, de acuerdo con la graduación del eje de la izquierda. Construir el polígono de frecuencias acumulado y añadir toda la información relativa al gráfico t ara que pueda ser fácilmente interpretado. El resultado final tiene el aspecto que se presenta t- la figura 2.9. PO R C E N T A JE
N Ú M . DE
TO T A L
CA U SA
R EC LA M A C IO N E S
A C U M U LA D O
PO R C EN TA JE
ACUM ULADO
D B F A C E Otras
104 42 20 10 6 4
104 146 166 176 182 186 200
52 21 10 5 3 2 7
52 73 83 88 91 93 100
TOTAL
200
14
10Ó
Tabla 2.4 Formulario previo a la construcción del diagrama de Pareto
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
n
CAUSAS DE RECLAM ACION DEL M ODELO RS-232
Siempre que sea posible, es conveniente utilizar unidades monetarias en el eje vertical izquierdo. Consideremos, por ejemplo, que se ha realizado una auditoría final a un lote de productos y se han detectado 200 defectos por causas indicadas en la tabla 2.5. Con esta información, y realizando el diagrama de Pareto por número de defectos, se llegaría a la conclusión de que la primera causa a atacar es la A. Sin embargo, considerando los costes que origina cada tipo de defecto, la tabla podría ser la 2.6 y, por tanto, vista la situación de esta forma, la causa que tendría un interés prioritario sería la B. Otra recomendación importante es recoger Fig. 2.9 Ejemplo de representación de un diagrama de Pareto los datos de forma que puedan ser fácilmente estratificados según su origen (tumo, operario, máquina, día de la semana, tipo de materia prima, etc.) No hay que conformarse con un diagrama de Pareto global, sino estratificar según el origen de los datos, cor iparar los diagramas y sacar conclusiones. AÑO 1992
TIPO D E CAUSA
N Ú M . D E DEFECTO S
A B C D Otras
34
110 45 22 6 17
PR O PO R CIÓ N
PRO PO R CIÓ N A C U M U LA D A
0.55 0.23 0.11 0.03 0.08
0.55 0.78 0.89 0.92 1.00
Tabla 2.5 Causas ordenadas según su frecuencia de aparición
TIPO D E
NÚM. DE
C O STE
C O ST E PO R
PRO PO R CIÓ N
PR O PO R CIÓ N
CA USA
D EFEC TO S
UNITARIO
CAUSA
C O STE
A C U M U LA D A
0.51 0.25 0.15 0.03 0.06
0.51 0.76 0.91 0.94 1.00
B A c D Otras
45 110 22 6 17
5 1 3 2 1.5
225 110 66 12 22.5
Tabla 2.6 Causas ordenadas según el coste ocasionado por cada una de ellas
2.4 Diagramas causa-efecto En muchas ocasiones, cuando se presenta un problema, se confunde su resolución con la eliminación de los efectos que produce, y esta práctica suele traer consigo malas consecuencias. Ishikawa, en su libro ¿Qué es el control total de calidad?, presenta un caso de su propia experiencia. Explica que cierto dispositivo iba unido a una máquina por medio de cuatro pernos. El perno 1 se rompía con frecuencia por lo que se decidió sustituirlo por otro de mayor diámetro. A partir del cambio no se volvió a romper el perno 1, pero empezó a romperse el perno 2. Ante la nueva situación se decidió que los cuatro pernos deberían ser más grandes y se procedió al cambio. Ya no
H ER R A M IEN TA S B Á SIC A S PARA LA M EJO R A D E LA C A LID A D
•otvió a rom per ningún perno, pero em pezaron a er fracturas en la placa de hierro en la que estaba el dispositivo. Se cambió la placa de hierro por otra gruesa y se anunció que el problem a había quedado lio definitivamente. Un estudio más profundo realizado posteriorm ente de m anifiesto que una vibración que llegaba al ítivo era lo que ocasionaba los fenóm enos de F ig. 2 .1 0 D isp o sitiv o u n id o a una m áquina por cuatro pernos y que si no se elim inaba acabaría rom piendo la placa m etálica o inutilizando el dispositivo con consecuencias. Lo que se había hecho era intentar evitar el efecto del problema, pero sin elim inar su causa, y si permanece, el efecto vuelve a manifestarse, de form a aún todavía más perjudicial. Para solucionar un problema deben estudiarse sus causas y eliminarlas (en el caso de Ishikawa la era la vibración, aunque también debería haberse investigado el origen de la misma). La idea está para solucionar un problema: ¡atacar las causas, no los efectos! Pero descubrir el entramado de posibles causas que hay detrás de un efecto no es fácil. Para hacerlo . eniente seguir una determinada metodología y construir el llamado “diagrama causa-efecto” 1. Una forma de hacerlo es siguiendo los puntos que ha continuación se describen: Determinar e identificar claramente cuál es el efecto (el problema, la característica de calidad, etc.) a estudiar. 1 Reunir a las personas que puedan aportar ideas sobre el origen del problema y realizar un brainstorming de posibles causas. Existen distintas formas de organizar este tipo de reuniones, pero el objetivo básico es siempre .segurarse de que cada participante aporta todo lo que lleva dentro. Una posibilidad es establecer rondas de intervenciones en las que todos participen siguiendo un orden establecido. Cada persona deberá ir aportando posibles causas hasta que las ideas se hayan agotado totalmente. - Realizar una selección de las causas aportadas. Seguramente algunas de las causas que aparecen en -1 brainstorming son descabelladas o están repetidas. Es necesario, por tanto, realizar una selección ¿cordada de cuáles son las causas que deben aparecer en el diagrama. Construir el diagrama. Con todas las causas aportadas, una sola persona, especialista en estas u reas y con un buen conocim iento del M aquinaria M ano de obra Materials 7* ?blema estudiado, debe ser la respon sable de construir el diagrama. En el diagram a las causas se presentan —_ jerarquizada y agrupadas en unos ^eis grandes grupos denom inados Efecto prim arias”, las cuales suelen ser: mano m aquinaria, m ateriales, m étodos, B ebiente y m antenim iento (conocidas seis M). C ada causa prim aria está M antenim iento M étodo por varias secundarias, estas últimas y así sucesivam ente, tal com o F ig . 2.11 D isp o sic ió n jerarquizada de causas en un diagram a ca u sa -efecto en la figura 2.11.
—-rr^m a de esp in a de p e z ” o “diagram a de Ish ik aw a”
M ÉTODOS ESTADÍSTICOS. CO NTROL Y M EJORA DE LA CALIDAD
K
En la figura 2.12 se reproduce un diagrama en el que sólo se han consi derado cuatro causas primarias. No debe perderse de vista que las causas anotadas en el diagrama son causas potenciales. Por tanto, será necesario recoger datos para confirm ar que las relaciones causa-efecto realmente existen. Como consecuencia de lo anterior, el diagrama causa-efecto debe ser consi derado un diagrama vivo. Es decir, un Fig. 2.1 2 E jem plo de diagrama causa-efecto diagrama que va cambiando a medida que se van adquiriendo nuevos conocimientos sobre el fenómeno estudiado. Algunas causas desaparecen porque se han logrado eliminar, otras porque se ha constatado que no influyen. Cuando una causa deja de ser considerada, debe tacharse, más que borrarse, para dejar constancia de que ya se ha estudiado. También pueden aparecer nuevas causas potenciales que en un primer momento no se habían considerado. MANO DE OBRA
MAQUINARIA
2.5 D iagram as bivariantes Una forma de com probar si existe relación entre una característica de calidad y un factor que puede afectarle es la construcción de diagramas bivariantes. El profesor Hajime Karatsu, en su libro CTC. La sabiduría japonesa , explica un interesante caso en el que la utilización de este tipo de diagramas perm itió resolver un importante problema. Dice así: “El sintonizador suele ser lo prim ero que se estropea en un televisor Actualm ente los boto nes electrónicos son algo corriente, pero en el pasado todos los selectores de canal tenían que girar se manualmente y podían funcionar m al si el sintonizador tenía un contacto pobre. El sintonizador es el punto en que las ondas m agnéticas se captan por prim era vez. Los sin tonizadores estandarizados se producían en masa y se empleaban en distintos modelos de televisor. Hace algún tiempo, un experto en control de calidad investigó el nivel de mal funcionam iento de los sintonizadores. D escubrió que, aunque se utilizaban sintonizadores idénticos, la proporción de mal funcionam iento era muy distinta de un modelo de televisor a otro. Se dio cuenta de que el problema debería estar relacionado con alguna cosa que no fu era el propio sintonizador; no obstante, seguía teniendo el problema de descubrir el verdadero fa cto r entre varias alternativas posibles. La gente utiliza sus televisores de distinta manera; algunos los colocan en rincones polvorientos, otros los tienen en el salón, más o menos como un objeto decorativo. La frecuencia de uso y la fuente de elec tricidad también pueden ser distintas. En consecuencia, la avería de un televisor podía estar cau sada p o r el entorno o p o r un simple error en el proceso de fabricación. Los datos reunidos en cien tos y cientos de televisores revelaron, sin embargo, que los sintonizadores se estropeaban en función del tipo de televisor en que habían sido instalados. El experto en control de calidad analizó los datos desde distintos ángulos y descompuso en factores cada una de las condiciones concebibles y su relación con la proporción de averías: ¿Estaba relacionada con el tamaño de la caja, o con un aumento de la temperatura? ¿Se trataba de la longitud del eje del sintonizador o de la diferencia en unidades de corriente eléctrica? Durante bastante tiempo, parecía que no había ninguna correlación entre ninguno de los factores, pero al fin a l surgió la causa.
7t
----------------------------------------------------------------------------------------------------------------------
HERRAMIENTAS BASICAS PARA LA MEJORA DE LA CALIDAD
La correlación residía en la distancia entre el sintonizador y el altavoz. Cuanto más cerca estaba el sintonizador del altavoz, con más frecuencia se averiaba; cuanto más lejos, menor era la proporción de mal funcionamiento. Una vez establecida esta correlación, los fabricantes empezaron a colocar los altavoces tan lejos de los sintonizadores como permitían los cajas, y el resultado fu e que las quejas de los consumidores se redujeron drásticamente”. Fig. 2.13 Diagrama de correlación entre la proporción (figura 2.13) de averías y la distancia altavoz-sintonizador, obtenida La construcción de un diagrama a partir de los datos de un gran conjunto de televisores bivariante puede realizarse de la siguiente forma: 1. Reunir pares de datos de las variables cuya relación se desea investigar. Con TE M P. R EN D . OBS. TEM P. R EN D . O B S. menos de 30 pares es difícil sacar conclusiones. En tomo a 50 suele ser 94.0 162 94.6 26 160 1 91.3 154 93.0 27 110 2 suficiente. 92.5 148 93.9 28 138 3 2. Trazar los ejes. Decidir las escalas de 92.7 29 140 92.0 4 116 forma que ambos ejes tengan aproxi 92.2 152 92.8 30 150 5 madamente la misma longitud. 134 92.0 136 92.5 31 6 93.5 93.5 32 162 7 158 Marcar los ejes con valores fáciles de 95.2 126 91.5 33 180 8 leer. 92.1 93.8 34 142 9 140 Si una variable es una característica de 92.4 35 152 10 160 93.6 36 170 92.9 11 160 92.6 calidad y la otra un factor (de diseño o 94.1 37 150 91.5 12 160 de producción), se sitúa la primera en el 93.0 144 92.9 38 160 13 eje vertical. 104 91.0 39 14 120 91.0 3. Situar los puntos en el gráfico. Si dos o 40 130 92.5 15 126 92.0 134 92.4 41 160 93.1 16 más puntos coinciden, se señala mar 164 93.4 42 138 93.0 17 cando círculos concéntricos. 93.4 43 152 18 162 93.6 4. Incorporar toda la información perti 93.4 44 130 132 92.3 19 92.0 45 110 20 130 91.1 nente que ayude a interpretar el gráfico 92.5 93.0 46 120 21 170 (título del diagrama, número de pares 92.3 91.4 47 110 22 148 de datos, título y unidades de cada eje, 92.8 144 48 152 23 93.0 identificación del autor, etc.). 92.0 49 172 24 112 91.6 92.6 50 126 126 92.0 25 Los datos de la tabla 2.7 indican la temperatura a que se ha realizado cierta reacción química y el rendimiento que se ha obtenido en Tabla 2.7 D atos correspondientes a las temperaturas de realización y el rendimiento obtenido en 50 reacciones químicas la misma. A partir de esta tabla se obtiene el gráfico de la figura 2.14. Los diagramas bivariantes pueden presentar distintos aspectos según el tipo de relación que exista entre las variables. En la figura 2.15 se han representado los diversos tipos de diagramas que pueden aparecer. En algunas ocasiones no está claro si existe o no correlación. Para estos casos, Ishikawa propone la realización del llamado “test de correlación de las medianas”. Para ello se sigue el siguiente procedimiento:
M ÉTODOS ESTADÍSTICOS. CONTROL Y M EJORA DE LA CALIDAD
n
R E L A C IO N T E M P E R A T U R A -R E N D IM IE N T O R e a c to r B. P e río d o e n e ro -fe b re ro d e 1993 (N = 5 0 )
T e m p e ra tu ra ( °C )
Correlación. positiva
C orrelación negativa
Posible correlación positiva
P osible correlación negativa
R elación no lineal
N o correlación
Fig. 2.14 Diagrama bivariante elaborado a partir de los datos de la tabla 2.7
38
Fig. 2.15 D istintos aspectos que puede presentar un diagrama bivariante
HERRAMIENTAS BÁSICAS PARA LA MEJORA DE LA CALIDAD
1. Determinar las medianas de las x (variable colocada en el eje horizontal) y de las y (variable colocada en el eje vertical). 2. Trazar ambas medianas en el diagrama bivariante. De esta forma, el diagrama queda dividido en cuatro cuadrantes, que son notados como I, II, III y IV, a partir del extremo superior derecho y en sentido contrario a las agujas del reloj. 3. Contar los puntos que quedan en cada cuadrante excluyendo los que están situados sobre las medianas. Determinar la suma de puntos en los dos cuadrantes opuestos (I y III o II y IV) que presenten la suma menor. Este número se denomina “valor de prueba”. 4. Comparar el valor de prueba en la tabla 2.8. Si el valor de prueba obtenido es igual o inferior a la cantidad límite que se da en la tabla, puede decirse que existe correlación con una probabilidad de error igual o menor al 5 %. La justificación teórica de las cantidades límite de la tabla requiere el uso del modelo binomial que se estudia en el capítulo 4.
N ÚM . DE
LÍM ITE D EL VALOR
N Ú M . DE
LÍM ITE D EL VALOR
PUN TO S
DE PRU EBA
PUNTOS
D E PRU EBA
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 1
54 55
5 5 5 6 6 7 7 7 8 8 9 9 9 9 10 10 11 12 12 12 13 13 14 14 15 15 15 16 16 17 17 18 18 18 19
56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
20 20 21 21 21 22 22 23 23 24 24 25 25 25 26 26 27 27 28 28 28 29 29 30 30 31 31 32 32 32 33 33 34 34 35
19
Tabla 2.8 Límites del valor de prueba para el test de correlación de Ishikawa
K
M ÉTODOS ESTADÍSTICOS. C O N TR O L Y M EJO R A DE LA CALIDAD
CUADRANTE
En el diagrama tem peratura-rendim iento (figura 2.16), los puntos que se obtienen en cada cuadrante son:
PU N TO S
I n in IV
18 5 18 5
Por tanto, en este caso el valor de prueba será 10 (número de puntos en los cuadrantes II+IV). El número de puntos a considerar es de 46, ya que del total se restan los que caen sobre las medianas (cuatro en este caso). El valor límite que da la tabla para N=46 es 15, y como 10<15, podemos afirmar con una probabilidad de equivocamos menor del 5 % que existe correlación entre temperatura y rendimiento. (Ver figura 2.16.) R ELA C IO N T E M P E R A T U R A -R E N D IM IE N T O Reactor B.
|
Período enero-febrero de 1994
©
95
+
-3 ac> *
(N = 50)
94
93
+
+
++++ + 92-
*
+ + +
+
+
+
+
+
+
+
* +*
: +
+++
*
. *
+ + +
++ ©
9 0 --------------1 ------------ 11------------ i1------------ i1------------ i1 i-----------100 120 140
i 160
i
ri 180
Temperatura ( C )
Fig. 2 .1 6 Test de correlación de Ishikaw a sobre los datos de la tabla 2.7
Respecto a la construcción de este tipo de diagramas, cabe hacer las siguientes recomen daciones: 1. Representar los datos con distinto símbolo según su origen (estratificar). Observe la figura 2.17. El diagrama de la derecha representa la relación entre la humedad final de un producto tras un pro-ceso de secado y el tiempo de molturación a que fue sometido previamente. Del análisis de este diagrama parece deducirse la inexis-tencia de correlación. Sin embargo, no se ha considerado que las medidas han sido toma-das por dos aparatos distintos, y teniendo este hecho en cuenta, se ha representado el diagrama de la derecha. Éste no es un caso raro, puesto que, cuando se toman medidas con dos aparatos distintos, éstos pueden estar calibrados de forma distinta y conviene distinguir los puntos que han sido obtenidos con uno u otro aparato. Lo mismo podríamos decir si los datos hubieran sido tomados por dos (o más) operarios, de varios tumos, de varias máquinas, de materias primas de distinto origen, etc.
n
HERRAMIENTAS BÁSICAS PARA LA MEJORA DE LA CALIDAD
o Aparato A • Aparato B
Datos mezclados
o o o o o o o 0 ° 0 0 O o o o o o o 0 0 o o o
o
o
o
o
O
0
o O <
o
Fig. 2.17 Diagrama bivariante con los datos sin estratificar y estratificados
2. Aunque los datos históricos de que se dispone no indiquen la presencia de correlación, no significa que ésta no exista. Quizá los datos de que se dispone, sobre el factor cuyo efecto se estudia, se mueven en un rango de variación demasiado pequeño para poner de manifiesto la correlación existente, tal como pone de manifiesto la figura 2.18. 3. La existencia de correlación no implica una relación causa-efecto. Condiciones Se ha comprobado que existe una alta de producción correlación entre la temperatura media de un mes y el número de matrimonios que durante • • . * ese mes se celebran. Sin embargo, no cabe • • • • * • • • ¿ • esperar que una ola de calor en el mes de T • • • • • • • . • * > • • febrero aumente el número de matrimonios • . • ese mes. Esta relación es debida a otras • :• • • • • • • • • • variables interpuestas (en este caso, quizá: • •: calor - vacaciones, vacaciones - matrimonio). * -----Es necesario, por tanto, ser prudente a la hora de sacar conclusiones ante un diagrama que Fig. 2.18 Aunque los datos de que se dispone no indiquen presenta una clara correlación. la presencia de correlación, no significa que ésta no exista
2.6 Estratificación Lu estratificación es también una de las siete herramientas básicas que propone Ishikawa. En realidad, no es una técnica nueva, sino que es una metodología que conviene incorporar a cada una de las "crramientas que ya hemos visto. Así, las plantillas para la recogida de datos deben pensarse para que posteriormente pueda ■erizarse los análisis dividiendo los datos según su origen. En el caso de los histogramas, los diagramas de Pareto o los diagramas bivariantes, una correcta estratificación permite obtener una ■formación de gran importancia que, de otra forma, no se pondría de manifiesto.
n
M É T O D O S E S T A D ÍS T IC O S . C O N T R O L Y M E JO R A D E L A C A L ID A D
E je r c ic io s
2.1
D urante una sem ana, se ha m edido diariam ente el contenido de hum edad co rrespondiente a 24 paquetes de un determ inado producto, tom ados al azar a la salida de una línea de envasado. Los resultados obtenidos son: LUNES
MARTES
M IÉ R C O L E S
JU E V ES
VIERNES
8.05 8.7 6 8.51 8 .18
8.20 8.36 8.37 8 .52 8.61 9 .1 4 8 .5 2 9 .2 0 9.43 8.85 8.66 8.89 8.97 9 .0 2 9.61 9 .1 5 8.46 8 .0 0 8 .32 8.91
8.48 8 .3 4 8.51 8.08 8 .3 2 8.33 8.41 9.0 7 8.8 6 9.2 8 8.5 0 9 .1 9 8 .7 6 9.21 8.7 6 9 .4 0 8.64 8.81 8.73 8.73
8.53 8.6 4 8.83 8.35 8.59 8.66 8.7 0 9 .0 8 9 .5 9 9.15 8.75 9 .1 8 8 .8 6 8.75 9 .6 4 9 .05 8.97 8 .2 0 8.33 8.2 6
9 .3 0 8.5 8 8.81 8.68 9.2 8 9 .1 4 9.41 9 .3 4 9.21 9 .5 3 9 .2 8 9 .2 8 8.17 8 .6 0 8.48 8.65
8.15 8.15 8.68 8.7 9 9.0 8 9.1 3 8.6 9 8.46 9.1 9 9 .1 2 9 .2 0 8 .8 0 9 .5 5 9 .5 0 9.48 9.58 8.4 0 8 .6 0 8.47 8 .1 0
8 .7 9 8.91 8 .3 2 8 .4 9 8.43 8.6 6 9 .1 7 8 .5 6 9 .2 2 8.85 8.5 6 9 .4 6 9.3 8 9.5 8 9 .0 9 9 .4 6 8.17 8.11 8.05. 8.89
Indicar qué conclusiones se pueden o b ten er a p artir de estos datos.
2.2
C onstruir los diagram as causa-efecto para los siguientes efectos: a) llegar tarde al trabajo, b) suspender un exam en, c) d errota en una com petición deportiva.
2.3
E n un diagram a causa-efecto aparece la tem p eratu ra de la m atriz de una prensa com o posible causa de la aparición de poros en el producto. Para confirm arlo, se recogen datos de 50 prensadas y se realiza un diag ram a bivariante entre la tem peratura (7) y el núm ero de poros obtenidos (P). Indique cuáles serían las conclusiones obtenidas al realizar el test de correlación de Ishikaw a, en cada uno de los siguientes casos. A
19
B
c
D
10
5
8
CUADRANTE
1
CUADRANTE
2
4
12
20
21
CUADRANTE
3
20
11
5
8
CUADRANTE
4
5
10
20
13
K
2.4
HERRAMIENTAS BÁSICAS PARA LA MEJORA DE LA CALIDAD
Los datos que figuran a continuación corresponden a una característica de calidad de cierto producto (y), y los valores de cuatro factores de producción (x r x2, x3, x4), que se considera que pueden influir en ella.
1
NÚM.
y
Xl
X2
X3
x4
NÚM.
y
Xl
X2
X3
x4
1 2 3 4 5
18.96 12.81 11.15 19.38 18.41
6.39 5.54 5.24 6.44 6.33
8.34 6.90 6.44 8.43 8.22
5.25 6.03 6.10 5.17 5.34
9.99 9.23 8.89 10.02 9.94
16 17 18 19 20
25.27 15.04 20.65 11.15 18.53
7.01 5.89 6.57 5.24 6.34
9.58 7.46 8.69 6.44 8.25
3.96 5.82 4.94 6.10 5.32
10.28 9.58 10.10 8.89 9.95
6
7 8 9 10
Vi .00 10.37 15.39 11.90 21.50
5.51 5.08 5.94 5.38 6.66
6.95 6.21 7.54 6.65 8.86
6.02 6.11 5.78 6.08 4.77
9.21 8.70 9.63 9.06 10.15
2\ 22 23 24 25
2?» .55 11.81 23.51 25.74 12.64
6.%6 5.36 6.86 7.05 5.51
9.26 6.63 9.25 9.67 6.85
4.3>4 6.08 4.35 3.85 6.04
\0.23 9.04 10.23 10.28 9.20
11 12 13 14 15
11.45 18.04 10.63 17.39 13.27
5.29 6.28 5.13 6.20 5.62
6.53 8.14 6.29 8.00 7.02
6.10 5.40 6.11 5.50 6.00
8.96 9.91 8.76 9.85 9.31
26 27 28 29 30
25.45 18.26 10.56 15.46 10.98
7.03 6.31 5.12 5.95 5.20
9.61 8.19 6.27 7.56 6.39
3.92 5.37 6.11 5.77 6.11
10.28 9.93 8.75 9.64 8.85
Realizar diagramas bivariantes e indicar qué conclusiones se pueden obtener con estos datos. Hace unos años, en una revista editada en la Escola Técnica Superior d ’Enginyers Industriáis de Barcelona (ETSEIB), aparecía una nota de la Dirección de la Escuela en la que se informaba que en el primer parcial de ese curso se había gastado el 75% de todo el papel de examen que se necesitó en el curso anterior. Se incluía también la siguiente tabla: DEPARTAMENTO Matemáticas M ecánica Cons. Arq. Ind. Gestión empresarial Ing. Eléctrica Informática Proyectos Téc. Cuant. Gestión Técnicas Exp. Gráf. Transp. y motores Ing. Electrónica Ing. Química Yis'ica Ing. Cibernética M ecánica de fluidos Ing. de materiales Química Ing. Nuclear Termodinámica
ALUMNOS
HOJAS
2282 1030 178 682 675 515 173 560 1114 329 350 181
27000 35000 700 2700 8100 2000 1000 5500
vyn
9500
222 630 47 0 1128 258 723
1900 3500 5500 8500 1000 450 0
— 3900 4000 2700
Desde el punto de vista de la economía de la escuela y con el único objetivo de disminuir al máximo el consumo de papel, si sólo se pudiera llamar la atención a un departamento, ¿cuál habría escogido usted?
K
M É T O D O S E S T A D ÍS T IC O S . C O N T R O L Y M E JO R A D E L A C A L ID A D
Justifique su respuesta realizando el gráfico que le parezca m ás adecuado. 2.6
El núm ero de piezas defectuosas detectadas en un m es debido a diversas causas es el que se m uestra a continuación: CAUSA
P resión T em peratura R u id o H u m ed ad O tros
N Ú M . D E P IE Z A S D E F E C T U O S A S
42 15 10 6 12
Se realiza u n a m odificación para intentar reducir el núm ero de piezas defectuosas y se obtienen los siguientes resultados: CAUSA
P resió n T em peratura R u id o H u m ed a d O tros
N Ú M . D E P IE Z A S D E F E C T U O S A S
5 11 9 7 12
R ealice un gráfico que ponga de m anifiesto los efectos de la m odificación introducida.
K
HERRAMIENTAS BÁSICAS PARA LA MEJORA DE LA CALIDAD
Apéndice 2A Datos e información No es extraño que en una empresa se recojan y archiven gran cantidad de datos y, sin embargo, cuando se pretende solucionar un problema concreto, no se disponga de los datos para realizar un diagnóstico seguro. O los datos son incompletos o, simplemente, no son fiables. J. M. Juran aclara esta aparente paradoja, distinguiendo claramente entre los conceptos de datos e información. Los datos pueden definirse como la concreción numérica de hechos o realidades, mientras que la información debe entenderse como la respuesta a preguntas previamente planteadas. Datos = Hechos, realidades Información = Respuesta a preguntas Cuando se plantea un problema, su resolución exige disponer de una cierta información •respuestas a preguntas del tipo, ¿con qué frecuencia se presenta el problema?, ¿en qué circunstancias >e presenta?, etc.). Pero, mientras que la buena información siempre está basada en datos, un determinado volumen de datos, por grande que sea, no necesariamente aporta la información que se rrecisa para resolver el problema. La “información” incluye “datos”. Los “datos” no necesariamente incluyen “información”. Así pues, la clave no está en cómo recoger datos, sino en cómo obtener información que resulte útil.
El proceso de generar información puede resumirse en las siguientes etapas: Formular claramente las preguntas que se desea contestar. Recopilar datos relativos a la cuestión planteada. Analizar los datos para determinar la respuesta a la pregunta. Presentar los datos de forma adecuada para poner claramente de manifiesto cuál es la respuesta a la pregunta. Es importante tener presente cuál es la pregunta que se desea contestar, cuando se planifica la re-cogida de datos. Unos datos correctos y muy exactos, recopilados mediante un elaborado diseño de muestreo estadístico, son inútiles si no permiten contestar alguna pregunta de interés. 1. 2. 3. 4.
3 Causas y medidas de la variabilidad
Consideremos el proceso de correr 100 m libres por parte de un atleta. En principio cada carrera representa una repetición de ciertos pasos del proceso: precalentamiento, colocación en los tacos de salida, la salida en aceleración, mantenimiento de la velocidad, etc. La evidencia nos indica que, a pesar de que se intenta repetir todos los pasos en forma idéntica, el resultado no es el mismo en todas las carreras. Esta variación en el ‘"producto” (resultado de la carrera en nuestro ejemplo) recibe el nombre de variabilidad y está presente en todo proceso real, de modo que no se puede predecir con exactitud el resultado de una carrera antes de que ésta se celebre. Ello no significa que la variabilidad no se pueda medir. En nuestro ejemplo, sí suele ser posible saber el tiempo aproximado en que acostumbra a correr la prueba el atleta en cuestión, o con qué frecuencia corre por debajo de 10,2 seg por ejemplo, ya que no hay que confundir la variabilidad con ausencia total de regularidad. En la vida real, casi siempre hay que tomar decisiones en presencia de “ruido” o variabilidad, la estadística la disciplina especializada en el tema. En este capítulo se analizan conceptualmente las distintas causas que generan variabilidad en la mayoría de procesos, y se introducen los importantes conceptos de función de densidad de probabilidad y función de distribución que nos permiten medirla.
3.1 Causas de variabilidad _ r.'ideramos el proceso genérico de la figura 3.1. ENTRADAS
PRO D U CTO
M étodos — Mano Obra — M á q u in a s-----
PRO C ESO
Materia prima E ntorno-------Variabilidad Fig. 3.1 Variabilidad en un proceso
MÉTODOS ESTADÍSTICOS.CONTROL Y MEJORA DE LA CALIDAD
n
En la práctica, existen siempre variaciones en las entradas de un proceso y, en consecuencia, existirán diferencias (variaciones) entre las características de las distintas unidades de producto obtenidas como salida del proceso. Si, por ejemplo, consideramos un cierto proceso de mecanización de piezas de acero y de cada pieza medimos su diámetro, el histograma de la parte derecha de la figura 3.1. representará la variabilidad del diámetro de las distintas piezas producidas. Toda variabilidad tiene sus causas, y el hecho de que los diámetros de dos piezas fabricadas por el mismo proceso sean distintos es la consecuencia de variaciones en la materia prima (diferencias en el porcentaje de carbono entre distintas partidas de acero), de la variabilidad en la mano de obra (los operarios no trabajan siempre de la misma manera), o de la variabilidad en cualquier otra entrada del proceso. Un hecho de trascendental importancia, y que justifica la gran utilidad de la estadística en el estudio de la variabilidad, consiste en que, aunque los diámetros de las distintas piezas sean distintos, si se mantiene constante el sistema de causas que producen variabilidad en las entradas, las frecuencias con que se observan los distintos valores de los diámetros tienden a estabilizarse en forma de una distribución predecible. En otras palabras, si bien el diámetro de una pieza individual es impredecible, cuando el sistema de causas de variabilidad es estable, se pueden hacer predicciones estadísticas sobre grupos de piezas. En la argumentación anterior ya se intuye que las causas de variabilidad podrán tener consecuencias muy distintas, dependiendo de que su presencia en el proceso sea estable o esporádica. Pero lo más importante es que, según cuales sean las características de una causa de variabilidad, su eliminación del proceso o, por lo menos, la reducción de sus efectos corresponderá a distintos niveles de autoridad y responsabilidad dentro de la organización. Como se explica en Peña, Prat (1986), bajo supuestos muy generales, las pérdidas que un producto causa a la sociedad cuando se utiliza son directamente proporcionales a la variabilidad de la característica de calidad del producto en cuestión. Por ello, en general, será cierto que: MEJORAR LA C A LID A D
----- -
REDUCIR LA VARIABILIDAD
Así pues, la estrategia básica para la mejora de la calidad pasa por la identificación de las causas que producen variabilidad, y por una correcta asignación de la misma a una u otra de las dos categorías definidas ya por Shewhart (1931): 1) Causas comunes, cuya eliminación es responsabilidad de la dirección de la empresa y que acostumbran a ser responsables de más del 90% de los problemas de calidad. 2) Causas asignables, cuya eliminación es más sencilla y son responsabilidad del operario, si bien representan menos del 10% de los problemas de calidad de un cierto proceso. Aunque no existe una definición precisa de estos dos tipos de causas, en la tabla 3.1 se encuentran algunas características de cada uno de ellos. CA U SA S A SIG N A B LES (E SPE C ÍFIC A S)
C A U SA S C O M U N ES
• • • • •
Suelen ser muchas y cada una produce pequeñas variaciones. Son parte permanente del proceso. Su suma (superposición) determina la ca pacidad del proceso. Son difíciles de eliminar. Forman parte del sistema y es responsabilidad de la dirección disminuir sus efectos. Afectan al conjunto de máquinas, operarios, etc. La variabilidad debida a estas causas admite representación estadística (densidad de probabilidad).
• •
• •
Suelen ser pocas pero de efectos importantes. Aparecen esporádicamente en el proceso. Este hecho facilita su identificación y eliminación (gráficos de control). Son relativamente fáciles de eliminar por parte de operarios y/o técnicos. Afectan específicamente a una máquina, operario, etc. No admite representación estadística.
Tabla 3.1 C aracterísticas de las cau sas de variabilidad
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
K
En la tabla 3.2 se encuentra una lista de condiciones a las que normalmente se asocian las dos categorías de causas de variabilidad. CO N D ICIO N ES A SOCIADAS A
COND ICIO NES ASOCIADAS A
C A USA S CO M UNES
CAUSAS ASIGNABLES
Inevitable Estable Homogéneo Constante Normal Estacionario Controlado Predecible Consistente Permanente No significativo Estadísticamente estable Múltiple
Evitable Inestable Heterogénea Errático Anormal Descontrolado Impredecible Inconsistente Esporádico Diferente Importante Significativo Desgaste Pocas
Tabla 3.2 Condiciones asociadas a las causas de variabilidad
No es exagerado decir que toda la teoría de los gráficos de control de Shewart tenía como bjetivo el desarrollo de métodos que permitiesen identificar la ocurrencia de causas asignables de ¿habilidad en un determinado proceso, para proceder a su eliminación y mejorar así la calidad de los productos industriales. Al mismo autor se debe el concepto de proceso en estado de control, como _quel proceso sobre el que únicamente actúa un sistema estable de causas de variabilidad (las causas comunes), y cuyo output es, en consecuencia, predecible estadísticamente. Todas estos conceptos serán desarrollados con mayor detalle en el capítulo 11 de este libro.
3.2 Medidas de la variabilidad Las unidades producidas y las que conceptualmente puede producir un proceso en estado de control son — ejemplo de lo que en estadística se conoce como población. Consideremos, por ejemplo, un proceso de rellenado automático de botellas de agua y supongamos _je está en estado de control. Un conjunto de n botellas, seleccionadas aleatoriamente de entre las “ñcadas por el proceso, constituye una muestra e atona de dicha población. Recibe el nombre de variable aleatoria la PROCESO rjoción, F, que asocia, por ejemplo, cada botella je agua con su contenido en cm3. El concepto de • ■¿fiable aleatoria es objeto de estudio profundo en MUESTRA . -siquier libro de estadística matemática y, aunque (v.a.) Y r^se estudio queda lejos de los objetivos de este fibfo. es conveniente observar que la función Y Datos . revierte la muestra de observables (botellas de ---- h 199 200 201 x_pL¿» en números reales (contenidos en cm3), 3 V olum en en cm joe pueden tratar matemáticamente. Estos conceptos se representan esqueFig. 3.2 Población, muestra y variable aleatoria ~ jocamente en la figura 3.2.
iiliá i'
MÉTODOS ESTADÍSTICOS.CONTROL Y M EJORA DE LA CALIDAD
n
3.2.1 Variabilidad en una muestra Es evidente que una manera de representar gráficamente la variabilidad en los datos muéstrales es el histograma de dichos datos. En la figura 3.3 se presenta el histograma c 40 con los contenidos en cm3 de una muestra de < o z 100 botellas rellenadas por el proceso w 30 p o considerado. a u- 20 El histograma permite contestar fácil mente a preguntas del tipo: 10 1. ¿Qué proporción de botellas en la muestra tienen un contenido inferior a CONTENIDO 198 crri* 198 cm3? 2. ¿Qué proporción de botellas en la Fig. 3.3 Histogram a del contenido en cm 3 en una muestra de muestra cumplen con las especificaciones tamaño 100 200 ± 2 cm3? A pesar de que sería de considerable interés tener respuestas a las preguntas anteriores, no cabe duda que sería de mayor utilidad aún poder contestar a preguntas similares, pero referidas a la población de las botellas que se pueden rellenar con el proceso en estado de control. Esta idea la desarrollamos a continuación.
50
3.3 D ensidad de probabilidad. Variabilidad en la población
_
C /5
k
-
i
t/0
-7o0 8 m—
8 m c/3 —
i
- s □
“ 703 8 m — ----
1 1
J
-o 8 m C /i
1 i
En este apartado vamos a introducir d efo rm a intuitiva un concepto cuya formulación matemática correcta nos llevaría excesivo tiempo y que el lector interesado puede encontrar en cualquier libro de estadística matemática, desde textos introductorios como Hogg-Craig (1978) hasta textos como Chung (1968). Consideramos la situación descrita en la figura 3.4.
Fig. 3.4 C oncepto intuitivo de densidad de probabilidad
‘I
Si tomamos una muestra de, por ejemplo, n=20 unidades de un cierto proceso y representamos la variabilidad de la muestra mediante un histograma, muy probablemente éste presentará la forma irregular de la parte izquierda de la fig. 3.4. El reducido tamaño de muestra obligará a definir una amplitud de intervalo grande, y además pueden existir intervalos con pocos efectivos. Si la muestra fuese de n- 200 unidades, seguiríamos hablando de una muestra real de un proceso real y el histograma resultante sería, posiblemente, más regular que el anterior y con intervalos de menor amplitud. Manteniéndonos en el mundo real podríamos extraer una muestra de 2.000 unidades
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
K
y, seguramente, el histograma que representase la variabilidad muestral sería todavía más regular y con unos intervalos de menor amplitud. Pasemos ahora al mundo de las abstracciones. Siguiendo el proceso anterior hasta el límite, cuando n=oo o, lo que es lo mismo, cuando tuviésemos valores de la población conceptual formada por todas las unidades que se pueden rellenar con el proceso en estado de control, en una gran mayoría de casos el “histograma” que se obtendría sería tan regular como la función f( y ) representada en la parte derecha de la figura 3.4. Esta curva suave es la que recibe el nombre de función densidad de probabilidad (d.p.) de la variable aleatoria Y considerada. Por tanto, en términos coloquiales podríamos decir que la densidad de probabilidad es como el histograma realizado con todas las unidades que constituyen la población. La d.p. es evidentemente un ente abstracto o modelo matemático y, como todo modelo, está sometido a la afirmación de Box: “Todos los modelos son falsos; algunos modelos son útiles”. Esta afirmación viene a decimos que, cuando formu lemos una d.p., f(y) debe ser útil para hacer previsiones ^obre las unidades fabricadas por dicho proceso, pero no podemos afirmar que la variabilidad del proceso sea exactamente la implicada por f{y). Consideremos ahora la figura 3.5. Fig. 3.5 Densidad de probabilidad Hemos visto en el capítulo anterior que, en un rjstograma, el área sobre un cierto intervalo era la frecuencia relativa con que se habían observado ¿lores en dicho intervalo. Teniendo en cuenta que una de las definiciones de probabilidad es que ésta es el límite hacia el que tiende a estabilizarse la frecuencia relativa cuando el tamaño de la muestra crece indefinidamente, la relación entre histograma y d.p. que hemos visto anteriormente, se deduce que: b
\ f ( y ) d y = Prob (a
(3.1)
a
joode informalmente Prob(a0 para todo y e R lb)j f ( y ) d y = l R
; 4 Esperanza matemática y varianza M igual que en una muestra, parte de la variabilidad puede venir sintetizada en un par de estadísticos maestrales como x y S2y, la variabilidad representada exhaustivamente por la d.p. /(y), puede también caracterizada parcialmente por dos parámetros poblacionales: ju=E(Y) y a 2= Var(Y) cuya definición es: n = E(Y) = j y f ( y ) d y
(3.2)
M É T O D O S ES T A D ÍST IC O S.C O N T R O L Y M E JO R A D E LA C A L ID A D -------------------------------------------------------------------------------------------------------------------------------- JZ
asociada con el nom bre de m edia poblacional o esperanza m atem ática de la variable aleatoria y C72
-
V ar(Y )
=
f
(y -
¿i)2
f ( y ) dy
=
E (Y —
(3.3)
R
conocida com o varianza poblacional. El parám etro jj es un parám etro de localización, es decir, es el valor alrededor del cual tom an valores los individuos de la población considerada, m ientras que o 2 es un parám etro de dispersión, ya que es la esperanza m atem ática de las desviaciones respecto a ju, al cuadrado. Si bien en la estadística m atem ática se definen m últiples parám etros de localización y de dispersión, /j y a 2 son los m ás utilizados en el presente libro.
3.5 F u n ció n d e d istrib u ció n Supongam os de nuevo, que la fu n c ió n /(y ) de la figura 3.5 es d.p. del contenido en cm 3 de la población de botellas de agua rellenadas por un proceso en estado de control. E stá claro que /( y ) contiene toda la inform ación sobre la variabilidad de proceso. En efecto, c o n o c id a /(y ) se pueden contestar preguntas del tipo: 1. ¿Q ué proporción de las botellas rellenadas por el proceso tendrán contenidos entre a y b l b
R espuesta: \ f (y ) dy a
2. ¿Q ué proporción de las botellas rellenadas por el proceso tendrán contenidos inferiores a a l a
Respuesta:
J / (y ) dy
3. ¿Qué proporción de las botellas rellenadas por el proceso tendrán contenidos superiores a b l Respuesta:
j
f ( y ) dy
b
El ú n ico in co n v en ien te es que cada resp u esta im plica calcular un área bajo la c u rv a /(y ). Por ello resulta de gran utilidad el concepto de función de distribución. D ada una variable aleatoria F, se llam a fu n ció n de distribución de la v.a. Y a la función F de la recta real R en el intervalo [0,1 ] definida por: F ( y ) = j f ( t ) d t = Prob (Y < y )
F ig. 3 .6 R ela ció n entre la fu n ció n de distribución y la den sidad d e probabilidad
(3.4)
L a figura 3.6 representa esquem áticam ente la relación existente entre la densidad de probabilidad y la fu n ció n de d istrib u c ió n de una variable aleatoria. Es im portante observar que las ordenadas F(y) son directam ente probabilidades, m ientras que
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
n
en f ( y ) las ordenadas son densidades de probabilidad y, en consecuencia, las respuestas a las preguntas (1), (2) y (3) serían ahora: F(b)-F(á); F(a) y 1-F(b). Toda función de distribución es obviamente monótona no decreciente, continua por lo menos por la derecha y tal que lim F( y ) = 0 y lim F( y ) = 1 .
3.6 Caso discreto El lector puede preguntarse en este momento por qué decimos que toda función de distribución (f.d.) es continua “por lo menos por la derecha”. La razón es que no todas las variables aleatorias son continuas, como la considerada en el ejemplo del contenido de las botellas de agua. Consideremos un proceso con una variable aleatoria que vamos a denominar discreta. Supon gamos que lanzamos 10 veces una moneda y que la variable aleatoria considerada, Y, es ahora el número de veces que ha salido cara. En este caso, Y sólo puede tomar los valores 0, 1, 2 , . . . , 10. En este caso recibe el nombre de distribución de probabilidad la función f definida por: f ( y ) = Prob (Y=y) para y = 0,1,2,...,10 f ( y ) = 0 en el resto Está claro que para una v.a. d iscreta,/y a no es una curva suave como ocurría en el caso continuo, sino que tendrá una forma como la de la figura 3.7. La función de distribución de Y, será ahora:
Fig. 3.7 Distribución de probabilidad de una variable aleatoria discreta
F( y ) = í f ( k ) k=0
Su forma geométrica será del tipo repre sentado en la figura 3.8. (Razone el lector la conti■_:dad por la derecha.) Para el caso discreto, los parámetros |i y o 2 'vr definen: M= X y / ( y ) y = 'L(y~v? f(y) y
(3.5)
(3.6)
Fig. 3.8 Función de distribución de una variable aleatoria discreta
M ÉTO D O S ESTADÍSTICOS .CO N TR O L Y M EJORA D E LA C A LID A D
n
3.7 El caso bivariante Consideremos de nuevo el proceso de envasado representado en la figura 3.1. Supongamos ahora que a cada individuo de la población le asignamos un par de valores (.x,y) en el que x es el contenido de la botella en cm 3 e y es su peso en gr. M atemáticamente hablando, esta asignación estaría representada por una función (X,Y) que hace corresponder a cada individuo de la población un elemento de (x,y) de M2. Dicha función recibe el nombre de variable aleatoria bidimensional o vector aleatorio de dimensión 2. Los conceptos de variabilidad muestral y poblacional discutidos en apartados anteriores se generalizan de manera inm ediata al caso bivariante, como veremos a continuación.
3.7.1 Variabilidad muestral Supongamos que disponemos de n pares de valores (xey¡) i=l,2,...,n; correspon dientes a valores muéstrales de un cierto vector (X, Y). Una forma razonable de representar la variabilidad muestral es el histogram a generalizado de la figura 3.9 en el que el volumen del paralepípedo correspondiente a la celda rayada en ^1 plano x , y, representa la frecuencia rela tiva de individuos muéstrales, con la que X, Y toman valores en dicho rectángulo (celda). Fig. 3.9 H istogram a generalizado
3.8 D en sid ad es de p rob ab ilidad con ju n ta y d en sidades m arginales Al igual que hemos hecho en el apartado 3.3, cuando consideremos la población conceptual en lugar de una muestra concreta, en el histograma generalizado de la figura 3.9, las v.a. X e Y convergerán en general hacia una superficie regular, f ( x, y) denominada densidad de proba bilidad conjunta (d.p.c), y que puede tener una forma como la de la figura 3.10, por ejemplo. De nuevo, no todas las funciones matemáticas f ( x, y) pueden ser una densidad de probabilidad conjunta.
F ig. 3 .1 0 D ensidad de probabilidad conjunta
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
71
Para ello es necesario que: (a) f(x ,y ) > 0 para todo (jr,y) e R2 f(x,y)dxdy = 1 En el caso bivariante tendremos que: (3.7)
P( x0 < X < x Q+ dx, y 0 < Y < y0 + dy) = f ( x 0, y 0)dxdy
3.8.1 Densidades marginales A partir del conocimiento de la d.p.c. f(x, y) de un vector aleatorio (X,Y), siempre es posible obtener la densidad de probabilidad univariante correspondiente a cada una de las dos variables aleatorias que definen el vector. La distribución univariante de X se conoce como densidad marginal en X y está definida por: (3.8)
/* ( * ) = j f ( x , y ) d y R
La distribución univariante de Y se conoce como densidad marginal en Y y está definida por: f r ( y ) = j /(■*» y) dx
(3.9)
R
Veremos que, por el contrario, no siempre es posible obtener la densidad conjunta a partir de las densidades marginales, aunque sí lo será en el caso en que las variables aleatorias X e Y sean r-tocásticamente independientes. Este concepto se desarrolla en el siguiente apartado.
3.9 Densidades condicionales e independencia de variables aleatorias Sea (X,Y) un vector aleatorio cuya d.p.c. es f ( x , y ) y sea yQun cierto valor de Y tal que f Y( y 0) * 0. Se define como densidad de X condicional al valor y0 de y a la densidad univariante: f ( x \ Y = y 0) = f ( x \ y 0) = /y (y 0)
(3.11a)
Si x0 es un valor de X tal q u e /x(jt0) ^ 0, se puede definir también la densidad de Y condicionada ±1 *alor xQde X como: (3.11b)
Así pues, en general se tiene que: f ( . x, y) = f ( y \ x 0) f x (x o) = f ( x \ y 0) f r ( y 0) r ^
(3.12)
El concepto de densidad condicional permite definir la noción de independencia entre variables aleaDado el vector aleatorio (X, Y), diremos que X, Y son variables aleatorias independientes si y sólo si
M ÉTO D O S EST A D ÍST IC O S.C O N T R O L Y M EJO R A D E LA C A LID A D
f ( . x\ y0) = f x ( x)
n
(3.13)
O bserve el lector que en este caso: f ( x , y ) = f x ( x ) f Y( y )
(3.14)
y por lo tanto, si las variables X, Y son independientes, es posible obtener la densidad com o producto de las marginales. Los conceptos de densidad conjunta, m arginal y condicional así com o las de independencia estocástica pueden extenderse fácilm ente a los vectores de dim ensión n. En particular, si ( Yv Y2 Yr) es un vector aleatorio, direm os que las variables que lo com ponen Yv F2,..., Yn son variables aleatorias independientes si y sólo si la densidad de probabilidad conjunta es tal que: f ( y l , y 2, . . . , y „ ) =
(3.15)
Para ilustrar de m anera intuitiva el concepto de independencia entre variables aleatorias considerem os un caso concreto. Supongam os que en una cierta población de individuos se define el vector aleatorio (X , Y) tal que X es la estatura en cm de un cierto individuo e Y es su peso en kilos. ¿Puede el lector im aginarse la form a geom étrica de f( y 1150)? ¿y l a /( jl 180)? ¿Cree el lector que am bas densidades serán idénticas? Es casi seguro que la densidad de probabilidad de los pesos de todas las personas que miden 150 cm esté centrada en un valor m enor que la de las personas que m iden 180 cm, ya que en general esta subpoblación estará constituida por individuos que pesan más que los correspondientes a un¿ estatura de 150 cm. En este caso, por tanto, no se cum ple la expresión (3.13), ya que f(y \x 0) depende del valor de v Este hecho coincide con la noción intuitiva de que la estatura y el peso de una persona no soc independientes sino que, en general, las personas más altas tam bién pesan más. Si, por el contrario, las variables fuesen independientes, la densidad de probabilidad de l variable X sería la m ism a fuese cual fuese el valor de Y.
3 .10 C o v a ria n za y co eficien te de co rrela ció n lin eal Sea (X, Y) un vector aleatorio. Sabem os que la variabilidad de dicho vector está representada por s* función de densidad de probabilidad co n ju n ta/(jt,y ). Un parám etro de interés para caracterizar la dependencia lineal entre las v.a X c Y ^ covarianza definida de la m anera siguiente: Un = C O V ( X , Y ) = E[( X - /UJ ( Y - iu y )\
(3.!€B
donde \áx y |ay son las m edias de las densidades m arginales. C om probam os de m anera intuitiva que |in m ide el grado de dependencia lineal entre X e Y Ex efecto, si suponem os que X e Y están relacionadas de la m anera indicada en la figura 3.11 (a), c c J sería seguram ente el caso si X e Y fuesen respectivam ente la estatura y el peso de una cierta poblac::m J vem os que, si para un cierto individuo, (X -\ix) es positivo y grande (un individuo de m ucho peso que la m edia de la población), tam bién en general (K-|*iy) será positivo y grande (el in d iv .a » será m ás alto que la media), y si (X-jax) es negativo (individuo de m enor peso que la mec^w.
TI -------------------------------------------------------------------------------------------------------------------------------------------------------CAUSAS Y MEDIDAS DE LA VARIABILIDAD
probablemente (F-|Jy) será también negativo (individuos más bajo que la media). En consecuencia, la mayoría de productos (FHy) (X-|Jx) serán positivos y, por.lo tanto, (Jn, que es el valor medio esperado de dichos productos, será positivo. Un razonamiento parecido al anterior nos conduce a la conclusión de que, en el caso de la figura 3.11 (b), la covarianza jnn sería negativa. Podemos utilizar como X, Y, la temperatura máxima de un cierto día como variable X, y el consumo de electricidad para calefacción durante el mismo día en una cierta unidad como variable Y. En un día que sea más frío que la media probablemente se consumirá más Fig. 3.11 Algunos patrones en los diagramas bivariantes electricidad para calefacción que la que se consume en mediales decir que, cuando (X-px) sea negativo, (F-|ay) será positivo. Análogamente en un lía más cálido que la media, el consumo de energía para calefacción será menor que la media y, por lo .into, cuando (X-^x) es positivo, se tiene que (F-py) es frecuentemente negativo. Así pues, los rroductos (X-\ix) (F-|iy) serán negativos para una mayoría de individuos de la población y, por lo tanto, - será negativa. Cuando no exista dependencia lineal, como ocurre en el caso de la figura 3.11 (c), para un individuo en el que (AT- |lix) sea positivo, será equiprobable que (F-jiy) sea positivo o negativo y, por lo inito, es razonable pensar que \in será nulo. De los razonamientos anteriores se desprende que el signo de la covarianza es un indicador del -po de dependencia lineal entre X e Y. No ocurre lo mismo con el valor de pn, ya que éste depende de unidades de medida. Así, para el caso de la figura 3.11 (a), si X se mide en toneladas e K en kilómetros, \iu será un número pequeño, mientras que si X se mide en miligramos e Y en mieras, |in m d rá un valor muy grande. En consecuencia, es conveniente definir un parámetro que tenga siempre el mismo signo que la • crianza, pero cuyo valor sea independiente de las unidades en las que se midan las variables X, Y. I :e parámetro se denomina coeficiente de correlación lineal y se define:
P*v =
COV(X, Y) G
(3.17)
Se puede demostrar fácilmente que, si entre X, Y existe una relación lineal exacta: Y = p 0 + p lX
es Pxy = (signo p
,) 1
Así pues, pxv puede tomar valores desde -1 a +1, y toma el valor 0 cuando X e Y son -ce Tendientes.
M É T O D O S E S T A D ÍS T IC O S .C O N T R O L Y M E JO R A D E LA C A L ID A D ----- ---- — — ------ --------------------------------------------------------------------------------------------------------- K
3.11 E sp era n za m a tem á tica y v a ria n za d e co m b in a cio n es lin eales d e variab les aleatorias Sean Yv Y2 Yn variables aleatorias y sean c v c 2,..., c n constantes reales. C onsiderem os una com binación lineal del tipo: Z = ± c iYi (3.18) i=\
De la definición de esperanza m atem ática, se deduce que E , es un operador lineal y, por lo tanto: E ( Z ) = ' Z c iE( Yl ) =
i=1
Por otro lado se tiene que: V (Z )
E ¿=i
i=i rt — 1
(3.19a)
n
.2
J ,c ? V a r (^.) + 2 X J ucicj COV( Y „Yj ) 1=1 1=1 7=1+1 De la expresión (3.19 a) se deduce que, cuando las variables Yv Y2,..., Yn sean independientes: = Z c ? V a r(Y ,)
V V *=1
)
(3.19b)
i= I
Es m uy im portante entender correctam ente el cam po de aplicación de la expresión (3.19 b), y para ello vam os a considerar un ejem plo concreto. Supongam os un proceso de rellenado de gel en unas botellas de plástico. D efinam os las siguientes variables aleatorias: X - peso neto de gel en una botella Y - peso de la botella vacía Z - peso de la botella llena de gel Es razonable pensar que será fácil obtener datos experim entales que perm itan estim ar la varianza a y2 de la variable Y y la varianza a 2 de las botellas llenas, m ientras que será casi im posible obtener datos experim entales de la variable X (parte del gel quedaría pegado a las paredes de la botella y el vaciado sería im perfecto). N o obstante, si tenem os en cuenta que: Z = X+ Y y que es razonable pensar que X e Y son independientes, podem os aplicar:
v ÍÉ c .V l = ±cfVar(Y,) V 1=1
y obtener:
/
1=1
^2 ^ 2
y, por lo tanto:
O bserve el lector que si hubiese enfocado la solución al cálculo de a x2 a partir de: X =Z- Y debería tener en cuenta que ahora Z e K son claram ente dependientes y, en consecuencia, debería aplicarse la expresión (3.19 a)
CAUSAS Y M EDIDAS DE LA VARIABILIDAD
n
'£c ?V ar( Y, ) + 2 £ y£ t cfiJ COV(Yl,YJ) i=1 í=l >=«+1
en lugar de la (3.19 b) V L e , Y, = XcfVa>r(Y,) Vi=i / í=i
3.12 E jem plo del “helicóptero” Para ilustrar los conceptos básicos de este capítulo, amos a utilizar el “helicóptero” de papel cuyo diseño está realizado en la figura 3.12. La idea de utilizar este ejemplo a lo largo del libro le fue sugerida a uno de >us autores por George E. P. Box, Soren Bisgaard y honrad Fung de la Universidad de Wisconsin. El proceso de fabricación de helicópteros consistiría, entre otros, en los siguientes pasos (ver ::gura 3.13.): Supongamos que la característica de calidad más importante en los helicópteros fabricados es el empo que tardan en caer desde tres metros de altura. Si el lector tiene paciencia suficiente para construir unos cuantos helicópteros a partir del diseño le la figura 3.12, y una vez fabricados los lanza desde ¿ altura de 3 m y mide el tiempo de caída, observará obvio: no todos los helicópteros tardan el mismo empo en recorrer los 3 m. ¿Por qué existe variabiidad en estos tiempos?
(1 ) U N "H E L IC Ó P T E R O "
D IS E Ñ O B Á S IC O (1/2 F O L IO )
10,5 c m
Fig. 3.1 2 D iseñ o del helicóptero de papel
PROCESO
H E L IC Ó PT E R O
Fig. 3.13 P roceso de fabricación de los helicópteros
Como ejemplo de algunas de las causas de variabilidad podríamos considerar las de la tabla 3.3. Obsérvese que en la variabilidad final intervienen, no sólo las causas que actúan durante el r r ceso de fabricación de los helicópteros, sino también las que actúan durante el proceso de ¿alzamiento y medida del tiempo de caída. En este ejemplo la población conceptual estaría formada por todos los helicópteros que se ~ - r íen fabricar por el proceso en estado de control, es decir, eliminando las causas asignables como ü criada antes en segundo lugar en la tabla 3.3.
M É T O D O S E S T A D ÍS T IC O S .C O N T R O L Y M E JO R A D E L A C A L ID A D
n
T IP O
CAUSA
V ariab ilid ad en la ca lid a d (textu ra, p e so , e tc .) d e lo s fo lio s u tiliza d o s c o m o m ateria prim a. D istr a c c ió n durante el d ib u jo d e las lín ea s d e corte d el 5 h elicó p tero . N o sie m p re d eja rem o s ca er e l h e licó p tero d e sd e 3 m etros e x a cta m en te. V ariab ilid ad en las co rrien tes d e l aire en la h a b ita ció n d o n d e se d ejan ca er lo s h e licó p tero s.
C om ún A sig n a b le C om ún C om ún
T ab la 3 .3 A lg u n a s c a u sa s d e v a ria b ilid a d en e l e je m p lo d e l h e lic ó p te r o
T IE M P O D E C A ID A D E S D E 3 m (e n s e g )
3,4 3,3 • 3,2 • 3,1 • 3 I 2,9 • i• 2,8 » 2,7 » 2,6 • 2,5
3,4 3,3 3,2 3,1
>
3 2,9 2,8
\
2>7 ~ 2,6 2,5 1
V 1 ■■■ 1 2
3
4 5 6 7 8 O rden de experim entación
9
F ig . 3 .1 4 R e p r e se n ta c ió n g r á fic a c o n p o c o s d atos
Tiem po
F ig . 3 .1 5 H isto g ra m a d e lo s tie m p o s d e c a íd a d e 10 0 h e lic ó p te r o s.
K
U na m u estra estaría co n stitu id a, p o r ejem plo, p o r 10 h elicó p tero s seleccio n ad o s al azar de en tre los fab ricad o s p o r el proceso. E l ex p erim en to co n siste en d ejar caer un h elicó p tero d esd e 3 m de altura. M id ien d o el tie m p o de c a íd a d e fin im o s la v ariab le aleato ria Y, que aso ciaría a los 10 h elicó p tero s de la m u estra los 10 n ú m ero s reales c o rre s p o n d ien tes a sus tiem p o s de caíd a. D ichos tiem p o s, en segundos, p o d rían ser: 3,25; 3,14; 2,68; 2,96; 2,99; 2,60; 2,90; 2,75; 2,86; 3,05. D ad o el re d u c id o n ú m ero de datos m u é stra le s, la re p re se n ta c ió n g rá fic a m ás ad ecu ad a será la de la fig u ra 3.14. Si en lu g ar de seleccio n ar una m uestra de 10 helicó p tero s, h u b iésem o s eleg id o una m u estra de m ay o r tam añ o (100 helicópteros p o r ejem p lo ), la rep resen tació n g ráfica de los datos sería el h isto g ram a de la fig u ra 3.15. El área ray ad a en la fig u ra 3.15 es p ro p o rcio n al a la frec u en c ia re la tiv a o la p ro p o rció n de los 100 h elicó p tero s m uéstrales cu y o s tiem p o s de caíd a desde 3 m han estado co m p ren d id o s en tre 2,4 y 3,6 segundos. C o n c e p tu a lm e n te p o d e m o s su p o n er que, si ex p erim en tásem o s con todos y cad¿ u n o de los h e lic ó p te ro s de la población, o b ten d ríam o s com o lím ite del h isto g ram a un¿ c ierta d en sid ad de p ro b ab ilid ad co m o la de la fig u ra 3.16. E n e sta d e n sid a d , el á re a rayad* rep resen ta la p ro b ab ilid ad de q u e un heli cóptero de la p o b lació n tard e m ás de 3,2 > m enos de 3,4 segundos en c ae r d esd e 3 m o. k que es lo m ism o, la p ro p o rció n de h e lic ó p te ro
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
en la población cuyo tiempo de caída estaría comprendido entre 3,2 y 3,4 segundos. Finalicemos este capítulo indicando que uno de los objetivos básicos de la estadística es hacer inferencias acerca de una población conceptual a partir de datos muéstrales de dicha población.
F ^ 3 .16 Densidad de probabilidad en el caso de los helicópteros X
0 2 005q
M ÉTODOS ESTADÍSTICOS .CO N TR O L Y M EJORA D E LA CA LIDAD
Tí
E jercicios 3.1
El número de averías que sufre una determinada máquina a lo largo del día está descrito por la siguiente distribución de probabilidad: N Ú M . D E A V E R ÍA S ( X )
P R O B A B IL ID A D P ( X )
0 1 2 3 4 5
0.1 0.2 0.2 0.2 0.2 0.1
Calcular la esperanza m atem ática y la varianza de la variable aleatoria ‘‘número de averías”. 3 .2
Una variable aleatoria tiene la siguiente distribución de probabilidad: VALOR D E X
P R O B A B IL ID A D P ( X )
30 31 32 33 34 35 36 37
1/12 2/12 3/12 2/12 1/12 1/12 1/12 1/12
Calcular: a) E(x2) b) E [ ( x - m c) E(x) d) E(2x-1)
3 .3
Se considera la variable X “suma del resultado de lanzar dos dados a la vez”. Calcular: a) E(x) b) V(x)
3 .4
Una variable aleatoria tiene la siguiente distribución de probabilidad: f ( x ) = k(l -x)2 0
3 .5
Una variable aleatoria x se distribuye según la función de densidad: f ( x ) = 3 kx 0
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
71
3.6
La viscosimetría es una técnica corrientemente utilizada en la industria química para conocer la distribución de pesos moleculares de polímeros. Un investigador estudió muestras de polimetacrilato de metilo a lo largo de una semana, y obtuvo los siguientes resultados:
DÍA
PESO (G)
VISCOSIDAD (PO)
TEMP. LABORTORIO (eC)
1 2 3 4 5 6 7
0.8241 0.6022 0.4554 0.4287 0.2290 0.2000 0.3325
0.6749 0.668 0.641 0.6240 0.6010 0.5750 0.6200
22.3 22.1 18.9 22.6 23.1 22.5 23.0
a) Calcular la covarianza y el coeficiente de correlación entre el peso (expresado en gramos) y la viscosidad (en poises). b) Calcular la covarianza y el coeficiente de correlación entre el peso (expresado en kilogramos) y la viscosidad (en poises). c) ¿Qué se puede deducir a la vista de los resultados de los apartados a) y b)? d) ¿Existe relación entre la temperatura y la viscosidad? e) ¿Y entre la temperatura y el peso de los polímeros? f) Realizar diagramas bivariantes y decir si los resultados obtenidos son coherentes con dichos diagramas. En un estudio de mercado se observó que el consumo de una determinada revista dependía de la edad según la siguiente densidad de probabilidad: /(edad) =0
edad<18
/ ( edad) =£/edad4 edad >18 a) Calcular el valor de k. b) Utilizando dicha densidad de probabilidad, calcular la probabilidad de que una persona que compre la revista, escogida al azar, tenga una edad comprendida entre 25 y 30 años. Un fabricante de juguetes de madera utiliza en sus productos cuatro tipos de material (a, b, c, d) que une mediante cuatro tipos diferentes de cola (A, B, C, D). Ha observado que en ciertas condiciones sus A B D c productos se rompen con facilidad según la distribución de probabilidad conjunta de la siguiente tabla: a 0.01 0 0.07 0.02 a) ¿Cuál es la probabilidad de que se despeguen las b 0.02 0.05 0.1 0.23 piezas utilizando el material b y la cola C? b) ¿Cuál es la probabilidad de que la pieza se rompa c 0.06 0.11 0 0.03 utilizando la cola A? d 0.01 0.24 0 0.05 c) ¿Cuál es la probabilidad marginal de bl
4 Algunos modelos probabilísticos
: onsideremos tres situaciones frecuentes en la industria: SI .Consideremos el control de recepción de materias primas o de componentes semielaborados. En general, el control consistirá en extraer una muestra aleatoria del pedido y aceptar o rechazar el mismo en función del número de componentes defectuosas halladas en la muestra. S2.Consideremos un estudio de mercado destinado a estimar el porcentaje de hogares que tienen instalado un cierto electrodoméstico. El estudio consistirá en seleccionar una muestra aleatoria de hogares y estimar el porcentaje en la población en función del número de ellos que en la muestra tengan el electrodoméstico en cuestión. S3.Supongamos que una empresa desea estimar la proporción de facturas emitidas que tardan más de tres meses en ser cobradas. Para ello se seleccionará una muestra de las facturas emitidas en el pasado y a partir de la proporción muestral de facturas cobradas con el retraso antes indicado, se estimará dicha proporción en el total de facturas. Las tres situaciones son asimilables al siguiente modelo: Una urna contiene bolas de dos tipos, B y B en cantidades NB y N-NB respectivamente. Se :"^aen n bolas de la urna, sin reposición, y se considera la variable aleatoria X, definida por el número !>olas del tipo B que han aparecido en la muestra. En dicho modelo, la probabilidad de que X=x (*=0,1,2,3...,«) sería: - nA { n-x ) 'N' ín
h(x\N ,N B,n)
. por ejemplo,
l *J
(4.1)
es el número de combinaciones de orden x entre NB elementos.
La expresión (4.1) es la distribución de probabilidad de un modelo probabilístico conocido modelo hipergeométrico. La tabla 4.1 muestra cómo las situaciones SI, S2 y S3 se adaptan conceptualmente al modelo [geométrico, es decir, que sería correcto basarnos en dicho modelo para hacer las inferencias se n a ria s en los tres casos descritos.
K
M ÉTODOS ESTADÍSTICOS. CO N TR O L Y M EJORA DE LA CALIDAD
n
T IPO B
N
SI
C om ponente defectuosa
Componente buena
Núm ero de com ponentes en el pedido
N úm ero de com ponentes defectuosas en el pedido
N úm ero de com ponentes extraídas para control
S2
Hogar con electro dom éstico
Hogar sin electro dom éstico
N úm ero de hogares en la población estudiada
N úm ero de hogares de la población que tienen electrodom ésticos
N úm ero de hogares en la muestra
S3
Factura retrasada
Factura cobrada antes de 3 m eses
N úm ero total de facturas em itidas
N úm ero de facturas em itidas y cobradas con retraso de más de 3 m eses
Núm ero de facturas exam inadas en el estudio
SIT U A C IÓ N
T IP O B
atb
Tabla 4.1 Situaciones que se adaptan al m od elo hipergeom étrico
En la teoría de la probabilidad existen otros muchos modelos teóricos que resultan de utilidad en una gran variedad de situaciones prácticas. El objetivo de este capítulo es presentar las más relevantes desde un punto de vista conceptual. El lector interesado en los aspectos m atem áticos involucrados en la deducción de dichos modelos y de sus principales características puede, de nuevo, dirigirse a los textos de estadística matemática mencionados en el capítulo anterior.
4.1 L a ley norm al 66
En este apartado vamos a estudiar las principales características de la ley normal, también conocida como ley de Laplace-Gauss. Dicho modelo probabilístico desempeña un papel esencial en la teoría y la práctica de la estadística, así como en la teoría de la probabilidad, especialmente en los teoremas límite. Se dice que una variable aleatoria Y se distribuye según una ley normal de parámetros (J y a [lo abreviaremos diciendo: y~Af(|j;o)], cuando su densidad de probabilidad viene dada por:
f(y) =
y jlñ o
(y -¿ 0 lo 2
exp
(4.2)
para - o o < y < o o ; - 0 0 < J J < 0 0 y G>0. Desde un punto de vista geométrico, la ley normal tiene la conocida forma de campana de la figura 4.1. Es fácil com probar los siguientes elem entos más relevantes: a) f(y) es simétrica respecto del eje y= |J. b) La gráfica de f(y ) presenta un máximo relativo en
n
n+0
Fig. 4.1 Gráfica de la densidad de probabilidad N(p; o )
yflTTO
c) La gráfica de f(y) presenta puntos de inflexión en y=p-(T e y= |j+ a. d) f(y)> 0 para todo valor de y.
e) ¡ f ( y ) d y = i-
ALGUNOS MODELOS PROBABILÍST1COS
A nivel estrictamente geométrico, es Tesante observar que variar el valor del rara metro (j equivale únicamente a variar la > ición de la campana sin variar su forma. P : r el contrario, una variación en el valor del T^rametro a implica una modificación de la i ryrUi de la curva (si aumenta o, se alejan del : i -fi los puntos de inflexión y disminuye . rdenada del máximo relativo), pero no ¿recta a la posición de la misma. En la figura - I >e observan estos efectos. Estos efectos son perfectam ente eazonables, ya que:
Fig. 4.2 E fectos de (i y o sobre la gráfica de la ley normal
E(Y) = \Ry f ( y ) d y = n V ( Y) = \ R( y - n f f ( y ) d y = a 2 Así pues, ja y a no son más que esperanza matemática y la desviación ie c de la variable aleatoria y, en con^i.-encia, \á es un parámetro de loca. :^:ió n . m ientras que a afecta a la xk r-trsión y, por lo tanto, a la forma de lensidad. La gran utilidad de la ley normal r~ - práctica es consecuencia de su Mesen histórico, muy ligado a la teoría je los errores de medida. De hecho, si la ley normal fue descubierta por fe a h a m de Moivre como límite de un VKaáelo binomial, su uso fue potenciado ic c Laplace y especialmente por Gauss r- .iñ estudios sobre los problemas de ición en astronom ía. Parece muy ible suponer que la distribución os errores de m edida en un t -zmmentó “norm al” sea sim étrica, a e r a d a en el valor 0, y que la probade com eter un error sea de m anera inversam ente proporjt la magnitud del error. Gauss la densidad (4.2) a partir de hipótesis. En el siglo XIX, Bessel justifica de (4.2) a partir del principio superposición, que está en la base de *1
2.0
1.0
2.0
1.0
3.0 4.0 (a) dos dados
3.0 4.0 (b) tres dados
5.0
6.0
5.0
I I 1.0
2.0
3.0 4.0 (c) cuatro dados
5.0
1.0
2.0
3.0
5.0
6.0
M-
6.0
U ___ L — L 4.0
6.0
(d ) o c h o d a d o s
Fig. 4.3 D istribuciones obtenidas por sim ulación de las puntuaciones m edias al lanzar un determinado número de dados
M ÉTO D O S ESTA D ÍST IC O S. C O N T R O L Y M E JO R A D E L A C A L ID A D ---------------- — ---------------------------------------------------------------------------------------------------
K
los teorem as centrales del lím ite de la estadística m atem ática. La idea consiste en suponer que el error observado en una m edición concreta es consecuencia de una gran cantidad de causas independientes, con distribuciones de probabilidad parecidas, y cada una de ellas con un efecto pequeño com parado con el efecto total resultante. En este caso la utilidad de la ley norm al para m odelar el efecto total es con secu en cia del teorem a cen tral del lím ite que dice, en lenguaje no fo rm alizad o , que la sum a (superposición) de un núm ero no m uy pequeño de variables aleatorias independientes, idénticam ente distribuidas, en condiciones m uy generales, se distribuye según la ley normal. Este teorem a puede ser com probado em píricam ente con el ejem plo ilustrado en la fig.4.3. Si X v X 2, ..., X n representan los valores obtenidos al tirar varias veces un dado “perfecto” , la distribución de probabilidad de X sería: / ( * , ) = — para i=1, 2,..., 6. A utom áticam ente com probam os 6 que las distribuciones de probabilidad de la m edia obtenida en 2, 3, 4 ,..., 8, tirad as, es decir, la distribución de probabilidad de: ^ ( X , + X 2), 2
i ( X 1+ X 2 + X 3),...,- (X , + X 2+...+ X J 3 n
sería la de la figura 4.3(a), (b), (c), (d) para n=2, 3, 4, 8 respectivam ente. O bsérvese que podem os abord ar la sum a (d iv id id a p o r 8) de 8 v ariab les in d ep en d ien tes equidistribuidas según la figura 4.3(a) m ediante una ley norm al con algún tipo de corrección por continuidad que com entarem os más adelante. Si el lector repasa los conceptos de proceso en estado de control y el de sistem a de causas com unes de variabilidad, com prenderá que com o consecuencia del teorem a central del lím ite, la variabilidad en este tipo de procesos se puede representar en muchas ocasiones por m edio de la ley norm al.
4.1.1 Función de distribución La función de distribución (f.d.) de la ley norm al viene dada por: F ( y ) = J_v^ f ( t ) d t , donde/(O viene dada por (4.2). Puesto q u e /(í) no tiene función prim itiva, no existe expresión analítica para F(y) y, en consecuencia, la f.d. de la ley norm al aparece en form a de tablas o program ada en m uchas de las calculadoras existentes en el m ercado. El lector interesado en las distintas aproxim aciones para el cálculo num érico de F (y) puede en co n trar abundante m aterial en A bram o w itz y Stegun (1964), Johnson y K otz (1970) o Patel y Read (1982) entre otros. E xisten tablas de la f.d. de la ley 7V(0;1), tam b ién co n o cid a com o ley norm al cen trad a y reducida o ley norm al estándar, y cuya densidad de probabilidad, que se obtiene haciendo |j= 0 y G=1 en (4.2), resulta ser
z2
para —«> < z < +c
La función de distribución de esta ley 7V(0;1) será:
y está tabulada en la tabla C del apéndice. M ediante esta tabla, es posible calcular el valor en cualquier punto de la función de distribución de una ley norm al genérica N(\á ,g ). En efecto, si F~./V(jj;c7) entonces:
K
------------------------------------------------------------------------------------------------------------------------------------------------------- ALGUNOS MODELOS PROBABILISTICOS
F( y 0) = P r o b ( Y < y 0)
i
yo J lñ o
exp
If y-n 2
\2
dy
y —(l Con el cambio de variable z = ------- tendremos: <7
y0-n F ( y 0) = J T
i
y0-M
fr-" cxP yj27T(J
En la figura 4.4 se representa gráficamente la función de distribución de una ley normal .V(p;a) y se señalan algunos valores de uso frecuente. Observemos que ahora es posible interpretar el significado de a en el caso de distribución normal; así, por ejemplo, si Y es el contenido en cm3 de unas botellas rellenadas por un cierto proceso, y suponemos que F~Af(200;10), entonces el 95,44% (97,72-2,28) de las botellas estará entre p±2a, es decir, entre 180 y 220 cm3. Si otra máquina rellenase botellas con a= 4 cm y jj=200, entonces el mismo porcentaje, 95,44%, de botellas tendrían contenidos entre 192 y 208 cm3, es decir, una población más homogénea. Es también evidente que entre |i-4a y jj+4a se encontrará el 99,994% de la población, es decir, que un intervalo de 8a centrado en la media comprenderá prácticamente a todos los individuos de la población. Por este motivo, a veces 8 a recibe el nombre de capacidad o tolerancia intrínseca de una máquina cuya producción se distribuya nor malmente. Si para graduar el eje vertical utilizamos una escala especial, que se deduce de los valores de la f.d. de una ley normal Af(p;a) de la manera indicada en la figura 4.5, entonces, en un papel gráfico con dicha escala en el eje probabilístico, la f.d. de N(|a;a) será una recta. Este hecho nos permite utilizar este papel, conocido como papel probabilístico normal, para estudios de capacidad de máquina y de proceso, para análisis de la normalidad de los residuos en un modelo de regresión lineal, o bien para identificar los efectos importantes en los diseños experimentales que se estudiarán en el capítulo 7.
Fig. 4.4 Función de distribución de la ley normal N( jj; a )
Fig. 4.5 E scala del eje vertical en el papel probabi lístico normal
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
K
En este mismo capítulo veremos la utilidad de la ley normal para abordar, en condiciones asintóticas bastante generales otras distribuciones de probabilidad tales como la t-Student, la ley binomial y la ley de Chi-cuadrado entre otras. Finalicemos este apartado con un importante resultado cuya justificación puede hallarse en Lukacs (1956): Si Yx (í= l, 2, ..., n) son variables aleatorias independientes tales que K-A^ju^cr) y a.(i=\,2,...,ri) son constantes reales, entonces: ^ a¡Yi ~ N (/x;cr) con H = '£ a ¡j i i y
(4.3)
La expresión (4.3) tiene importantes aplicaciones en el cálculo de tolerancias. En efecto, supongamos que se quieren ensamblar tres varillas tal como se indica en la figura 4.6. — ^
V 1
^
d ^
^
V -«T 2
L
te ►
— ^
~ ~ 1"
X . J
-------------
^ ►
w
Fig. 4.6 Ensamblaje de tres varillas
Si todas las varillas han sido fabricadas independientemente y de manera que su longitud X se distribuya norm alm ente según N(\ a \o ), la longitud total L se distribuirá según 7V(3|j; V3cr). El conocimiento de la desviación tipo de L nos permitirá el cálculo de tolerancias del montaje en serie de las tres varillas. En el ejemplo anterior, hemos definido L=X}+X2+X3 con X ^ N (\í;g ) 2=1,2,3. Es interesante que el lector reflexione sobre el error que se cometería si se hubiese definido L=3X.
4.2 La ley binom ial Supongamos que en una urna hay una proporción p de bolas blancas y, por lo tanto, una proporción q=l-p de bolas negras. Extraemos n bolas de la urna con reposición (es decir, devolvemos la bola a la urna después de haber anotado su color). Sea X el número de bolas blancas que han aparecido entre las n bolas extraídas. Esta situación se caracteriza por: (i) se realizan n experimentos independientes (la extracción de las n bolas); (ii) para cada experimento sólo hay dos sucesos posibles: A (la bola blanca) y A (es negra); (iii) p=P(A); q= l-P (A \ la probabilidad de que ocurra A es constante; (iv) la variable aleatoria de interés X es el número de veces que ocurre A en los n experimentos. Cuando se cumplen todas las condiciones ( í ) . . . ( í v ) anteriores, se dice que X sigue la ley binomial. La distribución de probabilidad binomial es: Pr ob( X = x) = b(x\ n, p) donde
p x( l - p ) nx para x = 0,1,2, . . . , n
es el número de combinaciones sin repetición de orden x entre n elementos y su valor es
K
ALGUNOS MODELOS PROBABILÍSTICOS
La gráfica de b(x;n,p) depende del valor de sus dos parámetros n y p, tal como se indica en la figura 4.7. b ( x; n; p )
b ( x; n; p )
n = 10
n = 10
0.4
p = 0.2
p = 0.5 0.3
0.2
0.1
4
6
10
X
Fig. 4.7 Distribución de probabilidad de la ley binom ial
La función de distribución se define de la siguiente manera: B(x; n, p) = Prob (X < x ) = X b (j\n ,p ) /=o Su gráfica es la de una función en escalón, B ( x; 10; 0.5 ) :: ntinua por la derecha y monótona no decreciente, tal : :mo se indica en la figura 4.8. B(x;n,p) se encuentra tabulada para algunos ^ ?res de n y p en la tabla binomial del apéndice 1. L i esperanza matemática y la varianza de una v.a. que una ley binomial de parámetros n y p son: ji = E ( X ) = n p 5 y —r= < 0,3, entonces B(x;n, p) yin P \l~P' ^ rjnción de distribución de la ley normal estándar en el punto b. El factor Vi que aparece en la expresión anterior es debido a la corrección por continuidad a al aproximar una distribución de probabilidad de una v.a. discreta con una continua.
M ÉTODOS ESTADÍSTICOS. CONTROL Y M EJORA DE LA CALIDAD
K
Si en lugar de considerar la v.a. X se considera la proporción de veces que ocurre A en los n experimentos, es decir,/?*, tendremos: * X P =— n E(p') = - E ( X ) = p n V( p*) = \ v ( X ) = p n
n
En este caso, cuando se cumpla la condición: f
1
\ 1 a H------- p 2n p < 0,3, tendremos que Prob (p* < a) « Ipd-p) p \ 1- p n ) J Finalmente, en el próximo apartado veremos que, cuando n es grande, p pequeño y np es finito, la ley binomial se puede aproximar por la ley de Poisson.
4.3 L ey de Poisson *
En este apartado se presenta la ley de Poisson desde dos puntos de vista. El primero es como límite de la ley binomial cuando p ^ 0 y np—\ es finito, y el segundo como proceso de Poisson. Supongamos una máquina que funciona durante 20.000 segundos diarios. Sea p }=0,0001 la probabilidad de que la máquina se averíe durante un segundo dado, y admitamos la hipótesis de que la ocurrencia de una avería en un segundo dado es independiente de lo ocurrido con antelación. Para planificar el mantenimiento de dicha máquina es necesario calcular las probabilidades de 0, 1 ,2 , ..., averías durante un día. Dichas probabilidades se podrían calcular utilizando la ley binomial y serían: N Ú M . D E A V E R ÍA S E N U N D ÍA ( x )
0
1
2
3
4
0 .1 3 5 3 2
0 .2 7 0 6 7
0 .2 7 0 6 8
0 .1 8 0 4 6
0 .0 9 0 2 2
PR O B A B IL ID A D E S :
b (x; 2 0 .0 0 0 ; 0 ,0 0 0 1 )
Si disponemos de otra máquina menos utilizada, que funcione durante 10.000 segundos diarios y con una probabilidad p 2=0,0002 de averiarse durante un segundo dado, las probabilidades de 0, 1, 2, ..., averías en esta segunda máquina serían: N Ú M . D E A V E R ÍA S E N U N D ÍA ( x )
0
1
2
3
4
0.13531
0 .2 7 0 6 7
0 .2 7 0 7 0
0 .1 8 0 4 6
0 .0 9 0 2 2
P R O B A B IL ID A D E S :
b (.x ; 10.000; 0 ,0 0 0 2 )
Es interesante constatar que las probabilidades calculadas para las dos máquinas prácticamente coinciden. ¿Por qué?
71
ALGUNOS MODELOS FROBABILÍSTICOS
Observemos que en los dos modelos binomiales n es muy grade y p es muy pequeño, mientras que el número medio de averías por día es np=2 en ambas máquinas. Se demuestra fácilmente que: A' = p( x; Á) con np = A( finito) lim b(x;n, p ) = e -A — x! p —>o
(4.4)
La distribución límite p(x;X) se conoce como ley de Poisson. En nuestro caso tendríamos que: NÚM.
D E A V E R ÍA S
E N U N D ÍA ( x )
0
1
2
3
4
0,13534
0,27067
0,27067
0,18045
0,09022
PR O B A B IL ID A D E S : *
-X ^
—
(X =
2)
x\
Y es evidente la coincidencia práctica de los resultados obtenidos mediante la ley de Poisson y los obtenidos aplicando las leyes binomiales respectivas. La gráfica de la distribución de Poisson p(x;X) depende de X, tal como se indica en la figura 4.9. P ( x; A. )
P ( x; X )
X= 5
Fig. 4.9 D istribución de Poisson
La función de distribución de la ley de Poisson vendrá dada por: P( x; A) = Prob (X < x ) = ¿ p ( y ;A ) 7=0
D icha función de distribución está lobulada en el apéndice de las tablas y su gráfica para X=2 es la de la figura 4.10. La ley de Poisson viene caracterizada t « t t un único parámetro X y es sencillo probar ; -c E(X)=X y V(X)=X, es decir, que la media y - crianza de una ley de Poisson coinciden y : _e las dos son iguales a X.
Fig. 4 .1 0 Función de distribución de la ley de Poisson para X=2
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
n
La ocurrencia de averías en una m áquina puede ser vista como un proceso estocástico particular. Supongamos que las averías ocurren a lo largo del tiempo, y llamemos X(t) al número de sucesos (averías en este caso) que ocurran durante el intervalo del tiempo (0,t) con t>0, y supongamos sin pérdida de generalidad que X(0)=0. Para que los sucesos (averías en nuestro caso) sigan un proceso de Poisson, deben cumplirse las siguientes hipótesis: (i) La probabilidad de que durante el intervalo (£,{¡+t) ocurran exactamente x sucesos depende sólo de x y de í, pero no de í¡. (ii)E l núm ero de sucesos que ocurren en intervalos de tiem po disjuntos son m utuam ente independientes. (iii)La probabilidad de que durante un intervalo de tiempo de amplitud h ocurra un suceso es Xh+0(Ji) y la probabilidad de que ocurra más de un suceso es O(h) donde X es un valor constante y 0 (h )fh -0 cuando h^O. Bajo estas condiciones, llamamos p(x;Xt) a la probabilidad de que en un proceso de Poisson ocurran exactamente x sucesos durante un intervalo de tiempo (0,0 y es: p(x;ÁJ) = e~h
x\
x = 0,1,2,...
(4.5)
es decir, la distribución de Poisson de parámetro Xt. K La coincidencia entre los dos puntos de vista que acabamos de exponer es intuitivamente clara si consideramos el intervalo (0,0 dividido en n intervalos disjuntos de amplitud h=tln. Cuando las hipótesis (i), (ii) y (iii) equivalen al límite de un modelo binomial en el que 7di-0, pero X es finito. En la expresión 4.5, X representa, pues, el número medio de sucesos por unidad de tiempo.
4.4 Distribución de estadísticos en m uestras aleatorias sim ples de poblaciones norm ales Se dice que una muestra extraída de una cierta población es una muestra aleatoria simple (m.a.s) de la misma, cuando todo elemento de dicha población tiene la misma probabilidad de ser escogido para formar parte de la muestra. Si Y es una cierta variable aleatoria será útil imaginar una población conceptual en la que la frecuencia con que aparezcan los distintos individuos sea la definida por la función de distribución de Y. En este caso, una muestra aleatoria simple sería cualquier conjunto de n realizaciones independientes de Y. Es decir, (Yr Y2y...,Yn) es una m.a.s. de y si y sólo si: (i) las v.a. Y{ son independientes; (ii) Yx ~ j\y ) i=l,2,...,tt donde fiy ) es la densidad de probabilidad de Y. Sea (yvy2,...,yn) una m.a.s. de Y; los estadísticos muéstrales más utilizados en el presente libro son:
Yy Y = ± * —n
¿(r,-ñ2 y
S 2 = —------------n —1
Tanto la media muestral V , como S 2 son variables aleatorias, y uno de los objetivos del presente capítulo es obtener las densidades de probabilidad de y y de S2 en m.a.s. de poblaciones normales. La figura 4.11 indica de forma gráfica este objetivo.
n
ALGUNOS MODELOS PROBABILÍSTICOS
P O B L A C IÓ N
°l
s22 S.2
F ig. 4.11 L o s e sta d ístico s Y y S 2 so n variab les aleatorias
- 5 Distribución de Y (a 2 conocida) Sea Y:,Y2,...,Yn) una m.a.s. de y~N(|j;o). Dado que Y = XF. /n se tiene que: _ La distribución de será Y normal por ser Y una combinación lineal de F , que son normales. = - ( m + j U+. - M) = H ■ n l=i n 1 n, 1 -> ? 7 (J2 -*V(K) = - r Y V (^ ) = —y(
-•£ (ñ
= - ¿ £ (1 ')
En consecuencia, Y ~ N m;
(4.6)
Conviene reflexionar sobre el resultado (4.6). En primer lugar observamos que Y sería un :r insesgado de (j o, lo que es lo mismo, que Y toma valores alrededor del verdadero valor de (j. >rrundo lugar, la variancia V(Y) puede hacerse tan pequeña como se quiera, si se toma un tamaño nuestra adecuado (aunque puede resultar caro) y, por lo tanto, el valor de Y en una muestra concreta ^rr tan próxima a \á como se desee. Por ello, cuando se quiera jpbtener una buena estimación del parámetro ¡j en una población dicha estimación será Y —Y .
II
K
M ÉTODOS ESTADÍSTICOS. CONTROL Y M EJORA DE LA CALIDAD
También es im portante observar que (4.6) es también cierto para muestras de una población cualquiera (no necesariam ente normal), aunque en este caso el tam año de m uestra no debe ser muy pequeño. Ello es debido al teorema central de límite aplicado a la suma de v.a. del num erador de Y = 'LYJn. La distribución de Y cuando a no sea conocida se estudiará en el apartado 4.9.
4.6 La ley de C hi-cuadrado Para la obtención de la densidad de probabilidad de S2 es necesario introducir una nueva ley de probabilidad conocida como la ley de Chi-cuadrado. La ley de Xv (Chi-cuadrado con v grados de libertad) es la distribución de la suma de los cuadrados de variables aleatorias independientes y todas ellas de distribución N(0;1). La figura 4.12 ilustra el concepto de X v . LEY DE CHI-CUADRADO ( x 2 ) N ( 0 ;I )
N (0;1)
1 76
2
3
Y12
Y 13
Y 22
Y 23
Y 31
Y 32
Y 33
Yki
Yk2
Yk3
Yu Y
21
N (0;1)
N (0,1)
l 2 =2 Y; v
\ =\ 1 Fig. 4 .1 2 Esquem a conceptual de la ley de Chi-cuadrado
Supongamos que disponemos de urnas con papeletas en cada una de las cuales hay escrito un número con cuatro decimales, de modo que las frecuencias con que aparecen dichos números sean las definidas por la d.p. de la ley 7V(0,1). Si extraemos una papeleta de cada urna y observamos los núm eros escritos en ellas tendrem os: (yn,yi2,...,y,v). Si elevam os al cuadrado y los sumamos obtendríamos un cierto valor XY^ . Repitiendo esta operación conceptualmente se irían obteniendo valores , £ Y2¡ ,...,que serían realizaciones de la variable aleatoria: x l = ± y ,2 1=1
'• 5*i
donde y ~N(0;1) para ¿=1,2,...,V y las Yi son independientes.
71
ALGUNOS M ODELOS PROBABILÍSTICOS
La densidad de probabilidad de /(* ;) ■
es: y (-)-l K2) e —■ 2- para y > 0
HH
(4.7)
donde T(-) a la función gamma incompleta. 2 La esperanza matemática y la varianza de Xv son: E (X I)
y
V ( x l ) = 2v
Obsérvese que los grados de libertad de la ley de Chi-cuadrado, v, son el número de variables aleatorias independientes que aparecen en el sumatorio: ^
= lif i=i 2
La gráfica d e / ( Xv) depende de v. Es ¿simétrica y sesgada hacia la izquierda para v pequeño como puede observarse en la figura 4.13. La ley de Chi-cuadrado está par cialmente tabulada en el apéndice de tablas tabla F). Para v >30 existen diversas aproxi maciones, como la de Fisher o la de WilsonHilferty. Según nuestra experiencia y de forma empírica, la ley de L se puede aproximar de a forma siguiente: Para v > 200
Para 30 < v < 200
xl ~
log x\
V¡2v) N
logv; J —
4.7 La ley t-Student Student era el seudónimo utilizado por William Gosset cuando trabajaba en la empresa cervecera Guiness en Dublin, que le obligó a no publicar con su auténtico nombre. En aquellos tiempos de principios de siglo, la totalidad de la teoría estadística existente era teoría asintótica y, en consecuencia, válida únicamente para muestras de tamaño grande. Por el contrario, Gosset quería estudiar la relación existente entre la calidad de ciertas materias primas, como '.a cebada y la calidad del producto final, y sólo disponía de muestras pequeñas. Para este tipo de muestras Gosset dedujo la distribución conocida hoy en día como la t-Student. Este es un ejemplo más de que el contacto con la realidad es la mejor fuente de inspiración en la investigación teórica de alta calidad.
M ÉTO D O S E S TA D ÍST IC O S. C O N T R O L Y M EJO R A D E LA C A L ID A D
n
C onceptualm ente la ley t-Student con v grados de libertad la obtuvo G osset com o distribución del estadístico: Z en el que: a) Z~7V(0,1). b)
.
c) Z y U son independientes. La densidad de probabilidad de tv depende de v y tiene la expresión: _ fity) =
.
yfvK
i ?
)
(4.8)
v+1
para 11\ <°°. Los grados de libertad de la t-Student coinciden con los grados de libertad de la ley de Chicuadrado que aparece en el denom inador de tv. La ley t-S tudent está parcialm ente tabulada en el apéndice de tablas (Tabla D). La esperanza m atem ática y la varianza de tv sólo están definidas para v > l y v>2, respectiva m ente, y son: E (tv ) = 0 para v > 1 V( t v ) = ——— para v > 2 v —2 L a g rá fic a de f ( t v) tien e tam b ién fo rm a de cam pana, cen trad a en cero y con co las m ás ex ten sas que la ley norm al, por lo que la t-Student puede resultar de utilidad para m odelar datos en los que se sospeche que haya algunas anom alías m oderadas. C uando (en la práctica, para v>30), la densidad f ( t v) se puede aproxim ar m ediante la ley normal centrada y reducida. En la fig. 4.14 se representan algunas distribuciones de tv. Veremos en el apartado 4.8 que G osset encontró la d en sid ad del e sta d ístic o tv cu an d o se in te re só p o r la distribución del estadístico: t = (F -/i)V ü /s . para m uestras pequeñas, que es el equivalente a Z = F ig. 4 .1 4 D en sid a d de probabilidad de la le y t-Student
yfñ
cuando a es desconocido y se sustituye por su estim ación S.
X
ALGUNOS MODELOS PROBABILÍSTICOS
4.8 Distribución de S2 Sea (Yv Y2,...,Yn) una muestra aleatoria simple de K~/V([í;g). La varianza muestral se acostumbra a definir:
s,„lAíznL donde p=lil n —1
n
Para m.a.s. de poblaciones normales se puede demostrar que: a) Y y S 2 son independientes; S2 2 b) (ti —1)—- se distribuye según una ley Xv con v=n- 1 grados de libertad. cr Una forma intuitiva de comprender a) es la siguiente: Si Y es el vector de observaciones ■Destrales, se puede descomponer en dos componentes ortogonales Y e Y- Y tal como se indica en la rLrura 4.15. Obsérvese que S2 está relacionado únicamente con la urnna de (Y- Y ). _ n_ La ortogonalidad es debido a que ^ Y ( Y ¡ —Y) = 0. j=i De b) se deduce que S E( S 2)
V(S ) =
° 2 E (x U )
n —1 n- 1
n —1 xl-i = ~ ~ ~ 7 (n
n- 1
(n-iy
y-y
y-p°rlotanto: 1) =
C72
2(n-l) =
2a4 n —1
Fig. 4.1 5 vector Y
D esco m p o sició n ortogonal del
Estas dos últimas expresiones justifican el hecho de que S2 se utilice frecuentemente como r de o 2, ya que cumple las dos propiedades que hemos comentado para Y como estimador de (i.
• - Distribución de Y (a 2 desconocida) m m f r 19r v „.9Yn) una m.a.s. de y~/V(|i;a). En general a será desconocida, por lo que el estadístico I = Y-
fj)y[ñ/<7
no será de gran utilidad.
Se podría sustituir a por una estimación S que, si se obtiene a partir de una muestra flñoeniem ente grande, tomará un valor próximo a a y, por lo tanto, la distribución del estadístico:
S/yfñ considerarse idéntica a la de Z, es decir, A^(0;1). Este razonamiento es típico de la teoría « n e c e a . Cuando n->°°9todo resulta fácil. Ya hemos comentado en el apartado 4.6 que Gosset se enfrentaba al problema de determinar la “*-ción de t para muestras pequeñas.
X
M ÉTO D O S ESTA D ÍSTIC O S. C O N T R O L Y M EJORA DE LA C A LID A D
S2 Si se tiene en cu en ta la in d ep en d en cia en tre Y y S2, que (n —l ) —— ~ X 2n-\ y ílue
~
t = (Y-H)yfn
S
=
(Y-tihfü oS/a
= _Z_ = S/o
Z
l(n-l) S2 \ (n —1)
= V
donde, evidentemente, Z~N(0;1) y U~ yJ x l / v con v=w“l y además Z y U son independientes, pues Z sólo depende de Y y JJ de S2. En consecuencia, t se distribuye según la ley t-Student con v= n -1 graarw de libertad, es decir, que para muestras pequeñas: Y —fu t = —, r— ~ t - Student con v = n —l grados. S/ y / n
4.10 E l caso de d os p ob la cio n es n orm ales in d ep en d ien tes 80
Supongamos que X e Y son dos v.a. independientes y tales que X ~ N (|Jx;a x) e Y~N (p y,a y). El lee* puede suponer que X es la duración de vida de las bom billas fabricadas por la em presa A e Y e> duración de vida de las bom billas fabricadas por la em presa B. Sean (X,, X2,...,X nx) una m .a.s. de tam año nx extraída de la población de bom billas de A ( Y v y2f...,y ) una m .a.s. de tam año ny extraída de las bom billas de B. Sean X , S x 2, Y y 5y 2 las medias y varianzas muéstrales. Es fácil dem ostrar que:
En efecto, la norm alidad es consecuencia de la norm alidad de las distribuciones de Y y X , y valor de la esperanza m atem ática y la varianza del estadístico Y - X es consecuencia inmediata óf expresión (4.3). En consecuencia se tendrá que: = (y - x ) - ( n y- ¿ o
n y si además
a 2 = a 2 = a 2,
n.
entonces se cum plirá que: Z = ( Y - X ) - ( H y - H x ) ~ N ( 0;1) 1 1 — I---n. n
<4
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
n
La primera idea consiste en seleccionar 10 sensores del tipo A y otros 10 del tipo B y y colocarlos en los tubos de escape de 20 coches distintos. No obstante, un ingeniero de la empresa sugiere que el experimento debería bloquearse para evitar que la variabilidad entre coches distintos enmascarase los resultados del experimento. Para ello sugiere que se utilicen 10 coches y que en cada uno de ellos se monte un sensor A y otro B, ambos colocados en el silencioso y en dos posiciones cercanas entre sí. El contenido en partes por millón de CO observado en el experimento fue el que se indica en la siguiente tabla. a) Describa brevemente el mecanismo de aleatorización del experimento. NÚM. T IP O A T IP O B b) ¿Cuál sería la distribución de referencia para comparar los 1 72.1 7 4.0 valores medios de los dos tipos de sensores, si el experimento se 2 6 8 .2 68.8 hubiera llevado a cabo con los 20 coches? 3 7 0.9 71.2 4 74.3 7 4.2 c) ¿Qué decisión se tomaría con la distribución de referencia 5 70.7 7 1 .8 anterior? 6 66 .6 66 .4 d) Dado que el experimento se ha realizado según el diseño del 7 69.5 69.8 8 70.8 7 1.3 propuesto por el ingeniero, es decir con 10 coches, ¿es preferible 9 68.8 69.3 utilizar 10 coches del mismo modelo, o 10 coches de modelos y 10 73.3 7 3.6 cilindradas diferentes? 5.5.
Una fábrica de jabones produce detergente en dos plantas gemelas, una en Getafe y otra en Granollers. En Granollers utilizan materia prima del proveedor A y en Getafe materia prima del proveedor B. Se desea comparar la influencia de los dos proveedores en la producción, para lo cual se recopilan cantidades producidas en las dos plantas durante 25 días, con los siguientes resultados: PRO V EEDO R A
PROVEEDOR B
25
25
130.0 Tm
127.2 Tm
4.5 Tm
3.1 Tm
D ÍA S PR O D U C C IÓ N M E D IA D E S V IA C IÓ N TIPO
5.6.
Se desea comparar dos programas de entrenamiento de trabajadores en una línea de producción. Se escogen 10 al azar para ser entrenados por el método A y 10 para ser entrenados por el método B. Finalizados los programas de entrenamiento, se mide el tiempo que tardan en realizar una de las operaciones en la cadena, y se obtenienen los siguientes resultados: T IE M P O
a) b) c) d)
a) Basándose en este estudio, ¿qué pro veedor es preferible? b) Comentar el diseño del experimento y los resultados obtenidos.
(minutos)
M ÉTODO A
15
20
11
23
16
21
18
16
27
24
M ÉTODO B
23
31
13
19
23
17
28
26
25
28
¿Es mejor uno de los métodos que el otro? ¿Qué suposiciones han sido necesarias? ¿Qué papel desempeña la aleatorización a la hora de escoger a los trabajadores? ¿Qué otros factores pueden tener importancia en el tiempo empleado por cada trabajador? ¿Es posible protegerse de los mismos?
n
COMPARACIÓN DE DOS TRATAMIENTOS
5.7.
Una fábrica dedicada a la fabricación de losetas para el recubrimiento de naves espaciales recibe el encargo de una empresa muy importante dedicada a la aeronáutica. Dicha fábrica produce dos tipos de losetas, A y B. Para saber qué tipo de losetas preferirá la empresa se hace una prueba con 18 losetas (9 del tipo A y 9 del tipo B), introduciéndolas en hornos a 10.000°C y anotando el tiempo transcurrido hasta su rotura. Los resultados, en horas, son los indicados en la tabla adjunta. a) ¿Qué losetas preferirá la empresa? b) ¿Cómo se podría haber mejorado la precisión del experimento? ¿Por qué?
A
B
54.6 45.8 57.4 40.1 56.3 51.5 50.7 64.5 52.6
58.9 65.7 55.6 57.6 64.2 60.8 59.8 59.0 50.3
101
M ÉTO D O S ESTA D ÍST IC O S. C O N T R O L Y M E JO R A D E LA C A L ID A D ---------------------------------------------------------------------------------------------------------------------------
71
A p én d ice 5A Test d e co m p a ra ció n d e m ed ia s cu an d o no p u ed e asu m irse la igu ald ad d e v a ria n za s p o b la cio n a les U na de las hipótesis que hacíam os al aplicar la técnica de com paración de m edias en diseños totalm ente aleatorizados era suponer la igualdad de varianzas poblacionales. Si no puede asum irse esta hipótesis, puede obtenerse una buena aproxim ación al nivel de significación resultante calculando el estadístico: (yB - ya) t' n
n
Si nA = nB = n , el nivel de significación se determina utilizando com o distribución de referencia una t de Student con n - 1 grados de libertad (figura 5A.1). Si nA^ n B, con el valor calculado de f se hallan los niveles de significación p A y p B en F ig. 5A .1 N iv e l d e sig n iñ c a ció n en el c a so de m uestras distribuciones t de Student con nA- 1 y nB- 1 grados del m ism o tam año de libertad (figura 5A.2). Siendo en este caso el nivel de significación de la prueba: P 102
A
=
con:
co
PA co
^
B
PB
Cú
n
F ig. 5 A .2 V alores p revios al cá lcu lo d el n iv e l de sig n ific a c ió n en e l ca so d e tam años de m uestra d iferentes
Ejercicio:
¿Qué hacer si en un diseño en bloques aleatorizados no puede suponerse la hipótesis de igualdad de varianzas poblacionales? (Ayuda: Repase cuáles son las hipótesis que se realizan en este caso.)
X
ALGUNOS MODELOS PROBABILÍSTICOS
En general a 2 será desconocida, pero se puede estimar a partir de una media ponderada de las dos varianzas muéstrales. La estimación de la varianza común desconocida será por tanto: (n - l ) S v2 + (n -1)S: ny + n x - 2 En este caso se tendrá que: ( Y - X ) - ( n y - f i x) t = --------- , ------- t-S u d en tco n v = n v + n —2 (1 1 y S — +— Vn y n x r*ados de libertad, ya que éste es el denominador de (4.11) utilizado para estimar a 2.
-.11 La ley F-Snedecor 5 definimos una v.a. F :
81
— que y U~ x l x, V~ x l 2 y U y V son independientes, entonces F se distribuye según la ley F-Snedecor - i r. v grados de libertad para el numerador y v2 grados de libertad para el denominador. La distribución F debe su importancia al uso que de ella se hace en el análisis de la varianza y limbién cuando se quieren comparar dos varianzas de poblaciones normales, como veremos en el citado siguiente. La esperanza matemática y la varianza de F son: E( F) = ——— V, — 2
=
para
* ■ > . + v* ^ 2)
v2 > 2
y>4
v , ( v 2 - 2) (v 2 - 4 )
En el apéndice de tablas están tabulados los valores / ra(v1,v2) para algunos valores de a , es necir el valor Fa(y vv 2) que, en una ley F de Snedecor con grados de libertad para el numerador y v2 r«ir¿ el denominador, deja un área de valor a a su derecha. Para el manejo de estas tablas resulta de utilidad el hecho de que:
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
4.12 D istribución del cociente de dos varianzas m uéstrales Para la situación descrita en el apartado 4.9 vamos a estudiar la distribución de Sy2/Sx2. Dado que: 2
S 2y cr2y ( r t - 1)—Y----> <*y " v " 1
« donde, como hemos visto en 4.7, í/~ ^
<*, «, -1
52
Kl 11
V :
».-i
, V~ #ÍL, y U, V son independientes, en consecuencia:
En el caso particular en que
82
U 2 ------- CJ. WV“ 1 '
n
ALGUNOS MODELOS PROBA BILÍSTICOS
E jercicios 4.1
Un estudiante desea aprobar una asignatura que consta de 100 temas estudiando el mínimo posible. El examen consta de tres preguntas que el alumno escoge al azar de una urna con 100 papeletas numeradas del 1 al 100; las tres papeletas que saca el estudiante corresponden a los tres temas de los cuales debe escoger uno para exponer. a) ¿Cuál es el menor número de temas que puede estudiar para que con una probabilidad no inferior al 95% extraiga alguna papeleta correspondiente a un tema conocido? b) ¿Y si la probabilidad es del 100%?
4.2.
Un jugador observa que en 100 jugadas consecutivas de la ruleta el rojo ha aparecido en 70 ocasiones. ¿Se puede decir que ello es debido al azar?
4.3.
Una máquina fabrica arandelas cuyo radio interior r se distribuye según una ley normal de media 20 mm y desviación tipo 0,3 mm, y cuyo radio exterior R se distribuye según una ley norm al de m edia 50 mm y desviación tipo 0,4 mm. A m bas variables aleatorias son independientes. Se considera que una pieza es defectuosa si la diferencia de radios supera los 30,98 mm o bien si dicha diferencia es menor de 29,22 mm. a) ¿Cuál es la probabilidad de que una arandela sea defectuosa? b) Si se recoge una m uestra de 20 arandelas, ¿cuál es el valor esperado de la proporción de arandelas defectuosas? c) De la m uestra de 20 arandelas, ¿qué probabilidad existe de que se encuentren 5 arandelas defectuosas?
-
La duración en horas de las lámparas adquiridas en una determinada empresa se distribuye según una ley normal Af(1.200;a). Se sabe que el 97% de todas las lámparas citadas dura entre 1.178,3 horas y 1.221,7 horas. Si se extraen 200 muestras aleatorias simples de 9 lámparas cada una: a) ¿Cuál es la probabilidad de que la media muestral supere las 1.203,5 horas en al menos 90 de las 200 muestras? bi ¿Cuál es la probabilidad de que la s2 muestral supere el valor 193,84 h en 40 muestras como máximo?
4.
4-5.
Una línea eléctrica se avería cuando la tensión sobrepasa la capacidad de la línea. Si la tensión es iV ( (u, =100; a , =20) y la capacidad es N( \x2 = 140; a 7 = 10), calcular la probabilidad de avería.
U .
En un concesionario de ventas de automóviles se supone, por la experiencia que se tiene, que cuando una persona entra a interesarse por un coche, acaba comprándolo en el 20% de los casos. Si en un día se atiende a seis de estos clientes potenciales: ¿Cuál es la probabilidad de que realicen cuatro ventas en este día exactamente? ¿Y la probabilidad de que en este día se realicen más de cuatro ventas? ¿Cuál sería la probabilidad, en el caso de que apareciesen 15 clientes, de que se realizasen menos de tres ventas?
\
¿ b :
MÉTODOS ESTADÍSTICOS. CONTROL Y M EJORA DE LA CA LID AD
4.7.
U na cierta m áquina de fabricación de rollos de cinta aislante tiene un prom edio de dos defectos cada \ .000 m. C a\cu\ar \a probabilidad de que \m rollo de 3.000 m*. a) no contenga defectos; b) contenga exactam ente 5 defectos; c) contenga menos de 4 defectos.
4.8.
M ediante un estudio estadístico realizado en una fábrica de com ponentes electrónicos se sahc que sólo 1 de cada 100 es defectuoso. Si se em paquetan dichos com ponentes en cajas :v r grupos de 500, ¿cuál es la p ro b ab ilid ad de que la caja no co n ten g a ningún com poner:* defectuoso? Y si se decide em paquetar las cajas en grupos de 100 com ponentes, ¿cuál es la probabilidad ó t que una determ inada caja no tenga ningún com ponente defectuoso?
4.9.
Una em presa fabricante de detergentes tiene dos m áquinas de llenado. Se sabe que la m á q u w A llena según /V(87,5 g; 0,5 g) y otra m áquina B llena según 7V(87,5 g; 0,8 g). Para que nc ^ rechace una bolsa llena, el contenido de detergente no puede ser m enor de 86 gramos. a) ¿Q ué probabilidad hay de que una bolsa, escogida la azar, llenada p o r la m áquina A rechazada? Idem si es llenada por la m áquina B. b) Si la bolsas vacías tien en un peso que se d istrib u y e según N (21,5 g; 1,2 g), ¿cuál es ki probabilidad de que el peso de una bolsa llena, escogida al azar, llenada por la m áquina A scfl m ayor de 110 gram os? Idem para la m áquina B. c) Se ha recogido una m uestra de 10 bolsas llenas producidas por una única m áquina y se h a pesado. El resultado es el siguiente: 109
105
112
111
108.5
107.5
111.5
108
109.5
108
¿Qué m áquina cree que las habrá producido? Razone la respuesta.
4.10.
Se sabe que el 20% de los árboles de un determ inado bosque están atacados por un cierto t.pe de parásitos. a) ¿Cuál es la probabilidad de que el núm ero de árboles con el parásito en una m uestra de 300 es* entre 49 y 71 ? b) Suponga que en la m uestra de 300 árboles hay 72 con el parásito. ¿C ontradice esto la hipótesis de que la p o blación está p arasitad a en un 20% ? Razone a respuesta justificándola con las hipótesis necesarias.
Comparación de dos tratamientos
El análisis estadístico que se aborda en este capítulo tiene como objetivo la comparación de dos poblaciones, que representan lo que genéricamente denominamos “tratamientos”, pudiendo referimos bajo esta denominación a dos máquinas, dos métodos de trabajo, dos catalizadores, dos proveedores, o dos tipos de materia prima distintos. Dicha comparación se realiza a partir de datos muéstrales. Se tratará de determinar si la diferencia que presentan las medias de las dos muestras es indicativa de una diferencia en las medias poblacionales o si, por el contrario, puede ser atribuida al azar. Es importante tener presente que el estudio estadístico no se refiere simplemente a la aplicación del test de rigor a unos datos de los que no se cuestiona su calidad (quién, cómo, cuándo, con qué criterio se han tomado). Tal como veremos a continuación, el análisis empieza con un claro planteamiento del problema y sigue con el adecuado diseño de la recogida de los datos (sin descuidar el rigor necesario en su recogida física). A continuación se realiza un análisis exploratorio para detectar posibles valores anómalos, constatar que no existe evidencia de incumplimiento de las hipótesis del método, y también para obtener unas primeras conclusiones en torno al objetivo del estudio. Finalmente, se realiza el test estadístico (contraste de hipótesis) y se interpreta el resultado obtenido.
5.1 Caso 1: Com paración de dos productos en un proceso de curtido de piel 5.1.1 Planteamiento del problema. Recogida de los datos L’na industria dedicada al curtido de pieles utiliza normalmente una cierta solución A, en la que sumerge el cuero durante 4 horas en la fase final de su proceso de curtido. Aunque el producto A produce unos resultados satisfactorios, se presenta la oportunidad de sustituirlo por otro producto B, considerablemente más barato. Se sospecha, sin embargo, que la nueva solución puede afectar a las características del cuero reduciendo su resistencia a la tracción. Los responsables del proceso deciden cambiar, sólo en el caso de constatar experimentalmente que la nueva solución no reduce la resistencia a la tracción. Para ello, realizan unos experimentos con el fin de analizar los resultados obtenidos y tomar una decisión sobre este tema.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
71
Para la realización del experimento se toman 20 porciones de cuero, todos ellos de calidad y características lo más parecidas posible, y aleatoriamente se asignan 10 para ser tratados con el producto A y otros 10 con el B. C U R T ID O C O N C U R T ID O C O N Para realizar la prueba se dispone de 20 recipientes, todos ellos SO L U C IÓ N B SO L U C IÓ N A idénticos, a 10 de los cuales se le asigna la solución A y a otros 10 la 24.4(1) 2 4 .3 <2) B. Los trozos de cuero se sumergen simultáneamente, y todos ellos se 2 5 .6 <3) 21.5(4) retiran al cabo de las 4 horas. 2 5 . í {6) 2 6 .7 <5) Posteriormente se dejan reposar durante 2 días (todos ellos en iguales 22.8(7) 22Jm 25.2(8) condiciones) y se procede a medir su resistencia a la tracción, 2 4 .8 m> 23.5(10) 2 3 .8 (12> aplicando una metodología perfectamente definida. Para evitar la 22.2(13) 25.9i14) influencia de posibles derivas en el aparato de medida, o vicios en el 26 .4 '16) 23.5{l5) proceso de medición, éste se realiza también de manera aleatoria. Los 23.3(19) 2 5 .8
5.1.2 Análisis exploratorio. Formalización del problema Siempre conviene representar los datos gráficamente. En la figura 5.1 se presentan los diagramas de puntos correspondientes a ambos conjuntos de datos. No se observan valores anómalos, y ya se adivina que la diferencia de medias va a resultar significativa.
• ____ I________• ___|_*_____ ! ___f * ----- |----------------- • ------ • 1
22.0
23.0
24.0
25.0
26.0
A
27.0
Fig. 5.1 Diagramas de puntos correspondientes a los datos obtenidos en las pruebas de curtido
Para constatar que el orden en que se han realizado las mediciones no ha afectado a la respu pueden realizarse diagramas en los que se coloque el orden de obtención en el eje horizontal y en vertical el valor obtenido. La figura 5.2 presenta dichos diagramas para cada una de las soluciones, que se observe nada anormal. Supongamos, como hipótesis de partida, que las resistencias a la tracción son ig independientemente de la solución utilizada. A esta hipótesis se la denomina hipótesis nula (H ,» supondremos, asimismo, que en caso de no cumplirse dicha hipótesis, las unidades curtidas con la í ción A tendrán una resistencia mayor que las que hayan utilizado la solución B. Esta hipótesis, que¡ la que consideramos que se cumple en el caso de no cumplirse la hipótesis nula, se denomina hi alternativa (//,). Podemos notar el planteamiento realizado de la forma: #0 • Ma — Mb H i : Ma >
Mb
X
COMPARACIÓN DE DOS TRATAMIENTOS
SOLUCIÓN
A
SOLUCIÓN
B
Fig. 5.2 Diagramas en secuencia temporal de los resultados obtenidos
: i -3 Resolución 'recuente realizar la hipótesis de que las poblaciones de las cuales provienen las muestras son — ales, por tanto, podemos escribir: y Á ~ N ( m a , o a) Y análogamente para los valores obtenidos con la solución B : yb Por tanto, las medias de los valores obtenidos se distribuirán de la forma:
yA ~ N V a *
yB~N j :. -cuerdo con lo visto en el capítulo 4:
yA - y B ~ ^ Por tanto:
Va - V i
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CA LID AD
~ N ( 0 , 1)
Vn A
n B
Pero no conocem os o A2 ni o B2, sino que los estim am os a partir de sus respectivas vari muéstrales: sA2 = 1,54, .sB2 = 1,53. Estos valores son tan parecidos que, evidentem ente, p< suponer que las varianzas poblacionales son iguales. En el caso de que las varianzas mués presentaran m ayor diferencia, antes de realizar esta suposición se debería realizar el test de ig de varianzas, utilizando la distribución F de Snedecor. Ejem plo 5.1a Se tom an 2 m uestras aleatorias simples de tam año n = 10 de sendas poblac normales, y se obtiene sA2 = 1,54 y sB2 = 2,18. ¿Puede considerarse que varianzas poblacionales son iguales? Hacemos: 2,18 si = 1,42 1,54 si Com parando el valor obtenido con una distribución F de Snedecor con 9 > grados de libertad, se obtiene que el área de la cola es m ayor de 0,25 y, por nada se opone a suponer que a A2 = a B2. Ejem plo 5.1b Igual planteam iento que en el ejem plo anterior, pero ahora consideram os sa2=1,54 y s b 2= \ 6 ,3. En este caso se obtiene 7^=10,58, y el área de la cola resulta ser m enor de 0. luego no podrá trabajarse con la hipótesis de igualdad de varianzas poblacion En el apéndice 5A se com enta qué hacer en el caso de que se dé circunstancia. En nuestro caso, calcularem os un estim ador de la varianza poblacional única, que serm edia de las varianzas m uéstrales ponderada según los grados de libertad de cada m uestra (si m uestras son del m ism o tam año com o en nuestro caso, esto se convierte en una simple aritm ética). Con dicho estim ador único podem os escribir: t
con nA + n B —2 g.l.
Si se cum pliera que pA - jjb = 0, tendríam os que:
tx —
En nuestro caso tenemos:
(
1
^3
1
~
t
con
nA + n B —2g. l .
71
COMPARACIÓN DE DOS TRATAMIENTOS
h=
(25,14-23,62) ---------L = 2,74 1,24
Si se cumpliera la hipótesis nula (recordemos: H 0: |JA= pB), el valor t] obtenido pertenecería a una distribución t de Student con 18 grados de libertad. ¿Puede considerarse que esto es así? Una forma de determinar hasta qué punto es normal un valor en una distribución, es a través del área de la cola que define. Consultando las tablas observamos que Pr(t > 2,74) = 0,007, luego éste es un valor muy poco probable en su distribución de referencia. Si las medias de A y B fueran iguales, se darían diferencias como la observada o mayores, realizando una prueba como la que aquí se ha hecho, el 0,7 % de las veces. Luego, en este caso, lo más razonable será considerar que las medias poblacionales son distintas y diremos que la diferencia entre ías medias muéstrales es estadísticamente significativa. ¿Estamos absolutamente seguros de que la media de resultados con la solución B es menor que ^on la solución A l La respuesta es no pero la probabilidad de equivocamos al hacer esta afirmación es 'ólo del 0,7 %.
5.2 G eneralización del caso de la com paración de dos productos para el curtido: com paración de m edias en diseños totalm ente aleatorizados La recogida de datos debe hacerse de forma que el único factor que influya de forma distinta en ambas -nuestras sea aquel cuyo efecto se desea estudiar. Si otros factores también afectaran de forma distinta, ería imposible distinguir si las diferencias apreciadas (en el caso de que existieran) deberían ser _:nbuidas al factor estudiado o a otros de los que accidentalmente hubieran podido influir. Deberán seguirse, por tanto, dos reglas básicas al planificar la recogida de datos: ► Asegurarse de que todos los factores que puedan tener alguna influencia en la respuesta, influyan exactamente igual en las dos muestras (excepto aquel cuyo efecto se desea estudiar). ► Aleatorizar todo lo que se pueda para protegerse de posibles sesgos introducidos por factores no identificados. Así, en el ejemplo de la comparación de soluciones ha sido necesario asegurarse de que todos : - factores que podían influir en la respuesta (tipo de piel, tiempo que está sumergida en la solución, empo y condiciones de secado, etc.) afectasen exactamente igual a las unidades tratadas con ambas .aciones. Y aunque consideremos que los 20 retales de piel son muy parecidos (no serán idénticos), >s asignaremos aleatoriamente a cada tratamiento y, por si influyera el orden de medición, también —ediremos aleatoriamente. Una vez recogidos los datos es necesario constatar que nada se opone al cumplimiento de las ■ pótesis en que se basa el método a aplicar. Estas son: ► N orm alidad de las 2 poblaciones. Una form a práctica de com probarlo sería realizando los histogram as de ambas m uestras, pero en la práctica difícilm ente encontrarem os evidencia de no norm alidad de las poblaciones, porque dispondrem os de m uestras de tamaños pequeños. En cualquier caso, ésta es una hipótesis poco crítica, ya que lo que realm ente se supone es que las medias se distribuyen según una normal, lo cual en general podrá considerarse cierto por el teorem a central del límite. Por otra parte, se conoce que las pruebas que utilizan como distribución de referencia la t-Student son robustas frente a la hipótesis de normalidad.
I MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Independencia de las poblaciones. Es una hipótesis que suponemos al decir que: v { y A - y B)
+
El origen de los datos pone de manifiesto si las poblaciones pueden considerarse independí; tes o no. ► Aleatoriedad de las muestras. Ésta es una hipótesis absolutamente crítica. El objetivo es exti conclusiones sobre las poblaciones a partir del análisis de las muestras y, por lo tanto. ésLarf deberán ser representativas. La aleatoriedad garantiza la representatividad. La obtención de muestras verdaderamente aleatorias debe ser el objetivo del diseño de la recogida de datos. L correcta aleatorización contribuye a asegurar el cumplimiento de esta hipótesis. ► Igualdad de varianzas poblacionales. Si se trabaja con esta hipótesis es necesario co m p ro b é que nada se opone a su cumplimiento. Para ello se puede aplicar el test de igualdad de varianza tal como se ha presentado en el capítulo 4. Un adecuado análisis exploratorio de los datos también ayuda a constatar el cumplimiento ce las hipótesis anteriores, además de identificar posibles valores anómalos o extraer unas primeras conclusiones, tal como se ha visto en el ejemplo anterior. A continuación, los cálculos a'desarrollar son los siguientes: 1. Calcular el estimador de la varianza poblacional única (media de las varianzas muéstrales ponderada según los grados de libertad de cada muestra). [nA ~ i) + [nB - l) nA + nB - 2
90
2. Calcular el valor de tQ, el cual pertenecerá a una distribución t de Student con nA+nB-2 gradede libertad, si las medias poblacionales son iguales. h)
—
ya - yn i i — +— n A nB
3. Comparar el valor de tQcon su distribución de referencia. Si la hipótesis alternativa es del tipo //,: (JA > |JB, como en el caso que se ha planteado, se determina la probabilidad de que se presente un valor como el obtenido o mayor, y a esta probabilidad se le denomina nivel ce significación.
Fig. 5.3 C om paración del estad ístico de prueba en su distri bución de referencia
En el apartado 5.6 se explica cómo calcular e nivel de significación según sea la hipótesis alternativa planteada. El nivel de significación obtenido es un^ información que ayuda a tomar la decisión m¿' adecuada. En general, un nivel de significación pequeño aconseja rechazar la hipótesis de igual dad de medias, aunque para tomar la decisión habrá que considerar también otro tipo de infor mación: costes, riesgos que se corren en caso de equivocarse, etc.
X
COMPARACIÓN DE DOS TRATAMIENTOS
5.3 Caso 2: com paración de dos tratam ientos superficiales para lentes 5.3.1 Planteamiento. Recogida de los datos Cierta industria fabricante de lentes para gafas desea comparar dos tipos de recubrimiento ¿ntirreflectante. Los dos tipos tienen idéntico aspecto y prestaciones, pero antes de decidirse por uno a otro desean comprobar si el tipo de recubrimiento influye en el deterioro que sufre la lente. En un principio, piensan seleccionar al azar 20 personas que utilicen gafas, y asignar aleatoria mente gafas sometidas al tratamiento A a 10 de ellas y gafas con el tratamiento B a las otras 10. Al abo de 6 meses se realizaría un control y, tras tomar medidas con el instrumento adecuado, se ^-“.alizaría si existían o no diferencias estadísticamente significativas. Pero el método planteado tiene un inconveniente. En el desgaste que sufre la lente no sólo nfluye el recubrimiento superficial, sino también el trato que recibe por parte del usuario. Si la recogida de los datos se lleva a cabo de la forma antes planteada, se corre el riesgo de que, si algunas -«ersonas, por sus hábitos o profesión, deteriorasen las lentes más de lo normal (o menos) y no se '¿partiesen equitativamente entre los dos tratamientos, atribuyamos a algún tratamiento un efecto que - le correspondiera, ya que en realidad lo pro•ocarían las personas. D E SG A STE D ESG A STE D IFE R EN C IA ¿Es posible eliminar el efecto de las IN D IV ID U O LENTE A LENTE B B-A personas en el desgaste de las lentes? Sí puede 1 6.7 (I) 6.9 (D ) 0.2 nacerse. La mejor forma será construyendo las 2 5.0 (1 ) 5.8 (D ) 0.8 gafas con una lente de cada tipo. Si alguien las 3 3.6 (D ) 0.5 4.1 (I) 4 6 .2 (I) 7.0 (D ) 0.8 desgasta mucho lo hará con ambos trata 5.9 (D ) 5 7 .0 (I) 1.1 mientos, igual que si las desgasta poco. Natu 6 4 .0 (D ) 4 .6 (I) 0.6 ralmente, el método de análisis de los datos 7 5.2 (D) 5.5 (I) 0.3 beberá tener en cuenta la forma en que se han 8 4.5 (I) 5.0 (D ) 0.5 9 -0.1 4.4 (D) 4 .3 (1 ) •acogido. 10 4.1 (I) 4.8 (D) 0.7 Supongamos que la prueba se ha reali Media 4.96 5.50 0.55 zado de esta forma (con 10 individuos) y que al cabo de 6 meses se mide el desgaste, y se Tabla 5.1 Resultados del estudio realizado para comparar el obtienen los valores que se indican en la tabla desgaste de dos tipos de lentes. La letra entre paréntesis indica 5 1 (en unidades codificadas). la posición (izquierda o derecha) a que se ha asignado aleato riamente cada lente
5-3.2 Análisis exploratorio
R esp u esta
ruando ios datos se han recogido de esta : rma, una representación gráfica muy ¿cecuada es la que se indica en la figura c - Además, por supuesto, se pueden ‘r-lizar los gráficos que en cada caso se consideren oportunos.
F 5.4 Representación gráfica de los resultados écenidos en el estudio de comparación del desgaste io s tipos de lentes
Individuo
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
71
5.3.3 Resolución El análisis de los datos no se realiza como en el caso anterior (ahora no se cumpliría la hipótesis de poblaciones independientes), sino que se analizan las diferencias que se observan dentro de cada individuo entre un tratamiento y otro. Seguiremos suponiendo que los resultados de ambos tratamientos pertenecen a sendas poblaciones normales, es decir: yA ~ NQlA, CJA) ~ ^(H b’ <*B) y por tanto: y B -A
~ t f í U r T M * ’ <*d )
donde a d es la desviación tipo de las diferencias. Si las medias poblacionales son iguales, y B A se distribuirá según una normal de media cero y una desviación tipo que puede estimarse mediante la desviación tipo de las diferencias.
n —1 Obteniéndose con nuestros datos, sd = 0,344 y la media de las diferencias se distribuirá de la forma: d ~N En nuestro caso tenemos que d = 0,54. ¿Podemos considerar que pertenece a la distribución anterior? Si así fuera tendríamos que: J L - n {o.i) u d
O, al trabajar con un valor estimado de Gd: —- ~ / —Student con n — l g .l. sd En nuestro caso tenemos que: d -----
=
4,97
y éste es un valor muy poco probable en su distribución de referencia (nivel de significación de 0,0008). Por tanto, podemos afirmar con una probabilidad de error de 0,0008 que el recubrimiento B se deteriora más fácilmente que el A (figura 5.5).
K
COMPARACIÓN DE DOS TRATAMIENTOS
5.4 Generalización del caso de la comparación de dos tratamientos superficiales de entes: comparación de medias en diseños en bloques aleatorizados En muchos casos existe algún factor que influye sobre la respuesta y no puede asegurarse que afecte exactamente igual a los dos tratamientos. En el caso anterior se trataba del efecto del individuo en el lesgaste de sus lentes, y las diferencias se calculaban para cada individuo, es decir, dentro de bloques homogéneos. En muchas otras circunstancias conviene diseñar la recogida de datos de esta forma. Tiempo, máquina o materia prima, pueden afectar a la respuesta y requerir que se formen bloques para analizar - datos dentro de los mismos. Dentro de cada bloque, el orden de recogida de los datos se aleatoriza, ror eso se llaman diseños en bloques aleatorizados. Ejemplo 5.1 Se desea comparar el valor obtenido con un aparato electrónico para la medida de la tensión arterial con un instrumento clásico de columna de mercurio. ¿Cómo deberían tomarse los datos? Naturalmente, no sería un buen procedimiento elegir dos grupos de personas, tomar la tensión con el aparato electrónico a un grupo, con el clásico al otro y comparar. En la respuesta, además del aparato influye la persona y, por tanto, lo correcto será tomar la tensión a cada uno con los dos instrumentos y analizar las diferencias por persona. Ejemplo 5.2 Se desea comparar la cantidad de producto fabricado utilizando dos procedi mientos de montaje distintos. Una unidad de medida que se considera correcta es la producción obtenida durante 4 horas. Se sabe que no hay variaciones de productividad a lo largo del día, pero sí puede haberlas de un día a otro. ¿Cómo tomar los datos? Podrían tomarse dos datos cada día, uno con cada procedimiento, correspon dientes a la producción obtenida durante 4 horas seguidas (aleatorizando cada día qué procedimiento se hacía primero). De esta forma, la diferencia de producción de un día a otro no afectaría a las conclusiones obtenidas. Cuando los datos se han recogido de esta forma, y considerando que el efecto bloque afecta por a los dos tratamientos (efecto aditivo), su método de análisis requiere el cumplimiento de las relentes hipótesis: ► Normalidad de las dos poblaciones. En realidad lo que se supone es la normalidad de yB-yA, aunque, como en el caso de los diseños totalmente aleatorizados, ésta es una hipótesis poco crítica, ya que siempre se podrá suponer que la diferencia media sigue una distribución normal.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
71
► Independencia de las diferencias. O lo que es lo mismo, las diferencias son una muestra aleatoria simple de la población de diferencias. Si se ha aleatorizado correctamente y la recogida de datos se ha llevado a cabo con la meticulosidad requerida, en general se podra suponer el cumplimiento de esta hipótesis. El obligado análisis exploratorio de los datos servirá también para poner de manifiesto que no existen pruebas de incumplimiento de la hipótesis anterior. Además del gráfico del tipo que se visto en la figura 5.4, puede realizarse, por ejemplo, un gráfico de las diferencias en función del orden de obtención de los datos. En el caso de las lentes, tendrá el aspecto que se indica en la figura 5.6, que pone de manifiesto un patrón de comportamiento aleatorio en torno a su valor medio, tal como era de esperar. Una vez se tienen los datos, los cálculos que se D iferencia deben desarrollar son los siguientes: B -A 1. Calcular las diferencias dentro de cada bloque, y 1.2 también la media ( d ) y la desviación tipo (sá) de dichas diferencias. 2. Calcular el valor del estadístico de prueba. —
t
=
3. Comparar el valor del estadístico de prueba con su distribución de referencia, que será una t de Student Individuo con n- 1 grados de libertad. Determinar la probabilidad de que en dicha distribución se presente un valor igual Fig. 5.6 Diagrama que representa la diferencia de des que el obtenido o superior. Esta probabilidad será el gaste para cada individuo nivel de significación de la prueba. Si el nivel de significación es bajo se rechazará la hipótesis de igualdad de medias y diremos que la diferencia observada entre un tratamiento y otro es estadísticamente significativa. -
1.2
5.5 A leatorización y bloqueo: recapitulación En una prueba para la comparación de dos tratamientos, puede considerarse que en los datos obtenidos influyen cuatro tipos de factores: i) El factor cuyo efecto se desea estudiar (el tipo de recubrimiento superficial en el caso que hemos visto anteriormente). ii) Factores identificados que pueden influir en la respuesta, pero que es posible mantener constantes para los dos tratamientos (como podría ser el tipo de montura, que quizá influya en el desgaste de lente, pero cuyo efecto se podría neutralizar utilizando siempre monturas del mismo tipo). iii) Factores identificados que pueden influir en la respuesta y que resulta imposible mantener constantes para los dos tratamientos (como el trato que se da a las gafas y el desgaste que sufren). iv) Otros factores, no identificados, que también pueden tener influencia en los resultados obtenidos (quizá el orden en que se efectúan las mediciones por la existencia de pequeñas derivas en el aparato de medida, tal como se ha comentado anteriormente).
COMPARACIÓN DE DOS TRATAMIENTOS
%
Obviamente, el factor estudiado debe afectar de forma distinta a cada tratamiento (en el caso de afectar igual sería imposible detectar su posible efecto). ¿Qué hacer con los factores identificados del tipo ii? No nos interesará que afecten de forma >tinta a cada tratamiento, por tanto, deberán mantenerse exactamente igual tanto en un tratamiento womo en el otro. Pero, ¿y si no es posible mantenerlos constantes? (caso de los factores tipo iii). En este caso será -.ecesario bloquear, es decir, analizar las diferencias dentro de bloques homogéneos en los que estos rectores afecten por igual. En general, a medida que transcurre el tiempo, y cuanto mayor es el período en el que se rrocede a la recogida de los datos, mayor es la probabilidad de que aparezcan variabilidades no deseadas (los lunes se trabaja de forma distinta a los viernes, la humedad o la temperatura varían con - *tiempo, etc.). En estos casos, suele ser una buena idea utilizar períodos de tiempo como bloques. Así, en el caso de que se comparen dos métodos de trabajo a partir de un dato por turno, pero se sospeche que el turno de la mañana puede dar un nivel de respuesta distinto del de la tarde, la mejor forma de i¡>eñar la recogida de datos sería la que se indica en la figura 5.7. Man.
Tar.
Man.
A
B
B
D ía 1
Tar.
D ía 2
A
Mañ. B
Tar. A
Mañ.
Tar.
A
Día 3
B Día 4
Fig 5.7 D iseñ o bloqueado por días debido a la diferencia entre tum os
Dentro de cada día (bloque) conviene aleatorizar para protegernos de la influencia de posibles actores del tipo iv (factores no identificados). Si éstos existen, al aleatorizar cabe esperar que su efecto - difumine entre los dos tratamientos y no altere las conclusiones del análisis. La consigna en el diseño de la recogida de datos podría ser “Bloquear lo que se pueda y --eatorizar el resto”. Bloquear neutraliza la influencia de fuentes de variación conocidas, pero no deseadas. Aleatorizar protege del efecto de posibles factores con cierta influencia, pero no :entificados. Volvamos, para terminar este apartado, al caso del curtido de pieles. Si se aprecia que las rorciones de cuero no son idénticas (lo cual es bastante posible) un diseño mejor que el propuesto . insistiría en tomar sólo 10 retales, dividirlos por la mitad, aplicar a un trozo el tratamiento A y al :ro el B. Aleatoriamente, por supuesto.
5.6 C ontraste de hipótesis. Form alización y lim itaciones El procedimiento seguido en el análisis de los datos para la comparación de medias puede resumirse r- las siguientes etapas: 1. Formular las hipótesis nula (HQ) y alternativa (//,). 2. A partir de los datos disponibles se calcula un valor relevante (estadístico de prueba) mediante una determinada expresión. Si no existe diferencia de medias, el valor obtenido pertenece a una determinada distribución de probabilidad denominada “distribución de referencia”. 3. Se compara el estadístico de prueba con su distribución de referencia, determinando la probabilidad (nivel de significación) de que un valor como el observado (o mayor) sea debido al azar en el caso de que la hipótesis nula sea cierta.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
71
4. Si el nivel de significación es pequeño se rechaza la hipótesis de igualdad de medias y se dice que la diferencia obtenida es “estadísticamente significativa” . Este esquema de razonamiento, muy usado en estadística, recibe el nombre de contraste de hipótesis, ya que lo que hace es suponer que se cumple una determinada hipótesis (H0) y contrastar si los datos de que se dispone son o no coherentes con ésta. Normalmente, la hipótesis nula es del tipo de las que se han planteado en los caso anteriores, es decir: H0- Ha = Hb La hipótesis alternativa puede ser de la forma: Hi'
Ha > V b
°
h i
Va < H b
°
H a * /uB
Los dos primeros planteamientos son, en esencia, el mismo (si no son iguales, una media es mayor que la otra), pero el tercero refleja una mayor desinformación sobre el fenómeno que se estudia, lo cual se traduce en una distinta medida del nivel de significación. La tabla 5.2 indica el enfoque que se da al análisis de los datos en función del resultado obtenido y de cuál sea la hipótesis alternativa planteada. Nótese que si la hipótesis alternativa es del tipo jja ^ jjb se esperan diferencias de medias tanto positivas como negativas. De hecho, en este caso, dada una diferencia, se considera igualmente probable la diferencia en sentido contrario y, por tanto, el nivel de significación (área de cola) se multiplica por 2 en este caso. P L A N T E A M IE N T O D E L C O N T R A S T E R E SU L T A D O
Ha'.
( l A — M-b
Ho'.
O B T E N ID O
H \.
H - A < |ÍB
H x: i i a > 1 ¿ b
M-a = M - b
H0: [í H \\
a
=H
[Ia ^
b b
< yB
Resultado esperado. S e tratará de analizar, mediante el proce dim iento adecuado, si la dife rencia obtenida es estadística m ente significativa o no.
N o hace falta que realicemos ningún cálculo. Con el resultado obtenido es obvio que no podem os rechazar H 0 para quedamos con H \.
ya
> yB
N o hace falta que realicemos ningún cálculo. Con el resul tado obtenido es obvio que no podem os rechazar H q para quedamos con H \.
Resultado esperado. S e tratará de analizar, mediante el proce dim iento adecuado, si la dife rencia obtenida es estadística m ente significativa o no.
ya
= yB
En este caso, que prácticamente no se dará (sería una casualidad), obviam ente no podrá rechazarse la hipótesis nula, sea cual sea la alternativa.
ya
Es necesario analizar si la diferencia obtenida es estadís ticam ente significativa.
Tabla 5.2 A ccion es a emprender en función del planteamiento del contraste y del resultado obtenido
El tipo de hipótesis alternativa que se plantea depende del conocimiento que se tiene del fenómeno en estudio. En una prueba para estudiar la eficacia de un cierto abono, puede saberse (por razonamientos biológicos) que el fertilizante puede aumentar la cosecha o no tener ningún efecto, pero no es posible que la reduzca (en este caso //, sería del tipo |aA>faB). También puede plantearse en función del enfoque que se dé al problema. Si tenemos un proveedor habitual (A), del que estamos básicamente satisfechos, y se plantea la posibilidad de cambiar a otro (B), que podría ser mejor, la hipótesis alternativa debería ser del tipo (ía<(jb. Puede plantear una cierta perplejidad la circunstancia de que el nivel de significación sea uno o justamente el doble en función de cuál sea la hipótesis alternativa que se plantee (decisión no exenta,
COMPARACIÓN DE DOS TRATAMIENTOS
X
algunos casos, de cierta arbitrariedad). Esta r*: rma de proceder puede justificarse con el -■Alimento de que, si sólo se sabe que las ~rdias son iguales o son distintas, se conoce - rnos sobre el proceso que si se está seguro de --c. si no son iguales, una en concreto es mayor que la otra. La menor información que ^ tiene en el primer caso se traduce en una -.íyor probabilidad de error al rechazar H0 para zn resultado dado.
5
Fig. 5.8 N ivel de significación cuando la hipótesis alternativa es del tipo fiA * ¡j b
Un análisis alternativo: intervalos de confianza para la diferencia de m edias
comparación de medias también se puede abordar aplicando el concepto de intervalo de confianza. _ - intervalo de confianza 1-oc para la media de la población se obtiene mediante una expresión del rpo: a y ± Zy2 Estimando a 2 a partir de la varianza muestral, obtenemos:
En general, estos intervalos responden a la expresión: estadístico ± t aJlv. desviación tipo del estadístico Por tanto, a partir de los datos de un diseño totalmente aleatorizado, puede plantearse el guíente intervalo de confianza para la diferencia de medias poblacionales
¡ i
ionde s es el estimador conjunto de la varianza poblacional. Si el diseño es bloqueado, la expresión obtenida es: T i , d
-
Sd
taÁ *
r
Vn
Ejemplo 5.3 Calcular un intervalo de confianza del 95 % para la diferencia de medias poblacio nales tomando el planteamiento y los datos del caso 1. Tenemos que: yA = 25.14 yB = 23.62 *0.025,18 = 2 . 1 0 1
í
= 1.24
«A= !0 «B = 10
Luego el intervalo es:
1.52 ±1.17
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
K
Ejem plo 5.4 Igual al ejem plo 5.3 pero a partir del caso 2. En este caso: d = 0.55 *0.025.9 = 2.262 5. = 0.344 n = 10 Y se obtiene: 0.55 ± 0.25 Si el cero está incluido en el intervalo 1-a, cabe considerar que éste no es un valor extraño para la diferencia de medias y, por tanto, no se podrá rechazar la hipótesis nula de igualdad de las medias poblacionales con un nivel de significación de oc. Ejercicio
Si en un contraste de hipótesis del tipo: H r Ma*Mb se obtiene un nivel de significación exactam ente igual a 0.05, ¿qué peculiaridad tendrá uno de los extrem os del intervalo de confianza del 95% para |ja- jíb?
K
COMPARACIÓN DE DOS TRATAMIENTOS
Ejercicios 5.1.
Se desea saber si un determinado plan de seguridad en el trabajo es efectivo en la reducción del número de accidentes laborales y, por tanto, en la pérdida de horas de trabajo debido a accidentes. Los siguientes datos son las horas de trabajo semanales perdidas a causa de accidentes en seis fábricas, antes y después de implantar el nuevo plan de seguridad. PLANTA 1
2
3
ANTES
12
29
16
D ESPU ÉS
10
28
17
4
5
6
37
28
15
35
25
16
a) Especificar las hipótesis necesarias. b) ¿Se puede decir con estos datos que el plan de seguridad es efectivo?
5.2.
Una fábrica de automóviles dispone de dos proveedores (A y B) de llantas de aluminio. Se tiene la sospecha de que existen diferencias en cierta característica mecánica (X) de las llantas, según sea el proveedor que las suministra. Para analizar el tema se toman muestras aleatorias de cada uno de los proveedores, obteniéndose los valores que se indican en la tabla adjunta. a) ¿Puede decirse que existen diferencias en las llantas según el PROVEEDOR A PROVEEDOR B proveedor que las suministre? b) Calcular los tamaños de muestra (iguales para ambos nA = 100 "* = 9 4 proveedores) para que un intervalo de confianza del 95% de *4=5.43 x b =5.75 |iB - MAPueda expresarse de la forma: sB = l l 2 s a = 1-20 * b -*a ± °>3
5.3.
Unos grandes almacenes desean cubrir un puesto de vendedor, para lo cual contratan temporalmente durante tres meses a dos candidatos. Los datos obtenidos después de estos tres meses son: N° de días trabajados: A= 66 días B= 60 días (6 días de baja por enfermedad) S(A)= 3.000 pts S(B)= 3.100 pts Se admite que los puestos de trabajo a que han sido asignados tienen idénticas posibilidades de venta. Después del período de prueba el candidato A ha vendido producto por un valor medio de 56.000 pts/día, y el candidato B por valor de 53.000 pts/día. ¿Justifica esta diferencia la afirmación de que A vende más que B1
5.4.
Una empresa suministra tubos de escape a la industria del automóvil. En el tubo de escape se coloca un sensor que comunica al ordenador del coche el contenido de CO en los gases de escape. La empresa dispone de dos tipos de sensores, A y B, basados en principios de medición diferentes. Tanto uno como otro se colocan en el silencioso del tubo de escape. El departamento I+D de la empresa sospecha que pueden haber diferencias entre las mediciones efectuadas por los dos tipos de sensor y decide realizar un experimento.
71
COMPARACIÓN DE DOS TRATAMIENTOS
Apéndice 5B Pruébelo Ud. m ism o. Com paración de dos tipos de helicóptero. Vamos a utilizar de nuevo helicópteros del tipo que hemos presentado en el apartado 3.12. En primer lugar hay que construirlos. Para ello deberá tomar una hoja DIN A-4 y cortarla longitudinalmente por la mitad. Uno de los trozos obtenidos deberá recortarlo y doblarlo tal como se indica en la figura 5B.1. 5.3
5.3
12.9
3.8
12.9
Fig. 5B.1 Esquema de construcción del helicóptero (cotas en cm)
Si lo deja caer desde una cierta altura (3 metros, por ejemplo), observará que primero hace un recorrido de aproximadamente 0,5 metros de forma desordenada (régimen turbulento), hasta que se le despliegan las alas y empieza a caer de forma lenta y suave (régimen laminar). Ejercicio: Consiga un cronómetro y deje caer varias veces (10, por ejemplo) el helicóptero desde la misma altura y en “idénticas” condiciones. Anote cada vez el tiempo que ha tardado en caer. Represente gráficamente los datos obtenidos (histograma, serie temporal, etc.). ¿Por qué realizando la prueba siempre en idénticas condiciones, el resultado obtenido no es siempre el mismo? Vamos a intentar mejorar el diseño para aumentar el tiempo que tarda en caer. Probaremos recortando las puntas de las alas tal como se indica en la figura 5B.2. ¿Qué hacer para comprobar si el nuevo diseño es mejor que el anterior? Desde luego no sería una prueba fiable que dejáramos caer un helicóptero de cada tipo y comparáramos los dos resultados obtenidos por qué?). Lo correcto sería construir varios helicópteros con el primer diseño y otros tantos con el segundo, dejarlos caer tomado datos y compararlos (test de la t de Student para datos totalmente aletorizados). Ejercicio:
¿Por qué no se utiliza un solo helicóptero de cada tipo dejándolo caer tantas veces como se desee? ¿Qué tipo de error se puede cometer si la prueba se realiza de esta forma?
Fig. 5B.2 Esquema de construcción del helicóptero “mejorado”
MÉTODOS ESTADÍSTICOS. CON TROL Y M EJO RA DE LA CA LID A D
X
La prueba que hem os propuesto tiene un inconveniente: todos los helicópteros deben ser construidos con el m ism o tipo de papel y esto im plica que, si el nuevo diseño es m ejor, lo será con ese tipo de papel, pero nada puede asegurarse para helicópteros construidos con papel de características distintas al usado en la prueba. D ado que este tipo de construcción puede realizarse con una cierta gam a de papel de uso habitual (m ás o m enos pesado, m ás o m enos rígido, etc.), en rigor no podem os asegurar que un diseño sea m ejor que otro sin hacer referencia al tipo de papel que se ha utilizado. Ejercicio:
¿C óm o realizar la com paración considerando que los helicópteros pueden construirse con distintos tipos de papel? (Ayuda: R ecuerde que con cada hoja se pueden construir dos helicópteros. Q uizá convendría tom ar un conjunto de hojas representativas de las usadas habitualm ente para estos m enesteres y...)
Comparación de más de dos tratamientos: análisis de la varianza
Como ya se ha visto en el capítulo anterior, para la comparación de dos medias se utiliza, en la mayoría los casos, un estadístico que tiene como distribución de referencia la t de Student. Este estadístico calcula de una forma u otra según se trate de muestras independientes o de datos apareados. Normalmente, el test que se realiza en ambos casos se denomina “test de la t de Student”, en relación ,on la distribución de referencia utilizada. Cuando se trata de comparar más de dos medias, la técnica que se utiliza recibe el nombre de ¿nálisis de la varianza”. El lector se preguntará por qué “análisis de la varianza”, cuando el objetivo - > comparar medias. Un sencillo ejemplo nos servirá para aclarar la razón de esta denominación. Supongamos que se desea analizar si la diferencia entre las medias de tres muestras es r-:adísticamente significativa o no. Consideremos dos situaciones distintas, representadas por los i: ¿gramas de puntos de la figura 6.1. A la vista del gráfico resulta sencillo sacar la conclusión de que en el caso a) sí puede hablarse ie diferencias significativas, mientras que en el caso b) no. Pero, ¿por qué? Las diferencias de medias son exactamente iguales tanto en un caso como en otro, entonces, ¿por qué en un Casoa) ¿¿so se ha considerado que la diferencia i—i—i—i—i—i—i—i—i—i t , ■■ significativa y en el otro no? yA La razón es, simplemente, que se m % m 3 ¿ analizado si las diferencias (varia yB bilidad) entre las medias es mayor de la * * • que cabría esperar a partir de la varia' M Ve ■ :dad dentro de cada muestra. Y se ha Caso b) egado a la conclusión, con toda la razón, * t * le que en el caso a) esas diferencias sí son t imyores de lo que cabría esperar, pero en yA * • | rl caso b) no. * t En definitiva, lo que se ha hecho yB un análisis de la variabilidad, o , * ? t t , . ............. t , , , , análisis de la varianza, para decidir si las j diferencias de medias son o no estadís_--tmente significativas. Fig. 6.1 ¿Son significativas las diferencias de las medias muéstrales?
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
----------------------------------------------------- --------
%
6.1 M étodo gráfico de com paración de m edias para poblaciones independientes 6.1.1 Ideas básicas para la aplicación del método Vamos a desarrollar en este apartado una sencilla metodología gráfica, que nos permitirá discernir si un conjunto de medias pueden considerarse iguales o distintas. Lo haremos de una forma más objetiva que la usada anteriormente, basada en la simple contemplación de los correspondientes diagramas de puntos, aunque no conviene desestimar este método, que en muchas ocasiones puede ser suficiente y en otras puede utilizarse como complementario. Empezaremos planteando un sencillo ejercicio: ¿Puede considerarse que X los valores: 15, 17, 16, 21 y 14, pertenecen a una distribución normal con a = 1? f(x) Una forma de resolver este problema es representando a escala una 0.399 0 0.5 0.352 distribución normal con a = 1, junto con los valores dados, para ver si se puede 1 0.242 considerar que pertenecen a esta distribución o no. 1.5 0.130 El cálculo de las ordenadas de la distribución normal puede hacerse a partir 0.054 2 de la fórmula de su función densidad de probabilidad1, y como no hay ninguna 2.5 0.018 3 0.004 limitación en cuanto a la media, consideramos \a = 0 y obtenemos la tabla de la derecha cuya representación será la de la figura 6.2. f(x) Dado que el parámetro [i (media) en una ley normal es un parámetro de localización, pasar de una ley normal de ja = 0 a cualquier otro valor de [i se consigue mediante una simple traslación del eje de simetría de la campana al valor de ja. En la figura 6.3 hemos centrado la campa na sobre el valor 16, pero lo podríamos haber hecho sobre cualquier otro. Lo que se trata de ver es si todos los valores dados caben “debajo” de la campana, para alguna posición de la misma. En nuestro caso, está claro que no caben todos los valores; el 21 se queda fuera, y si Fig. 6.2 Representación a escala de una distribución centramos la campana en el 21, se quedan fuera normal con p = 0, a = 1 todos los demás. Luego, en este caso se puede considerar que todos los valores f(x) dados pertenecen a una normal con a = 1, excepto el 21. Si en vez de comparar nuestros datos con una normal de a = 1, lo hiciéramos con una de a = 3, ¿deberíamos construir una campana distinta?
1Con o = 1 y \x = 0, se tiene:
Fig. 6.3 Representación de valores junto a una N (0,1)
COMPARACIÓN DE MÁS DE DOS TRATAMIENTOS: ANÁLISIS DE LA VARIANZA
7C
No necesariamente. Para una distribución normal con a = 3 podemos mantener la escala de abcisas del gráfico anterior y variar la forma de la campana, o mantener la forma de la campana y variar la escala de abcisas. La distribución de probabilidad representada en la figura 6.4, con la misma forma que la anterior pero con distinta escala en el eje de abcisas, corresponde a una normal con a = 3. Y si en esta escala representamos nuestros valores, tendremos:
Fig. 6.4 Representación de una distribución normal con o = 3
Fig. 6.5 Representación de valores junto a una N(0,3)
Luego sí puede considerarse que pertenecen todos a una normal con a = 3. Obsérvese, por tanto, que cuando se desea realizar este tipo de estudio comparando un conjunto de datos con la distribución normal, no es necesario dibujar una campana distinta para cada caso, sino que bastará con una sola variando la escala de abcisas, multiplicándola por un cierto “factor de escala”, que será igual a la desviación tipo de la distribución que se desee representar. Pero cuando se quiere resolver este tipo de problema y no se conoce la desviación tipo de la población, sino que se tiene una estimación de la misma, no puede utilizarse la normal como distribución de referencia, sino una t de Student con los grados de libertad que correspondan según sea el tamaño de la muestra utilizada para estimar a. Con los datos de nuestro ejemplo, si la desviación tipo de la población se ha estimado a partir de una muestra de tamaño n = 5, y se ha obtenido s = 3, la distribución de referencia será una t de Student con v = 4 grados de libertad y con un factor de escala igual a 3. Como la forma de la t de Student no es siempre la misma (depende del número de grados de libertad), deberían calcularse las ordenadas en cada caso, pero esto no es necesario, ya que se hallan tabuladas en tablas como la que se adjunta en el apéndice 1. Para realizar la comparación en este caso conviene construir una pequeña tabla previa, como la siguiente:
t ORDENADA
0
0.5
1
1.5
2
2.5
3
0.375
0.322
0.215
0.123
0.066
0.036
0.020
0
1.5
3
4.5
6
7.5
9
(v=4) t* 3
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
TI
Y a continuación se construye la t de Student situando los valores dados en un eje horizontal con la misma escala que la utilizada para la distribución. (Ver figura 6.6.) También en este caso podemos considerar que todos los valores pertenecen a la misma población.
F ig. 6.6 C om paración de valores con una t de Student con 4 grados de libertad
i------ ,------ ,------ r« * M —i---- ---------r 7
10
13
16
19
22
25
6.1.2 R equisitos de aplicación El método gráfico que acabamos de ver nos va a servir para realizar comparaciones de medias, pero para que el procedimiento sea válido, es necesario que se cumplan tres requisitos: a. Las muestras cuyas medias se desee comparar, deben ser muestras aleatorias simples de su> correspondientes poblaciones. De lo contrario, las muestras no pueden considerarse represen tativas y el método carece de validez. b. Las poblaciones de las que proceden cada una de las muestras deben ser normales, aunque este requisito es poco crítico y ligeras desviaciones respecto a la normalidad no afectan a la validez del método. c. Todas las poblaciones de las que proceden las muestras deben tener la misma varianza. A través de un análisis exploratorio de los datos podemos cerciorarnos de que no hay pruebas de que estos requisitos no se cumplen. En el caso del tercer requisito, los gráficos de residuos (valor observado menos media de la muestra), frente a valores previstos (media de la muestra) son de gran utilidad. Veámoslo en los siguientes ejemplos. Ejemplo 6.1: Sean los datos: 1
2
3
4
5
DATOS
14.0 18.1 18.0 15.7 16.4 16.3 13.5
12.3 15.1 16.2 14.0 13.8 14.1 12.5
13.7 17.4 17.4 15.6 15.4 15.2 13.8
13.4 16.8 15.7 15.1 14.5 15.4 14.1
15.0 19.1 18.5 16.7 17.4 17.3 15.0
M E D IA
16.0
14.0
15.5
15.0
17.0
M UESTRA
Recordando que los residuos son las diferencias entre los valores observados y los previstos el modelo (en este caso las medias muéstrales) tendremos:
COMPARACIÓN DE MÁS DE DOS TRATAMIENTOS! ANÁLISIS DE LA VARIANZA
71
M UESTRA
1
2
3
4
5
RESIDUOS
-2.0 2.1 2.0 -0.3 0.4 0.3 -2.5
-1.7 1.1 2.2 0.0 -0.2 0.1 -1.5
-1.8 1.9 1.9 0.1 -0.1 -0.3 -1.7
-1.6 1.8 0.7 0.1 -0.5 0.4 -0.9
-2.0 2.1 1.5 -0.3 0.4 0.3 -2.0
Y el gráfico de residuos frente a valores previstos tiene el aspecto: y
O
T3
(U2.1 1 o 05-
8
°
o
0 -05"
o
-I.* -2-2.?
109
Valores previstos
Fig. 6.7 Gráfico de residuos frente a valores previstos (no se observa heterocedasticidad)
Luego nada nos hace pensar que la variabilidad (varianza) seas distinta entre poblaciones, y podemos asumir el tercer requisito. Ejemplo 6.2: Sean los datos: 1
2
3
4
5
DATOS
14.0 19.1 18.0 15.7 16.4 16.3 12.5
13.3 14.1 15.2 14.0 14.8 13.1 13.5
13.8 18.2 16.9 15.6 16.6 15.2 12.2
13.4 16.8 15.7 15.1 14.5 15.4 14.1
13.0 21.1 18.7 16.7 17.2 17.3 15.0
M ED IA
16.0
14.0
15.5
15.0
17.0
M UESTRA
En este caso los residuos son:
MÉTODOS ESTADÍSTICOS. CONTROL Y M EJO RA DE LA C A LID A D
71
M UESTRA
1
2
3
4
5
R E S ID U O S
-2 .0 3.1 2 .0 -0.3 0 .4 0.3 -3 .5
-0 .7 0.1 1.2 0 .0 0.8 -0 .9 -0.5
-1 .7 2.7 1.4 0.1 1.1 -0 .3 -3 .3
-1 .6 1.8 0 .7 0.1 -0.5 0 .4 -0 .9
-4 .0 4.1 1.7 -0.3 1.2 0 .3 -3 .0
Se obtiene el siguiente gráfico de residuos frente a valores previstos:
Valores previstos F ig . 6 .7 G ráfico d e resid u o s frente a v alores p revistos. S e ob serva h eteroced asticid ad
E n este caso no se puede suponer que la variabilidad sea la m ism a para todas las poblaciones. De hecho, se da un fenóm eno que suele ocurrir con cierta frecuencia, y es que la varibilidad aumenta al aum entar la m edia, dando origen a gráficos com o el que nosotros hem os representado, con una típica form a de em budo. Este fenóm eno se denom ina “heterocedasticidad” , y cuando se da, no se pueden aplicar las técnicas clásicas de análisis de la varianza com o las que verem os a continuación.
6.1.3 Caso de la comparación de procedimientos de montaje. Aplicación del método Los datos que se presentan a continuación corresponden a la productividad m edia por hora en el montaje de un cierto m ecanism o, según que el procedim iento em pleado sea el A , el B o el C. Supondrem os que la recogida de los datos se ha aleatorizado convenientem ente y que nada hace suponer que exista algúz factor que no ejerza el m ism o tipo de influencia para todos los resultados obtenidos. P R O C E D IM IE N T O ¿Puede decirse que los tres procedim ientos A B C no dan la m ism a productividad?, y en este caso, 3 .2 2 .6 ¿cuál o cuáles son distintas? P R O D U C T IV ID A D /h . 2 .6 3.1 2.5 2 .5 El razonam iento que se hace en la reso 2 .7 3.1 3.5 lución de este tipo de problem as es considerar que 3 .4 2.7 2 .6 se da la circunstancia m ás conservadora (hipótesis 2 .6 2 5 M E D IA 2 .7 3.3 nula, H 0), que en nuestro caso sería considerar que 0 .1 0 0 .2 7 0 .1 8 D E S . T IP O los tres procedim ientos dan la m ism a producti-
COMPARACIÓN DE MÁS DE DOS TRATAMIENTOS: ANÁLISIS DE LA VARIANZA
X
vidad, contrastando a continuación si los datos de que se dispone son coherentes con la hipótesis rianteada o, por el contrario, no lo son, en cuyo caso es rechazada. Que los tres procedimientos den la misma productividad significa que sus medias poblacionaftes son iguales, es decir que podemos plantear la hipótesis nula de la forma: "o • Ma “ Mb “ Me La hipótesis alternativa (//,) es la que se considera cierta en el caso de que no se cumpliese la hipótesis nula, que en este caso será simplemente considerar que no todas las medias son iguales. La metodología que se debe seguir, si no existe evidencia de incumplimiento de los requisitos -ecesarios, puede resumirse en las siguientes etapas: a) Estimar la varianza poblacional única a 2 (recuerde que éste era uno de los requisitos) mediante una media ponderada de las varianzas muéstrales. Cada una de las varianzas muéstrales es un buen estimador de a 2, pero seguramente todas son i:stintas. Entonces, ¿con cuál nos quedamos? Si las muestras son iguales en tamaño utilizaremos la Tiedia aritmética de las varianzas muéstrales y, si no lo son, haremos una media de las s2 ponderada según los grados de libertad de cada muestra (nos fiamos más de las muestras más grandes). La fórmula general para el cálculo de la estimación de a 2, que llamaremos 5-R2, será: X (n, - l ) s , 2 Í=1_________
2 "
■
"íi^ T t=1
X (», - l ) s ,2
1=1
■
áoode:
k: Número de procedimientos (o, en general, tratamientos) a comparar nr: Número de datos de que se dispone correspondientes al tratamiento t s :: Varianza de los datos correspondientes al tratamiento t Y: Número total de datos en los k tratamientos En nuestro caso, al ser iguales los tamaños de muestra, no es necesario aplicar ponderación ¿.runa, sino que podemos calcular sR2 de la forma: 2 =
s \ + si + s 2c 3
=
0.073 + 0.032 + 0.010 3
=
0Q3g
De donde: sR =
-v/0.038
=
0.196
;::o v = 9 grados de libertad (3 de cada muestra). b i Calcular el factor de escala de la t-Student con v = 9. Recuerde que la media de una muestra se distribuye con una desviación tipo igual a la íación tipo de la población, dividida por la raíz cuadrada del tamaño de la muestra (teorema central -c imite). Por tanto, en nuestro caso el factor de escala será: factor de escala
= -4?L = yin
0196
=
0.098
Si los tamaños de las muestras no son iguales (pero no muy distintos), entonces en lugar de n m adliza:
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
K
k
_
n
X»,
r= l
=
---------
k
c) Construir la distribución de referencia según el método visto anteriormente En este caso, la tabla será: t
0
0.5
1
1.5
2
2.5
3
ORDENADA
0 .3 8 8
0.3 8 8
0 .2 2 9
0 .1 2 7
0 .0 6 2
0 .0 2 8
0 .0 1 2
0
0 .0 4 9
0 .0 9 8
0 .1 4 7
0 .1 9 6
0 .2 4 5
0 .2 9 4
(v = 9 ) f*0.098
Con lo que se obtiene una distribución de la forma indicada en la figura 6.9.
112
F ig. 6.9 Construcción de una distribución de referencia
d ) Situar las medias en un eje horizontal con la misma escala que la utilizada en la distribución ócj referencia. Deslizar la distribución y sacar conclusiones.
------ y------ r*--- ?------,------ ------- ------- ------- -------f------------ *,-------T------ .------ i-- *---T------ T ------ r------*2.5
2.6
2.7
28
2.9
3.0
31
3.2
Fig. 6 .1 0 C om paración de valores con su distribución de referencia (¡m ism a escala del eje de abcisas!)
3.3
Fig. 6.11 N o se puede afirmar que A y B sean distintos i Que 1° sean B y C, pero sí que lo son A y C
COMPARACIÓN DE MÁS DE DOS TRATAMIENTOS: ANÁLISIS DE LA VARIANZA
K
Vemos que no se puede considerar que las tres medias muéstrales pertenezcan a la distribución a la que deberían pertenecer si las medias poblacionales fueran iguales. Luego los datos no están en consonancia con la hipótesis nula realizada que, por tanto, será rechazada. La conclusión es que los procedimientos A y C son estadísticamente indistinguibles, mientras que el B presenta una diferencia significativa respecto a los otros dos. Nótese que el hecho de que A sea indistinguible de B y B indistinguible de C, no implica que A sea indistinguible de C, tal como pone de manifiesto la figura 6.11.
6.2 Caso de la comparación de procedimientos de montaje con datos bloqueados. Hipótesis sobre el modelo de la respuesta Supongamos que en el experimento anterior de análisis de la productividad de tres técnicas de montaje distintas se desea tomar cuatro datos de cada procedimiento, pero considerando ahora que sólo se puede tomar un dato cada día, y de forma que se tiene la sospecha de que el día de la semana también puede influir en la productividad. En este caso, es mejor no recoger los datos de una forma totalmente aleatoria, ya que podría ocurrir que tres datos correspondientes al procedimiento A fueran tomados el lunes, y si este día de la semana el nivel de productividad fuera menor, achacaríamos una disminución del nivel de respuesta al procedimiento, cuando en realidad correspondería al día en que se tomaran los datos. En circunstancias como ésta, es indispensable planificar la recogida de datos de forma que el posible efecto de ese factor, que no se puede mantener constante, quede convenientemente neutralizado. Una forma de hacerlo es tomando los datos de la siguiente forma:
PRO CED IM IEN TO
PR O D U CTIV ID A D
A
B
C
2.6
3.2
2.6
Lunes
2.1
2.7
2.1
Martes
3.5
3.9
3.1
Miércoles
2.6
3.4
2.7
Jueves
DÍA
El experimento ha consistido en cuatro bloques (días), y se han tomado datos para cada uno de ios procedimientos de forma aleatoria dentro de cada bloque (diseño en “bloques aleatorizados”). De esta forma, dentro de cada bloque pueden compararse las productividades (respuesta) de cada procedi miento, por mucha variación que haya en las medias de los bloques. Consideraremos que cada resultado obtenido yü se puede expresar mediante el modelo: ya
= l¿ + f i + T t + €ti
donde: |j: Media general P¿: Efecto correspondiente al bloque i Tt: Efecto correspondiente al tratamiento t £ti Perturbación aleatoria correspondiente a la observación ti. sti ~ N(0, o 2).
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA C A L ID A D ------------------------------------------------------------
%
Como puede observarse en el modelo, el bloque tiene un efecto aditivo sobre la respuesta, subiendo o bajando el nivel de la misma para todas las observaciones incluidas en el bloque. Si no existe efecto bloque, p¡=0 para cualquier i.
6.2.1 Resolución El objetivo será hallar una distribución de referencia para comparar las medias de los bloques y otra para la media de los procedimientos (esta última es la de interés fundamental). Pero en primer lugar siempre es conveniente representar los datos gráficamente. Una representación gráfica de los datos que resulta muy adecuada en este tipo de casos es la que se indica en la figura 6.12. Para iniciar el análisis de los datos, en primer lugar escribiremos la tabla de resultados incluyendo las medias de los bloques y de los procedimientos. El supraíndice sobre cada uno de los valores corresponde al orden de toma de los datos que, tal como se ha dicho, es aleatorio dentro de cada bloque. Productividad 4.20 M ED IA S PR O C E D IM IE N T O S 3.60 —
A 114
3.00 —
2.40 —
1.80-
I
” I--Lunes
M artes
M iércoles
B
C
D E LO S BLOQUES
Lunes
2 .6 (2)
3 .2 U)
2 .6 (3)
2.8
Martes
2 .1 (,)
2 .7 <3)
2 .1 (2)
2.3
M iércoles 3 .5 (2)
3 9
3 .1 <3)
3.5
Jueves
2.6<3)
3.4<2)
2 .7 (l)
2.9
M ED IA S
2.7
3.3
2.625
Jueves
Fig. 6.12 Gráfico para la comparación de las productividades obtenidas con los datos bloqueados
La metodología que se debe seguir en estos casos se resume en las siguientes etapas: a. Eliminar las diferencias de nivel entre bloques, restándole a cada dato la media de su bloque: P R O C E D IM IE N T O S
SU M A
A
B
C
Lunes
-0.2
0 .4
-0.2
0
Martes
-0.2
0.4
-0.2
0
M iércoles
0
0.4
-0.4
0
Jueves
-0.3
0.5
-0.2
0
M ED IA S
-0.175
0 .425
-0 .2 5 0
COMPARACIÓN DE MÁS DE DOS TRATAMIENTOS: ANÁLISIS DE LA VARIANZA
7C
b. Calcular los residuos. Es decir, a cada observación de la tabla obtenida en la etapa anterior, restarle la media de su columna (valor previsto): SUM A
PR O C ED IM IEN T O S
B
A
C
Lunes
-0.025
-0.025
0.05
0
Martes
-0.025
-0.025
0.05
0
0.175
-0.025
-0.15
0
-0.125
0.075
0.05
0
0
0
0
Miércoles Jueves SUM A
c. Estimar la varianza poblacional a 2. La estimación de la varianza poblacional puede hacerse de la siguiente forma: ^
7 R
—
Suma de cuadrados de los residuos Grados de libertad
-------------------------------------------------------------------------------------------------------------------------------------------------------------
En este caso, si llamamos a al número de tratamientos y b al número de bloques, el número de grados de libertad es: Grados de libertad
=
[a
-
l) * [b - l)
=
2*3
=
6
Realmente, en la tabla de residuos, sabiendo que las filas y las columnas suman cero, podemos apar los datos correspondientes a cualquier fila y también los correspondientes a cualquier columna, • volverlos a deducir. Sólo hay 6 residuos que se mueven libremente (6 grados de libertad). Por tanto, en nuestro caso tendremos: .2 = s~ *
:£donde’
( - 0.025)2 + ( - 0.025)2 + (0.175)2 + ... + (0.05)2 _ ---------- :----- :--------- :------;------ ----------------- — = 6 sR =
VO.014167
=
u.014167
0.119
d. Calcular el factor de escala para la comparación de tratamientos. Si H0 : jlia = |aB= |ic fuera cierta, las medias muéstrales correspondientes a cada procedimiento distribuirían según una t de Student con v = 6 grados de libertad y con un factor de escala íes vi ación tipo): factor de escala
=
s —§= = 4b
0119 V4
= 0.0595
axide b es el número de observaciones dentro de cada tratamiento, o lo que es lo mismo, el tamaño de bs muestras. e. Calcular el factor de escala para comparar las medias de los bloques En este caso será: ^ 0.119 factor de escala = —^= = — j=— = 0.0687 4a V3
115
71
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
donde a el número de observaciones dentro de cada bloque, o tamaño de las muestras a partir de las que se han calculado las medias de los bloques. f
Construir las distribuciones de referencia. Elaboramos la tabla previa, construida de forma que sea útil para las dos distribuciones. t
0
0.5
1
1.5
2
2.5
3
ORDENADA
0 .3 8 3
0 .3 3 2
0 .2 2 3
0 .1 2 6
0 .0 6 4
0 .0 3 2
0 .0 1 6
( v = 6) t * 0 .0 5 9 5
0
0 .0 3 0
0 .0 6 0
0 .0 8 9
0 .1 1 9
0 .1 4 9
0 .1 7 9
0
0 .0 3 4
0 .0 6 9
0 .1 0 3
0 .1 3 7
0 .1 7 2
0 .2 0 6
(P R O C E D IM IE N T O )
t * 0 .0 6 8 7 (B L O Q U E S )
y para los bloques:
Y tenemos, para los tratamientos:
116
-//-
F ig. 6 .1 4 C om paración de las m edidas de lo s bloques
F ig. 6.13 C om paración de las m edidas de lo s tratamientos
Luego hay diferencias de productividad según el método utilizado (resultado que nos interesaba saber), y también podemos afirmar que existe diferencia de productividad según el día de la semana. ¿Qué hubiera ocurrido si a unos datos bloqueados como los anteriores, les hubiéramos aplicado la técnica de análisis que corresponde a datos independientes (diseños totalmente aleatorizados)? En este caso, el estim ador de la varianza poblacional única (con las desviaciones tipo de los procedimientos A, B y C) hubiera sido: 0.5 82 + 0.50 +0.41 Luego:
=
=
0.5
0.25,
con
con
v = 9 g.l.
v =9
el factor de escala sería: factor de escala
=
S
-íy[n
=
(J j
—^= V4
=
0.25
7Ü ------------------------------------------------------------------------------------------------ COM PARACIÓN D E M ÁS DE DOS TRATAMIENTOS: ANÁ LISIS DE LA VARIANZA
Se obtiene, por tanto, la siguiente tabla: t
0
0.5
1
1.5
2
2.5
3
ORDENADA
0 .3 8 8
0 .3 8 8
0 .2 2 9
0 .1 2 7
0 .0 6 2
0 .0 2 8
0 .0 1 2
0
0 .1 2 5
0 .2 5 0
0 .3 7 5
0 .5 0 0
0 .6 2 5
0 .7 5 0
(v = 9 ) t * 0.25
que da lugar a la distribución de referencia que se indica en la figura 6.15, a la vista de la cual, no puede decirse que existan diferencias . entre los tres procedimientos. Esta conclusión errónea se debe a que la varianza poblacional está sobreestimada por la variabilidad que produce la diferencia entre días de la semana. Por tanto, las conclusiones que se obtienen se ven afectadas si a datos obtenidos en diseños bloqueados se les aplica una técnica de análisis propia de datos totalmente aleatorizados.
0.40
-
035 . 0.30 -
0.20
-
Q15 _
0.05
-
0. -
0.75
-
0.5
-0.25
Fig. 6.15 Comparación de datos con su distribución de referencia
6.3 M étodo clásico de análisis de la varianza. Tabla ANOVA 63.1 Planteamiento de un caso y cuestiones previas Vamos a ver a continuación un método analítico para comparar las medias de varios tratamientos. Éste es el método clásico que se basa en la construcción y análisis de una tabla denominada ‘'tabla ANOVA” ANalisys O f VAriance). Para ilustrar su aplicación utilizaremos los mismos datos que ya utilizamos en la descripción del método gráfico. Recordemos el caso en que se com pa raba la productividad obtenida aplicando diversos procedimientos de montaje, en el que teníamos:
P R O C E D IM IE N T O
A
B
C
P R O D U C T IV ID A D
2 .6 2.5 3.1 2.6
3 .2 3.1 3.5 3.4
2 .6 2.5 2.7 2.7
M E D IA
2.7
3.3
2 .6 25
D E S . T IP O
0 .2 7
0 .1 8
0 .1 0
Y la pregunta que nos planteábamos era: ¿Puede decirse que los tres procedimientos no dan la misma productividad? Antes de iniciar el método para contestar esta pregunta, abordaremos dos : aestiones previas. a. Requisitos para la aplicación del método. Los requisitos que se deben cumplir son los mismos que ya se comentaron para el método gráfico, y pueden resumirse en que los datos correspondientes a cada tratamiento deben ser
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
----------------------------------------------------------- ----
K
muestras aleatorias simples de sus correspondientes poblaciones, poblaciones que deben ser todas normales y de la m ism a varianza, es decir, iguales en todo excepto, quizá, en su media. Com o siempre, un adecuado análisis exploratorio de los datos sirve para verificar que nada se opone al cum plim iento de los requisitos establecidos. b. Notación. En general, considerarem os que existen k tratam ientos y que el tratam iento t contiene nz ' los datos se pueden escribir: •••
y t\
•••
y*i
yn
yn
yu
yn
yn
y¡d
yin,
yin2 •••
y*.
y kni
A la m edia general de todos los datos se le denom ina y .
6.3.2 Construcción e interpretación de la tabla ANOVA en diseños totalmente aleatorizados
118
á) Cálculo de ,yR2. Se trata de la estim ación de la varianza poblacional única, a 2, a partir de la variación dentro de los tratamientos. El método habitual consiste en calcular la m edia de las varianzas de las muestras, ponderándola según los grados de libertad de cada muestra. 2
V,
S ? + V 2 s l + ... + V , s f + . . . + V k Vi +
v
2
+ . . . + V , + . . . + V,
Teniendo en cuenta que:
i=i
tenemos: Use, t =\
=
X S U t=1 i = l
-y,)
=
scs
y por tanto, podemos escribir: k £
n, V ) Z (ÍyV „ -- y,)
f=i /=i
En nuestro caso:
seR
COMPARACIÓN DE MÁS DE DOS TRATAMIENTOS: ANÁLISIS DE LA VARIANZA
K
«r st2
sct scR
A
B
C
4 0.073 0.220
4 0.033 0.100
4 0.010 0.027 = 0.3475 = 12-3 = 9 = 0.3475 i 9 = 0.0386
N -k Sr
b) Cálculo de sT2. Se trata de realizar una estimación de a 2 basándonos en la variación entre tratamientos. Si no hubiera diferencia entre las medias poblacionales de los tratamientos, todas las poblaciones serían iguales (en realidad sería una sola población) y podríamos obtener una estimación de a 2 a partir de la variación de las medias de los tratamientos respecto a la media general. Supongamos que todos los tratamientos tienen el mismo número de observaciones n. Como la media muestral se distribuye con varianza G2/n, tendremos que: r¿=(\ y , - y ) k - 1
Luego:
es un estimador de
a n
n ± { y t - y)
119
es un estimador de a
i
¿Qwafe ocrcrre si n o \o&os tratsometilos tienen e\ m ism o irámeio 6e observaciones^ Sustituyendo n por nt, que en este caso deberá ir colocado dentro del sumatorio, obtenemos: t=l
(y, - y)
k -l El nuevo estimador de a 2, sólo válido cuando las medias poblacionales son iguales, se llama sT2> y su fórmula es: 2 nt (y, - y)
t=I
En nuestro caso tenemos: A ST
=
1.095
=
0.55
Obsérvese que si la media pobla:ional de los tratamientos no es la mis ma, sT2 será mayor que .yR2, ya que en este c a s o está afectada, no sólo por la
-Vr
(yt - y )2 nx
nt(yt - y )2
C
B
2.7
3.3
2.625
-0.175
0.425
-0.250
0.031
0.181
0.625
4
4
4
0.1225
0.7225
0.250
y = 2.875
L = 1.095
MÉTODOS ESTADÍSTICOS. CONTROL Y M EJO RA DE L A C A LID AD
----------------------------------------------------------------
71
variabilidad dentro de los tratam ientos (caso de sR2), sino tam bién por la variabilidad entre tratam ientos. c) Com paración entre sR2 y sT2. Tenemos dos estim adores de cr2: sR2:Se obtiene a partir de la varianza de las observaciones de cada uno de los tratam ientos. Siempre es un buen estim ador de a 2. sT2:Se obtiene a partir de la varianza de las m edias de los tratam ientos. Sólo es un buen estim ador de a 2 si la hipótesis de igualdad de m edias poblacionales es cierta. Si sT2 es mucho m ayor que sR2 (como en el caso de nuestro ejem plo), nos induce a pensar que la hipótesis de igualdad de m edias entre tratam ientos es insostenible. M ás adelante se verá cóm o se puede contrastar esta sospecha de form a m ás objetiva. d ) Tercera form a de estim ar a 2. Si las m edias de todos los tratam ientos son iguales, otro estim ador de
2
S°
r= 1
se, N - 1
i=1
=
N - 1
=
El valor N - 1 son los grados de libertad de sD2, para los cuales se utiliza la notación v D. Puede com probarse algebraicam ente que se verifican las siguientes igualdades: SC D
=
SC R + SC T
y que para el cálculo de SC D puede utilizarse la expresión: =
i i y 2l - N y t=i 1=1
e) Presentación de la tabla ANOVA. Los cálculos realizados anteriorm ente se resum en en una tabla que tiene el siguiente aspecto FU ENTE DE
SU M A DE
GRADOS DE
CUADRADOS
V A R IA C IÓ N
CUADRADOS
L IB E R T A D
M E D IO S
Entre
SC t = 1.095
Vt — 2
¿T2 = 0 .5 4 7 5
5C r = 0 .3 4 7 5
v R —9
ír 2 =
S C D = 1.4425
v D = 11
R E L A C IÓ N s t 2/ s
r2
= 14.2
tratamientos D entro de los
0 .0 3 8 6
tratamientos T otal respecto a la m ed ia general
Los valores de SC D y v D, que son los más fáciles de calcular, sirven para verificar la corrección de los cálculos de SCT, SC R, vT y v R.
COMPARACIÓN DE MÁS DE DOS TRATAMIENTOS: ANÁLISIS DE LA VARIANZA
n
f)
Uso de la tabla ANOVA. Es sabido que, si s 2 es la varianza de una muestra aleatoria de tamaño ny de una población normal de varianza o 2 y, análogamente, sx2 es la varianza de una muestra aleatoria de tamaño nx de una población normal de varianza a x2, se verifica que: (« , - * ) ¿ f
- * í,-i
(«. - 0 ^ - -
z l-,
y por otra parte, si U es una variable aleatoria que sigue una distribución de %2 con v, grados de libertad, y V otra variable aleatoria que también sigue una distribución %2, pero esta vez con grados de libertad, siendo U y V independientes, se verifica que: F
=
— V- ~ F-Snedecor ( v . ; v 2) U/v2 v 2J
A partir de las expresiones anteriores, y mediante transformaciones algebraicas, puede llegarse a:
Por tanto, si a 2 = o 22, se tiene que:
Es decir, si s 2 estima la misma varianza poblacional que s22, su cociente se distribuye según una F de Snedecor con v, y v 2 grados de libertad. ¿Podemos decir en nuestro caso que sR2 y sT2 estiman la misma a 2? La relación sT2/sR2 es igual a 14.18. Si las tres poblaciones tuvieran la misma media, sería un valor de una distribución F de Snedecor con 2 y 9 grados de libertad. ¿Es esto posible? Sí, pero es muy poco probable. Consultando las tablas se observa que tal probabilidad es de 0.002, luego podemos iecir que nuestros datos no son coherentes con la hipótesis de igualdad de medias, hipótesis que por '~into será rechazada.
0 . 3 Tabla ANOVA para diseños bloqueados Tomamos los datos y el planteamiento ya realizados en el apartado 6.2:
P R O C E D IM IE N T O S
M E D IA S D E
A
B
C
Lunes
2 .6 m
3 .2 (1)
2 .6 i3)
2 .8
M artes
2 .1 (1)
2 .7 ®
2 .1 (2)
2.3
M iércoles
3 .5 <2)
3 .9 (1)
3 .1 <3)
3.5
Jueves
2 .6 <3)
3 .4 <2)
2 .7 Í»
2.9
M E D IA S
2.7
3.3
2.625
LOS BLOQUES
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
En este caso de diseños bloqueados se usa la notación: M edia de los bloques
Tratamiento 2 ... t
1 1 2
yn
yn
yu
y iz
yn
y
i
y i¡
y2i
Yü
y id
n
y in
y in
ym
ykn
yi
~yi
y,
ñ
B loq u e
M ed ia de tratam ientos
y ki
«2
Yk2
y,
y
M edia general
Las fórmulas generales de las sumas de cuadrados para la construcción de la tabla son2: ► Sum a de cuadrados debida a la variación entre bloques: k ± ( y i - y ) 2
=
► Suma de cuadrados debida a la variación entre tratamientos:
= « X (y , - y )
scT
i
► Sum a de cuadrados debida a la variación dentro de los tratamientos: scr
= X É(y- -y¡ - y . + y )2 t
i
► Sum a de cuadrados total: k
SC D =
L
n
X y « ~ nky
Con los siguientes grados de libertad: SU M A DE
GRADOS DE
CUADRADOS
L IB E R T A D
SCB SCT SCr SCd
n- 1 k- 1 (« -1 )( £ -!)
n k -l
La tabla ANOVA de nuestros datos, tendrá la siguiente forma:
2 La ded u cción detallada de estas fórm ulas puede verse en el libro de B o x , Hunter y H unter E stadística in vestig a d o re s. Ed. R everté, B arcelona, 1988.
COMPARACIÓN DE MÁS DE DOS TRATAMIENTOS: ANÁLISIS DE LA VARIANZA
K
GRADOS DE
CUAD RA D O S
CUADRADOS
LIBERTAD
M EDIOS
Entre bloques
SC b = 2.1825
Entre tratamientos
SC t = 1.0950
>
Jt2 = 0.55
Dentro de los
SCR= 0.0850
vR= 6
sRz = 0.014
SC d = 3.3625
vD = 11
CQ
co II
SUM A DE
VARIACIÓN
>
FU ENTE DE
5B2
= 0.73
RELACIÓN s b 2/ s r ¿
= 52.1
II H
sT2/sK2 = 39.3
tratamientos Total respecto a la media general
s b 2/ s r 2 es el estadístico de prueba que sirve para contrastar si existe diferencia entre las medias de los bloques, utilizando como distribución de referencia una F de Snedecor con vB y vR grados de libertad. Análogamente, sT2/sR2 es el estadístico para contrastar las diferencias de medias entre tratamientos utilizando como distribución de referencia la F de Snedecor con vT y vR grados de libertad. El lector puede comprobar, consultando las tablas de la F de Snedecor, que existen diferencias >:gnificativas, tanto en las medias de los bloques como de los tratamientos, conclusión idéntica a la que ya se había obtenido analizando los datos por el método gráfico.
n
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
E jercicios 6.1
Se selecciona una muestra aleatoria de 30 muelles. Esta muestra se divide en tres partes y se pintan los muelles de cada parte con una pintura diferente. Posteriormente, los muelles son sometidos a una prueba de elongación y se obtienen los siguientes valores: P IN T U R A A
P IN T U R A B
P IN T U R A C
0.38 0.26 0.41 0.33 0.33 0.37 0.54 0.76 0.39 0.74
0.53 0.35 0.38 0.45 1.09 0.46 0.57 0.46 0.39 0.56
0.51 0.63 0.46 0.47 0.42 0.45 0.41 0.39 0.66 0.76
Realice los gráficos y análisis que le parezcan convenientes. Compruebe las hipótesis. ¿Hay algún efecto del tipo de pintura en la elongación? 6.2
124
Para comparar la efectividad de tres tipos diferentes de pinturas fosforescentes para señales át tráfico, se pintan ocho cuadrantes con cada una de las pinturas. Luego se iluminan cuadrantes y los siguientes datos indican los m inutos que dieron luz por encim a de un ciert» umbral, después de que la iluminación fuese apagada. T IP O A
46.3 48.2 42.0 41.8 48.9 51.0 49.7 50.1
T IP O B
48.7 53.6 49.3 47.3 51.4 53.9 43.6 48.8
T IP O C
62.3 64.7 56.2 60.2 53.6 55.5 61.8 54.5
¿Pueden considerarse idénticos los tres tipos de pintura? En caso contrario decir cuál es mejor, razonando la respuesta. 6.3
En una determinada fábrica de galletas, se desea saber si las harinas de sus tres proveed* producen la m ism a viscosidad en la masa. Para ello produce durante un día nueve masas, de cada tipo de harina, y mide su viscosidad. Los resultados obtenidos son:
PR O V EE D O R A
PR O V EED O R B
PR O V EED O R
19
17
22
23
18
21
21
21
24
C
¿Puede decirse que existen diferencias en las viscosidades obtenidas? No satisfechos con el resultado, se repite el experimento quince días más tarde, con siguientes resultados:
COMPARACIÓN DE MÁS DE DOS TRATAMIENTOS: ANÁLISIS DE LA VARIANZA
K
PR O V EED O R A
PR O V EED O R B
PROVEEDOR C
24 23 25
22 20 24
27 25 23
Considerando estos resultados, junto con los obtenidos anteriormente, ¿cambia nuestra conclusión sobre la influencia del proveedor en la viscosidad obtenida? 6.4
Se realiza un estudio sobre la inflamabilidad en cuatro fibras distintas. Para estas cuatro fibras se obtienen los siguientes tiempos de ignición (en segundos): FIBRA 1
FIBRA 2
FIBRA 3
FIBRA 4
17.8 16.2 17.5 17.4 15.0
11.2 11.4 15.8 10.0 10.4
11.8 11.0 10.0 9.2 9.2
14.9 10.8 12.8 10.7 10.7
a) ¿Qué fibras podemos considerar que tienen igual tiempo de ignición? b) ¿Cuál es la que tiene un tiempo menor de ignición? 6.5.
Una fábrica de pañales utiliza habitualmente tres laboratorios para comprobar la absorción de sus productos. En un momento determinado, se decide llevar a cabo un estudio llevando 9 pañales lo más parecidos posible a los laboratorios (3 a cada uno). Las cantidades absorbidas detectadas son: C A N T ID A D
PE SO
PAÑAL
L A B O R A T O R IO
A B S O R B ID A ( g )
PU LPA (g )
1 2 3 4 5 6 7 8 9
1 1 1 2 2 2 3 3 3
15.5 15.2 14.6 16.0 15.6 14.6 14.5 15.8 15.9
8.8 8.6 8.0 9.1 8.8 8.0 8.5 9.9 10.0
a) ¿Cuál es la variabilidad entre laboratorios? (Cantidad absorbida.) b) ¿Cuál es la variabilidad entre pañales? c) ¿Qué se deduce de la comparación entre estas dos variabilidades?
125
7 Diseños factoriales
7.1 Necesidad de la experimentación ".1.1 Avance del conocimiento La adquisición de conocimientos nuevos, el descubrimiento, viene condicionado por dos elementos vencíales: la ocurrencia de algún hecho diferente de lo habitual, cosa por tanto poco frecuente, y -i circunstancia de que este hecho se produzca en presencia de una persona capaz de identificarlo :omo extraño, reflexionar sobre él y, lo que es más difícil, extraer consecuencias. La unión de estos dos sucesos es extremadamente rara, aunque podemos citar aquí algunos casos famosos: la manzana, Newton y la ley de gravitación universal; la tapadera de la olla, Watt * la máquina de vapor; el incensario, Galileo y la ley del péndulo, o la aparición de hongos, Fleming y la penicilina, por citar solo algunos de los casos más conocidos. La experimentación no consiste más que en reproducir artificialmente estas dos circunstancias. >c trata, pues, de forzar la aparición de circunstancias “extrañas” en presencia de personas r>pecialmente preparadas para interpretar y extraer conclusiones de lo que ocurra. Es indudable que, en el mundo competitivo en el que se mueve actualmente cualquier icganización, uno de los factores clave de éxito es el ritmo con el que la organización es capaz de prender. La experimentación es uno de los elementos que más pueden contribuir a aumentar ese ntmo.
"1*2 Diferencia entre experimentar y analizar datos existentes intentar aprender de los procesos industriales, una situación que se plantea con frecuencia es la de ñsponer de gran cantidad de datos sobre el funcionamiento diario del proceso en cuestión, y surge la "rgunta: ¿Es realmente necesario hacer experimentos?, ¿no se podría llegar a las mismas conclusiones ¿raizando convenientemente (con frecuencia se sugieren las técnicas de regresión) los datos ñ sponibles? A continuación, y sin que ello signifique que no se pueda aprender, y mucho, analizando es datos del pasado, exponemos cuatro riesgos que se corren y de los que conviene ser consciente, atindo se analizan datos cuya recogida no ha sido planificada.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
a) Datos inconsistentes Los procesos industriales cambian con el tiempo, el envejecimiento, las reparaciones, los cambios en procedimientos, etc. Todo este tipo Cíe canteara c o rta s datos que suelen ser presiones, temperaturas, caudales, concentraciones, etc. Esto provoca que los datos recogidos mecánicamente no sean consistentes y por tanto intentar extraer conclusiones sobre el comportamiento del proceso a base de analizarlos es una tarea con escasas posibilidades de éxito.
128
b) Rango de las variables limitado por el control La figura 7.1 muestra un gráfico entre la concentración (una variable importante del proceso) y la pureza (una característica de calidad crítica del producto). En ella se aprecia la relación que hay entre estas dos variables. Sin embargo, y precisa mente porque se sabe que la concentrado® Lím. inf. Lim. sup. Pureza tiene una gran influencia en la pureza, durante la producción se controla de forma muy estricta el rango de variación de la concentración. Si rango de control es pequeño en relación a variabilidad en la pureza para un» concentración dada, resulta imposible detectar, la relación entre ambas por muy fuerte que sea. Esta situación es muy frecuente c u a n « se intenta establecer modelos a base de dat Concentración Rango observado recogidos en las operaciones habituales^ Además, causa sorpresas y comentarios Fig. 7.1 R elación entre la pureza y la concentración cuando se tipo: ¿Cómo es posible que la concentración restringe el rango de variación influya en la pureza? c) Variables altamente correlacionadas Cuando dos variables del proceso están correlacionadas, se pueden producir dos tipos difere de situación engañosa al analizar datos recogidos durante las operaciones habituales. La primera situación se produce cuando los datos recogidos incluyen, entre otras, las variables en cuestión. Esta situación es conocida como confusión de los efectos. d) Confusión de los efectos % Grasa * (534) 3 * (506) *
(491)
* (439) (413) * (410) * (356)
~r 40
45
”1 50
T~ 55
Caudal (r.p.m.)
Fig. 7.2 R elación entre el caudal, el % de grasa y la densidad (número entre paréntesis)
Considérese un proceso de extrusión en el una característica importante del producto í es la densidad (en gr/1 ) y se han recogido del caudal o velocidad de avance a través de extrusora (en r.p.m.) y del contenido de (en %) de la materia prima, una mezcla harinas vegetales. Y supóngase que la reí entre estas dos variables y la densidad es la aparece en la figura 7.2. Resulta claro que al aumentar el ca el contenido en grasa, aumenta la dens: Pero lo que no se puede discernir es si incremento de la densidad es debido incremento del caudal, al del % de grasa o
K
DISEÑOS FACTORIALES
aumento combinado de las dos variables. Es por este motivo que en estos casos se dice que los efectos de las variables están confundidos. La segunda situación se produce cuando sólo se han recogido (o tenido en cuenta en el análisis) los datos correspondientes a una de las dos variables correlacionadas. Ello produce la aparición de una relación no causal debida a la existencia de una “variable oculta”. e) Relación no causal. Variable oculta Considérese de nuevo el proceso de extrusión, pero suponiendo que no se han recogido datos del contenido de grasa de la materia prima. Al realizar un diagrama bivariante (figura 7.3) entre el caudal y la densidad, se observaría una relación entre estas dos variables que induciría a pensar que se puede obtener la densidad deseada, regulando las r.p.m. del caudal de Densidad ( gr/1 ) alimentación de materia prima. Sin embargo, una persona que 550 * * * intentase regular la densidad manipu * * lando las r.p.m., se encontraría con la * * * * * 500 desagradable sorpresa de no conseguirlo. Y es que la relación que existe entre 450 * * estas dos variables no es de causa-efecto. * * * * De hecho, es debida a una tercera variable (el % de grasa de la materia 400 * * * * prima), ya que un aumento del % de * * Caudal (r.p.m.) grasa provoca a un tiempo un aumento 350 1 en las r.p.m. (al ser más fluida la materia 45 55 40 50 prima, con la misma potencia se obtiene ana mayor velocidad), y un aumento en Fig. 7.3 Diagrama bivariante caudal-densidad la densidad. En este caso el % de grasa es una variable oculta.
".1.3 Modelos mecanicistas y empíricos En la industria, las técnicas de diseño y análisis de experimentos se utilizan básicamente en dos áreas: el diseño o mejora de productos y el diseño o mejora de procesos. Y ello es así porque actualmente anto los productos como los procesos son tan complejos, que resulta prácticamente imposible -salvo :n casos excepcionales- encontrar maneras de mejorarlos mediante consideraciones de tipo teórico. Los modelos mecanicistas, basados en conocimientos teóricos, son útiles para describir las andes líneas de comportamiento de los productos y procesos, pero muy rara vez sirven para describir el comportamiento del proceso o producto que tenemos entre manos, bien por ser poco conocido o, con mayor frecuencia, por ser excesivamente complejo. En estos casos, una descripción aproximada, -imitada a una región de interés (rango de variación de los factores restringido), y obtenida a partir de experimentación puede resultar de extrema utilidad. En este capítulo se utilizan ejemplos relativos a productos y a procesos. Queremos dejar : instancia de que independientemente de cuál sea el ejemplo que hayamos utilizado, todos los .: nceptos y técnicas que se mencionan son aplicables a la mejora o diseño de productos y procesos indistintamente.
|M
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
7.2 Posibles estrategias experimentales
fí
M SI;
fl ü
130
Experimentar significa variar deliberadamente las condiciones habituales de trabajo para encontrar mejores maneras de proceder, y ganar al mismo tiempo un conocimiento más profundo sobre e. comportamiento de productos y/o procesos. El problema básico del diseño de experimentos reside en decidir qué conjunto de prueba? pondrán de manifiesto, de forma más clara y con menor esfuerzo, los diversos aspectos de interés de! problema. Si, simplificando, se considera un experimento con sólo dos variables (temperatura > tiempo), las pruebas que hace el experimentador se pueden representar mediante puntos en ur diagrama bivariante, en el que los ejes sean las variables con las que se experimente. En la figura 7A el punto P representa un experimento realizado a temperatura 210°C y tiempo 23 minutos. En P mediríamos la o las respuestas de interés, como por ejemplo, la viscosidad o la cantidad producida. La cuestión de dónde situar los puntos no es trivial y requiere ciertas suposiciones sobre el comportamiento de la función respuesta. En concreto, que ésta sea continua y suave, o que las discontinuidades sean en gran medida conocidas. Éste es el caso, por ejemplo, en las discoc-; tinuidades producidas por cambios de estado líquido a gas-, por energías de activació* Temperatura necesarias, por imposibilidad física de acopla miento entre dos piezas si no cumplen unos requisitos básicos, etc. Resultaría prácticamente imposible llegar a conocer por métodos experi mentales una función cuya respuesta viniese representada por una superficie similar al lomo 2 1 0 __ de un puercoespín. Afortunadamente, los fenómenos indu~_____ tríales, salvo discontinuidades como las comecT Tiempo tadas que resultan en gran medida conocida*.] 23 cumplen estos requisitos de continuidad suavidad. Fig. 7.4 Representación gráfica de un punto experimental
7.2.1 Estrategia secuencial
1»
»
La principal barrera que se opone a la utilización del diseño de experimentos -aparte de la forma< inicial del personal- es que requiere una inversión importante en tiempo, materias primas, etc. Lo provoca que, aun suponiendo que se decida llevar adelante la investigación, el número de experimei a realizar sea siempre limitado. La consigna es, por tanto, obtener la máxima información con mínimo de recursos. En la manera de utilizar los recursos disponibles para la investigación, podemos distins claramente tres posibles estrategias: a) Experimentar sin planificar Seguramente es la más utilizada. Se usa la intuición para realizar pruebas, sin excesivo orden en forma individual, por iniciativas personales y aprovechando momentos que por circunstancias - averías, relajación en la carga de trabajo, necesidad de solucionar un proble] etc.- sean propicios. Sin duda esta manera de proceder no puede ser considerada como estrategia.
7U
DISEÑOS FACTORIALES
b) Decidir de golpe cómo se va a invertir todo el presupuesto Esta estrategia consiste en decidir de entrada en qué condiciones se van a realizar todos y cada uno de los experimentos que permite el presupuesto disponible. Por supuesto esta decisión se realiza tras haber considerado los objetivos del experimento y estudiado cuidadosamente todos los aspectos que, por razones teóricas o de experiencia, se conocen sobre el problema en cuestión. c) Estrategia secuencial En este caso, tras considerar los objetivos y recursos disponibles, se decide en qué condiciones se van a realizar un reducido número de experimentos, de manera que los conocimientos adquiridos se utilizan para decidir en qué condiciones realizar los siguientes. En una primera decisión lo más recomendable es invertir del orden del 40% del presupuesto. Entre las tres estrategias, sin ninguna duda, la preferible es la tercera. Esta reserva una parte del presupuesto para poder aclarar las cuestiones confusas que hayan surgido -siempre surgen- como consecuencia del análisis del primer experimento y, además, permite aproximarse paulatinamente a la zona donde los resultados son óptimos, inviniendo en ella un mayor número de experimentos. Veamos un ejemplo. Supóngase que se desea realizar un mapa de la superficie del fondo del mar o encontrar el punto más profundo en una determinada zona -en este caso, ésta es la respuesta de interés, en la fábrica será la pureza, la cantidad producida o cosas similares- y que para ello solamente podemos realizar 100 mediciones de la profundidad. En este caso, obviamente, el equivalente a las variables del experimento -que en la fábrica, serán temperaturas, tipo de materias primas, concentraciones, etc.- son la longitud y la latitud. La mejor manera de distribuir los cien puntos, si esto se desea hacer de golpe y no se dispone de conocimientos previos, es distribuirlos uniformemente en una retícula. Compárese esta estrategia con situar en una retícula sólo 40 puntos, reservándose 60 para investigar con mayor detalle aquellas zonas en las que la superficie sea más rugosa o en que la profundidad sea mayor. A esto hay que añadir que la situación de estos primeros 40 puntos resultará tanto más informativa en la medida en que hayamos utilizado nuestros conocimientos previos sobre la forma de la superficie del fondo del mar para situarlos. Estos conocimientos previos se pueden haber obtenido de conversaciones con los pescadores de la zona, de informaciones sobre corrientes y mareas, etc. Los equivalentes en el caso industrial son obviamente los conocimientos teóricos sobre el proceso y las conversaciones con operarios y encargados en contacto directo con el proceso o producto. Por tanto, una primera regla de oro de la experimentación es: “No invertir nunca todo el presupuesto en un primer conjunto de experimentos y utilizar en su diseño toda la información previa disponible
7.2.2 Diseños factoriales frente a intuición Suponga que desea optimizar un proceso (obtener la máxima cantidad de producto, por ejemplo) sobre el que se piensa que pueden influir diez variables. ¿Cómo planificaría los experimentos? Una planificación aparentemente correcta sería fijar nueve variables e ir probando diferentes niveles de la décima hasta encontrar aquel en el que se maximize la cantidad. A continuación, se fijaría esta variable ¿ su “mejor” nivel y se probaría cambiando los niveles de una de las nueve restantes. El procedimiento continuaría hasta haber experimentado con las diez variables tomándolas de una en una. Aparentemente el procedimiento está bien organizado, conduce al óptimo y, además, tiene la gran •entaja de que los resultados son muy fáciles de analizar. Veamos gráficamente cómo funciona este procedimiento en un caso con sólo dos variables (con diez resulta imposible visualizarlo, pero la situación es totalmente análoga). Se desea maximizar la
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
n
cantidad de producto obtenida como resultado de una reacción, sobre la que se sabe que hay dos variables que pueden resultar tremendamente influyentes: la temperatura del reactor (habitualmente fijada en 225°C) y el tiempo de reacción (habitualmente 110 minutos). La cantidad que se obtiene en estas condiciones es 84 gr. Para ello (ver figura 7.5) se mantiene fija la temperatura a su valor habitual y se prueban diversos tiempos, con lo que se obtiene una cantidad máxima de 87 gr que corresponde a un tiempo de 130 minutos. Una cierta mejora. Sigamos con el procedimiento. A continuación se fija el tiempo ec 130 min y se experimenta con diversos valores de la temperatura (ver figura 7.6). La nueva cantidad máxima es de 95gr, correspondiente a una temperatura de 240°C.
T em peratura ( C )
132 Fig. 7.5 Cantidad de producto obtenido en función del tiem po, con la temperatura fija a 225°C
Fig. 7.6 Cantidad de producto obtenido en función de temperatura, manteniendo el tiem po fijo a 130 min.
Así pues, una vez concluido el experimento, que ha sido un éxito, se ha conseguido aume la cantidad producida en once gramos. ¿Ha sido un éxito? Veamos la situación desde otro punto de vista. En la figura 7.7 el eje ordenadas corresponde a la temperatura > eje de abcisas al tiempo, y la cantidad Temperatura CANTIDAD (gr) representada por curvas de nivel. Salta ¿ vista que con el procedimiento anterior ik ha alcanzado el óptimo, a pesar de lo sei del caso, que sólo considera dos variables, t que la superficie representada por la can' es simple. Este procedimiento no resulta adec Lo correcto, aunque parezca ir en contra óe intuición, es experimentar con todas las c: naciones de variables y niveles; sólo as: puede detectar la dirección de las pendie alcanzar las cimas o los valles de la su en sucesivos experimentos, tiempo (min.) Los diseños que permiten expe Fig. 7.7 Curvas de n ivel que representan la cantidad de con todas las combinaciones de variables y producto obtenido en función del tiem po y de la temperatura se denominan diseños factoriales.
DISEÑOS FACTORIALES
K
Este tipo de diseños presenta diversas ventajas. Permiten, utilizados secuencialmente, acercarse al óptimo y estimar interacciones (concepto de gran interés que se explica en el siguiente apartado), y proporcionan estimaciones de los efectos de las variables con una varianza reducida, ya que, como se ve en el apartado 7.5, se calculan con todas las observaciones y son relativamente sencillos de construir y analizar. Su principal inconveniente es que requieren un gran número de experimentos. Este inconveniente se soluciona a través de dos caminos. El primero, que comentamos inmediatamente, es la utilización de dos niveles para cada variable. El segundo, del que se habla en el apartado 8.10, utiliza los diseños factoriales fracciónales.
7.2.3 Concepto de interacción Todos conocemos por experiencia el efecto de una dosis moderada de alcohol sobre nuestro organismo: ponemos contentos, sensación de euforia. También conocemos el efecto del medicamento X , que ingerimos para contrarrestar los efectos de la gripe: disminuir la fiebre, provocar una cierta sensación de bienestar. La figura 7.8 representa gráficamente la situación. La cuestión es, ¿qué ocurre cuando ingerimos las dos cosas? La intuición parece indicar que deberíamos sentir sensación de euforia y bienestar; la experiencia y la medicina indican que la sensación será de somnolencia y mareo. Este es un caso típico de interacción, en que los efectos de las dos variables consideradas no son aditivos. Esto ocurre con relativa frecuencia en los procesos industriales, causando desconcierto y admi ración. Son muy frecuentes los comentarios del tipo: a) Este proceso no hay quien lo entienda, el otro día aumenté la velocidad de extrusión y aumentó la densidad, hoy he aumentado de nuevo la velocidad de extrusión y la densidad ¡ha disminuido! b) Nuestro proceso es muy complejo, no siempre reacciona igual. El único que es capaz de mane jarlo es Juan, un encargado que lleva muchos años. Comentarios de esta índole son casi con seguridad el reflejo de interacciones. En el ejemplo de la temperatura y el tiempo (figura 7.7), la superficie más bien parece excesivamente sencilla para ser real, pues bien, esa forma refleja la existencia de una interacción entre el tiempo y la temperatura. Considérese un encargado que cierto día, trabajando a temperatura 220°C, aumenta el tiempo de 90 a 150 minutos: observará que la cantidad aumenta de 68 a 78 gr. Si al día >iguiente, en el que la temperatura es de 230°C, decide también aumentar el tiempo de 90 a 150 min para, basándose en su experiencia del día anterior aumentar en 1 0 gr la cantidad producida, se encontrará con que la cantidad permanece inalterable. La situación está representada en la figura 7.9.
(con)-
bienestar
som nolencia y mareo
230
medicamento
T e m
X
P (sin)-
normal (sin)
euforia Alcohol
(con)
R g. 7.8 Representación de la interacción alcohol-medicamento X
220 90
tiempo
150
Fig. 7 .9 Interacción tiempo-temperatura
133
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
7C
Nótese que los valores están extraídos de la superficie representada en la figura 7.7. Pues bien, en situaciones como ésta se dice que las dos variables interaccionan. Una definición general es: dos variables interaccionan, cuando el efecto de una de ellas sobre la respuesta depende del nivel de la otra.
7.3 V ariabilidad de la respuesta
134
Ya se ha comentado en el capítulo 3 que ningún sistema es totalmente determinista. Es decir, si se repiten exactamente las mismas acciones varias veces, no siempre se obtiene exactamente el mismo resultado. Esta idea es una constante a lo largo de todo el libro; veamos ahora cómo este hecho, especialmente importante cuando se plantean experimentos en la industria, donde los sistemas (procesos, máquinas, etc.) con los que se experimenta suelen ser complejos, afecta al diseño y análisis de experimentos industriales. La figura 7.10 representa la situación. Supóngase que una determinada característica de un producto depende de dos variables del proceso de producción XI y X2. A cada valor de XI y X2 le corresponde un determinado valor de esa característica representado aquí por/(X l,X 2). La realidad es que ese valor /(X I,X2) es solamente un valor teórico, ya que cuando produzcamos realmente bajo las condiciones X \ y X2, obtendremos un valor más o menos próximo, pero no igual al esperado. Ello es debido a que en el complejo mundo industrial actual cada característica depende de un número enorme de variables. Resulta aquí de aplicación el principio de Pareto, ya que depende en gran medida de un reducido número de variables (XI y X2) y muy poco de otras muchas, como condiciones ambientales, diferencias en materias primas, operarios, etc. Esas otras muchas son las que provocan esa fluctuación en principio no explicada y que en general representamos por £. Esta parte e no explicada por Fig. 7 .1 0 Error experim ental en la m edida de la respuesta variables con las que se ha experimentado que, por tanto, están incluidas en el mode provoca la variación en la respuesta. En general podemos describir la superficie por una ecuación de la forma: Y = f(X 1,X2) + 8 donde: Y : respuesta j \ X 1,X2): parte determinista £ : parte estocástica (aleatoria) No hay que olvidar que, como ya se ha comentado, £ es el fruto de las pequeñas variaciones todos aquellos factores que influyen en la respuesta, pero que no han sido considerados en el m; Por tanto, £ puede ser escrito como £(Zl,Z2,...,Zn). En muchas ocasiones uno de los objetivos de experimentación es averiguar cuáles de esas variables, en principio no consideradas, afectan ^
DISEÑOS FACTORIALES
71
respuesta en mayor medida y cómo lo hacen, para poder tener un nuevo modelo en el que la parte estructural incluya un m ayor número de variables y la parte aleatoria, también llamada ruido, sea menor. Así, el modelo: y = /(X l,X 2,Z3,Z7) + 8 proporcionaría una mejor descripción del fenómeno bajo estudio. Los efectos de las variables son detectables en la medida en que son mayores que el ruido. Esta misma cuestión ha surgido en capítulos anteriores, por ejem plo al intentar detectar diferencias entre las medias de dos poblaciones. Por tanto, pasando variables inicialmente incluidas en la parte aleatoria a la parte determinista, se disminuye el ruido lo que, a su vez, nos permite detectar la influencia de nuevas variables. Como se ve este proceso iterativo está íntimamente ligado a la naturaleza secuencial de la experimentación. En otras ocasiones, el objetivo de la investigación es conseguir reducir la variación de la respuesta provocada por algunas de las variables no consideradas inicialm ente en el modelo (Z), que sabe que afectan a la respuesta, pero que varían de una forma imposible de controlar. La utilización del diseño de experimentos para este fin es una de las grandes contribuciones de G. Taguchi. Este tema -e tratará en el capítulo 9.
7.3.1 Variabilidad en el sistema de medición de la respuesta Un aspecto de gran importancia y muchas veces olvidado es el hecho de que una parte importante de ¿ es debida a variaciones en el sistema de medida de la respuesta. Esto ocurre, bien sea porque las mediciones se realizan con poco cuidado, bien porque los instrumentos de medida son poco precisos. Com o ya se ha com entado la posibilidad de poder detectar los efectos de las variables .lepende del “tam año” del ruido, y el ruido provocado por el sistem a de m edida puede en muchas ocasiones ser reducido. Por ello, el prim er paso es conocer la variabilidad del proceso de medición. En ocasiones la proporciona el propio fabricante del equipo de medición. En otras habrá que recurrir a realizar un estudio de capacidad (ver capitulo 1 1 ). Si una vez conocido es evidente que resulta muy grande comparado con el tamaño de los efectos que se pretenden detectar, o si simplemente se sospecha que este es escaso, la manera más sencilla de 'educirlo consiste en medir repetidas veces la respuesta de cada prueba y considerar como la verdadera 'espuesta la media de estas mediciones. Con ello el ruido se reduce según la conocida fórmula: ^ o b s .i n d i v . m edia
No hay que caer en el error, sin embargo, de considerar que la desviación tipo de esas medidas -epetidas representa el ruido del experimento. Representa únicam ente el ruido del sistema de medida. Este aspecto es importante y se volverá a insistir sobre él al hablar de réplicas en el apartado 7.4.
".4 D iseños factoriales con las variab les a dos niveles Er. el apartado 7.2 se ha comentado la necesidad de utilizar diseños factoriales, es decir, experi mentando con todas las combinaciones de variables y niveles. A continuación vamos a com entar los : onceptos más habituales que intervienen en el planteam iento de este tipo de diseños experimentales.
135
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Respuesta: es el nombre genérico que se da a ¿ característica estudiada. En este libro do* Longitud L 10 cm y 15 cm centraremos en ejemplos en los que se estudia unt. Grosor G 5 mm y 7 mm sola respuesta, si bien en la practica es frecuens T ipo acero T Ay B que se estudien varias respuestas como conse-n cuencia de un solo diseño. En el capítulo 12 se Tabla 7.1 Factores y niveles. Ejem plo del m uelle muestran ejemplos de ello. Factores: se designa de esta forma a las variables que se considera que pueden afectar a la respuesta y, por tanto, se incluyen en el plan je experimentación. Niveles: son los valores que toma un factor en un determinado experimento. Supóngase que se desea diseñar un muelle de manera que el número máximo de compresiones hasta la rotura sea lo mayor posible, y que para ello se puede jugar con tres variables: la longitud, d grosor del alambre de partida y el tipo de acero del alambre (obviamente hay muchas otras variables & considerar, pero en este caso sólo se va a experimentar con estas tres). Además, se ha determinado qje se experimentará con dos valores de longitud, 1 0 cm y 15 cm, y con dos valores de grosor, diámetro* 5 mm y 7 mm, y con dos tipos de acero, que llamaremos A y B. La tabla 7.1 resume las variables 9 niveles del experimento propuesto. En este caso la respuesta (F) será el número de compresiones hasta la rotura. La notación utilizada para referimos a los diseños factoriales es una potencia de n, del tipo n* La ti significa que cada factor tomará n niveles (n valores distintos), y k es el número total de factores que intervendrán en la experimentación. El resultado de elevar nk proporciona el número de experimentos elementales que se deben realizar. En el caso del alambre, el diseño factorial adecuaác sería un 2 3. También se pueden realizar diseños en los que el número de niveles no sea el mismo para to d a los factores. Por ejemplo, si considerásemos estudiar cuatro factores a dos niveles y cinco a tres niveles, se tendría un diseño 2435 Este tipo de diseños, sin embargo, excede el ámbito de este libro. Em Peter John (1.971) se encuentra una introducción a este tipo de diseños. FA C T O R E S
A B R E V IA T U R A
N IV EL ES
7.4.1 Diseños factoriales a dos niveles En la industria los diseños más utilizados, con una gran diferencia sobre los demás, son los diseñe* factoriales a dos niveles. Es decir diseños del tipo 2k . En este caso, los valores correspondientes a los dos niveles se codifican asignando al nivel bajo el valor - 1 (o simplemente -) y al alto + 1 (• simplemente +). Si el factor es cualitativo, a un nivel se le asigna -1 y al otro +1 arbitrariamente Algunos autores utilizan los símbolos 1 y 2 para denotar los niveles; en este libro utilizaremos I* notación - 1 y + 1 , ya que tiene algunas ventajas conceptuales, si bien al escribir resulta más rápioc utilizar simplemente - y +. La difusión industrial de los diseños 2k se fundamenta en tres motivos: 1. Proporcionan una excelente relación entre el esfuerzo experimental y la información obtenida 2. Son sencillos de construir, realizar, analizar e interpretar. 3. Son fáciles de combinar entre ellos para obtener otros diseños más complejos. (Supóngase d caso más sencillo en el que se realiza un experimento 2 1, una variable a dos niveles -\m temperatura a 50°C y a 60°C- y que a continuación se vuelve a realizar un experimento 2 1 coc la temperatura a 70°C y 80°C; en conjunto se ha realizado un experimento 4 1. Es fácil imaginar casos más complejos.)
DISEÑOS FACTORIALES
7C
Resulta evidente que los diseños en los que cada factor sólo se varía a dos niveles tienen un grave incon veniente: sólo permiten estudiar relaciones lineales. Así, en la figura 7.11 aparece un diseño 21; por supuesto el experimentador sólo “verá” los dos puntos marcados en el gráfico y, a partir de ellos, a la relación entre el factor X y la respuesta Y le ajustará una relación lineal del tipo:
-1
+1
Factor X
Fig. 7.11 Diseño 2 1
Y = p l + pl X+ e Si la relación entre X e Y fuese no lineal, la divergencia entre el verdadero modelo (no lineal) y el ajustado (lineal) estaría incorporada al término de error (£) de este último. Este inconveniente queda en gran medida compensado por dos hechos. En primer lugar, los niveles los escoge el investigador, por lo que siempre puede escogerlos lo suficientemente juntos como para que una recta sea una buena aproximación a la verdadera forma de la respuesta en la región de interés. Por otra parte acabamos de ver que una de las ventajas de estos diseños es que resultan fáciles de combinar para obtener diseños más complejos. Por ello en este capítulo y en el siguiente nos vamos a centrar en los diseños 2k.
7.4.2 Matriz de diseño. Construcción La matriz de diseño es la relación que define el valor que deben tomar los factores en cada uno de los experimentos a realizar. Siguiendo con el ejemplo del muelle, la tabla 7.2 refleja los factores y niveles con su codificación. NIVELES La tabla 7.3 refleja la relación de condiciones FA C TO R ES -1 +1 experimentales para realizar un diseño 2 3. (L) Longitud 1 0 cm 15 cm Nótese que no hay dos condiciones experimentales (G) Grosor 5 mm 7 mm repetidas, ni tampoco falta ninguna combinación posible (T) Tipo acero A B de los niveles de los factores de diseño. En la tabla 7.3 se muestra la matriz de diseño para el Tabla 7 .2 Factores y n iv eles cod ificad os. Ejemplo del muelle caso del muelle y se especifican los valores reales de los
TIPO EX PER .
LO N G ITU D
G ROSO R
A CERO
N Ú M . D E C O M PR E SIO N ES H A STA LA R O TU R A (R e s p u e s t a )
1
10
2
15
3 4 5
15
6
15
7
10
8
15
10
10
5 5 7 7 5 5 7 7
A A A A B B B B
(A determinar mediante la experimentación)
Tabla 7.3 Matriz de diseño. Ejemplo del muelle
MÉTODOS ESTADÍSTICOS. CONTROL Y M EJO RA DE LA CA LID AD
niveles. En general esta m atriz se escribe con las variables codificadas, indicando con un - 1 cuando la variable debe tom ar el nivel bajo y con _] _i 1 -1 un + 1 , para sim plificar 1 , cuando la variable debe tom ar el nivel alto -1 -1 2 1 La tabla 7.4 representa, con esta notación, la m atriz de diseño para el -1 3 -1 1 -1 4 1 1 ejem plo del muelle. -1 5 -1 1 Este orden en el que se presenta la secuencia de experim entos a -1 6 1 1 realizar se denom ina orden estándar de la m atriz de diseño. En este 7 -1 1 1 8 1 1 1 orden resulta particularm ente sencillo construir la matriz: conocido el núm ero de experim entos a realizar (recuérdese que viene delimitado por el núm ero de factores) queda fijado el núm ero de filas y a partir de Tabla 7 .4 M atriz de d iseñ o en ahí, para el prim er factor se van alternando ( - 1 ) y ( 1 ) hasta haber ord en estándar. N iv e le s c o d if i cad os. E jem p lo d el m u elle com pletado todas las filas, para el segundo se van alternando 2 (- 1 1 > 2 (1), para el tercero 4 (-1) y 4 (1), para el cuarto 8 y 8 , y as: sucesivam ente hasta haberlos agotado. C onstruyendo la m atriz de esta forma, se tiene la seguridad de no om itir ni repetir ninguna com binación de valores de los factores de diseño. EX P.
L
G
T
7.4.3 Aleatorización
138
El orden estándar resulta m uy conveniente para escribir la m atriz de diseño e incluso, com o veremos más adelante, para calcular los efectos de las variables, pero no para realizar los experim entos. El orden de realización debe ser aleatorio. Se ha h ab lad o ya en cap ítu lo s an terio res de im p o rtan cia de la aletorización. A leato rizar protege al e x p erim en tad o r de la in flu en cia de variables sobre la resp u esta -desconoce cu áles son y qué efecto tienen- y que, al no perm anecer constantes durante todo el experim en to , p u d iesen afectar a la ev alu ació n e in terp retació n de los resultados. Supóngase que en el ejem plo del m uelle los prototipos se realizan en el orden m arcado por la m atriz de diseño. C om o los cuatro prim eros se realizan con el acero tipo A y los cuatro siguientes con el tipo B , si hubiese cualquier otro factor de los que intervienen en la fabricación del muelle tem peratura del horno, tipo de tem plado etc.- que cam biase a lo largo del tiem po, de form a que hiciese em peorar paulatinam ente la calidad (núm ero de com presiones hasta la rotura) del muelle. llegaría a la conclusión, tal vez errónea, de que el acero B es peor que el A. Por tanto, siem pre que sea posible y no origine ningún problem a serio, ni coste adicional im portante en la realización del experim ento, es conveniente aletorizar totalm ente el orden ac experim entación, ya que ello protege contra posibles efectos de factores no considerados en sá experim ento e ignorados por el experim entador. En ocasiones, el coste de cam biar un factor de nivel es m uy elevado (esto ocurre con frecuenta* cuando uno de los factores es la tem peratura y el coste energético y tiem po del calentam iento es mof: elevado, así com o el tiem po para el enfriam iento). Se puede recurrir a aleatorizaciones restring:cja* para m inim izar el núm ero de veces que se cam bia el nivel de un factor. Supóngase que se está experim entando con un proceso de prensado donde la tem peratura de m m atriz es una de las cuatro variables a estudiar. Se va utilizar un diseño 24 que im plica, por taimL. realizar 16 experim entos. La aleatorización total del orden de experim entación podría obligar ai cam biar el nivel de esa tem peratura hasta trece veces. U na solución es realizar, en prim er lugar > am orden aleatorio, los ocho experim entos en los que esa tem peratura está a nivel bajo, y a continuac::*. y tam bién en orden aleatorio, los ocho experim entos en los que la tem peratura de la m atriz está a alto. O bviam ente esta solución es la m ás drástica, ya que sólo requiere un cam bio de nivel. Se p u e ja i
DISEÑOS FACTORIALES
7U
pensar soluciones intermedias en las que se fija un número máximo de cambios de nivel (por ejemplo cuatro) y se aleatoriza de forma que se respete esta restricción. Esta práctica debe ser realizada sólo cuando sea imprescindible y prestando atención al analizar los resultados a su posible influencia en las conclusiones. En estos casos, la forma correcta de analizar los resultados es la técnica del Split-plot; su descripción excede el ámbito de este libro, pero se puede hallar en Milliken and Johnson (1984). 7.4.4 Réplicas Cuando se sabe que el sistema objeto de la experimentación es muy variable, se hacen varios experimentos bajo cada condición experimental. A estas repeticiones se las denomina réplicas. Como se verá en el apartado 7.6, al analizar los resultados se considera la media de estas réplicas como la única respuesta, y se procede a calcular los efectos como si sólo se hubiese experimentado una vez bajo cada condición y el resultado hubiese sido precisamente esa media. Es evidente que esta práctica reduce el efecto de la variabilidad del sistema experimental en la respuesta, pues se ha visto ya en repetidas ocasiones que:
c(m edia) =
o(obs. individuales)
donde n es el número de observaciones que componen la media. Conviene destacar que una réplica implica la realización de todo el experimento (bajo la condición
139
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
X
7.5 C álculo de los efectos 7.5.1 Cálculo de los efectos a partir del cubo Una vez realizado el experimento se procede a calcular de qué manera afectan a la respuesta km factores con los que se ha experimentado. Estos cálculos se repetirán tantas veces como respuestas haya. Considérese el ejemplo anterior en el que los experimentos se hubiesen replicado. La tab** 7.5 m uestra los experimentos y la respuesta; entre paréntesis al lado de cada respuesta aparece d orden -aleatorio- en el cual se han realizado. Como ya se ha comentado, se procede al análisis del experimento como si la única respuesu fuese el promedio de las réplicas. Dado que este experimento es un 2 3 se puede representar gráficamente por medio de un cubo, como en la figura 7.12.
R E S P U E S T A (N Ú M . C O M P . R O T U R A )
L
7 (+ l)
5(-l) 15 (+1)
Fig. 7.12 Representación gráfica de variables y respuesta. Ejem plo del m uelle
R É PL IC A S
T
1
_1
-1
1
-1
-l
-1
1
-1
1
1
-1
-1
-1
1
1
-1
1
7
-1
1
1
8
1
1
1
6
—I--10 (-1 )
G
2
3 4 5
(E N M IL E S )
FA C T O R E S
EXP.
7 7 (6 ) 9 8 (12) 7 6 (1 ) 9 0 (1 5 ) 63 ( 8 ) 82 (9) 7 2 (3) 9 2 (7)
81 (13) 96 (4) 7 4 (16) 9 4 (1 0 ) 65 (2) 8 6 (1 4 ) 7 4 (1 1 ) 8 8 (5)
M ED IA
79 97 75 92 64 84 73 90
Tabla 7.5 M atriz de diseño, orden de experim entación y respuesta. Ejem plo del m uelle
En primer lugar se calculan los efectos de cada factor por separado, a los cuales se denomirai efectos principales. El efecto principal de un factor indica cuánto cambia la respuesta (en promedio al pasar dicho factor del nivel bajo (- 1 ) al nivel alto (+ 1 ). Así, el efecto principal de L corresponde al promedio de valores de la respuesta con L a m *d i 1, menos el promedio de valores con L a nivel -1. En este caso será: 97 + 92 + 84 + 90 79 + 75 + 64 + 73 L = ----------------------- -- ------------------------ = 18 4 4 Es decir, que al cambiar la longitud de 10 a 15, el número de compresiones hasta la rotam aumenta, en promedio, 18 miles de compresiones (MC). Análogamente se pueden calcular los efecia^ principales para G y T. (El efecto principal de un factor se designa con la misma notación que m utilizada para designar al propio factor.) Y se obtendrá:
DISEÑOS FACTORIALES
K
Una mirada a la figura 7.12 muestra claramente que no siempre que el grosor pasa de 5 a 7 la respuesta aumenta 1.5 MC. Es más, esto no ocurre en ninguna combinación de las otras variables. Como ya se ha indicado, sólo ocurre en promedio. Está claro, por tanto, que con los efectos principales no hay suficiente para explicar la forma en que los factores afectan a la respuesta. Ello es debido, como acabamos de ver, a que en muchas ocasiones el efecto de un factor depende del valor que toma otro. Hemos comentado ya que cuando esto ocurre, se dice que estos dos factores interaccionan. Veamos si en el ejemplo anterior interaccionan el grosor y el tipo de acero. Para ello haremos los siguientes cálculos: a) Efecto principal del grosor con el tipo de acero a nivel 1 (nos olvidamos de las respuestas con el tipo de acero a nivel - 1 , o lo que es lo mismo nos centramos en la cara trasera del cubo): 73 + 90 64 + 84 G = ---------- -- ----------- = 7,5 2
2
b) Efecto principal del grosor con el tipo de acero a nivel -1: 75 + 92 79 + 97 G = ---------- -- ----------- = - 4,5 2
2
Por tanto, el efecto del grosor es distinto según se use uno u otro tipo de acero. Con el tipo B aumentar el grosor hace aumentar la respuesta, mientras que con el acero tipo A la hace disminuir. Esta claro que G y T interaccionan, ya que el efecto de uno depende del nivel a que se encuentra el otro. La forma de cuantificar la interacción de 2 factores -A y B- es la siguiente: Interacción AB = (l/2)(Efecto de A con B a nivel 1) - (l/2)(Efecto de A con B a nivel -1) Si esta diferencia es cero indica que el efecto de un factor es independiente del nivel del otro y, p r tanto, que no interaccionan. La diferencia se divide por 2 para que la varianza de las interacciones sea rual que la de los efectos principales (ver la sección significación de los efectos de este mismo apartado). Puede demostrarse, fácilmente, que la interacción AB es exactamente igual que la BA . Así, en el ejemplo : G T = TG = (l/2)(7.5) - (l/2)(-4.5) = 6 De la misma forma se podrían calcular, y lo dejamos como ejercicio para el lector, las otras dos Eteracciones de dos factores y se obtendría: LG = -1 L T = 0.5 Y con la respuesta en el eje vertical y un factor en el eje horizontal, el otro se indica con mbolos (figura 7.14). Análogamente, tres factores interaccionan cuando la interacción de dos de ellos depende del tr. el de la tercera. En la inmensa mayoría de los casos, se consigue explicar de forma muy satisfactoria . . rnportamiento de las respuestas a través de los factores sin necesidad de considerar las interacciones ic tres o más factores. Sin embargo, es muy importante tener en cuenta las interacciones de dos. El lector puede calcular la interacción LG T de forma similar a como se ha calculado la LG. B^Lsta para ello calcular la interacción LG cuando T está a nivel alto y restarle el valor de la interacción _ J cuando T está a nivel bajo. Como en el caso anterior y por el mismo motivo, el resultado de esta nrerencia debe ser dividido por 2 . LTG = -0.5
Í » S ES! \Df5TKTOS. CONTROL Y MEJORA DE LA CALIDAD
Respuesta (M C )
74,0
81.5
88.0
83.5
+1 Fig. 7.13 Interacción GT. Ejem plo del m uelle
Fig. 7.14 Interacción GT. Ejem plo del m uelle
7.5,2 Algoritmos de cálculo
142
El método que se ha visto para calcular los efectos de los factores tiene la ventaja de ser muy intuitivcJ pero también el inconveniente de ser muy laborioso, y de ser aplicable sólo cuando el número de factores es igual o inferior a tres. Existen dos maneras rápidas y sencillas de calcular los efectos (cuando hablamos de efectos lo hacemos en forma genérica, y se incluyen tanto los efectos principales como las interacciones de todo tipo); son el algoritmo de los signos también llamado de Box, Hunter y Hunter (en el apéndice 7A se justifica su funcionamiento), y el del algoritmo de Yates, que es el que requiere un menor número de operaciones y, al mismo tiempo, es el más adecuado para implementarlc en una hoja de cálculo o cualquier otro programa de ordenador. a) Algoritmo de los signos Este algoritmo calcula los efectos a partir de los signos utilizados para definir los niveles en la matriz de diseño. Como quiera que entonces sólo se podrían calcular los efectos principales, se añade una colum na para cada interacción. Los signos de esas colum nas se obtienen m ultiplicando algebraicamente los signos de las columnas de las variables que la componen. Se añade además un¿ columna con +1, que servirá para calcular la media. Este valor es el promedio de todas las respuesta> obtenidas durante la experimentación, pero resulta de escasa utilidad práctica. La tabla 7.6 muestra la matriz de diseño “completa”, así generada. Para hallar cualquiera de los efectos, se suma algebráicámente la respuesta, de acuerdo con les signos definidos en la columna del efecto correspondiente, y se divide por la mitad del número de condiciones experimentales. Para hallar la media la operación es exactamente la misma de antes^ excepto que se divide por el número de condiciones experimentales especificadas en la matriz de diseñcL Así, la estim ación de la media sería: media
79 + 97 + 75 + 92 + 64 + 84 + 73 + 90 8
81,75
la estimación del efecto principal de la longitud (L): - 7 9 + 9 7 - 7 5 + 9 2 - 6 4 + 8 4 - 7 3 + 90 L = ------------------------------------------------------ = 18 4
DISEÑOS FACTORIALES
la estimación de la interacción LG:
M EDIA
L
LG
GT
G
T
LT
LGT
_j
1
1
1
_1
-1
-1
-1
1
1
1
-1
1
1
-1
-1
-1
1
_1
1
1
-1 1
-1
1
-1
1
1 -1
1
1
-1
-1
1
1
1
-1
1
-1
-1
-1
-1
1
-1
1
1
-1
1
1
-1
1
1
1
1
1
1
1
1
1 1
RESPUESTA
79 97 75 92 64 84 73 90
Tabla 7.6 Matriz de diseño completa (23). Ejemplo del muelle
b) Algoritmo de Yates L a a p lica ció n de e ste a lgoritm o, ilustrada e n la fig u ra 7 . 1 5 , se tealiz.a d e la siguiew te maceta*.
1. Colocar la respuesta en columna y en el orden estándar de la matriz de diseño. 2. Añadir tantas columnas auxiliares como factores de diseño existan. La primera columna auxiliar se completa de la siguiente forma: ► Primera mitad de valores: ler. valor: Suma de las respuestas Ia y 2a, 2o valor: Suma de las respuestas 3a y 4a, y así sucesivamente. ► Segunda mitad de valores: ler. valor: Resta de la 2a respuesta menos la Ia, 2o valor: Resta de la 4a respuesta menos la 3a, y así sucesivamente. La segunda columna auxiliar se completa igual que la primera, utilizando los valores de esta última como respuestas. Análogamente para la 3a, la 4a, etc. 3. Crear una nueva columna dividiendo el primer valor de la última columna auxiliar por un divisor igual al número de condiciones experimentales. Para el resto de valores el divisor es igual a la mitad del número Resp. Efectos de condiciones experimentales. M EDIA 4. En la última columna creada el primer A valor es igual a la media de las respuestas B y el resto corresponde a los efectos. AB La correspondencia entre valores y C efectos se realiza a través de la locali AC zación de los “ 1 ” en su fila correspon BC diente de la matriz de diseño. ABC Si un valor sólo tiene “1” en la columna del factor B, corresponderá al efecto X+Y principal de B. Si lo tiene en las Y -X columnas correspondientes a los facto res A y C, corresponderá a la interacción de AC, etc. 1 AS te
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Seguramente será útil repasar (tabla 7.7) la aplicación de este algoritmo en el ejemplo del Obsérvese que, además de los efectos ya comentados (efectos principales, interacciones y de tres factores), el algoritmo de Yates proporciona la media. M A T R IZ
CO LUM NAS
D IS E Ñ O
L
G
T
-1
-1
_] 1
_i
-1
1
-1
1
1
-1
-1
-1
1
1
-1
1
-1
1
1
1
1
1
D IV .
A U X IL IA R E S
RESP.
Y
(1 )
(2 )
(3)
79 97 75 92 64 84 73 90
176 167 148 163 18 17
343 311 35 37 -9 15
654 72 6
-4 -32 2
2 0
-1
24
17
-3
-2
8
4 4 4 4 4 4 4
EFECTO
81.75 18.0 1.5 -1 .0 -8 . 0 0.5 6 .0
-0.5
ID E N T IF IC .
M edia L G LG T LT GT LGT
Tabla 7.7 A lgoritm o de Yates. Ejem plo del m uelle
7.6 Significación de los efectos
144
Que la estimación de un efecto, hallada a través del experimento, sea distinta de cero no implica el verdadero valor del mismo lo sea. Es decir, no implica que afecte de forma detectable a la res y que, por tanto, corresponda a un término que deba ser incluido en el modelo. El origen de este aparente contrasentido reside en que cuando se determina una res indefectiblemente está afectada por una variabilidad -en el apartado 7.3 se ha hablado con detalle ce variabilidad de la respuesta- y esta variabilidad se transmite inevitablemente a los efectos (recué que los efectos, principales o interacciones, se calculan a partir de la respuesta bajo las dife condiciones experimentales). De forma que, si un efecto es nulo, el valor que de él obtendremos consecuencia de la experimentación no será exactamente nulo, sino un valor en tomo al cero, puede estar tanto más alejado de éste cuanto mayor sea la variabilidad -también llamada experimental- del sistema. Por tanto, una vez calculados los efectos, la primera tarea, mediante la técnica estadística adecuada, será distinguir cuáles son significativamente distintos de cero (realmente existentes) y cr no lo son. (Como hablar de “efecto significativamente distinto de cero” es un tanto largo, se ab diciendo sólo “efecto significativo”.) Hay dos situaciones de partida distintas al abordar este problema: cuando se ha replicado experimento, y cuando cada experimento elemental se ha llevado a cabo una sola vez. Por raz obvias de economía experimental, la segunda situación es la más habitual. El motivo básico para replicar es reducir la variabilidad de los efectos calculados. Como hemos \ el cálculo de los efectos es una combinación lineal de las observaciones (la diferencia entre dos medias, una con la mitad de observaciones) y, por tanto, de acuerdo con la fórmula de la varianza de los efectos, es tanto menor cuanto mayor es el número de observaciones que se ha utilizado para calcularla. En general, cuando se está dispuesto a realizar el doble de experimentos para reducir variabilidad de los efectos estim ados, resulta más aconsejable introducir un nuevo fa experimental, aunque a priori no se considerase imprescindible. De esta manera se consir exactamente la misma reducción en la variabilidad de los efectos estimados, y además la oportuni de ampliar el estudio.
DISEÑOS FACTORIALES
71
7.6.1 Significación cuando se dispone de réplicas Cuando se dispone de réplicas, estudiar la significación de los efectos es un caso particular de las pruebas de significación que se han visto en capítulos anteriores. Veámoslo en el ejemplo de los muelles. Recuérdese que se habían realizado dos experimentos en cada condición experimental, lo que nos permite calcular la varianza -con dos observaciones en este caso- en cada una de ellas (ver tabla 7.6). EXP.
FACTORES L
1 2 3 4 5 6 7 8
1 -1 1 -1 1 -1 1
RESPUESTA
G
T
_I
_I -1 -1 -1 1 1 1 1
-1 1 1 -1 -1 1 1
RÉPLICAS 77 98 76 90 63 82 72 92
81 96 74 94 65 86 74 88
MEDIA
VARIANZA
79 97 75 92 64 84 73 90
8 2 2 8 2 8 2 8
Tabla 7.6 M edia y varianza de los experim entos. Ejem plo del m uelle
Supondremos (suposición en general razonable) que la variabilidad no depende de la condición bajo la que se esté experimentando, sino que es una característica del sistema experimental y, por tanto, que se cumple la hipótesis de igualdad de varianzas. Entonces, una buena medida del error experimental será el promedio de estas varianzas. El promedio de las ocho varianzas calculadas es: « 8+ 2 + 2 + 8+ 2 + 8+ 2+8 S 2 = ----------------------------------- = 5
8
:on lo que SR= 2.24 es la desviación tipo del error experimental, estimada con ocho grados de libertad, . a que es el promedio de ocho varianzas, cada una de ellas calculada con un grado de libertad. En general, y admitiendo que por diversas circunstancias propias de cada experimento el 'úm ero de réplicas en cada condición experimental puede ser diferente, la S2R será: ( r i i - D S f + (n 2 - l ) S ¡ + . . . H n N - 1 ) 4 R —
nx + n2 + ...+nN —N
;o n n , + n2 + ... + nc - C grados de libertad, donde C es el número de condiciones experimentales ::>tintas (C=2k) y ni el número de réplicas de la i-ésima condición experimental. Para poder determinar la significación de los efectos, es necesario disponer de una medida de a variación que el error experimental ha inducido en la estimación de los mismos. Esta medida la rroporcionará la desviación tipo de los efectos, que puede ser calculada, ya que: ► cada efecto es una combinación lineal de las respuestas obtenidas en las distintas condiciones experimentales; ► las respuestas obtenidas en las distintas condiciones experimentales son independientes entre sí.
145
EXP.
FACTORES A B
1
-1
2
-1
3 4
1 -1
-1 1 1 1
RESPUESTA RÉPLICAS
Yn Y2i r 31 y41
Yn Y22 y32 y42
Considérese en primer lugar el caso de un diseño 2 2 en el que cada condición experimental ha sido replicada, tabla 7.7. el efecto de A será:
+ efecto A =
Tabla 7.7 D iseñ o 2 2 con réplicas
Por lo que, suponiendo que todas las respuestas son independientes y tienen la misma varianza a 2, se obtiene: 1
V (efecto A) = V
(■*21 + *22 + *41 + *42
*11
*12
*31
*22 )
En general, y teniendo en cuenta que cada efecto es un estadístico formado a base (recuérdese el algoritmo de los signos) de hacer el promedio de la mitad de las observaciones con signo +, representado por y+, y restarle el promedio de la otra mitad con signo -, representado por Y_, se obtiene que: efecto = Y+ - Y_ donde cada media ha sido calculada con N i2 observaciones, y donde N es el número total de experimentos que se han realizado -incluidas por tanto, las réplicas. La varianza de un efecto será: V (efecto) = V(Y+ -Y _ ) donde, por estar calculadas con el mismo número de observaciones, provenientes de la misma ley normal: V (Y ) = V(Y+) = (Y_) N Íl Y como Y+ e Y_ son independientes: V (efecto) = — c N Y su estimación es, por tanto: V (efecto) = ~ S R Nótese que esta fórmula sólo es válida cuando el número de replicas es idéntico bajo todas .as condiciones experimentales; en caso de que esto no sea así, habrá que deducir la fórmula adecuada er forma análoga a la utilizada aquí. Asimismo, se puede calcular de forma inmediata la desviación tipa de la media, si bien rara vez resulta de utilidad práctica. En el ejemplo de los muelles la estimación de la varianza de los efectos será, pues: V (efecto)
— 5 = 1,25 16
Estrictamente, lo correcto sería realizar una prueba de significación para cada efecto, utili la t-Student (con los grados de libertad con los que se ha calculado la SR) como distribución referencia. Para ello, el estadístico:
DISEÑOS FACTORIALES
n
efecto - 0 í = ----------<:e fecto se compararía con la t-Student mencionada y se calcularía el p-valor. En la práctica, por razones de comodidad y rapidez, se recurre al cálculo de intervalos de confianza aproximados, en la forma: efecto ± X desviaciones tipo de los efectos y se consideran como significativos aquellos efectos cuyo intervalo no contiene el cero. El valor de X se escoge en función de los objetivos del experimento. Así, si interesa identificar sólo aquellos efectos que con gran seguridad influyen en la respuesta, se escogen valores de X elevados (tres o más). Si, por el contrario, interesa identificar todos aquellos efectos con una posible influencia en la respuesta, se escogen valores de X cercanos a 1. El valor que se utiliza con mayor frecuencia es el 2, ya que proporciona intervalos de confianza en el entorno del 90%-95%. Obviamente, este procedimiento es una aproximación, pero más que suficiente en las ESTIM ACIÓN aplicaciones industriales, ya que si el cero está EFECTO ±2 DESV. TIPO próximo de un intervalo calculado de esta forma, ya Longitud (L) 18.0 ± 2.24 sea por dentro o por fuera, y no se dispone de cono Grosor(G ) 1.5 ± 2.24 cimientos técnicos que aclaren la cuestión, debe ser Tipo acero (T) 8.0 ± 2.24 objeto de una posterior investigación (recuérdese la Long. X Grosor (LG) -1.0 ± 2.24 estrategia secuencial). Long. X Tipo (LT) 0.5 ± 2.24 Grosor X Tipo (GT) 6.0 ± 2.24 Aplicando lo anterior al caso de los muelles Lon. X Gro. X Tip. (.LGT) -0.5 ± 2.24 se obtienen los intervalos de la tabla 7.8. En este caso resulta evidente que los efectos significativos son la longitud, el tipo de acero y la Tabla 7.8 Intervalos de confianza aproximados para los interacción entre el tipo de acero y el grosor. efectos. Ejemplo del muelle
7.6.2 Papel probabilístico normal Ya se ha comentado que lo habitual es no realizar réplicas. El método que veremos a continuación permite detectar los efectos significativos en forma sencilla y eficaz. Este método se basa en representar los efectos en papel probabilístico normal. Se ha comentado en el capítulo el origen y utilidad del papel probabilístico normal, y que al representar en él datos rrovenientes de una ley normal, los puntos aparecerán aproximadamente alineados. La respuesta experimental está sometida, como ya se ha comentado, a variación aleatoria. Esta ariación seguirá, en general, una ley normal con media cero y una desviación tipo que refleja el error experimental. Aún en el caso infrecuente de que no siguiese una ley normal, los efectos son combinaciones lineales de la repuesta, y por el teorema central del límite tendrán tendencia a seguirla. Tenemos, por tanto, que los efectos siguen una ley normal. Supóngase ahora un experimento en el que todos los efectos sean no significativos. Los efectos hallados oscilarán alrededor de cero, siguiendo una ley normal. Al representarlos en papel probabilístico normal aparecerán todos ellos alineados. En la ' gura 7.16 se representan los quince efectos de un diseño 24, en el que los factores eran inertes. Nótese que la recta pasa aproximadamente por el punto (0,50), indicando que la media de la distribución es cero. Asimismo, la pendiente de la recta es una indicación del tamaño del error experimental. Una recta más horizontal indicaría una mayor variabilidad. Por tanto, los efectos no gnificativos se distribuyen según:
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
X
Porcentaje
M O , (7efectJ
Pot e l coateaño, ew los efectos sig ti vos, si bien tienen la misma desviación la media varía dependiendo del tamaño de’ efecto. De manera que se distribuyen según: W n cfecto, ^efectos^ donde la |iefecto es distinta en cada caso. En la figura 7.17 se representan lo> quince efectos de un diseño 2 4 en el que doce efectos son no significativos y los tres restantes significativos. En la figura 7.17 se aprecia clarame cómo los efectos principales A, C y D significativos y puede haber dudas (q: deberán resolverse mediante los conocimiento* teóricos o empíricos previos a la experii tación, o realizando nuevas pruebas) respecte la significación de la interacción CD. Recuérdese que para representar e¡ papel probabilístico normal basta con: ► ordenar los valores (en este caso efectos excluyendo la media) de m a mayor; ► calcular la proporción de efec menores que el que se está consider (con el factor de corrección 0.5 poder representar el efecto menor), será el valor de la ordenada. Para elle puede utilizar la fórmula: P = 100(i-0.5)/n donde: i es el número de orden de cada efr n es el número total de efectos ► graduar el eje no probabilístico del ► representar las parejas (efecto, P). Veamos cómo sería la representan papel probabilístico normal de los efectos
Efectos
Fig. 7.16 R epresentación en papel probabilístico normal de los efectos de un 2 4 con factores inertes
Porcentaje
Efectos
Fig. 7.17 R epresentación en papel probabilístico normal de los efectos de un 2 4 con tres factores activos
NÚM.
1
2
3
4
5
6
7
EFECTO
-8
-1
-0.5
0.5
1.5
6
18
ID E N T ID A D
T
LG
LGT
LT
G
GT
L
35.7
50
64.3
78.6
9 2 .9
P
7.14
21 .4
Tabla 7 .9 E fectos ordenados para su representación en papel probabilístico normal. Ejem plo del m uelle
K
----------------------------------------------------------------DISEÑOS FACTORIALES
ejem plo del muelle que hemos venido comentando. Construir una tabla como la 7.9 o sim ilar facilita considerablem ente la representación. Nótese que se utiliza una fila para mantener la identidad de los efectos y facilitar su identificación una vez representados. En la figura 7.18 se aprecia clara mente que hay cuatro efectos que aparecen alineados (aproximadamente) y que esa recta pasa (también aproximadamente), por el punto (0,50). Esto indica que estos efectos siguen una ley normal con media cero, lo que es señal de que no son significativos. Han salido diferentes de cero a causa de la variabilidad del sistema. Fig. 7.18 Representación en papel probabilístico normal de los efectos. Ejem plo del m uelle Por el contrario, hay tres efectos que están fuera de esa línea; por lo tanto no se puede pensar que provengan de una distri bución con media cero. Son los efectos de L, T y GT. En consecuencia, diremos que son claramente significativos. Requiere una cierta práctica trazar correctamente las rectas e interpretar los resultados. Es obvio que la recta debe ajustarse a los puntos centrales y no a los de los extremos, que son los efectos potencial mente significativos. Un error común es considerar como significativos efectos que se apartan de la recta por estar demasiado próximos al cero (esto ocurre con cierta frecuencia, ya que al extraer muestras de tamaño reducido de una ley normal los extremos tienden a estar sobrepresentados). La figura 7.19 muestra un ejemplo de lo que se acaba de comentar. Los efectos A y B no son sig nificativos a pesar de que están fuera de ¡a recta. En el apéndice 7B se presenta papel Fig. 7.19 R epresentación en papel probabilístico normal de los rrobabilístico normal especialmente prepaefectos de un 2 4 con todos los factores inertes "ido para representar los efectos de experi mentos bajo ocho, y dieciséis condiciones rxperimentales. Se incluyen, además, diversos casos de representaciones en papel probabilístico " ormal, provenientes de investigaciones reales, para que el lector se familiarice con la manera de trazar las rectas y juzgar la significación.
149
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
n
7.7 Interpretación de resultados Una vez calculados los efectos y determinado cuáles son significativos, lo único que resta es interpretar físicamente esos resultados. Se ha comentado ya la interpretación que se debe hacer de los efectos principales y que la mejor manera de interpretar las FA C TO R E FEC TO interacciones es por medio de gráficos. Por supuesto es impres Longitud 18 cindible hacer estas interpretaciones a la luz de los conocimientos -8 Tipo de acero previos que sobre el problema se pudiesen tener. Interacción Es fundamental tener bien asimilada la posible existencia Grosor-Tipo de acero 6 de interacciones de dos factores para entender el comportamiento de la respuesta, y elegir de forma acertada la mejor combinación Tabla 7.10 Efectos significativos. Ejemplo del m uelle de los factores de diseño. En el ejemplo del muelle, y a la vista de los efectos que han resultado significativos (tabla 7.10), la interpretación sería: ► Aumentar la longitud de 10 cm a 15 cm hace aumentar el número de compresiones hasta la rotura en 18.000 (recuérdese que la respuesta estaba medida en miles de unidades). ► El tipo de acero y el grosor interaccionan y por lo tanto, se deben estudiar conjuntamente con la ayuda de la figura 7.13 o la 7.14. Reproducimos aquí la 7.13. El número máximo de compresiones hasta la rotura se obtiene al trabajar con el tipo de acero A y un grosor de 5 mm. Pero si las circunstancias obligasen a trabajar con acero tipo B, lo indicado serí¿ utilizar un grosor de 7 mm. Otra manera de interpretar los efectos calculados, que en ocasiones puede ser de ayuda, es considerar que lo 74,0 81,5 (B) i que se pretende a través de la experimentación es construir un modelo. Si bien no se puede pretender hallar uiu función que represente exactamente la relación entre U respuesta y los factores, sí se puede hallar un¿ aproximación a la misma, en la zona experimental (ci (A) -1 88.0 83.5 peligrosísimo extrapolar las variables más allá de 1» niveles en los que se han considerado), que resulte útil. -1 G +1 M ediante diseños 2k se pueden estimar la* (7mm) (5mm) coeficientes de modelos polinómicos sin término* cuadráticos. Para un diseño con 3 factores el modelo ¿ F ig.7.20 Interacción GT. Ejemplo del m uelle estimar es del tipo: y = PQ+ P}A + p 2B + p3C + p n AB + p l3AC+ p23BC + Pl23ABC donde: (J() (Jj, ..., p 123:
Término independiente del modelo. Corresponde a la media. Coeficientes. Son la mitad de los efectos calculados. Esto es debido a que el ef principal de un factor representa el cambio en la respuesta al pasar del nivel bajo I al nivel alto (+1). Mientras que el coeficiente representa el cambio en la respuesu cambiar el factor una unidad (del 0 al 1 , o del -1 al 0 ) A, B, C : Valores que toman cada uno de los factores. AB, AC, BC, ABC : Productos de los valores que toman los factores que se indican. E r modelo representan los efectos de las interacciones. y : Valor que toma la respuesta para los valores dados de A, B, C.
DISEÑOS FACTORIALES
K
Así, en el ejemplo del muelle, un modelo que explicara el número de compresiones hasta la rotura en función de la longitud, el grosor y el tipo de acero sería: N\im. Comp. =81.75 +9L-4T+3GT Nótese que en el modelo sólo aparecen los términos correspondientes a aquellos factores que han resultado ser significativos. También es importante resaltar que en este modelo las unidades de los factores no son las originales, ya que éstos han sido codificados. Si se desea se puede descodificar por medio de la fórmula: nivel sup. + nivel inf. xo= ---------------------- —---------nivel sup. - nivel inf.
X
¿onde el subíndice C indica unidades codificadas y el O originales. Los niveles superior e inferior se expresan en las unidades originales. Aplicándolo al ejemplo del muelle resulta: Ln. — 12,5 —6 = — --------- ’ G„ = — -----2,5 " 1 No es necesario decodificar la variable tipo de acero, por ser cualitativa. Con lo que en la ecuación resultaría: Num. Comp. = 36.75 + 3.6L0 - 22T + 3GQT • debe ser utilizada con los valores originales de las variables. Las ecuaciones con las variables en las unidades originales deben ser tratadas con cautela, ya que su interpretación es más compleja. Son útiles para predecir, pero no para interpretar los efectos de los factores.
^.7.1 Cálculo de residuos. Diagnosis del modelo A partir del modelo es posible calcular el valor previsto ( y ) para cada condición experimental y .onbién el residuo, es decir, la diferencia entre el valor observado y el previsto por el modelo. En la :Ma. 7.12 aparecen los residuos calculados para el ejemplo de los muelles.
EXP.
1 2 3 4 5 6 7 8
FACTORES L
G
T
_1 1 -1 1 -1 1 -1 1
-1 1 1 -1 -1 1 1
-1 -1 -1 1 1 1 1
RESPUESTA
VALORES
RÉPLICAS
PREVISTOS
77 98 76 90 63 82 72 92
81 96 74 94 65 86 74 88
79.75 97.75 73.75 91.75 65.75 83.75 71.75 89.75
RESIDUOS
-2.75 0.25 2.25 -1.75 -2.75 -1.75 0.25 2.25
Tabla 7.12 Cálculo de los residuos. Ejemplo del muelle
1.25 -1.75 0.25 2.25 -0.75 2.25 2.25 -1.75
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
X
Los residuos así calculados permiten com probar si se cumplen las hipótesis del modelo, que son ► independencia, ► normalidad, ► varianza constante, y pueden ser com probadas mediante técnicas gráficas.
7.8 D iseñ os a d os n iveles bloqu ead os
152
La técnica del bloqueo, si bien ya ha sido introducida y utilizada en el contexto de la comparación de I medias, tiene particularidades en el caso de los diseños factoriales. En ocasiones no se pueden realizar todos los experim entos elem entales que componen u r 1 diseño bajo las mismas condiciones. Por ejem plo podría ocurrir que se desease realizar un experimento I 2 4, pero sólo hubiese materia prim a de la misma partida para realizar ocho experim entos y que se j sospechase que la m ateria pudiese afectar en form a im portante a la respuesta. Hay muchos motivos que podrían provocar que el experimento no se llevase a cabo ba*e condiciones homogéneas. En la industria el más frecuente es que transcurra un período de tiempo largo entre la realización del prim er experim ento y el últim o y esto siempre provoca que sea difícil asegurar que no haya cambiado nada durante ese período. Pero cambios de turno, m ateria prima, operario, etc_ son también motivos frecuentes de bloqueo. Bloquear es dividir el global de experim entos a realizar en grupos (bloques), dentro de los cuales se piensa que las condiciones bajo las que se va a experim entar son homogéneas. Para conseguir esas divisiones, se confunden interacciones, de las que en principio se piens* que no son importantes (en general, de tres o más factores), con los factores de bloqueo. La técnica es muy sim ilar a la que se explica en el siguiente capítulo para diseñar experim entos factoriales fracciónales. Por ello, postergamos la explicación detallada hasta el apartado 8.5, en que dispondremos de una m ayor base para su presentación. Baste reseñar aquí la im portancia de bloquear para aumentar la precisión de los experimentos, especialm ente en la industria, y dejar constancia de esa posibilidad
DISEÑOS FACTORIALES
Apéndice 7A Relación entre los algoritmos de cálculo y el método de los mínimos cuadrados En este capítulo se han detallado dos algoritmos para calcular los efectos, cuando los resultados provienen de un diseño factorial con las variables a dos niveles. Los dos, algoritmo de Yates y -lgoritmo de los signos, están basados en la simplificación que supone, en el caso general de la estimación de coeficientes por mínimos cuadrados (regresión lineal), el hecho de que las columnas de matriz de diseño sean ortogonales. En este apéndice se detalla la relación entre estos algoritmos y el caso general, suponiendo que el lector está familiarizado con los aspectos básicos de la regresión lineal. Dado un conjunto de variables X v Xv ..., Xp (variables independientes o regresoras), de las que se nensa que pueden contribuir a explicar las variaciones de una variable Y (dependiente) según el modelo: + $ 2 X 2 +-"+$pX p el problema básico de la regresión lineal es estimar los coeficientes i a partir de los datos disponibles r¿ra esas variables y, por tanto, estimar el modelo anterior por medio de la ecuación: y
=
P
y=
o
+
P l X
l
+
-\- b^X y + Z?2 X 2 -K •
e
pX p + e
'onde las b. son las estimaciones de las (3r Estas estimaciones se realizan por el método de los mínimos cuadrados. Es decir, se eligen .llores de b de tal manera que minimicen la suma de los cuadrados de los residuos (e). Llamando X a una matriz formada por las variables independientes, e Y a un vector formado por -¿> observaciones de la variable dependiente, en la forma siguiente, fl
X =
•
*11
*21
'
1
*12
*22
'”
*P2
1
*13
*23
’ *
* ,3
1 X ln
X ln
*pl
Y= \YnJ
pn
: > valores del vector b: 'O
b= vV / __e minimizan las sumas de cuadrados je los residuos, vienen dados por: b = (X’JQ-'X’K Considérese ahora la matriz de ::-eño completa de un 2 3 para las friables A, B y C: Llamémosla X. Entonces:
media
B
AB
AC
BC
A BC
153
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
X X
8
0
0
0
0
0
0
0
0
8
0
0
0
0
0
0
0
0
8
0
0
0
0
0
0
0
0
8
0
0
0
0
0
0
0
0
8
0
0
0
0
0
0
0
0
8
0
0
0
0
0
0
0
0
8
0
0
0
0
0
0
0
0
8
N ótese que X 'X es diagonal porque las columnas correspondientes a los efectos son contrastes ortogonales entre sí. Este hecho resulta de gran transcendencia. que esa ortogonalidad es la que provoca que las b estimadas (los efectos) sean independientes entre sí y por tanto, fácilmente interpretables. Resulta evidente que la matriz (X ’X) 1 es tambi una matriz diagonal, pero con 1/8 a lo largo de la diagonal principal. Por tanto, la estimación b resulta:
b =~ X Y 8 donde Y es un vector que representa la respuesta del experimento. Explicitando las matrices resulta:
b= i
1
1
1
1
1
-1
1
-1
1
-1
-1
1
1
—1
—1
-1
-1
-1
-1
1
1
1
-1
-1
1
1
-1
1
-1
1
—1
—1
1
1
1
—1
—1
—1
—1
-1
1
í 1
1
-1
1
1
i -i i i -i -i i -i
r i i i i i i iy
Y=
y2 y3 y4 Y
6
Y i U J
que es exactamente la misma operación que se realizaba en el algoritmo de los signos, con la úi salvedad de que en este caso los coeficientes se obtienen dividiendo por ocho (el número experimentos) en lugar de por cuatro (la mitad del número de experimentos). Esto es así, como ya ha comentado en el apartado 7.5, porque los coeficientes indican el cambio en la respuesta al c; una unidad la variable, mientras que los efectos estiman el cambio en la respuesta al pasar del bajo (- 1 ) al nivel alto (+ 1 ) de la variable. El lector comprobará fácilmente que en el algoritmo de Yates las operaciones son exactai las mismas que en el algoritmo de los signos, sólo que se resulta más eficiente, ya que éstas se reí agrupadas. Por otra parte, y dejando al margen que el método de estimación sea el mismo, conviene de manifiesto dos diferencias básicas entre la estimación de un modelo cuando la respuesta s-e obtenido como resultado de un experimento diseñado, y la que se obtiene cuando la respuesta y variables se han recogido como consecuencia de las operaciones habituales: ► Los peligros ya mencionados al inicio de este capítulo cuando los datos no provienen de experimento diseñado. Inconsistencia de los datos, rango de variación de las variables lii por el control, confusión de los efectos e im posibilidad de determinar relaciones causa-efi (variable oculta). ► Cuando los datos no provienen de un diseño factorial, las variables independientes no socj la practica totalidad de los casos, ortogonales. Esto com plica considerablem ente interpretación de los modelos resultantes.
X
DISEÑOS FACTORIALES
Apéndice 7B Papel probabilístico norm al para diseños con ocho y dieciséis experim entos y casos prácticos Papel probabilístico normal preparado para el análisis de diseños factoriales a dos niveles Las dos figuras (7B.1 y 7B.2) que presentamos a continuación representan papel probabilístico ■orinal, que simplifica considerablemente la representación de los efectos. En ellas sólo aparecen las neas correspondientes a la probabilidad requerida en cada caso. Así, en el papel para ocho \perimentos sólo aparecen siete líneas horizontales, que están situadas precisamente en las ■robabilidades (7.14, 21.43, 35.71, 50.00, 64.29, 78.57, 92.86), de manera que para realizar la "rpresentación basta con ordenar los efectos de menor a mayor y representarlos secuencialmente. Las dos plantillas ahorran, por tanto, el cálculo de las probabilidades para diseños bajo ocho y i eciséis condiciones experimentales. 15
14 13 12 11
5
10 9 8
4
7 6
3
5 4
-> 2
1
Fig. 7B.1 Papel probabilístico normal para diseños con 8 experim entos
Fig. 7 B .2 Papel probabilístico normal para diseños con 16 experim entos
ntaciones de efectos provenientes de experimentos reales . ntinuación presentamos diversos casos reales para que el lector se familiarice con el trazado de las y la forma de juzgar la significación. Siempre presentamos en primer lugar una figura con los efectos sobre el papel normal, “ os al lector a que ensaye diversas rectas y decida cuáles son, a su juicio, los efectos cativos. A continuación se presenta la misma figura con la recta que recomendamos, los efectos cativos y algunos comentarios. Al referirnos a los efectos lo haremos utilizando su número de en la representación gráfica.
I
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CA LID AD
Por supuesto, al juzgar la significación es m uy im portante tener en cuenta los conocim iento previos del investigador y cualquier otra inform ación pertinente sobre el proceso en cuestión. Po razones de espacio se han om itido aquí estos aspectos, si bien en algún caso se hace referencia a L necesidad de tenerlos en cuenta. a ) Con ocho condiciones experim entales Breve descripción de los casos y representación de los efectos en papel probabilístico norm al Caso 1*. Los efectos provienen de un C aso 2: Este experim ento tenía cora diseño 2 3, con el que se pretendía optim izar la objetivo solucionar problem as en el compoi tam iento de transistores causados por el proces viscosidad de una em ulsión. La respuesta es por de encapsulado plástico de los m ism os. El diseñ tanto la viscosidad. era un 2 5'2.
156 -50
50 Caso 1
-1
!50
150
C aso 2
Caso 3: En esta ocasión se trata del proceso de obtención de una em ulsión polim érica utili; com o aditivo en pinturas industriales con el fin de conferirles ciertas propiedades mecánicas objetivo era obtener em ulsiones que perm itiesen aum entar al m ism o tiem po la elongación (mediáü %) y la resistencia (m edida en N /200m m .). El experim ento realizado fue un 2 4 1 y se consideraron dos respuestas m encionadas, identificadas com o caso 3a y caso 3b.
0
12
Caso 3a
24
36
• -200
TjóO
W
Caso 3b
F ig. 7 B .3 C a so s 1, 2 y 3. R epresentación d e e fe c to s en papel p rob ab ilístico norm al
X
DISEÑOS FACTORIALES
Caso 4: Las tres respuestas de este experimento (caso 4a: densidad aparente de la pasta, caso consistencia de la pasta y caso 4c: retención de agua de la pasta) corresponden a un diseño 24_1. Con : >e pretendía optimizar la formulación de cementos. Caso 5: Este caso corresponde a la optimización de la densidad del producto final en un proceso :c mezclado de resinas con carga mineral. El diseño era un 23. Comentarios a las rectas trazadas y los efectos considerados como significativos en cada uno de ns casos planteados. Como ya se ha comentado, por razones de concisión, nos referiremos a cada r’-f-jto por su número de orden, que corresponde al que está señalado en el eje de ordenadas.
157
4a
■4
0 C aso 4b
C aso 4 c
C aso 5
Fig. 7 B .4 C asos 4 y 5. Representación de los efectos en papel probabilístico normal
X
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Caso 1: Nótese que la recta pasa aproximadamente por el punto (0,50) y recuérdese que. como se han etiquetado los ejes, la probabilidad 50% corresponde al punto 4. El hecho de que lo® efectos 3 y 4 tengan prácticamente el mismo valor confiere a los puntos un aspecto de no alineado&j Por otra parte, según como se trace la recta, el efecto 1 podría quedar claramente fuera de la mis pero en ningún caso puede considerarse como significativo, ya que está fuera de la recta por demasiado cerca de cero. Obviamente los significativos son los que están fuera de la recta por alejados del cero. Por tanto, en este caso no hay ningún efecto que pueda ser considerado c significativo. Caso 2: La recta esta algo desplazada del punto (0,50); esto puede ser una indicación de existencia de algún valor anómalo en los datos correspondientes a la respuesta, que se de comprobar analizando los residuos. El efecto 1 puede considerarse como significativo, si bien escaso margen. El efecto 7 claramente no, ya que se aparta de la recta, pero por estar más cerca cero de lo que le correspondería.
/m
7
9 /
/
/ r j 7 T~
J 7
/
158
/
/
/
^
L
w
/
/ -3
-M.
-2
/
-1
Fig. 7B .5 C asos 1 y 2. Recta de efecto s no sign ificativos
Caso 3a: La situación es aparentemente clara, la recta engloba a los tres efectos cen y 5) y los efectos 1, 2 , 6 y 7 son significativos. Nótese, sin embargo, que la recta está muy del punto (0,50), lo que de nuevo requiere un análisis de los residuos para aclarar la posible de anomalías. Es de destacar que en este caso, a diferencia del anterior, si se diese por buen± se estaría admitiendo que los efectos 1 y 2, cuyo valor es -12 y -9 (aproximadamente significativos, mientras que los efectos 4 y 5, que valen 8 y 11, podrían ignorarse. Este c¿j>: una revisión en profundidad de todo el experimento. Caso 3b: Este es un caso claro, en el que los efectos 1 y 2 son significativos. Caso 4a: No hay ningún efecto significativo, los dos que se apartan de la recta, el I é hacen por estar demasiado cerca del cero. Caso 4b: En esta situación hay tres efectos que son claramente significativos, el 1. d y un cuarto efecto, el 5, que resulta difícil de juzgar sin tener conocimientos adicioniúc* sistema con el que se está experimentando. Si estos conocimientos no fuesen suficientes, recurrir a realizar más experimentos para despejar las dudas (estrategia secuencial). Caso 4c: Es totalmente análogo al caso 2 ya comentado.
X
DISEÑOS FACTORIALES
Caso 5: Es similar al caso 3b, con la diferencia de que los dos efectos significativos son en este positivos. Conviene destacar que en los casos 3 y 4, correspondientes a experimentos en los que se ha derado más de una respuesta, es conveniente realizar una interpretación global tras interpretar los :ados para cada respuesta individualmente. No lo hacemos aquí, ya que el propósito es únicamente ricar la interpretación del papel probabilístico normal. 7---
U
~
/
/o
—•
-
T
i2 Caso 3a
24
36
159
7
z
t
/
x -4
0 Caso 4b
T
4 C aso 4c
2
-2 Caso 5
Fig. 7B .6 C asos 3, 4 y 5. Recta de efectos no significativos
i Bajo dieciséis condiciones experimentales Breve descripción de los casos y representación de los efectos en papel probabilístico normal. Caso 6 : Los efectos corresponden a un diseño 25 1 donde el objetivo era optimizar los -etros en un proceso de termofijación de entretelas. Caso 7: Los efectos corresponden a un proceso de curvado de tubos. La respuesta de interés las deformaciones en el diámetro interior. El diseño realizado fue un 2 6 3.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Caso 8 : Los efectos provienen de un experimento realizado en un proceso de fabr papel con una máquina de doble tela. El diseño fue un 2 5' 1 y la respuesta (a) corresponde a la longitudinal del papel y la (b) a la resistencia transversal.
8
16
24
-0.1
0
0.1 Caso 7
Caso 6
0.3
0.2
w
15
160
0
• •
• • •
-50
Fig. 7B .7 C asos
6
,7 y
<1
100
0 50 Caso 8a
Caso 8b 8
. R epresentación de efectos en papel probabilístico normal
Comentarios a las rectas trazadas y los efectos considerados como significativos e~ los casos planteados. De nuevo, nos referiremos a cada efecto por su número ce corresponde al que está señalado en el eje de ordenadas (figura 7B.8). Nótese que, en general, la interpretación del papel probabilístico resulta más se han realizado dieciséeis experimentos que cuando sólo se han realizado ocho. Ello es aparecer un mayor número de efectos no significativos, la recta queda mejor de conviene destacar que en ninguno de los cuatro casos considerados aparecen proble anomalías y que todas las rectas pasan, aproximadamente, por el punto (0,50) que corresponde al (0 , 8 ).
DISEÑOS FACTORIALES
Caso 6 : Hay un efecto claramente significativo, el 15, y otro que a nuestro juicio también lo es con menor seguridad, que es el 14. Para juzgar este último resultaría conveniente conocer el Caso 7: Los efectos 13, 14 y 15 son significativos, y puede haber dudas respecto al 1 (aunque -iclinamos por considerarlo no significativo), que como siempre se deberían clarificar a partir de . nocimientos del proceso o recurriendo a la realización de nuevos experimentos. Caso 8 a: Sólo el efecto 15 es claramente significativo. Al igual que en el caso anterior podría una ligera duda sobre el efecto 1 . Caso 8 b: Los efectos 14 y 15 son obviamente significativos. Nos inclinamos por considerar que, en menor medida, también lo son el 1 y el 2 , aunque dependiendo del significado físico de los
Caso
6
Caso 7
50 Caso 8 a
Caso 8 b
Fig. 7B.8 Casos 6, 7 y 8. Representación de efectos en papel probabilístico normal
75
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Ejercicios 7.1.
En un diseño factorial 2 3 sin réplicas, efectuado con las variables x l , x2, *3, se han obtenit las siguientes estimaciones: E s t im a c ió n
xl x2 x3
-1.91 5.25 0.45
B IN A RIA S
x lx 2 x lx 3 x2x3
-0.07 1.55 -4.07
IN T E R A C C IÓ N
x 1x2x3
E fecto s PR IN C IPA L ES
IN T E R A C C IO N E S
0.85
DE TERCER ORDEN
Analizar qué efectos son significativos e interpretar los resultados. 7.2.
Una fábrica de pilas de níquel-cadmio desea obtener una capacitancia lo más alta posible los procesos de fabricación de que dispone. En un primer estudio de mejora de la calidad se seleccionaron tres macrovariables: A: Línea de producción
A l : Línea de producción A l A l: Línea de producción A l B 1: Línea de montaje B 1 B2: Línea de montaje B2 C l: Estación C1 C2: Estación C2
B : Línea de montaje C: Estación de proceso final
El estudio se realizó con 48 pilas (6 réplicas) con materias primas homogéneas y con el , aparato para medir la capacitancia final. Los resultados obtenidos fueron: capacitancia (datos codificados) A2
Al
2
c,
c
0 .6
1.9
1 .8
2 .1
0 .8
0.7
2 .1
2.3
1.7
0.7
2.3
2 .2
1.9
1.5
1 .2
2 .0
1.9
1.9
2 .2
1.3
1.3
1 .1
0.7
1 .0
2 .6
1 .8
1 .0
1 .1
-0.7
0.7
2 .1
2 .8
2.5
2
c,
c2
Ci
-0 . 1
1.1
0 .6
0.7
1 .0
0.5
1 .0
0 .6
0 .1
0 .8
0.7
1.4 0.5
c,
-0 . 1
B2
Bl
B2
Bl c
-0 . 1
c
2
a) Describir un mecanismo de posible aleatorización del experimento. b) Efectuar un estudio completo para determinar la influencia de las macrovariables en del producto obtenido, interpretando los resultados y sugiriendo posibles acciones a e en la fábrica.
X
DISEÑOS FACTORIALES
En un proceso de fabricación de tubos de escape para la industria del automóvil se desea optimizar la calidad de una determinada soldadura, que se realiza automáticamente en un componente de acero inoxidable. Para ello se lleva a cabo un diseño factorial 2 3 replicado, considerando los factores:
NIVELES A : C A UD A L D E GAS (L /M IN ) B : IN TEN SID A D (A M P )
C:
VELO CIDA D C A DEN A (M /M IN )
Y se obtienen los siguientes resultados (mayor valor de la respuesta significativa implica mayor a liad) -> Constate, mediante el test estadístico que le parezca más adecuado (como se vio en el capitulo 5), que no existe diferencia significativa entre los valores obtenidos en la primera y segunda réplica, b Calcule todos los efectos y utilice el error experimental en la medida de la respuesta para identificar cuáles pueden considerarse significativos.
A
B
C
-
-
-
-
-
+ +
-
+ + -
-
+
-
-
+
+ +
-
+ + + +
+
8
12
230
240
0.6
1
Yi 13 25 11 22 13 21 15 22
y2
14 24 14 21 13 25 11 24
Se realiza un experimento para comprobar si la temperatura (xl) y la velocidad de agitación (.x2) influyen en el diámetro de ciertas partículas. Para ello se lleva a cabo un diseño 22 por triplicado (el experimento fue debidamente aleatorizado). Los resultados obtenidos en dicho experimento son: E X P. NÚM .
x2
_
1 2 3 4
-
xl + -
+
-
+ +
D IÁ M ETR O D I (M )
4,16 9,86 10,14 12,68
2,12 10,03 9,94 12,58
0,32 10,11 9,92 12,54
d
Sd
2,2 10,0 10,0 12,6
1,921 0,122 0,128 0,072
Analizar el experimento e interpretar los resultados, suponiendo que se cumplen las hipótesis del modelo. Dado que las varianzas bajo las diferentes condiciones experimentales son muy diferentes, parece conveniente transformar los datos.(recomendación: considerar el volumen) y analizar de nuevo el experimento. Se planifica un experimento para estudiar cómo se modifica la potencia de un motor de 6 cilindros al variar ligeramente las dimensiones críticas del carburador (A,B,C,D). Los datos obtenidos fueron: D IM EN SIO NES A
B
-
-
+
-
-
+
+
+
-
-
+ +
-
+ +
R ESPU ESTA
c
D
-
-
+ + + +
-
-
-
(PO T EN C IA )
14.8 24.8 12.3 20.1 13.8 22.3 12.0 20.0
D IM EN SIO NES A
B
-
-
+
-
+
(PO T EN C IA )
-
+
16.3 23.7 13.5 19.4 11.3 23.6 11.2 21.8
+
+ +
-
+
+ + + +
+ + + +
-
-
-
D
-
+ +
R ESPU ESTA
c
+ +
+
¿cuál es la dimensión del carburador que tiene mayor efecto en la potencia del motor?
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
7.6.
Se desea optimizar cierta característica de calidad y de un producto, y para ello se realiza i diseño factorial 2 3 en el que los factores A, B y C son las variables de las que se sospecha qp pueden tener alguna influencia en y. Las posibilidades de experimentación permiten la realización de cuatro réplicas en cm condición experimental pero como sólo pueden realizarse 16 experimentos diarios, la experi mentación se bloquea por día. Los resultados obtenidos son:
DÍA 1
A
B
C
Yl
y
.
83
-
+
-
8 6
-
+
+ +
84 83
76 82 79 75
78 87 81 81
79 81 76 77
6 6
74 72 91 91
69
+ +
DÍA 2
+ +
.
_
+
+
71 74
-
-
-
88
-
+
+
94
2
70 84 87
y
3
y
4
6 8
85 8 8
a) Describa brevemente cómo podría aleatorizarse la realización de este experimento. Calcuie 1 efectos. ¿Qué opinión le merece el generador del bloque elegido? b) Indique cuáles son los efectos significativos. ¿Era necesario bloquear? c) Considere que los resultados anteriores se han obtenido utilizando cuatro máqomi correspondiendo la primera réplica a los datos de la máquina 1 , la segunda réplica a los de la máquina 2, y así sucesivamente. ¿Podemos seguir considerando que tenemos a réplicas? ¿Por qué?
Diseños factoriales fracciónales
Utilidad y justificaciones r capítulo anterior se ha desarrollado en detalle el diseño, análisis e interpretación de los diseños es completos. También se han comentado las ventajas e inconvenientes de su utilización, y estos últimos el más importante es el elevado número de experimentos que requieren. Este crece, como resulta evidente en la notación 2 k utilizada, en forma exponencial con el número iaciores. No es inusual en la industria desear estudiar el efecto de 6 , 7, 8 o más factores sobre una ia . En el caso de considerar siete factores, un diseño factorial completo exigiría la realización de - 128 experimentos, y tal volumen de experimentación resulta, en la mayoría de ocasiones, ;tivo. Los diseños factoriales fracciónales permiten estudiar un elevado número de factores en i timero de experimentos mucho menor de lo que requeriría un factorial completo. Justificaciones r que un diseño 2 7 implica realizar 128 experimentos y, por tanto, se dispone de 128 grados de que permiten estimar 128 efectos que son, además de la media: ► " efectos principales * 2 1 interacciones de 2 factores ► 35 interacciones de 3 factores ► 35 interacciones de 4 factores * 2 1 interacciones de 5 factores » 7 interacciones de 6 factores 1 interacción de 7 factores En la práctica resulta extremadamente raro que aparezcan interacciones de tres o más factores ■¿salten ser significativas. Dicho de otra manera, en general, se obtienen modelos suficientemente lados considerando sólo los efectos principales y las interacciones de dos factores. Este hecho no debe resultar sorprendente: los efectos significativos engloban las características "portantes de la superficie que se está estudiando, y en la práctica resulta infrecuente que estas muy “rugosas”. La situación es similar a la que se produce cuando, al desarrollar una función en Taylor, se trunca la aproximación en la segunda derivada. Resultaría además contradictorio
MÉTODOS ESTADÍSTICOS. CONTROL Y M EJORA DE LA CALIDAD
incluir tém inos de tercer o cuarto orden en un m odelo, en el que ya desde el inicio (al decidir real i el experim ento con los factores a dos niveles) se han desestim ado los térm inos cuadráticos puros. Se puede, por tanto, prescindir de parte de la inform ación que proporciona un diseño Para estudiar los efectos de interés, será suficiente con realizar u na parte (f diseño com pleto. Estos diseños reciben el nom bre de: diseños fa c to ria le s fra ccio sim plem ente, diseños fra cció n a les. Para los diseños fracciónales se utiliza la notación 2k_F. 2 sigue siendo el núm ero de niveles, k el núm ero de factores con los que se experim entará y ka p indica el grado de fraccionam iento (m ás adelante se com enta su significado específico i m anera que el resultado de elevar 2 a k-p indica el núm ero de experim entos que se van a Veamos unos ejem plos: ► 2 7_1 permite estudiar siete variables en 64 experim entos. Suponiendo que todas las inte de cuarto orden o superior sean cero, perm itiría estim ar los efectos principales interacciones de segundo y tercer orden. ► 2 7-3 perm ite estudiar siete variables en 16 exprim entos. Suponiendo que todas las int de tercer orden o superior y una parte de las de segundo orden sean cero, perm itiría e efectos principales y los de las restantes interacciones de dos factores. >► 2 7-4 permite estudiar siete variables en solam ente ocho experim entos. Suponiendo que interacciones sean cero, perm itiría estim ar los efectos principales de las siete v cuestión. Hay otra justificación para la realización de diseños factoriales fracciónales y es significación de los efectos se cumple, en general, el principio de Pareto. Cuando, sobre t fases iniciales de una experim entación, se incluye un elevado núm ero de factores se suele c unos pocos son responsables de la m ayor parte de variaciones en la respuesta (esca>:s significativos), m ientras que la m ayoría de factores producen cam bios en la respuesta de me (indistinguibles del ruido experim ental). Cuando esto ocurre los diseños factoriales perm iten estudiar de m anera com pleta los efectos de las variables activas. En el apé com enta este hecho con m ayor detalle.
8.2 E jem p lo in tro d u cto rio . C in co variab les en d ieciseis exp erim en tos En una investigación -en laboratorio- sobre solidez del color en tejidos se consideraron ciño? cada una de ellas a dos niveles, que se situaron alrededor de los habituales en el proceso de tabla 8 . 1 m uestra las variables y niveles. La respuesta m edida es la cantidad de w por la muestra, resultado del expe un testigo y com parada con un test:£? De m anera que lo que se desea es h C Ó D IG O V A R IA B L E N IV E L E S ciones que m inim icen la respuesta. + Esta investigación se desarro 11: 5.5 A Ph fijado 4 .5 de un diseño 2 5 com pleto. Los 8 0 eC B T em p. fijado 7 0 SC realizados (en orden aleatorio) C C oncentr. fijador 3 g/1 1 g/1 D 1 7 0 9C 1 9 0 QC T em p. acabado tabla 8 . 2 (en orden estándar) j E T iem p o acabado 5 0 seg. 7 0 seg. respuesta obtenida. Com o se han realizado 32 e Tabla 8.1 V ariables y n iv eles. E jem p lo del tintado dispone de 32 grados de libertad, que
X
DISEÑOS FACTORIALES FRACCIONALES
EX P .
A
B
C
D
E
1
-1
-1
-1
-1
-1
2
1
-1
-1
-1
-1
13.1 9.9
-1
1
-1
-1
8 .1
1
1
-1
-1
-1
1
-1
3 4 5
RESP.
7.5 9.0 9.2
6
1
-1
1
7
-1
1
1
-1
-1
8
1
1
1
-1
-1
-1 .0 -1 .0
9
-1
-1
-1
-1
1
-1
1 0 .6
-1
-1
1
-1
8 .2
1
-1
1
-1
1 1 .0
1
1
-1
1
-1
1 1 .2
-1
-1
1
1
-1
1
-1
1
1
-1
-1
1
1
1
-1
1
1
1
1
-1
10
1
11
-1
12
13 14 15 16
5.1 9.7 4.1 2.9
EX P.
A
17 18 19
D
-1
1
-1
-1
-1
1
-1
1
1
E
R E SP
-1
1
-1
1
-1
1
6 .6
-1
1 1
4.9 5.3 -5.1 -3.7 17.3 12.7 12.9 13.7 12.4 12.4 3.8 4 .0
-1
1
1
-1
1
-1
1
1
-1
1
1
1
-1
1
-1 1 -1
-1
-1
1
1
1
-1
-1
1
1
1
-1
1
1
1
-1
1
1
-1
1
1
1
-1
1
1
1
1
1
1
1
1
1
1
1
-1 1 -1 1 -1 1
6.4 9.8 9.0
1
-1
2 2
23 24 25 26 27 28 29 30 31 32
C
-1
2 0 21
B
Tabla 8.2 Matriz de diseño y respuesta (32 experim entos). Ejemplo del tintado
estimar los siguientes 32 efectos: M E D IA
m edia = 7.5
E F E C T O S PR IN C IPA L E S
A = B= C= D = E=
-0.2 -4.5 -6.0 4.0 0.3
IN T E R A C C IO N E S D E DOS
AB= AC= AD = AE= BC =
0.0 0.9 -0.1 0.1 -3.5
B D = 1.4 B E = -0.5 C D = 0.6 CE = -0.8 D E = 3.0
IN T E R A C C IO N E S D E TR E S
IN T E R A C C . D E C U A T R O
A B C = -0.6 A BD = 0.3 A B E = 0.1 A C D = 0.3 A C E = -0.3
A B C D = - 1.1 A B C E — 0.8 A BD E = 1.0 A C D E = 0.1 B C D E = 0.2
ADE = BCD= B CE = BDE = CDE=
-0.7 0.4 -0.5 - 1.5 0.2
IN T E R A C C IO N E S D E C IN C O
A B C D E = -0.4
Representando estos efectos en papel probabilístico normal se obtine la representación de la f^ura 8 . 1 . En la figura 8.1 se observa claramente que hay cinco efectos significativos: B, C, D, BC y DE. Es decir se cumple el principio de la escasez de efectos. Dejamos como ejercicio para el lector la interpretación de los resultados, de acuerdo con el cíivo planteado en la investigación. Como acabamos de ver, se han podido estimar 32 efectos, si bien es cierto que ya antes de r el experimento había 16 efectos que considerábamos despreciables -las interacciones de tres, y cinco factores. ¿Qué hubiese ocurrido si en lugar de realizar los 32 experimentos de un 25 se hubiesen hecho los 16 indicados por un 251? ¿Podríamos haber realizado solamente 16 experimentos, y nos sen servido para estimar los efectos principales y las interaccciones de dos factores? Imaginemos que realmente se han realizado sólo 16 experimentos y que éstos han sido un onjunto de los 32 del diseño completo. En la tabla 8.3 aparecen estos 16 experimentos. Invitamos ector a comprobar como la respuesta coincide con la que se ha obtenido bajo esas mismas
MÉTODOS ESTADÍSTICOS. C O N T RO L Y M E JO R A D E LA C A L ID A D
EXP. D
NÚM.
64
17 2 3
93
&J 6l* 9j»
20 5
22
5J
23
-5 J
8
IOS
9 26 27 12 29 14 15 32
F ig . 8.1 E fe c to s d e l e je m p lo d e l tin tad o (3 2 e x p e r im en to s) en papel p ro b a b ilístico norm al
12JX
123 11.2
1249 .T 4 .1 4J®
T abla 8.3 M atriz de d ise ñ o y resp u esta (1 6 m e n to s). E jem p lo d e l tin tad o
condiciones en el diseño com pleto; para facilitar la tarea, hem os conservado la num eración origina, los experim entos. M ás adelante justificarem o s la elección de estos experim entos y no otros, por el m entó concentrém onos en el análisis de los m ism os. N ótese que los experim entos se han reordenado para que al m enos en los cuatro pri factores (A ,B ,C ,D ), el diseño aparezca en orden estándar. Al plantear el experim ento 25_I hem os renunciado voluntariam ente a las interacciones de tres o superior. U tilicem os el algoritm o de los signos p ara calcular los efectos en los que estáb interesados. Para ello, adem ás de las colum nas de la m atriz de diseño que aparecen en la tabla tendrem os que calcular las correspondientes a la m edia y a las interacciones de dos factores. Ap en la tabla 8.4. M ED 1
AB 1
1
-1
1
-1
1
AC
AD
AE
BC
BD
BE
CD
CE
DE -1 1
RESP
6 .4 9 .9
1
1
-1
1
1
-1
1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
-1
-1
-1
1
1
1
8 .1
1
-1
-1
1
1
-1
-1
6 .6
1
-1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
9 .0 5.3 -5 .1 - 1 .0
-1
1
1
-1
1
1
-1
1
-1
1
-1
1
1
-1
-1
1
-1
1
-1
1
1
1
-1
-1
-1
-1
-1
1
1
1
-1
1
1
1
-1
1
-1
1
-1
1 0 .6
-1
-1
1
1
1
-1
-1
-1
-1
1
1
-1
-1
1
1
-1
1
1
1
-1
-1
1
-1
1
1
1
-1
-1
-1
1
1
1
1
1 1
1
1
1
-1
1
1
-1
-1
1
12 .7 12 .9
-1
1
-1
-1
1
-1
1 1 .2
-1
-1
-1
-1
1
1
1
-1
-1
-1
1
1
-1
-1
1
-1
-1
1
1
1
1
1
1
1 1
1
1
1 2 .4 9 .7 4.1 4 .0
Tabla 8 .4 C o lu m n a s d e sig n o s d e la s in ter a cc io n e s d e d o s fa cto res. E je m p lo d e l tin tad o (1 6 ex p e r im e n to s)
DISEÑOS FACTORIALES FRACCIONALES
En la tabla 8.4 se ha añadido la respuesta para facilitar la utilización del algoritmo de los signos, .ina vez aplicado proporciona los efectos indicados en la siguiente tabla. Comparando estos efectos con los obtenidos utilizando 32 experimentos, se observa que, si bien no iguales, son muy similares. De hecho las diferencias son de orden similar a las que hubiese podido x a r el ruido del experimento. Veamos cuáles resultan significativos, representándolos en papel probabilístico normal (figura 8.2). Resulta evidente que los efectos significativos son los mismos que cuando disponíamos de los 32 ECXTimentos. Por tanto, básicamente hemos obtenido la misma información con la mitad de los experi¿Se ha perdido algo al reducir el número de experimentos? ------------------M ED IA
EFEC TO S
ITER A CIO N ES
PRIN CIPA LES
media = 7.3
= 0.0 £ = -4.4 c = -5.0 D = 4.8 £ •= - 0 . 8 A
D E DOS AB =
0 .2
= -0 . 6 A D - -0 . 6 A E = 0.5 B C = -4.2 AC
BD =
1 .1
B E = -0 . 2 C D = 0.7 CE
L
= -0.5 2.4
DE =
Fig. 8.2 Efectos del ejem plo del tintado (16 experimentos) en papel probabilístico normal
1 Confusión de los efectos .Acular los efectos del 25A se han considerado únicamente Bellos en los que estábamos interesados: efectos principales meracciones de dos factores. De hecho se disponía de 16 ios de libertad, provinentes de los 16 experimentos realizay se han estimado 16 efectos, por lo que, en principio, no pe 'ible estimar nada más. Sin embargo, nada nos impide utilizar el algoritmo de signos para calcular las interacciones de tercer o cuarto l Veamos qué ocurre si decidimos calcular, por ejemplo, ■teracción ABC. La columna correspondiente se obtiene E-iíplicando las columnas A, B y C (tabla 8.5). Con lo que se obtiene: ABC = 2.4
A
B
C
ABC
-1
-1
-1
-1
1
-1
-1
1
-1
1
-1
1
1
-1
-1
-1
1
1
-1
1
-1
-1
1
1
-1
1
1
1
-1
-1
-1
1
-1
-1
-1
1
-1
1
1
-1
-1
-1
1
-1
1
1 -1 1
1 -1 1 1 -1 1
1
-1
-1
1
1
-1
1
1
1
RESP.
6.4 9.9 8 .1 6 .6
9.0 5.3 -5.1 -1 .0 1 0 .6
12.7 12.9 1 1 .2
12.4 9.7 4.1 4.0
1 Obsérvese que el valor obtenido coincide con el del o DE. ¿Es debido a la casualidad?; en absoluto. Nótese ¿ la columna del algoritmo de los signos correspondiente a Tabla 8.5 Columna de signos de la interacción -:eracción ABC coincide con la columna DE. ABC. Ejemplo del tintado (16 experimentos)
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
T
El valor 2.4 que hemos estimado, ¿corresponde 4 ABC o a DE? + Veamos un ejemplo más sencillo. T Tipo de calzado N ike Adidas Supóngase que un atleta realiza un e'G*! c Ingestión de café No Sí rimento con las variables de la tabla 8.6 para inteflM mejorar su marca en los 100 m. Y con la matriz M Tabla 8 . 6 Variables y niveles. Ejem plo del atleta diseño que aparece en la tabla 8.7 junto c o e f l j respuesta. Como quiera que siempre que calza Nike no toma café, mié que siempre que calza Adidas sí lo toma, no se sabe a cuál de R E SP . T C dos factores atribuir la ganancia de dos segundos. De hecho. cxm¡ 13 seg. -1 -1 información disponible cualquiera de las siguientes explic; 13 seg. -1 -1 podría ser válida: 1 1 seg. 1 1 1 1 seg. ► Calzar Adidas en lugar de Nike hace ganar al atleta 2 se 1 1 ► Tomar café hace ganar al atleta 2 segundos. ► Calzar Adidas le hace ganar un segundo y tomar café otro seg^ Tabla 8.7 Matriz de diseño y respuesta. ► Calzar Adidas le hace ganar tres segundos y tomar café k Ejemplo del atleta perder uno. La lista no es en absoluto exhaustiva, ya que las posibles interpretaciones son inagotables dos efectos están confundidos. Al calcularlos se obtiene el mismo valor: C Ó D IG O
V A R IA B L E
N IV E L E S
-
170
T
=
C
=
- 1 3 - 1 3 + 1 1 + 11
=
-2
- 1 3 - 1 3 + 11 + 11
pero en realidad lo que se está estimando es la suma de los dos efectos. Es decir, T+C. Así pues, cuando a dos efectos les corresponde la misma columna de signos decimos qnd confundidos, y que el contraste lineal definido por esa columna estima la suma de sus efectosVolvamos al ejemplo del tintado de fibras. Hemos visto que, si para estudiar cinco realizamos un 2 5 completo, podemos estimar 32 efectos, mientras que si realizamos un 2 5 ‘ s¿ podemos estimar 16. ¿Que ocurre con los 16 restantes? La respuesta es sencilla, la confusión y DE no es la única existente, los efectos están confundidos dos a dos. Una manera de averiguar cuál está confundido con cuál sería repetir el procedií hemos utilizado para la interacción ABC con el resto de interacciones de tercer cuarto y qui El procedimiento sería tedioso. En el siguiente apartado se presenta un procedimiento mucho más simple.
8.3 Construcción de diseños fracciónales y cálculo de las confusiones introdu 8.3.1 Construcción de diseños fracciónales ¿Cómo se escogieron los 16 experimentos del diseño 25'1? De hecho, no se escogieron 16 experimentos de entre los 32 del diseño completo, s-e la matriz de diseño de la siguiente manera (tabla 8 .8 ):
DISEÑOS FACTORIALES FRACCIONALES
Se escribió la matriz de diseño de un 24 completo para las variables A,B,C y D. Se escribió la columna de signos para la interacción ABCD y se asignaron esos signos a la variable E. Se confundió deliberadamente la interacción de cuarto orden, la mayor de las disponibles, con la quinta variable. Como se verá más adelante, el procedimiento es general. A esta confusión introducida para poder escribir la matriz de se la denomina generador. De manera que el generador del 2 51 utilizado es: E = ABCD
-1 1 1 1 1
\ 1 1
B
C
D
E ABCD
-1
-1
-1
11 1
1
1
1 -1
-1
-1 1
1 1 1
11
11
-1 1 1
-1 1
1 1
Tabla 8.8 C onstrucción de la matriz de diseñ o del 25*1
1
1 1
-1 "}
1 1 1 1 1
]
l
1 1
1 1
1 1 1 1 1 1
1 Cálculo de las confusiones introducidas
que sabemos cómo se ha construido el 2 5_I, veamos una manera sencilla de hallar todas las siones que presenta un diseño de este tipo. Para ello se define una operación entre las columnas la matriz de diseño. La operación es la misma que hemos utilizado en el algoritmo de los signos, esto es: dadas las as A y B se define la columna AB como aquella que tiene en cada fila el signo correspondiente producto de los signos de A y B en esa fila.
í_1> 1
-1 1 -1 V
V
r-i> -i i B= i -i ^
V
f -11) -1
AB =
1 1 k
:)
L’tilizaremos la letra / para denotar una columna sólo de unos (+1); es la correspondiente a la media. ► Cualquier columna por ella misma es la columna /. AA -I. * Cualquier columna por I es la columna original. AI—A. * Propiedad asociativa. (AB)C = A(BC). Propiedad conmutativa. AB = BA. Si utilizando esta operación, multiplicamos ambos miembros del generador por E obtenemos la n de definición. Generador: E = ABCD Relación de definición: EE = EABCD I = ABCDE La relación de definición está formada por todas aquellas interacciones a las que corresponde .: lumna con todo unos. Dicho de otra manera, está formada por todas las interacciones idas con la media.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
La relación de definición permite hallar fácilm ente cóm o están confundidos los efectos, sin más que m ultiplicar ambos miembros por el efecto de interés. Así, para hallar con cuál esta confundida la interacción A B C : ABC (l) = ABC(ABCD E) A B C = (A B O (A B C )D E A B C = (I)DE A B C = DE El cálculo se puede realizar fácilmente sin desarrollar todos los pasos. La tabla 8.9 muestra todas las confusiones existentes en el diseño 2 51 utilizado en el ejemplo del tintado de fibras. Nótese que, aunque utilizamos la misma notación para designar las columnas de signos que los efectos que ellas perm iten estimar, ello no debe inducir a error.
R E L A C IO N E N T R E COLUM NAS
PA TRO N DE C O N F U S IÓ N
A=BCDE B=AC D E C =ABDE D =ABCE E=ABCD AB=C D E A C =BD E AD=BC E A E =B C D BC=ADE BD=A C E BE=ACD CD=ABE CE=A BD DE=A BC I=A B C D E
A+BCDE B+AC D E C +ABDE D+ABC E E +A B C D AB+C D E AC+BD E AD+BC E A E +B C D B C +A D E B D +A C E BE+ACD CD+A BE C E +A B D D E +A B C m ed ia + l/2 (A B C D E )
EFECTOS ESTE
Tabla 8.9 Patrón de con fu sión del 2 51. E jem plo de.
8.3.3 Concepto de resolución Se dice que el diseño 2 5' 1 es de resolución V. La resolución de un diseño indica el nivel de c que se presentan en la estim ación de los efectos. Así, en este caso, y tal com o se puede ver 8.9, los efectos principales están confundidos con interacciones de cuatro factores y las in' de dos con las de tres. En general, un diseño de resolución R es aquel en el que ningún efecto de q f confundido con otro que contenga menos de R-q. Así, un diseño de resolución V indica m áximo se confunden interacciones de tres factores con interacciones de dos. Si la resoluc:* confunden interacciones de dos entre sí, o efectos principales con interacciones de tres. Si la es III, se confunden efectos principales con interacciones de dos, etc. La resolución se define como la longitud del térm ino más corto de la relación de del el diseño 25 i solo tiene uno, pero no siempre es así, como verem os en el apartado siguiente La resolución de un diseño se denota por un número romano situado como subí diseño estudiado sería: ^*5-1
8.4 O tros d iseñ os fracción ales. G en eralización d e con cep tos 8.4.1 Medias fracciones Del diseño 2 5 1 que ha servido para introducir los diseños fracciónales, se dice que fracción, ya que implica realizar la mitad de los experim entos que hubiese requerido el Resulta muy sencillo escribir medias fracciones. El procedim iento es escr_r*r com pleto para el número de variables deseado y asignar la variable restante a la in disponible. Veamos algunos ejemplos.
X
DISEÑOS FACTORIALES FRACCIONALES
► Diseño: 2)nl - Escribir un 2 2 para las variables A y B. El generador del diseño es: C = AB. La relación de definición es: / = ABC. La resolución es III. Patrón de confusión: A + BC B + AC C -h A B media + ABC. > Diseño: 2%]- Escribir un 2 3 para las variables A y B y C. El generador del diseño es: D = ABC. La relación de definición es: / = ABCD. La resolución es IV. Patrón de confusión: A + BCD B+ACD C + ABD D + A BC AB + CD A C + BD AD + BC media + ABCD. En el apartado anterior se ha visto el 2y~l. El procedimiento es general y , por tanto, sencillo construir diseños 2 ^71 , 2 yj}, etc.
t 4 2 Fracción complementaria Z procedimiento descrito sirve para escribir media fracción, ocurre si deseamos escribir la otra media? Se la llama la ión complementaria, ya que juntas reproducen el diseño leto. Una manera de hallarla sería escribir el diseño completo e.eccionar los experimentos que no estén incluidos en la a fracción original. Hay un procedimiento más sencillo; consiste en utilizar mismo generador, pero cambiado de signo. Veámoslo en el del tintado de fibras. El generador sería E = -ABC D , con lo que la matriz de o resultante es la que aparece en la tabla 8 . 1 0 , a nuación. La relación de definición es: / = - ABCDE t patrón de confusión aparece en la tabla 8 . 1 1 . Supongamos que después de haber completado una a fracción se hubiese añadido la otra, de manera que se
Tabla
8 1 0
M atriz de diseño (251) de la
fracción com plem entaria del
2 51
inicial
173
s
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
dispusiese del factorial completo. Entonces se podrían estimar todos los efectos sin confusicmJ reanalizando los 32 experimentos, o bien obtenerlos por sumas y diferencias de los efectos estima**» en cada una de las medias fracciones. La tabla 8.12 muestra esta segunda opción. Obsérvese cómo los efectos para el diseño completo concuerdan con los obtenidos en la seccxád 8.2 para el diseño 25, excepto el de la interacción ABCDE que, por estar confundido con la mecsaj aparece dividido por dos. R E L A C IÓ N E N T R E
PA T R Ó N D E
C O LU M N A S
C O N FU SIÓ N
EF E C T O S ESTIM A D O S
A =BC D E
A-BCDE
-0.4
B=AC D E
B-ACDE
-4.6
C=A B D E
-7.0
D =A B C E
C-ABDE D-ABCE
E=ABCD
E-ABCD
1.4
AB=C D E
AB-CDE
-0 . 2
AC=BD E
AC-BDE
2.4
AD=BC E
AD-BC E
0.4
AE=BCD
AE-BCD
-0.3
BC=A D E
BC-ADE
-2 . 8
BD=ACE
BD-ACE
1.7
BE=ACD
BE-ACD
-0 . 8
CD=A BE
CD-ABE
0.5
CE=ABD
CE-ABD
-1 .1
174
Tabla
3.2
DE=ABC
DE-ABC
3.6
I=ABCDE
media- 1/2(ABCDE)
7.7
8
.11 Patrón de confusión de la fracción complementaria
PA T R Ó N D E C O N F U SIÓ N I a FR A C C .
E FEC T. I a FR.
A +BC D E
0 .0
Xl
PA T R Ó N DE C O N F U SIÓ N 2~ FR A C C .
E FEC T. 2~ FR.
A-BCDE
-0.4
/ (jti+x2) A =-0.2
E F E C T O S D ISE Ñ O C O M PL E T O
x2 1 2
B=-4.5
1 / 2 (jc,-jc2) B C D E =0.2
A C D E = 0 .1
B+ACDE
- 4.4
B-ACDE
C+ABD E
-5.0
C -ABD E
-4.6 -7.0
C=-6.0
A B D E =1.0
D+ABC E
4.8
D-ABCE
3.2
D = 4.0
ABC E=0.8
E+ABCD
-0 . 8
E-ABCD
1.4
E=0.3
A BC D=-1.1
AB+CDE
0 .2
AB-CDE
-0 . 2
A B =0.0
CD E=0.2
AC+BDE
-0 . 6
AC-BDE
2.4
A C =0.9
B DE=-1.5
AD+BCE
-0 . 6
A D-BC E
0.4
A D = -0 .1
BCE=-0.5
AE+BCD
0.5
AE-BCD
AE=0.1
B C D =0.4
BC+ADE
-4.2
BC-AD E
-0.3 -2 . 8
BD+A C E BE+ACD
1 .1
1.7
A DE=-0.7 ACE=-0.3
-0 . 2
BD-ACE BE-ACD
BC=-3.5 B D =1.4
-0 . 8
BE=-0.5
A C D =0.3
C D +A BE
0.7
C D-A BE
0.5
C D =0.6
ABE=0.1
CE+ABD
-0.5
CE-ABD
- 1 .1
CE=-0.8
A BD =0.3
DE+ABC I+ l/2 ( A BCDE)
2.4
DE-ABC I-l/2 ( ABCDE)
3.6
D E=3.0
7.7
med=7.5
A B C =-0.6 l/2A B C D E =-0.2
7.3
Tabla 8.12 E fectos del diseño com pleto 25, obtenidos por sumas y diferencias de las fracciones c o m p lem en te^
DISEÑOS FACTORIALES FRACCIONALES
8.4.3 Diseños saturados Las medias fracciones son los diseños menos fraccionados. Veamos ahora el extremo opuesto, los ¿íseños lo más fraccionados posible. Se denominan saturados, ya que se obtienen mediante la saturación de un completo 2 k asignando a cada interacción una nueva variable, lo cual permite estudiar 2* variables. Son, por tanto, diseños de resolución ///. Ejemplos de diseños saturados son: ► 2 Permite estudiar 3 variables en 4 experimentos. ► 2]jjAPermite estudiar 7 variables en 8 experimentos. ► 2 \]~ Permite estudiar 15 variables en 16 experimentos. Resulta evidente que, si se intentase estudiar un mayor número de variables, los diseños -multarían de resolución II. Esto es, confundirían los efectos principales entre ellos y, por tanto, m ultarían de escasa o nula utilidad. Un ejemplo de diseño de resolución // es el del corredor de 100 m ipe se ha utilizado para introducir el concepto de confusión de los efectos. Estos diseños también se llaman diseños de efectos principales, y resultan especialmente útiles aa los estadios iniciales de una investigación, cuando lo que se desea es identificar las variables activas : . reening), para posteriormente, y utilizando la estrategia secuencial, estimar sus efectos y averiguar a. posible existencia de interacciones entre ellas. Veamos con detalle un ejemplo de diseño 27~r4. Un fabricante de tubos de escape tenía problemas en una operación de curvado y decidió llevar :abo una investigación para hallar mejores condiciones de funcionamiento. El objetivo era múltiple; embargo, nos centraremos en conseguir el diámetro del tubo deseado. La máquina era nueva, lo que ivó que se identificasen como potencialmente importantes siete variables y que se conociese muy sobre ellas a priori. Además, se disponía de poco tiempo para experimentar. Bajo estas condiciones un diseño saturado parecía idóneo. Las variables y niveles eran los de labia 8.13. La matriz de diseño utilizada aparece en la tabla 8.14. Por supuesto los experimentos se llevaron a cabo en orden aleatorio y se tomaron diversas auciones para medir el diámetro. De hecho, se realizaron cinco tubos bajo cada condición 7*rrimental (no constituyen auténticas réplicas) y la respuesta que se muestra es el promedio. ----■CCCiGO
A B
C D E
F ' C
V A R IA B L E
Presión mordaza Presión seguidor V elocidad seguidor V elocidad eje y V elocidad eje b V elocidad eje c Ajuste utillaje
N IV E L E S -1
1
50 45 -5 7 7 7
60 55 +5 9 9 9
2 .2
0 .2
' 1 3 Variables y niveles. E jem plo del curvado
EXP. NÚM.
A
1
-1
-1
-1
1
2
1 -1
-1
-1
-1
1
1
-1
-1 -1
7
1 -1
1
1
8
1
1
1
3 4 5 6
C
B
1
AB D
-1
AC E 1 -1
BC F
ABC G
1 1 -1
1
1
1 -1
1
1
-1
-1
1
1
-1
-1
-1
-1
1 -1
1
-1
1
1
1
1
-1
-1
1 -1
R ESP. D IA M .
34.6 46.3 48 .6 44 .9 49.7 34.0 46.5 4 9 .0
Tabla 8.14 Matriz de diseño 2 7*4. Ejem plo del curvado
Nótese que, tras escribir un 23 completo, se asignó una nueva variable a cada una de las rciones disponibles. Por tanto, este diseño tiene cuatro generadores que son: D = AB
E = AC
F = BC
G = ABC
175
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
Con lo que la relación de definición es:
(productos de dos) (productos de tres) (productos de cuatro)
/ = ABD = AC E = BC F = ABCG = BCDE = AC D F = CDG = ABEF = BEG = AFG = D EF = ADEG = BDFG — CEFG = ABCDEFG
La relación de definición, además de estar compuesta por los cuatro términos obtenidos a de los generadores, está compuesta por sus productos dos a dos, tres a tres, etc. Resulta evidente estos productos también proporcionan columnas sólo de masas y que, por lo tanto, forman parte relación de definición. En general, un diseño 2k p tiene p generadores y 2p términos en la relación de defi(incluyendo la /). Si no se incluye tiene 2p-l términos. Una vez se tiene la relación de definición se puede calcular el patrón de confusión, de análoga a cómo se hizo anteriormente. La única diferencia es que ahora cada efecto estará con'" con 15 efectos más, cosa perfectamente razonable, ya que en 2 7 se pueden estimar 128 efectos: si realizamos los ocho experimentos correspondientes a un 2 7'4, sólo podemos estimar ocho efectos, tanto, cada uno de ellos tiene que estimar 128/8 = 16, es decir, cada efecto tiene que estar con con otros 15. En este caso el patrón de confusión es:
176
A + BD + CE + A B C F + BCG DEG + ABDFG + ACEFG B + AD + ABC E + CF + ACG ABDEG + DFG + BCEFG C + ...
+ ABCDE + CDF + ACDG + BEF + ABEG + FG + BCDEFG + CDE + ABCD F + BCDG + AEF + EG + ABFG + ACDEFG
+ ADEF + BDEF
Como se ve, el patrón de confusión es, en los diseños altamente fraccionados, t calcular y escasamente informativo. Por ello, cuando el número de confusiones es muy el suele utilizar el patrón de confusión restringido, en el que sólo se representan los efectos pri las interacciones de dos factores. En este caso es: A + BD + CE + FG B+ AD + CF+EG C+AE+BF+DG D + AB + CG + EF E + A C + BG + D F F + BC + AG + DE G + CD + BE + AF En el ejemplo del tintado de fibras, los efectos se calcularon utilizando el algo signos. Para calcular los efectos en diseños fracciónales utilizando el algoritmo de Y¿ proceder como si el diseño fuese el completo correspondiente al número de experimentos a continuación utilizar el patrón de confusión para identificar los efectos estimados. L¿ muestra la utilización del algoritmo de Yates en el ejemplo de la operación de curvado. Representando los efectos en papel probabilístico nonnal, se obtiene la figura 8.5 Nótese que a la vista de los efectos (con sus confusiones) que han resultado si^“ teniendo en cuenta que es extremadamente raro que la interacción entre dos factores sea i sin serlo el efecto principal de ninguna de ellas, hay cuatro interpretaciones posibles:
DISEÑOS FACTORIALES FRACCIONALES
X
A
B
C
R ESP.
(1)
(2 )
(3)
EFEC .
EST.
PA T R . C O N F.
-1
-1
-1
34.6
80.9
174.4
353.6
44.2
med
media
1
-1
-1
46.3
93.5
179.2
-5.2
-1.3
A
A+BD+CE+FG
-1
48.6
83.7
8 .0
24.4
6 .1
B
B+AD+CF+EG
0.7
AB
D+AB+CG+EF
-1
1
1
1
-1
44.9
95.5
-13.2
2 .8
-1
-1
1
49.7
11.7
1 2 .6
4.8
1 .2
C
C+AE+BF+DG
1
-1
1
34.0
-3.7
1 1 .8
-2 1 . 2
-5.3
AC
E+AC+BG+DF
-1
1
1
46.5
-15.7
-15.4
-0 . 8
-0 . 2
BC
F+BC+AG+DE
1
1
1
49.0
2.5
18.2
33.6
8.4
ABC
G+CD+BE+AF
Tabla 8.15 Cálculo de los efectos. Algoritmo de Yates. Ejemplo del curvado
► ► ► ►
Los Los Los Los
efectos efectos efectos efectos
activos activos activos activos
son: son: son: son:
B, B, E, B,
E y G. E y BE. G y EG. G y BG.
Si los conocimientos previos sobre el rroceso no permiten quedarse con una de -Jas, se habrán de realizar más experi mentos (estrategia secuencial) para aclarar situación. En la sección 8.7 se discuten s posibles caminos a seguir. Nótese que este diseño ha permitido reducir el número de variables de las siete raciales a tres, es decir, ha servido para realizar un screening.
Efectos
Fig. 8.3 Efectos en papel probabilístico normal. Ejemplo del curvado
1 4.4 Diseños intermedios Entre las medias fracciones y los diseños saturados, existe toda una gama intermedia de diseños, que rermiten realizar menos experimentos que las medias fracciones y con confusiones más favorables que os diseños saturados. Así, entre el 271 y el 27 4 existen el 27-2 y el 27 3. El procedimiento a seguir para su construcción es el mismo: escribir el diseño completo a: “respondiente al número de experimentos que se desea realizar y asignar los factores restantes a las nieracciones. El problema con los diseños intermedios es que no siempre es evidente a qué interacciones hay .sae asignar los factores restantes para obtener diseños de máxima resolución (que son los que tienen m patrón de confusión más favorable). El criterio, intuitivamente razonable, de asignarlos a las z^racciones de mayor orden disponibles no suele proporcionar el mejor diseño. Veamos un ejemplo. Supóngase que se desea estudiar los efectos de siete variables, pero que en m rrimer experimento (estrategia secuencial) sólo se está dispuesto a realizar 16 experimentos. Ello implica realizar un diseño 27-3. Para construirlo se parte de un diseño completo 24 y se -z znan los tres factores restantes a interacciones.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
%
-------------------------------------------------------------
En la tabla 8.16 aparece la matriz de diseño completa correspondiente al 24 y dos posibles asignaciones.
E X P.
A
B
PR IM E R A A S IG N A C IÓ N
F
SE G U N D A A SIG N A C IÓ N
E
C
D
AB
AC
AD
BC
1 -1
1 -1
1
-1
1 -1
1
-1
1
1 -1
1 -1
-1
1
-1
-1
2
1
-1
3 4 5
-1
1
-1
-1
-1
1
1 -1
-1
-1
1
1
-1
1
-1
1 -1
-1
6
1
7 Q O
-1 ii
9
-1
10
1
11
-1
12
1
13 14 15 16
-1 1
-1 1 i I
i
i
1
i i
1 1
1
1 -1 1 -1
-1
1
1 -1
1
-1
1
-1
1 -1
-1
-1
-1
1
1
1
1
1
1
1
1
1 -1
BD
-1
1 -1
-1
-1
1 -1
-1
1
-1
1
1 1
1 1 1
1
CD
ACD
BCD
1
_|
.]
_i
_i
1
1
1
-1
1
1 -1
1 -1
1 -1
-1
1 -1
-1
1
1
-1
1
1
-1
1
1
-1
1
1
-1
1
1
1
-1
1
-i
1 -1
1 -1
1 -1
-1
-1
1 -1
1
-i
1 -1
-1
1
1
-1
1 -1
-i
-1
i
1 -1
-1
-1
i
1 -1
1 -1
1
1
i
-1
1
1
1
i
1
1
1
1
-1
1
1
1
1
1
1
1
1 -1
1
ABCD
1
1 -1
-1
F
A BD
-1
1 -1
G
ABC
;í
1
G
1 1 -1 -1
1 1 -1
-1
-1 -1
1 -1
-1
1 -1
1
-1
1
1
1
1
Tabla 8.16 Matriz de diseño com pleta de un 2 4 con dos p osibles asignaciones para construir un 2 7' 3
Un posible conjunto de generadores sería, siguiendo el criterio de utilizar las interacciones mayor orden disponibles (primera asignación): E = ABCD
F = ABC
G = BCD
Con lo que la relación de definición sería: 1 = ABCDE = ABCF = BCDG = DEF = AEG = ADFG = BCEFG Y por lo tanto el diseño resultante es un 21~¡‘ Mientras que, en la segunda asignación (nótese que en este caso no se utiliza la interacoiai cuarto orden), los generadores son: E = ABC
F = BCD
G = ACD
La relación de definición resultante es: / = ABCE = BCDF = ACDG = AD EF = BDEG = ABFG = CEFG Y, en consecuencia, proporcionan un diseño 2]y3. Por supuesto, para llevar a cabo el experim ento sólo son necesarias las c: correspondientes a los factores, esto es, las correspondientes a A, B , C, D, E, F y G. En la sección 8.6 se proporcionan tablas para facilitar la construcción de diseños fracc^ de máxima resolución.
1
DISEÑOS FACTORIALES FRACCIONALES
K
8.5 Bloqueo En la sección 7.8 se introducía la utilidad de bloquear los diseños factoriales completos, cuando se sospechaba que las condiciones bajo las que se iban a llevar a cabo los diferentes experimentos no eran homogéneas. Se comentaba que en la industria el motivo más frecuente para recurrir al bloqueo era el tener que llevar a cabo los experimentos a lo largo de un período dilatado de tiempo, pero que otros motivos frecuentes eran cambios de tumo, de operario, de materia prima, etc. Lógicamente, lo mismo sucede con los fracciónales. Como ya se vio en los capítulos 5 y 6 , bloquear resulta de utilidad cuando el efecto que provoca la falta de homogeneidad en las condiciones de realización del experimento es aditivo. Es decir, no provoca cambios en los efectos del resto de factores ni interacciona con ellos. Sólo provoca un cambio tn el nivel de la respuesta, que se traduce en un cambio de nivel en la media. ¿Cómo se bloquea un diseño factorial? Para construir diseños en bloques se utiliza el mismo rrincipio que para construir diseños fracciónales. Confundir el efecto del bloque con alguna interacción, a ser posible, de las consideradas despreciables a priori. S.5.1 Bloqueo de factoriales completos Veamos qué ocurre (tabla 8.17) cuando un diseño 2 3 se divide en dos bloques, confundiendo el efecto leí bloque con la interacción de tres factores. Designamos a los factores de bloqueo mediante números para distinguirlos de las variables del rxperimento, que siempre hemos designado mediante letras mayúsculas. Nótese que todos los experimentos del bloque I corresponden a los signos menos de la interacción ABC y todos los del bloque II a los signos más. La figura 8.4 muestra la situación. En la figura 8.4, los experimentos enmarcados en un círculo corresponden al bloque / y los ■orinales (dentro de un cuadrado) al bloque II. Obsérvese que en cada cara del cubo hay dos r\perimentos de cada bloque, con lo que al calcular los efectos principales -diferencias entre las medias de las caras- el efecto bloque queda compensado. Lo mismo ocurre con las interacciones de dos actores. Esta propiedad -que no es más que una consecuencia de la ortogonalidad- se puede observar también en la tabla 8.17, imaginando que se va a aplicar el algoritmo de los signos. Por el contrario, la interacción de tres factores estará confundida con el efecto bloque, ya que el ¿iseño se ha construido precisamente a partir de esa confusión. De hecho, el generador del diseño es:
NÚM '
FA C TO R ES
EXP.
A
B
1 C
AB
AC
BC
ABC
BLOQUE
-\
1
-1
I
1
1
n
1
_1
2
1
-1
-1
1 -1
1 -1
3 4 5
-1
1
-1
-1
-1
1
-1
1 -1
n
1 -1
1 -1
-1
1 -1
1
1
-1
-1
1
n
6
1 -1
-1
1
-1
-1
i
1
1
-1
1 -1
-1
7
1
-1
i
8
1
1
1
1
1
1
1
n
"tif ia 8.17 Matriz de diseño de un 2 3 dividido en dos bloques
i
Fig. 8.4 Representación gráfica de un diseño 2 3 en dos bloques de cuatro experim entos cada uno
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
1 =ABC y la relación de definición es:
I = A BC 1 Con lo que el patrón de confusión resultante es el que aparece en la tabla 8.18. PA T R Ó N D E C O N F U S IÓ N IN C L U ID A S IN T E R A C C IO N E S D E F A C T O R D E B L O Q U E
media + ABC1 A + BC1 B + AC1 C + AB1 A B + C1 AC + B1 BC + A l A BC + 1
P A T R Ó N D E C O N F U S IÓ N D E L EN
23
2 B LQ . D E 4 E X P E R IM . media A B C AB AC BC A BC + 1
Tabla 8.18 Patrón de confusión de un 2 3 dividido en dos bloques
Como quiera que ya se ha comentado que los factores de bloqueo no interaccionan cor variables del experimento (esas interacciones son cero), el único efecto confundido es el oc interacción ABC. En lo sucesivo, escribiremos directamente el patrón de confusión sin incluir interacciones.
8.5.2 Ejemplo de proceso químico Imaginemos que se lleva a cabo un experimento 2 3 con las variables siguientes y que la respue^ cantidad obtenida. Supóngase, además, que el experimento se debe : C Ó D IG O V A R IA B L E en dos días distintos para no interferir en las necesidacr* Temperatura A B producción. Como se sospecha que esto puede influir C oncentración C V elocidad agitación resultado del experimento, se decide llevar a cabo el ex; en dos bloques. El orden de experimentación de cada bloque se decide aleatoriamente. Los resultados del experimento, NÚM. en el orden de realización, aparecen en la BLOQUE B R E SP . A C STD Calculando los efectos, se puede -l 6 1 41 1 indistintamente el algoritmo de los signos -1 4 I 1 1 46 -1 -1 -1 1 42 Yates sin más requisito que tener en o 7 1 1 33 -1 confusiones. Se obtiene: n
5 3
-1
-1
1
-1
1
-1
8
1
1
1
2
1
-1
-1
38 43 50 55
Tabla 8.19 Matriz de diseño y respuesta. Ejem plo del proceso quím ico
media = 43.5 A = 9.0 B = -1 .0 C = -6.0
AB = 1.0 AC = 1.0 BC = 3.0 ABC + 1
Representados en papel probabi ja figura 8 .5 .
DISEÑOS FACTORIALES FRACCIONALES
Con lo que resulta que los efectos Porcentaje significativos son el A, el C y la interacción ABC confundida con el efecto bloque. Supo niendo la interacción de tercer orden despre ciable, diremos que el efecto bloque es 6 , es decir, que la respuesta en los cuatro expe rimentos del primer bloque ha sido unifor memente seis unidades más alta que en los cuatro del segundo bloque. ¿Qué hubiese ocurrido en este expe rimento si no se hubiese bloqueado? La tabla 8.20 muestra la respuesta que hubiese obtenido, en orden estándar, si los icho experimentos se hubiesen podido rea Efectos lzar el primer día. Nótese que tanto las respuestas de la Fig. 8.5 E fectos en papel probabilístico normal. Ejemplo del proceso químico übla 8.19 como las de la tabla 8 . 2 1 se corres ponden con éstas (tabla 8 .2 0 ), para lo que ~_>ta añadir 6 (el efecto bloque) a las .: respondientes a experimentos realizados el segundo día. Por supuesto, el efecto bloque también esta *:metido a variabilidad, y en la práctica nunca será un valor constante. La tabla 8.21 muestra los resultados obtenidos, en el orden de realización de los experimentos, realizar el experimento en dos días diferentes y sin bloquear. Con lo que los efectos resultan: media = 43.5 A = 9.0 B =-1.0 C = -6.0
AB = 1.0 AC = 1.0 BC = 9.0 ABC = 0.0
Que representados en papel probabilístico normal proporcionan la figura 8 .6 .
NÚM.
NÚM.
STD
A
B
C
R ESP.
STD
C
RESP.
D ÍA
1
-1
-1
-1
4
1
1
-1
1
-1
-1
6
1
-1
1
3 4 5
-1
1
-1
-1
-I
1
1
1
-1
5 3
-1
1
-1
-1
-1
1
6
1
-1
1
7
-1
1
1
8
1
1
1
46 41 32 37 50 48 55 39
1
2
42 49 37 46 32 41 33 44
?.20 Matriz de diseño y respuesta si todos los ntos se hubiesen realizado el primer día. Ejemplo r e c e s o químico
A
B
8
1
1
1
1
-1
-1
-1
2
1
-1
-1
7
-1
1
1
1 1 1 2 2 2 2
Tabla 8.21 Matriz de diseño y respuesta, experimentos realizados en días diferentes, sin bloquear. Ejemplo del proceso químico
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Fig.
8 .6
E fectos en papel probabilístico normal. Ejem plo quím ico realizado en dos días diferentes sin
Con lo que se hubiese llegado a la errónea conclusión de que los efectos significan'' » el C y el BC.
8.5.3 Factoriales completos divididos en más de dos bloques Si el experimento anterior se hubiese tenido que llevar a cabo en cuatro días en lugar de se hubiese tenido que dividir en cuatro bloques de dos experimentos cada uno. Veamos Para ello habrá que introducir dos generadores de bloque (en general para c o se r_ r se requieren k generadores de bloque): 1 = AB 2 = AC Con lo que la matriz de diseño será la de tabla 8.22. FACTORES
EX P. NÚM.
1 2
3 4 5 6
7 8
A
B
C
_i
_1
_1
1 -1 1 -1 1 -1 1
-1 1 1 -1 -1 1 1
-1 -1 -1 1 1 1 1
1
2
AB
AC
1 -1 -1 1
1 -1 -1 1
1 -1 1 -1 -1 1 -1 1
BLOQUE
I n
ni IV IV
m
El criterio utilizado par¿ mentos a bloques es que aquellos mismos signos en los dos gei quedan incluidos en el mismo bi Con estos generadore> relación de definición queda: I = AB 1 = A C 2 = B C \2 Y, por tanto, el patrón
n
i
Tabla 8.22 M atriz de diseño de un 2 3 en cuatro bloques de dos experim entos (un factor de bloqueo)
media A B C
AB
—
BC ABC
DISEÑOS FACTORIALES FRACCIONALES
K
Hay varios aspectos destacables en este patrón de confusión: En primer lugar que la interacción BC aparece confundida con 12, cuando se ha dicho que los bloques no interaccionaban. La explicación es simple: entre los cuatro bloques definidos hay tres grados de libertad (análogamente, en el caso anterior entre los dos bloques definidos había un grado de libertad) y, por tanto, se requieren tres columnas para poder estimar sus efectos. Por tanto, 12 no define una interacción entre bloques, sino que define un factor de bloqueo exactamente con las mismas implicaciones que el factor 1 o el factor 2 . Por otra parte, se requiere que la interacción ABC no esté confundida con ningún efecto bloque. Dejamos al lector que averigüe las consecuencias de utilizar la interacción triple como generador de bloque. En este caso resulta sencillo hallar los generadores más apropiados, pero en general puede ser un problema complejo; por ello en la sección 8.6 se proporcionan tablas (tabla 8.25) para facilitar el bloqueo. El diseño construido es de resolución ///, ya que las interacciones de dos están confundidas con efectos de un sólo “factor”, aunque en este caso sea de bloqueo. La resolución de los diseños bloqueados es, como en los fracciónales, la longitud del término más corto de la relación de EXP. definición, con la única consideración de que en FA C TO R ES 1 2 B LO Q U E DÍA O PE R . NÚM. A B AB AC C los términos con interacciones entre factores de bloqueo, éstas cuentan como un solo factor. Así, el -1 -1 -1 1 1 1 I 1 A 8 1 1 1 1 1 I término AC12 tiene longitud tres. 2 1 -1 -1 -1 -1 II 2 A El diseño que acabamos de comentar sirve -1 1 1 -1 -1 7 n rara acomodar un factor (día de realización del -1 1 -1 -1 1 3 ni 1 B r\perim ento) de bloqueo con cuatro niveles m 6 1 -1 1 -1 1 cuatro días diferentes). O bien, para acomodar dos 4 1 1 -1 1 -1 IV 2 B 5 rv 1 -1 1 1 -1 factores de bloqueo (día de realización de experimento y operario), cada uno de ellos a dos ■nreles (dos días distintos, 1 y 2 , y dos operarios, Tabla 8.23 Matriz de diseño de un 2 3 en cuatro bloques de dos experim entos (dos factores de bloqueo) .4 y B). La tabla 8.23 muestra cómo hacerlo.
*-5.4 Fracciónales divididos en bloques -L^sta ahora hemos bloquedo diseños factoriales completos. La técnica es igualmente útil para bloquear ñ -eños factoriales fracciónales. Cosidérese el caso en el que se desean estudiar 6 variables en cuatro bloques y solamente neciséis experimentos. Lo que se requiere es un diseño 26 2 divido en cuatro bloques. Los generadores, ®e se pueden hallar en la tabla de la sección 8 .6 , soni E = ABC F = BCD 1 = AC D 2 = ABD Se requieren dos generadores para el fraccional y dos para los bloques. Estos generadores se haber hallado por tanteo -lamentablemente no hay ninguna regla que permita hallarlos de ó-:cilla-, pero hubiese resultado tedioso. En la tabla 8.24 aparece la matriz de diseño, ya dividida en bloques.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
NÚM. ST D
1 8 10 15 3 6 12 13 4 5 11 14 2 7 9 16
A
B
C
D
ABC
BCD
ACD
ABD
E
F
1
2
-1
-1
-1 -1 -1 -1 1 1 1 1 1 1 1 1
1 1 1 1 -1 -1 -1 -1 1 1 1 1
BLOQUE
I 1 1 -1 1 1 -1 1 -1 1 1 -1 -1 1
1
1
1 1 -1 1 -1 1 -1 1 -1 -1 1 -1 1
1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1
1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1
1 1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1
1 1 1 1 -1 1 1 -1 -1 -1 -1 1 1
n
ni
IV
Tabla 8.24 M atriz de d iseñ o de un 26'2en cuatro b loq u es de cuatro experim entos
La relación de definición es: 1 =ABCE=BCD F=ACD \=ABD 2 =ADEF=BDE 1=CD E2=ABF 1=A CF2=B C 12 =CEF2=BEF2=AE12=DF12 =ABCD EF Aparentemente el diseño es de resolución IV , pero recuérdese que 1 2 es de longitud uno y, por tanto, los términos en los que aparece son de longitud tres, por lo que el diseño es de resolución III. El patrón de confusión que proporciona es:
C O N F U N D ID O C O N IN T E R A C C IO N E S D E
3 O MÁS
CONFU MÁS
m edia
A B C
D E F
1 2
Como se ve, las confusiones no están repartidas uniformemente. En otros distribución puede ser mucho más irregular, por lo que, al asignar las variables del expe columnas de la matriz de diseño, es conveniente tener presente el patrón de confusión. > asignación de manera que aquellos efectos que a priori parezcan más importantes les c confusiones más favorables. H allar los generadores que proporcionan diseños fracciónales bloqueados ctm resolución no es tarea sencilla, ya que desgraciadamente no existe una regla y se han ác tanteo. Por ello la tabla 8.25 de la sección siguiente proporciona los generadores para los comúnmente utilizados.
8.6 Tablas de diseñ os fracción ales En esta sección presentamos una tabla (tabla 8.25a y &.25b) que proporcionados gener los diseños factoriales, completos o fracciónales y bloqueados o no, que implican la re 16 experimentos. Se han omitido de la tabla los diseños compuestos por cuatro experi
DISEÑOS FACTORIALES FRACCIONALES
71
razones de espacio como de sencillez de construcción. Los diseños con 32 experimentos requerirían una tabla de gran tamaño, cuya inclusión no consideramos justificada dado lo infrecuente de su utilización. La tabla proporciona un único conjunto de generadores. Obviamente se pueden utilizar las reglas comentadas en el apartado 8.7 (a continuación) para, cambiando los signos de los generadores, obtener fracciones complementarias. Los generadores que aparecen son aquellos que proporcionan diseños con máxima resolución. Incluso, en los casos en que para un diseño se pueden encontrar varios conjuntos de generadores que producen la misma resolución, el conjunto suministrado es el que proporciona un patrón de confusión más favorable. De tal manera que en muchas ocasiones, se pueden hallar conjuntos de generadores que producen patrones de confusión del mismo tipo que el conjunto proporcionado, pero nunca mejor.
N Ú M . D E E X P E R IM E N T O S
8
NÚM. FA C T .
3
16
SIN
2 BLQ de
4 BLQ de
SIN
2 BLQ de
4 BLQ de 4
8 BLQ de
BLQ
4 EXP.
2 EX P.
BLQ
8 EX P.
EXP.
2 EX P.
23
2¿ I 3V
2 IV 3
2¿ v4
2¿ I4V
s 2=AC 4
¿2 4-1 rv
D =ABC 5
2 n5-2 i
D =AB E=AC 6
6—3 III
D =A B E=AC F=BC 7
2^ n7-4 i
D =A B E=AC F=BC G=ABC
2 4-1 iii
D =A B C 1=AB rs 5 -2 A III
2^11 4"1 D =A B C 1=AB 2=AC
1=ABCD 2 5-l
D =AB E=AC 1=BC
E=A BC D
9 6 -3 z in
r* 6-2 TV
D=AB E=AC F=BC 1=ABC
2 5 -í ¿
iv
1=ABC 2=B C D ^2
5-1
iii
E=ABC 1=BCD
E=ABC 1=BCD 2=A C D
^ 6 -2
^ 6 -2
¿ iv
2^ 4n i 1=AB 2=B D 3=BC 2 5- ' ///
E=ABC 1=AB 2=B D 3=BC
Z III
6—2 Z III
E=ABC F=BCD 1=AB 2=B D 3=BC
E=ABC F=BCD
E=ABC F=BCD 1=ACD
E=ABC F=BCD 1=ACD 2=A B D
2 IV 7- 3
¿2 i7-3 v
2 7-3 ^ ni
2^ 7"3 iii
E=ABC F=BCD G=ACD 1=A BD
E =ABC F=BCD G =ACD 1=AB 2=B D
E=ABC F=BCD G=ACD 1=AB 2=B D 3=BC
E =ABC F=BCD G=ACD
ibla 8.25a D iseños factoriales, com pletos y fracciónales, bloqueados y sin bloquear. Hasta siete factores con ocho y 16 experimentos
185
MÉTODOS ESTADÍSTICOS. CONTROL Y M EJORA DE LA CA LID AD
16 E X P E R IM E N T O S
NÚM. FACT. 8
9
10
SIN B L Q
2 BLQ d e 8 EXP.
8—4 ¿IV
8 -4 ¿ III
ry
E=ABC F=BCD G=ACD H =ABD 1= A B C D 2=B C
E =A B C F=BCD G =ACD H =ABD 1=A B C D 2= A B 3=A C
2 9' 5 ii i
^ iii
E=ABC F=BCD G =ACD H =ABD J= A B C D
E=ABC F=BCD G=ACD H =ABD J=A B C D 1=A B
E=ABC F=BCD G=ACD H =ABD J= A B C D 1=A B 2= A C
10 —6 ¿ III
1 1 -7 ¿ui ry
ry
12 -8
¿ III
E=ABC F=BCD G=ACD H =ABD J= A B C D K=AB L =A C M =AD
ry 10 —6 ¿ III
E=ABC F=BCD G=ACD H=ABD J=A B C D K =A B 1=AC 11 —7 Z III ry
ry
2 9-5
ry 10 —6 ¿ III
E=ABC F=BCD G=ACD H =ABD J=A BC D K=AB 1=A C 2=A D 1 1—7 ¿III ry
E=ABC F=BCD G=ACD H =ABD J=A BC D K=AB L =A C I=A D
E=ABC F=BCD G =ACD H =ABD J=A B K=AC L =A C L =A D 1=B C 2=B D
1 2 —8 ¿ III
ry 1 2 — 8 ¿III
E=ABC F=BCD G =ACD H =ABD J=A B C D K=AB L =A C M =AD 1=B C
E=ABC F=BCD G=ACD H =ABD J= A B C D K=AB L =A C M =AD 1=BC 2=B D
ry
2e x p .
8 -4 ¿ III
2 n9-5 ^ i
ry
8 BLQ d e
8—4 ¿III
ry
E=ABC F=BCD G=ACD H =ABD 1=A B C D
E=ABC F=BCD G=ACD H=ABD J= A B C D K=AB L =A C 12
4 BLQ d e 4 EX P.
E=ABC F=BCD G=ACD H=ABD
E=ABC F=BCD G=ACD H =ABD J= A B C D K=AB 11
ry
Tabla 8.25b co m p leto s y ad os y sin factores con
DISEÑOS FACTORIALES FRACCIONALES
En la tabla 8.25 aparece, además, la resolución del diseño, lo que permite prever el tipo de confusiones que proporciona un diseño determinado. Este hecho es de gran importancia, ya que entonces se puede decidir si es conveniente cambiar el número ie factores (añadir o suprimir alguno), el -úmero de bloques, o incluso si es posible disminuir el número de experimentos o :onviene aumentarlo, para conseguir el tipo ie confusión deseada.
13 FA C TO R ES 13-9 ¿III
SIN BLQ
E=ABC F=BCD G=ACD H=ABD J=ABCD K=AB L=AC M =AD N =BC ^ 13—9 ¿ iii
2 BLQ de 8 EX P.
E=ABC F=BCD G=ACD H=ABD J=ABCD K=AB L=AC M =A D N =BC 1=BD
14 FA C TO R ES 14-10 ¿ I II ry
E=ABC F=BCD G=ACD H =A B D J=ABCD K=AB L=AC M =A D N =BC 0=BD
15 FA C TO R ES 15-10 ¿ III
ry
E=ABC F=BCD G=ACD H =ABD J=ABCD K=AB L=AC M =A D N =BC 0=B D P=CD
14—10 ¿ III ry
E=ABC F=BCD G=ACD H =A B D J=ABCD K=AB L=AC M =AD N =BC 0=B D 1=CD
Tabla 8 .2 5 c D iseñ os factoriales, com pletos y fracciónales, bloqueados y sin bloquear. D e 13 a 15 factores con 16 experimentos
' " Estrategia secuencial utilizando diseños fracciónales Los diseños fracciónales permiten explotar al máximo la estrategia secuencial en la experimentación tn muchas ocasiones, conseguir la información deseada con un menor número de experimentos La idea de comenzar una investigación realizando un número de experimentos del orden del - ~ del total disponible, adquiere especial relevancia cuando se conocen y utilizan los diseños cionales. Ahora bien, la utilización de esta estrategia plantea la necesidad de saber, a la vista de las - oclusiones extraídas en un primer experimento, cuál es el siguiente experimento a realizar, de forma r-e dé respuesta a las cuestiones que hayan quedado pendientes y se aprovechen los concimientos ¿ccuiridos en el primero. En esta sección comentamos una serie de cuestiones que, además de poder resultar de utilidad M aplicar la estrategia secuencial, contribuirán, sin duda, a desarrollar una mejor comprensión de los 'tr.a s ya tratados. Antes, sin embargo, queremos dejar constancia de que los caminos a seguir en una investigación • * múltiples y no hay ninguno que a priori se pueda considerar el mejor. Con frecuencia, sólo al - ocluir la investigación se puede afirmar cuál hubiese sido el camino que, con menor esfuerzo, nos era conducido a las conclusiones correctas. Esta es precisamente la justificación para la utilización U estrategia secuencial poder corregir el camino a medida que se avanza por él. Es por ello que lo
187
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
comentado en esta sección son cuestiones que pueden resultar de utilidad, pero que en ningur pueden reemplazar la creatividad y los conocimientos sobre el sistema estudiado por el investí»
8.7.1 Advertencias Los métodos y técnicas que se exponen a continuación están basados en la idea de que el inv utilizará las mismas variables a los mismos niveles en la fracción añadida y en la original. ObT> esto no tiene por qué ser así. Es más, en la mayoría de ocasiones, el análisis de los resultados del experimento permitirá descartar alguna variable, aconsejará cambiar los niveles de otras, o : la necesidad de incluir alguna nueva variable que inicialmente no se tuvo en cuenta. Cuandc se pueden analizar los resultados de cada experimento por separado y luego extraer conc conjuntas de todos ellos, pero si se deseasen analizar los resultados de todos los expex conjuntamente, la forma de proceder es recurrir a la regresión lineal (método que queda exc* ámbito de este libro). Siempre que, utilizando la estrategia secuencial, se realizen experimentos con el mismc de forma consecutiva, hay que tener en cuenta la posibilidad de que entre el primer y el experimento se hayan producido cambios en el sistema, quizá no detectados por el investig que afecten a la respuesta. En otras palabras, hay que tener en cuenta la posible existencia de bloque entre el primer y el segundo experimento.
8.7.2 Fracciones complementarias En el ejemplo del tintado de fibras se vio que, combinando las dos medias fraccione> _ conseguía reproducir el diseño 2 5 completo. Y se comentó una manera fácil de obtener la fracción complementaria: cambiar de signo el generador. Esto es siempre posible, aun c diseños sean mucho más fraccionados. El procedimiento es sencillo: basta con cambiar de generadores del diseño fraccional original para obtener nuevas fracciones de la misma familia Según la notación empleada, un diseño 2k p es una fracción l/2 p del diseño co construcción requiere p generadores. Pues bien, para generar las 2p fracciones que unidas el diseño completo, basta con considerar que cada uno de los p generadores se puede escribir + y con signo -, y escribir los 2 p conjuntos de p generadores resultado de combinar los sigr Veamos un ejemplo. Supongamos que tras realizar un 2 6-3 (los ocho experimentos de representan 1/8 de los 64 experimentos del diseña con generadores: D = AB FR A C C IÓ N GENERADORES E = AC D =A B E=AC F=BC 1 F = BC 2 D =-A B E=AC F=BC 3 4 5 6 7 8
D =A B D =A B D =-A B D =-A B D =A B D =-A B
E=-AC E=AC E=-AC E=AC E=-AC E=-AC
F=BC F=-BC F=BC F=-BC F=-BC F=-BC
Tabla 8.26 Los och o conjuntos de tres gen e radores que proporcionan diseños 26'3
obtenidos a partir de la tabla 8.25, se desea experimentos más (una nueva fracción 2 6'3). ce que juntas proporcionen un diseño 2 6-2. A£: fracción realizada inicialmente, hay otras sie.e que representan un octavo del diseño complet : 8.26 aparecen los generadores que permiten Considerando conjuntam ente los ocho proporciona la tabla 8.26 se obtendría un 2 6
DISEÑOS FACTORIALES FRACCIONALES
n
Con cualquier conjunto de generadores de los que aparecen en la tabla 8.26 conseguiríamos nuestro propósito. Consideremos el de la fracción número 5. ¿Cúal sería la relación de definición del diseño 2 6 2 resultante? La relación de definición de la primera fracción es: / = ABD = ACE = BCF = BCDE = ACDF = ABEF = DEF La de la segunda fracción es: / = -ABD = -ACE = BCF = BCDE = -ACDF = -ABEF = DEF Para obtener la del diseño combinado, no hay más que recordar que cada término de la relación de definición significa que, multiplicando los signos de las columnas de cada una de las letras que lo compone, se obtiene una nueva columna sólo con signos más. Resulta entonces evidente que la relación de definición del disño 2 6 2 obtenido será: / = BCF = BCDE = DEF Es decir, estará compuesta por aquellos términos que tengan el mismo signo en las relaciones re definición de las dos fracciones. El diseño 26‘2 obtenido es, pues, de resolución ///, mientras que, si se hubiese planificado de mtrada un 26'2 se hubiese podido escoger de resolución IV. Aunque no siempre, en muchas ocasiones éste -> el precio que se paga por el hecho de utilizar la estrategia secuencial. A cambio, no hay que olvidar r ué la segunda fracción la hemos escogido entre siete posibles, y que cada una de ellas proporciona para d diseño combinado una relación de definición diferente y, por tanto, un patrón de confusión diferente. 7 : mo la elección se realiza sabiendo los resultados de la primera fracción, siempre se puede añadir una ^^unda que proporcione un patrón de confusión conjunto para aclarar los puntos conflictivos. Cuando se desea añadir una fracción para clarificar confusiones entre los efectos significativos :e:ectados en una primera fracción, hay unas reglas que pueden resultar de utilidad. En los diseños de resolución ///, al añadir una nueva fracción obtenida de la siguiente forma: ► Multiplicando por -1 (cambiar de signo) los signos de una columna correspondiente a una variable, se obtiene un diseño combinado en el que esa variable y todas las interacciones de dos en las que esté involucrada están confundidas con interacciones de orden superior. Ejemplo: Considérese el caso del curvado 2 ^ 4 , en el que los generadores eran: D = AB, E = AC, F = BC y G = ABC y la relación de definición: I = ABD = ACE = BCF = ABCG = BCDE = ACDF = CDG = ABEF = BEG = AFG = DEF = ADEG = BDFG = CEFG = ABCDEFG que proporciona el patrón de confusión restringido:
*
* *
A + BD + CE + FG B + A D + CF+EG C + AE + BF + DG D + AB + CG + EF E + AC + BG + DF F + BC + AG + DE G + CD + BE + AF
189
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Se han marcado con un asterisco los que resultan significativos. A la vista de interpretaciones posibles son: - Los efectos activos son: B, E y G. - Los efectos activos son: B, E y BE. - Los efectos activos son: E, G y EG. - Los efectos activos son: B, G y BG. Para aclarar la situación se podría llevar a cabo una nueva fracción 27*4, cambiando lo* de alguno de los tres efectos principales (B , E o G). Supongamos que cambiamos los cst generadores de la nueva fracción serían D = -A B , E = AC, F = -BC y G = -ABC, y la de definición conjunta de las dos fracciones (obtenida tomando sólo aquellos té tengan el mismo signo en las dos fracciones): I = A C E = AC D F = CDG = AFG = DEF = ADEG = CEFG que proporciona el siguiente patrón de confusión restringido (nótese que sólo efectos. De los dos restantes, uno estima la media y sus confusiones, y el otro inte orden superior): A + CE + FG B C + A E + DG D + CG + EF E + AC + DF F + AG + D E G + CD + A F
AB AD + CF + EG BC BD BE BF BG
Obsérvese que se ha conseguido la propiedad deseada. Obsérvese también que, casi seguridad, se solventarían los problemas de interpretación planteados en la primera fracción. ► Multiplicando por -1 (cambiar de signo) los signos de todas las variables, se obtiene un combinado de resolución IV. Es decir, un diseño en el que los efectos principales confundidos con interacciones de orden tres o superior. Ejemplo: En el mismo caso del curvado, cambiando de signo todos los factores, la fracción tendría como generadores: D = -A B , E = -AC, F = -BC y G = ABC, y la re definición del diseño combinado sería, por tanto: / = ABCG = BCD E = AC D F = ABEF = AD EG = BDFG = CEFG Con lo que claramente el diseño combinado es de resolución IV y proporciona el patrón de confusión restringido (de nuevo aparecen únicamente catorce efectos, restantes estiman la media e interacciones de orden superior): A B C D E F G
AB + CG + EF A C + BG + D F AD + CF + EG A E + BF + DG BC + AG + DE BD + CE + FG CD + BE + A F
También este diseño hubiese servido para aclarar las dudas planteadas tras el ejemplo del curvado.
DISEÑOS FACTORIALES FRACCIONALES
K
Como ya se ha comentado, estas reglas únicamente son aplicables a los diseños de resolución ///. En los diseños de resolución IV, las reglas son distintas. Al añadir una fracción de la siguiente forma: ► Multiplicando por -1 (cambiar de signo) los signos de una columna correspondiente a una variable, se obtiene un diseño combinado en el que todas las interacciones de dos en las que esa variable esté involucrada están confundidas con interacciones de orden superior. ► Si todos los términos de la relación de definición son de longitud cuatro, multiplicar por -1 (cambiar de signo) los signos de todas las variables reproduce la fracción original y, por tanto, no tiene ninguna utilidad. Ahora bien, si en la relación de definición, además de términos de longitud cuatro, hay términos más largos, entonces al cambiar de signo todas las columnas se obtiene un diseño combinado de resolución superior a IV. Es decir, un diseño en el que las interacciones de dos no están confundidas entre ellas.
8.7.3 Efecto bloque al añadir fracciones Como ya se ha comentado, al añadir una segunda fracción hay que tener en cuenta la posible existencia ie un efecto bloque entre el primer y el segundo experimento. Considérese de nuevo el ejemplo del tintado. En la sección 8.2 se describe un primer diseño 2 51 y en la sección 8.4 se describe cómo se le añade la fracción complementaria (un nuevo 251). Recordando que para la estimación de la media utilizamos el símbolo / (la columna sólo con -1), en la tabla 8.12 vemos que en las dos fracciones la media (/) está confundida con ABCDE. Pero en forma distinta, ya que en la primera fracción es / + ABCDE y en la segunda es / - ABCDE. Si se piensa que puede haber un efecto bloque entre las dos fracciones, lo que en realidad se ¿stá pensando es que las dos medias pueden ser diferentes. Llamemos /, a la de la primera fracción y L a la de la segunda. Entonces la tabla 8.27 resume la situación y los efectos hallados (tomados de la labia 8 . 1 2 ). El efecto bloque vendrá dado, en consecuencia, por la diferencia entre la media de la primera Tracción /, y la media de la segunda /2 (efecto bloque = I x - I2). Nótese que estará confundido con la interacción ABCDE, ya que al hacer la diferencia entre la estimación de la primera y la segunda ‘"acción obtenemos: (/, - /2) + 2{ABCDE) = -0.4 no pudiendo separar el efecto bloque de la interacción ABCDE. Por supuesto, si los diseños que se combinan están más fraccionados, el efecto bloque estará .:nfundido con más interacciones. Así, si consideramos el caso de combinar dos diseños 2 5 2, endríamos la situación de la tabla 8.28.
| FR A CCIÓN
.
P A T R Ó N D E C O N F U SIÓ N
EFECTO
■■
I, + A BC D E
7.3
1
-*
l2 - A BC D E
7.7
2
8.27 Patrón de confusión (ejem plo del tintado) erando un posible efecto bloque entre las dos nes
D ISE Ñ O
GENERADORES
R E L A C IÓ N D E D E F IN IC IÓ N
25-2
D = A B , E = AC
I, = A B D = ACE = BCD E
2 s-2
D = A B, E =-AC
12 = A B D = -ACE = -BC D E
Tabla 8.28 Generadores y patrón de confusión de dos diseños 25'2 realizados secuencialmente
191
MÉTODOS ESTADÍSTICOS. CONTROL Y M EJO RA DE LA CA LID A D
Y por tanto el efecto bloque (/, - I2) estaría confundido con las interacciones A C E y hecho la confusión vendría dada por: (I{ - / 2) -i- 2(ACE) + 2 (BCDE)
8.7.4 Adición de experimentos para conseguir clarificaciones puntuales
192
En ocasiones, tras la realización de un diseño fraccional, no se desea ni añadir variables, ni niveles, ni realizar una nueva fracción con todos los factores, sino realizar el m ínim o de e que perm itan aclarar algún aspecto (en general una confusión) que haya quedado oscuro, o confirm ar frente a una confusión que el responsable de la significación es el efecto sospe*. Se ha com entado ya que cada experim ento realizado supone un grado de libertad > consecuencia, estim ar un efecto. E llo sign: únicam ente se desea elim inar la confusión entre P A T R Ó N D E C O N F U S IÓ N EFECTO con un experim ento que perm ita estim ar uno de m ed ia 4 4 .2 confusión con el otro tendríam os suficiente 6.1 B+AD+CF+EG nuestro propósito. En la p ráctica necesi E+AC +BG +DF -5 .3 experim entos adicionales, ya que utilizaremos 8 .4 G +CD +BE+AF grados de libertad para estim ar un posible efecto Considerem os de nuevo el ejem plo del análisis se había hallado que los efectos signi Tabla 8 .3 0 E fe cto s sig n ific a tiv o s, co n sus de la tabla 8.30. co n fu sio n e s, en el ejem p lo d el curvado Si aceptam os la idea de que es mu> interacción de dos factores sea significativa sin que lo sean los efectos principales de lo* la com ponen (apéndice 8 .2 ), la explicación más creíble -ya com entada en elapartado S responsables sean los factores B, E y G, o sus interacciones. Frente a esta situación hay m uchas m aneras de proceder para resolver las duc¿¿ ellas son: ► A ñadir una nueva fracción 2 7-3 com o se ha com entado en este m ism o apartado ► Experim entar con estas tres variables (23), m anteniendo o no los niveles. ► Experim entar con dos de estas tres variables, realizando un 2 2 com pleto. ► E xperim entar con estas tres variables más alguna nueva que haya podido surgir de la investigación. ► A ñadir el m ínim o núm ero de experim entos que perm itan clarificar la situación En cada caso el investigador deberá escoger entre estas y otras opciones aqueLi adapte a sus necesidades. Supongam os que en este caso la escogida es la últim a, sin que ello signifique opción. De hecho, en este caso concreto, realizando un 2 2 com pleto con dos vai im plicadas, se obtiene el m ism o núm ero de experim entos y una m ayor sencillez de form as, el objetivo es describir un procedim iento que sea general y aplicable ^ situaciones. C om o se desean deshacer tres confusiones (B+EG , E+BG y G+BE)y el experim entos que perm ite clarificar la situación (perm itiendo detectectar la posible efecto bloque) es de cuatro. Se podrían haber deshecho todas las confusiones e efectos significativos, pero estQ hubiese requerido 10 experim entos. Para escoger estos cuatro hay que tener en cuenta dos cuestiones:
DISEÑOS FACTORIALES FRACCIONALES
K
► Que los efectos que se desea desconfundir tengan signos (niveles) diferentes. ► Que considerando la totalidad de experimentos (los ya realizados y los que se añaden), la matriz de diseño sea lo más ortogonal posible. En general, no será ortogonal, pero algunas elecciones proporcionan B E BE BG EG A C D F G correlaciones entre los coeficientes 1 1 -1 -1 1 1 1 1 -1 -1 menores (“matriz más ortogonal”) 1 1 -1 1 -1 1 -1 1 1 1 -1 -1 1 1 1 1 1 -1 1 1 que otras (“matriz menos ortogonal”). 1 1 1 1 1 1 1 1 1 1 Así, en el caso que nos ocupa, un posible conjunto de cuatro experimentos que cumple la primera cuestión es el de la Tabla 8.31 Cuatro experim entos para deshacer las confusiones. C aso del curvado tabla 8.31. Nótese que las cuatro variables, A, C, D y F, que habían resultado inertes, se mantienen constantes, en este caso al nivel alto. En general, se mantendrán a aquel nivel que resulte más económico o conveniente. También conviene destacar que no debe preocupar el hecho de que, en los experimentos añadidos, haya confusiones entre los efectos. Como el número que se añade suele ser muy pequeño, este hecho es inevitable. A este respecto, lo único importante es que las columnas correspondientes a los efectos entre los que se desea eliminar la confusión tengan signos distintos. En la tabla 8.31 cesulta fácil comprobar que esto ocurre y que, por supuesto, los signos de BE, BG y EG se han obtenido multiplicando convenientemente los de B, E y G. Sin embargo, es posible añadir cuatro experimentos que permiten estimar los efectos de interés :on menor correlación entre ellos. En la tabla 8.32 aparecen estos cuatro experimentos. A
C
D
F
B
E
G
BE
BG
EG
R E SP .
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
-1 1 -1 1
-1 -1 1 1
-1 1 1 -1
1 -1 -1 1
1 1 -1 -1
1 -1 1 -1
45.5 43.1 33.0 46.4
Tabla 8.32 Cuatro experim entos adicionales que producen estim aciones poco correlacionadas. C aso del curvado
La correlación entre B y EG, E y BG, y G y BE es menor, ya que en los cuatro experimentos añadidos los signos de estas tres parejas de columnas (que en los ocho experimentos iniciales eran exactamente iguales) son totalmente contrarios. No siempre es posible conseguirlo completamente, r^ero conviene tener en cuenta que las columnas entre las que se desea eliminar la confusión tengan el máximo número de signos opuestos en los experimentos añadidos. En la tabla 8.32 aparece, además, la respuesta correspondiente a los cuatro experimentos que, ror ser más ortogonales, se realizaron. El problema que surge es cómo incorporarlos a los ocho ijiteriores para obtener una estimación de los efectos de interés. Esto se puede conseguir siempre (si bien en aquellos casos en que la correlación entre los efectos sea muy elevada, se pueden plantear rroblemas de cálculo al invertir la matriz X ’X) por el método de los mínimos cuadrados (en el .péndice 7A aparece una breve descripción). Un método alternativo es plantear un sistema de ecuaciones con la información disponible. De los ocho primeros experimentos hemos aprendido que los factores A, C, D y F son inertes y que:
193
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALID AD
B + E G = 6.1 E + BG = -5.3 G + EB = 8.4 A partir de los cuatro experim entos adicionales podem os plantear las cuatro ecuaciones siguientes: / 2 + l/2 (- B - E - G + B E + BG + EG) = 45.5 /, + 1/2(4- B - E + G - B E + BG - EG) = 43.1 í 2 + l/2 (- fi + £ + G - BG + EG) = 33.0 / 2 + l/2(+ B + E - G + B E - BG - EG) = 46.4 donde I2 representa la media de este segundo bloque de cuatro experim entos añadidos y los efectos están m ultiplicados por 1/2 para que, tal como se explica en la sección 7.7, representen lo que cambia la respuesta al cam biar una unidad el nivel. Resolviendo el sistema planteado de siete ecuaciones con siete incógnitas, se obtiene que: I2 = 4 2 .0 0 B = 5.80 E = -4.95 G = 0.25 B E = 8.15 BG = -0.35 EG = 0.30 Y, por tanto, la confusión queda deshecha, ya que claram ente los efectos significativos son e~ (presión del seguidor), el E (velocidad del eje b) y su interacción. La media de los prim eros experim entos era /, = 44.2, por lo que no está claro si se ha producido un descenso de nivel o ser atribuible al ruido, pero en cualquier caso no afecta a las conclusiones. En este ejem plo no había, tras los prim eros experim entos, ningún efecto no confundido fuese significativo. Si lo hubiese habido naturalm ente se tendría que haber incorporado a ecuaciones. Por ejem plo, si el efecto de A hubiese sido 12, en las ecuaciones hubiese tenido añadirse un térm ino 1/2(A), es decir, 6 . Con signo + en aquellas ecuaciones correspondientes experim entos en los que A hubiese estado a nivel alto (todos en este caso) y signo - en caso contrario. Entonces cobra sentido incorporar / 2 a las ecuaciones, ya que en el ejem plo descrito, el * de /2 coincide con el prom edio de los cuatro experim entos añadidos.
K
---------------------------------------------------------------------------------- DISEÑOS FACTORIALES FRACCIONALES
Apéndice 8A Teoría de la proyección Se ha comentado en la sección 8.1 que una de las justificaciones para la utilización de los diseños fatoriales fracciónales es el cumplimiento del principio de Pareto respecto al tamaño de los efectos. El principio es aplicable a la situción, frecuente en la industria, de tratar de encontrar entre los muchos factores que pueden afectar a una respuesta los pocos que, en general, la afectan apreciablemente. En estos casos se suelen utilizar diseños altamente fraccionados (de resolución III), que provocan patrones de confusión complejos. Relacionada con este principio está la teoría de la proyección de diseños fracciónales. En esencia, esta teoría dice que, cuando tras realizar y analizar un diseño fraccional con k factores, uno resulta inerte, es como si se hubiese realizado un experimento con solo k - 1 factores (y el mismo número de experimentos) y, por tanto, se hubiese utilizado un diseño menos fraccionado. Para ver con más detalle la idea de proyección, supongamos que de los k factores considerados >ólo un subconjunto pequeño de tamaño d desconocido, cuya identidad también es desconocida, serán ¿ctivos (producirán efectos principales e interacciones apreciables) y que los restantes k-d serán inertes. En estos casos, si se trabaja con diseños 2k p y al analizar los resultados se comprueba que varios 'actores son inertes, el diseño resultante en los factores activos puede tener un patrón de confusión -nucho más favorable que el diseño original. Como ilustración consideremos el caso de un 2 31 con factores A, B y C. Si una de las tres • ariables resulta ser inerte, cualesquiera que sea, el diseño proporciona un diseño 2 2 completo en las ios variables activas (ver figura 8A.1). Sobre la relación de definición, el efecto de eliminar un factor que ha resultado ser inerte es el ¿e suprimir todos los términos en los que éste aparecía. Así, en el 23' 1 la relación de definición es / = ~iBC, por lo que al eliminar cualquier factor la relación de definición desaparece, indicando que el diseño “proyección” es un factorial completo. En general al proyectar (eliminar los factores que han resultado inertes) se pueden obtener diseños factoriales fracciónales (replicados o no) o diseños factoriales completos (replicados o no), dependiendo del diseño de partida y de los factores que resulten inertes. Los diseños de resolución R se proyectan como factoriales completos en cualquier subconjunto de R- 1 ¿actores. Así: ► el 23' 1 es de resolución III y se proyecta como un completo en cualquier subconjunto de dos variables. ► un 2 7'3 de resolución IV se proyecta como un factorial completo 2 3 (replicado) en cualquier subconjunto de tres variables. ► un 2 15-11 de resolución III se proyecta como un } factorial completo 2 2 (replicado cuatro veces) en cualquier subconjunto de dos variables. De hecho, es posible ir más allá de lo enunciado, a que este mismo diseño 2 1511 se proyecta como un J— I jctorial completo 2 3 (replicado) en 420 de los 455 ----- ------."•conjuntos posibles de tres variables, y como un -JaL.orial completo 24 en 840 de los 1365 subconjuntos p jg Proyección de un diseño 23' 1 en tres posibles de cuatro variables. diseños 23 completos
/
195
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
El problema que se plantea en todo lo expuesto es que, al proyectar un diseño alta fraccionado, se está dando por supuesto que los factores cuyo efecto principal no es importante interaccionan con los demás. Recuérdese que las interaccionas de dos factores estarán, en gec (resolución III), confundidas con los efectos principales y, por lo tanto, es obligado admitir que indistinguibles del ruido sin ningún tipo de comprobación, si se desea eliminar ese factor. Por este motivo, la teoría de la proyección resulta más útil como justificación para la utili de diseños fracciónales que como herramienta práctica al analizarlos. A continuación, en el a 8 B, se expone una posible justificación para su utilización en la práctica.
Apéndice 8B Significación de las interacciones de dos factores Al interpretar los resultados de diseños factoriales fracciónales, especialmente si son de re inferior a V, se plantea el problema de tener que decidir si es factible que una interacción factores que esté confundida con otras interacciones de dos o incluso con algún efecto pri significativa. Una consideración que puede ayudar a re dudas es la siguiente: es raro que aparezca una in de dos factores significativa sin que lo sea por lo ir de los efectos principales de los dos factores componen, y extremadamente raro sin que los sea de ellos. Veamos estas dos situaciones a través de un sencillo. Supongamos que al representar la in dos factores A y B obtenemos el gráfico de la .... donde X r Xv X? y X4 representan la media de las . obtenidas bajo las condiciones de A y B indicac^* A la vista del gráfico, está claro que los
a
_ - X \ + X 2 ~ X 3+ X a 2
b
^ - X x- X 2 + X 3 + X a 2
AB =
x , - x 2- x 3+ x ¿
Y, por lo tanto, para que A = 0 y A B * 0, se debe cumplir que: x 2 + x4 = x, + x3 X, + x 4 x 2 + X, Cosa que ocurre, por ejemplo, cuando:
DISEÑOS FACTORIALES FRACCIONALES
n
X, = 5 0 X, = 40 X3= 10 X4 = 20
10
20
50
40
Estos casos son relativamente raros. Ya que, además de que el efecto de una variable tiene que cambiar de signo al cambiar el nivel de la otra, éstos se han de compensar. Piénsese en la forma de la superficie de respuesta que valores de este tipo implican. Con todo, el caso anterior se presenta en la práctica con cierta frecuencia, incluso mayor de lo que la intuición parece indicar. Lo que es extremadamente raro es el segundo caso mencionado, es decir, que ninguno de los dos factores tenga efecto significativo y sí lo tenga su interacción. Para que esto ocurra 04=0, 8=0 y ABO) debe suceder que: X2 + X4 = Xj + X ? x] + x ? = x 3 + x 4 x7 + x 4 x 2 + x 3 Cosa que ocurre, por ejemplo, cuando: *0 x, x , *3
= = = =
50 40 10 20
10
20
50
40
Como se ve, esto implica haber escogido los niveles de las variables de forma tal que la zona le la superficie de repuesta hallada sea realmente particular. Estos criterios han sido los utilizados en el ejemplo del curvado de la sección 8.4 para decidir . jales eran las interpretaciones más probables de los resultados hallados.
X
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
E jercicios
8.1
Para estudiar la posible influencia de cuatro factores sobre una respuesta, se realiza j t experimento 2 (4 ,) en dos bloques, con el que se obtiene el siguiente resultado: FACTORES
8.2
8.3
a) Calcule todos los efectos y realice una tabla cor. im mismos indicando claramente las confusiones se presentan. b) Analice qué efectos son significativos y cuáles ro son. Razone de form a detallada el resufc"" obtenido. c) Interprete físicamente el resultado obtenido, justificado el bloque realizado?
RESPU ESTA
1
2
3
4
-
-
-
-
+
-
-
+
-
+
-
+
+
+
-
-
-
-
+
+
+
-
+
-
-
+
+
-
+
+
+
+
77 67 64 51 64 53 73 67
En un laboratorio se quiere realizar un experimento con cinco factores. El diseño propuess* A
B
c
D
E
-
-
-
-
+
+
-
-
+
+
-
+
-
-
-
+
+
-
+
-
-
-
+
+
+
+
-
+
-
+
-
+
+
+
+
+
+ -
a) ¿Qué tipo de diseño se ha propuesto? ¿Cuál ss resolución? b) Escribir los generadores del diseño anterior. c) Hallar la estructura alias completa. d) Si se decide realizar el mismo diseño, pero en dos b utilizando interacciones de segundo orden para g obtener la matriz de diseño indicando en la posible orden de experimentación. Escribir la definición de este diseño. ¿Cuál es su resolución^
-
-
Se realiza el diseño 2 5-2 que a continuación se indica, en el que se han rep condiciones experimentales: A
B
c
D
E
-
_
_
+
+
-
-
-
-
-
-
+
+ +
+ + + -
-
-
+
-
+
-
-
-
+ +
+
+
+ + +
+
+
+
+
-
Y 50 65 18 59 50 70 17 62
67 22 61 54 74 19
a) Estime el valor de los efectos. el patrón de confusiones (s que se presenta. b) Estime analíticamente, a pzrx'i réplicas disponibles, la desv de los efectos. c) A la vista de los efectos c -ü ser significativos, comente coa comportamiento de la re:~ _ interpretación más razonable tado obtenido.
DISEÑOS FACTORIALES FRACCIONALES
La tabla que figura continuación representa los resultados obtenidos en la realización de un diseño factorial fraccional (se han om itido los niveles de la condición experim ental núm. 8 ) A qué niveles se han fijado los factores en la condición experim ental núm ero 8 ? Cuál es la relación de definición del diseño? Estimar los efectos y sacar conclusiones (efectos significativos y p osibles interpretacio n es del resultado obtenido), despreciando las interacciones le tres o más factores.
A
B
+
+
-
+
C
D
E
F
+
-
+
-
Y
29 27 42
+
-
-
+
+
-
-
+
-
+
-
+
0
-
-
-
-
+
+
+
+
+
+
-
?
?
+ + ?
+
-
30 0 39 29
+ ?
-
-
?
?
I rnsiderem os un diseño 25y~] definido por la relación de definición /=-12345. Supongam os que leseam os dividir el diseño en cuatro bloques m ediante los generadores de bloque 1 y 2. ¿Existe - ¿runa m anera de realizar la división en bloques de m odo que ningún efecto principal y ninguna m fracció n de segundo orden entre los factores de diseño estén confundidos con algún efecto ísioque? Razone su respuesta.
?xra estudiar cóm o seis factores (A, B , C, D , E , F) afectan a una re sp u esta ^ se decide realizar i r ¿.seño 2 6-2 en dos bloques de ocho experim entos cada uno. l e u z c a cuáles son las confusiones que se presentan en la estim ación del efecto principal del A y de la interacción BC, forzando que uno de los generadores sea F=AB y que el factor rescante y el generador de bloque estén confundidos con interacciones de tres factores. ¿Q ué ®r«: ¿e diseño se obtendría si el factor F resultara ser inerte? S k zjo existiera ningún tipo de restricción en cuanto a la selección de generadores ¿Cuáles serían los óptimos? con los generadores elegidos en el apartado b) sólo se pudiera realizar el prim er bloque, serían los generadores del diseño resultante?, ¿qué tipo de confusiones presentaría?
optimizar el rendim iento de una determ inada reacción quím ica se planifica un diseño il con los siguientes factores y niveles: FACTOR
A: T em peratura B: Presión C: C o n cen tración d e un reactivo D : V elo cid a d d e incorporación E : D u ración de la reacción
N IV E L E S
150 y 2 5 0 aC 1 y 1.5 atm ósferas 10% y 15% 3 y 5 cm /s e g 2 .5 y 3 horas
de estudiar las posibilidades de experimentación, se decide realizar un experim ento 2 5'2 según el origen de la materia prima, utilizando los siguientes generadores: D=-AB E=AC
Bloque=2?C
endose los siguientes resultados (en orden estándar)
199
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
%
4 6 ,3 3 ,4 6 , 47, 4 2 ,3 1 ,4 6 ,45 a) Calcular los efectos indicando claramente las confusiones que presentan. b) Utilizando la técnica que le parezca más adecuada, determine qué efectos son significativos > comente cuáles podrían ser las posibles interpretaciones del resultado obtenido. c) En el caso de que se pudieran realizar ocho experimentos más, escriba la matriz de diseño le parezca más adecuada para despejar las ambigüedades existentes. Razone su respuesta y comente cómo analizaría conjuntamente los resultados de esta segunda fracción con los de primera.
8.8
8.9
Un experimentador inicia su plan experimental con un diseño 2 5'2 con generadores 4=125 j 5=23. A continuación realiza otro diseño con ocho experimentos que se obtienen cambiando j 24| signos de las cinco variables del diseño inicial. a) ¿Cuál es la resolución del diseño obtenido al combinar los 16 experimentos realizados? ¿O son los generadores que producirían este diseño? b) Si el investigador hubiese sabido al inicio de su proyecto que podría realizar 16 experim ¿existe algún diseño mejor que el del apartado anterior?
Sea un diseño 2 5’ 1 definido por /=-12345. Suponga que se desea escoger dos factores de B ] y B 2 de manera que el experimento se divida en cuatro bloques. a) ¿Es posible escoger B x y B 2 de modo que todos los efectos principales y las interacc: segundo orden no estén confundidas con efectos de bloque?
8.10
► ► ► ► a) b)
Se desea realizar un cierto diseño factorial fraccional, de modo que se pueda siguiente: Analizar siete factores de interés. Considerar tres factores de bloqueo (día, operario y proveedor) cada uno de ellos a d:< Realizar como máximo 14 experimentos. Obtener un diseño de resolución IV. ¿Existe algún diseño que pueda satisfacer todos los puntos descritos? Si el punto prioritario es obtener resolución IV ¿qué diseños podría proponer?
Introducción a la metodología de superficie de respuesta
En los capítulos 7 y 8 se han expuesto las técnicas de diseño y análisis de experimentos, que permiten A experimentador seleccionar aquellos factores que influyen en una determinada característica de -jlidad, y los niveles de los mismos que optimicen tal característica en la región donde se haya r \peri mentado. En la práctica, el experimentador desea extender estos objetivos a otras regiones de : \perimentación y se pregunta: ¿qué factores influyen en la característica en general?, ¿cuál es la -rgión óptima?, ¿cómo se relacionan los factores con la respuesta en esta región? En este capítulo presentaremos técnicas que comprenden lo que se denomina metodología de uperficie de respuesta (MSR), que permitirán encontrar la región de interés y contestar a las anteriores peguntas en esta región.
M Introducción. Necesidad de los modelos Uno de los deseos más fuertes que a lo largo de la historia ha mostrado la humanidad es el de modelar a realidad, es decir, el de encontrar funciones matemáticas que expliquen los distintos fenómenos de índole física, social, económica, etc. Este deseo de encontrar modelos responde principalmente a las dos aplicaciones más -mediatas que se pueden derivar de ellos: a) La capacidad de predecir o explicar el valor de cierta respuesta Y una vez conocidos los valores de ciertas variables X v X2,..., Xk. b) El hecho de poder seleccionar aquellas condiciones de los factores X r X,,..., Xk que permitan optimizar la respuesta Y. Aunque, como veremos en el capítulo 10, conocer el modelo ayuda también a: c) Determinar aquellas condiciones de los factores X v X2,..., Xk en que la respuesta sea más robusta o insensible al efecto de variaciones en factores que no son controlados por el experimentador (tales factores se denominan factores ruido). En la práctica, es muy difícil intentar resolver este problema de buscar un modelo único, si no m pico. En su lugar, se intenta aproximar tales relaciones de forma local a través de funciones inómicas de primer y segundo orden. Además, el análisis de estas aproximaciones permitirá, como verá más adelante, localizar la región óptima de una manera secuencial.
MÉTODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
Tem peratura
47.864 51.392 54.92 58.448 61.976 65.504 69/ m 72.56
La figura 9.1 refleja la utilidad del aproximaciones locales para abordar lai teórica de la respuesta. En esta fi¡_ representado con curvas de nivel uiu relación entre cierta característica factores ^ y %2, en un amplio variación de estos dos factores, mejor función que expresa tal reí; la región es una función compli r e g ió n R { p o d r ía a p r o x im a r se
mediante un modelo lineal, ya que mentó de la respuesta parece ser 83.144 región. Sin embargo, en la zona R 86.672 máximo, la superficie ya presenta curvatura y, por lo tanto, la apro: se ha de hacer con modelos que ii nos cuadráticos. Fig. 9.1 Relación entre una característica Y con dos factores 2;, y JL a través de las curvas de nivel En la práctica, general] obtendrá “el m odelo” que rige existente para cualquier combinación de los factores, sino que se obtendrán aproximaci tal modelo en diferentes regiones de los factores. 78.086
79.515
GRADO DE D E S C O N O C IM IE N T O
{»}
O B JE T IV O
N O M B R E D E S C R IP T IV O
•
D eterm inar el subconjunto § de las Elim inación de variables variables im portantes de u n con ju n to X grande de variables poten Diseños factoriales fracciónales cialm ente im portantes
•
D eterm inar em píricam ente los efectos de las variables conocidas D eterm inar una aproxim ación de A ¿S 6 ) m ediante interpolación local g( X, P)
Construcción del modelo em pírico D iseño de experimentos
D e te rm in a r/ D eterm inar 9
Construcción de un modelo mecanicista Estim ación de un modelo m ecanicista
•
• •
(5 9
M etodología respuesta
de
superficie
Tabla 9.1 G rado de conocim iento y objetivos en las diferentes etapas de la investig
9.2 G rado de con ocim ien to y objetivos Los m odelos pueden ser, atendiendo al m étodo que se siga para obtenerlos em píricos (este tem a fue anteriorm ente tratado en el apartado 7.1 del capítulo 7 se utilizan leyes físicas especializadas en el dominio concreto para seleccionar
INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIE DE RESPUESTA
m general, es necesario estim ar los parámetros que en ellos aparecen a través de la recogida ao no se tiene conocim iento teórico de la estructura del modelo, se hace una de forma empírica con los datos obtenidos en la experimentación. Tal experimentación realizar de una forma secuencial y con una metodología que dependerá del grado de que se tenga del problema. Este conocim iento ayudará en la selección de un modelo a la respuesta y en la selección del diseño a realizar para poder estim ar todos los de interés. .jibia 9.1 presenta la relación existente entre el grado de conocimiento que se tiene de un k>s objetivos en cada instante y la metodología estadística que se lleva a cabo para conseguir vos. La etapa de selección de variables y estimación de sus efectos se han dedicado los capítulo 7 libro y a ellos remitimos a aquellos lectores que deseen ampliar estos puntos. _ina primera etapa experimental, los métodos que se denominan metodología de superficie :a utilizan la experimentación para lograr principalmente tres objetivos: Encontrar un modelo capaz de explicar la relación existente entre cierta respuesta seleccionada determinados factores en una región de interés. Localizar las condiciones óptimas de los factores de experimentación para la respuesta (las coodiciones que hagan máxima la respuesta, por ejemplo). Realizar un estudio geométrico de la relación existente entre la respuesta y los factores en la -egión óptima, por medio del análisis canónico del modelo estimado. El logro de tales objetivos está ligado a las características que definen la MSR. En prim er es una metodología secuencial: la aproximación a la región de interés se realiza de forma utilizando diseños cada vez más complejos dependiendo de la información que se obtiene en etapa. En segundo lugar, el método de trabajo que se utiliza es el descrito en el ciclo PDCA (ver el 1 .2 . 2 del capítulo 1 ), que consiste esencialmente en plantear un modelo tentativo, seleccionar ño que permita estimar los parámetros de interés, analizar los datos y verificar si el modelo "o es adecuado.
Estrategias de la m etodología de superficie de respuesta —metodología de superficie de respuesta contiene toda una serie de estrategias que el investigador seguir para estimar el m odelo,/(^,0), que relaciona la respuesta de interés Y con los factores \ adecuadamente posible, con el mínimo coste de experimentación. El investigador actúa como ■etective buscando las pistas que le lleven a la resolución del problema. Tales pistas son obtenidas vés de la información que proporciona la experimentación secuencial. Al comienzo de la experimentación se puede conocer poco del problema y en tal caso es able suponer que la región donde se comienza a experimentar está lejos de la región óptima. Si así, una aproximación suficientemente buena a /( ^ , 0 ) es la que se obtiene con modelos lineales de er orden estimados a partir de diseños factoriales fracciónales a dos niveles. Por el contrario, cuando se tiene un conocimiento más preciso sobre la relación existente, o se próximo a la región óptima, el experimentador se aproxima a la relación/(^, 0 ) mediante modelos segundo orden estimados a partir de diseños más complejos. Por lo tanto, distinguiremos entre dos tipos de estrategias:
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
► Estrategias de primer orden: Diseño 2k p Estimación por mínimos cuadrados 1 Modelos de primer orden Y = p 0 + /?, + p2 X 2 + e Mapas de contornos o curvas de nivel Camino de máximo ascenso o steepest ascent > Estrategias de segundo orden: Diseño central compuesto Estimación por mínimos cuadrados Modelos de segundo orden Y = p 0 + /?, X } + P2 X 2 + p u X ,2 + P22 X \ + p ]2 X Mapas de contornos y análisis canónico En la primera etapa, a la vez que se emplean los diseños 2k p* se pueden llevar a acciones propias de los comienzos de la experimentación, tales como borrar o añadir f diseño, cambiar la escala de variación de los factores, replicar para una mejor estimacit experimental, añadir fracciones para romper las confusiones, etc. Estas acciones, gráficamente en la figura 9.2, tienen en común que, utilizadas adecuadamente, ayudan diversas situaciones de incertidumbre. B)
A)
A P x 204 C)
D)
A V Figura 9.2 Algunas acciones que se llevan a cabo con más frecuencia durante las primeras etapas experimentación. (A: Borrar o añadir factores; B: Cambiar la escala; C: Replicar y D: Añadir
Por otra parte, en cada momento existen métodos de chequeo que permitirán modelo lineal de primer orden es suficientemente bueno, o detectar una evidencia de respuesta. Este hecho implicará la selección de modelos de segundo orden y, por tantc segundo orden. En cuanto al modelo matemático a utilizar para aproximar /(%,0), se empl polinómicas g(X,(3) de primer o segundo grado, las cuales pueden ser interpretadas comc de hacer el desarrollo de Taylor de /(^,0 ) alrededor de (0,0), centro de la experimen codificadas, cortando el desarrollo en los términos de primer o segundo grado respe< Estos polinomios tienen la siguiente estructura para el caso particular de dos fac (x,p)
-
f t + f t X ,+ /3 2 X 2 + £
1 La estim ación de los efectos en diseños 2 k_ptal com o se ha realizado en lo s capítulos 7 y 8 utilizando o el algoritm o de Yates, es equivalente a la estim ación por m ínim os cuadrados.
.
INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIE DE RESPUESTA
los modelos de prim er orden, y — Po
fi\ X\
^' f il X2
Pl2 Xl X2
P\ 1 X \
@22 x 2
&
(9.2)
ios modelos de segundo orden. En ambos, e representa el efecto de aquellos factores que no se ^nido en cuenta en la experimentación o el efecto de aquellos presentes en el estudio, pero cuyo no se ha podido recoger adecuadamente con el modelo seleccionado. Los modelos de segundo orden necesitan más experim entos para ser estimados y sólo se recurre cuando existe evidencia de curvatura en el modelo y, por lo tanto, la aproximación lineal no es 'a. Para poder detectar la curvatura, a los diseños de prim er orden 2k p se les añaden puntos s, los cuales, como se verá en el apartado 9.4, permitirán realizar un test de curvatura. Aquellas regiones de experimentación en las que la superficie no presenta evidencia de ra son interpretadas como regiones lejanas a la zona óptima y, una vez más, existe una gia consistente en acercarse lo más rápidamente a esta zona a lo largo de la dirección de máximo de la respuesta. La figura 9.3 presenta las dos estrategias para k=2 factores. A) Por último, una vez se detecta la cercanía de la óptima, se pasa a la utilización de estrategias de o orden. Una de ellas consiste en la selección de ño de segundo orden apropiado que permita una estimación de un modelo cuadrático. Los diseños más utilizados son los “diseños es com puestos” que aparecen en la figura 9.4, B) dos al añadir un “diseño estrella” a un diseño al. Las características de estos diseños en cuanto niveles en que se han de colocar los factores, rdades de las estimaciones obtenidas, etc., se arán más adelante en el apartado 9.5. Una vez obtenida una aproximación cuadrática ajuste a la superficie, es conveniente realizar un is canónico del modelo resultante para interpretar F ig. 9.3 Estrategias de experim entación. A ) Añadir manera sencilla la geom etría de la superficie p u n tos cen tra les para detectar curvatura. B ) da en la región de experimentación y obtener E xperim entar a lo largo del cam ino de m áxim o ación que pueda ser útil para sugerir posibles crecim iento o decrecim iento iones teóricas cfeí pro 6 íema.
III Fig. 9 .4 D iseñ o central com p u esto form ado al añadir un “diseñ o estrella” a un diseñ o 2 k P
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
X
En lo que queda de capítulo se van a desarrollar las diferentes estrategias presentadas en apartado, aplicadas en un ejemplo particular, el de la fundición de una determinada pieza de aluminio por inyección. El apartado 9.4 se dedica a las estrategias secuenciales de primer orden, los test de curvatura > los métodos de selección del modelo lineal. A continuación, en el apartado 9.5 se presenta la técnica del camino de máximo ascenso (descenso). En el apartado 9.6 aparecen las estrategias de segundo orden, la estimación del modele cuadrático y los test que permiten la comprobación de la validez del modelo obtenido. Finalmente, el apartado 9.7 está dedicado al análisis canónico de la superficie obtenida. En es* mismo apartado se incluirá la clasificación canónica de las superficies en función de su modeü» canónico.
9.4 Aproxim ación lineal a las condiciones óptim as El presente ejemplo trata de un proceso de fundición de tapas de aluminio por inyección, en el que intenta minimizar el índice de porosidad encontrado en ellas. Tal índice es obtenido mediante método estándar a través de rayos-X. Al parecer la temperatura del aluminio líquido y la presión que éste se inyecta en el molde afectan al índice de porosidad de la placa resultante. Los objetivos de la experi tación son encontrar unas ciones óptimas de trabajo en cuales la porosidad sea míni estimar la relación existente el índice de porosidad cor temperatura y la presión, en región próxima a las condi óptimas. Los conocimientos que el tema tienen los técnicos proceso recomiendan no trabajar temperaturas externas al in 600-900 °C ni con presiones por bajo de 700 Kg/cm2. Tales nes definen la región de ope En la figura 9.5 se p las estrategias de primer onka se seguirán en este ejemipkx primer lugar se plantea la sobre el modelo que mejor xima la respuesta en la experimentación de partida. que estamos en los com ienza experimentación y poco mos, se asume que las co óptimas no tienen por que Fig. 9.5 Estrategias de primer orden en el ejem plo de la porosidad en tapas de próximas y que, por lo aluminio
IN T RO D U C C IÓ N A LA M E T O D O LO G ÍA DE SUPERFICIE D E RESPUESTA
K
d e resp u esta p u e d e ser aproxim ada : m odelo de prim er orden, estim ar tal m odelo se selecciona un coo dos puntos centrales tal com o aparece 9-2. puntos cen trales p e rm itirán co m p ro b ar zm test de c u rv a tu ra que se p re sen ta en el m odelo de p rim er o rd en es ad ecu ad o cf contrario, se n ecesita un m o d elo de se-
TEM PERATURA
P R E S IO N
INDICE DE
(°C)
(k g /c m 2)
POROSIDAD
-1
(6 4 0 )
-1
(9 5 0 )
6 .0 9
+1
(6 6 0 )
-1
(950)
5.53
1
(6 4 0 )
+1
( 1.0 0 0 )
6.78
+1
(6 6 0 )
+1
( 1.000 )
6 .1 6
0
(6 5 0 )
0
(9 7 5 )
5.93
0
(6 5 0 )
0
(9 7 5 )
6.12
Además, el hecho de tener réplicas (en este T abla 9 .2 R e su lta d o s d e u n p rim e r e x p e rim e n to con 650°C y 975 K g/cm 2) perm ite obtener una llan tas d e alu m in io . E n tre p aré n tesis fig u ra n las u n id ad es de a 2 independiente del m odelo seleco rig in a les d e los facto res 7al estim ación puede ser com parada con la obtenida a través de los residuos del m odelo m ediante un test de com paración de varianzas, se vio en el apartado 4.12 del capítulo 4. E n el caso de que am bas estim aciones difieran \ ám ente, tendrem os la prueba de que el m odelo propuesto no se ajusta bien a la superficie y que pensar en transform ar los datos o en aproxim aciones cuadráticas. El diseño anterior perm ite estim ar los parám etros de un m odelo com o el presentado en (9.1) que ^rr expresado en form a m atricial com o: Y
=
XP +e
( 9 .3 )
Y corresponde al vector de observaciones, X es la m atriz de diseño, (3 es el v ecto r de los s del m odelo y £ es el vector de errores. Para el ejem plo que nos ocupa: "6.09"
"1
-1
5.53
1
1
-1
1
-1
1
6.78 6.16
X
=
1
1
5.93
1
0
6.12
1 0
-l"
A /?.
-1
(9.4)
P2
0 0
La estim ación m ínim o cuadrática de los coeficientes del m odelo en 9.3 se puede realizar ieando las técnicas de regresión lineal, lo cual equivale a reso lv er la ecuación siguiente: b
=
(5
=
{ X ’X ) 1 X ' reteniéndose los resultados
( * ’X ) 1 X 'Y
V arianza (b)
=
(9.5)
1/6
1/6
1/6
1/6
1/6
1/6
-1 /4
1 /4
-1 /4
1 /4
0
0
-1 /4
—1 /4
1 /4
1 /4
0
0
(9.6)
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
6 .1 0
b ñ jl
=
-0 .2 9 0.33
X
“ Desv. estandar (b)
=
"0.045" 0.055 0.055
y, por lo tanto, todos los coeficientes significativos. En esta etapa, y tal como aparece en la figura 9.5, se ha de comprobar si existe alguna pru de que el modelo lineal estimado no sea una buena aproximación a la respuesta y se necesiten mode más complejos, es decir, modelos cuadráticos. Ello equivale a plantear el siguiente test: ► H0 = Modelo esperado: ^ = Po + Pl Xi + P 2 X2 + £ ► H = Modelo “temido”2: y = Po + P l Xl + P2 X2 + Pi2 XlX2 Pll X\ + P22 x 2 + £ o en forma matricial Y = XP+e ► H0 = Modelo esperado: Y = X p +Z y +e (9 ► H x = Modelo “temido”: donde Z corresponde a la matriz de términos cuadráticos y y al vector de sus coeficientes. El test que se debe utilizar para tomar una decisión en (9.8) está relacionado con consecuencias que se derivan de aceptar como mejor aproximación la que da un modelo lineal ( cuando en realidad la mejor es la de un modelo cuadrático (//,). En efecto, si se estiman los parámetros del modelo como en (9.5), suponiendo que H0 es c cuando en realidad lo es H ¡ se obtiene
Pt
E[b} = e \^ X ' x)~l X 'Y = (X 'X )“‘ X ^ ^ ^ ' X ^ 1 X ' ( X ¡i + Z y ) = [3 + (X ’ X)” ‘ X ' Z y 208
es decir, E[b]
=
fi+Ay
con A - (X’X)-'X’Z denominada matriz de alias o de confusiones. Esta confusión en las estimaciones para el caso de las tapas de aluminio es ^
[^o] — A> + 3 (A i + P 2 2 )
E[bl] = p l ;
0
s
Si
(9.7
E[b2] = p 2
Por lo tanto, en caso de que b n+b22 fuese significativo, al aproximar la superficie modelos lineales se comete un error en la estimación de la constante del modelo. Los diseños de primer orden no pueden estimar por separado /?,, y p21, pero sí su conjunto, P u+ P 22• La estimación de tal efecto por mínimos cuadrados es equivalente a com promedios de la porosidad en el centro de la superficie con el promedio en las esquinas del como lo muestra la figura 9.6. Luego el test de hipótesis planteado en (9.8) sobre la necesidad de modelos de segunde es equivalente al test de hipótesis: [«O ^ubo-ñentro
=
0j
\HÍ: ñ u b o
*
0 j
-
^centro
2 The Feared M odel tal com o lo denomina el profesor N. Draper, autor, junto con G. Box, del libro E m pirical M and R esponse Surfaces.
IN T R O D U C C IÓ N A LA M E T O D O L O G ÍA D E S U P E R F IC IE D E R E SPU E STA
-i existencia de curvatura, que puede comprobarse comparando el valor del estadístico Ycubo
Ycentro
(9.13)
y js2 / n
. ¿¿or de la t de Student con v grados de libertad, siendo v los grados de libertad con los que se lo a,, a partir de s. En el ejemplo de las tapas, al aplicar la ecuación 9.12 se obtiene 6.14 - 6.025 .012/4 + 0.012/2
=
1.21
• 012 estimada con 3 grados de libertad. Por lo tanto, ner un valor no significativo, no encontramos ia de curvatura. En consecuencia, no se puede Ho en (9.8), y concluimos que el modelo lineal una aproximación suficientemente buena de la de interés. En consecuencia, se intuye que se está lejos de la óptima y, por lo tanto, la siguiente estrategia será la de irse lo más rápidamente posible en la dirección de decrecimiento (se desea obtener llantas con mínimo de porosidad) hacia las condiciones óptimas de •ntación, y allí volver a plantear un diseño de primer puntos centrales, o directamente uno de segundo si ^l£una evidencia de curvatura.
(9.14)
XI
Fig. 9.6 Figura que representa la diferencia entre la respuesta en el centro y en las esquinas del cubo en una superficie que presenta curvatura
\p roxim ación por el cam ino de m áxim a pendiente momento del experimento, la estrategia que se debe adoptar es la de experimentar a lo largo rcción de máximo decrecimiento hasta que la porosidad deje de disminuir. Tal hecho indicará : bien se ha cruzado la zona óptima, o bien hay que rectificar la dirección de máximo ¿ento. Siguiendo con el ejemplo de las tapas de aluminio, a partir del modelo Y= 6.10 -0 .2 9 r + 0 . 3 3 P
(9.14)
de (9.7), se puede obtener la dirección de máximo crecimiento de la respuesta a través de la del gradiente, la cual se obtiene derivando respecto a cada factor, dY = - 0.29 dT dY 0.33 dP lo
(9.15)
tanto, la dirección de máximo decrecimiento será la opuesta, d=[0.29, -0.33]
(9.16)
209
X
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
la cual marca una dirección orientativa sobre la dirección a seguir en los nuevos experimentos. Si se desea experimentar en puntos a distancias de una unidad, similar a la distancia entre las condicione* experimentales anteriores, se puede utilizar el vector unidad como vector orientativo. u
=
0.295 0.44
0.33 0.44
=
[0.67,-0.75]
(9.
El número de experimentos jae deben realizarse y la cercanía de és»a* PO R O SID A D (Kg/cm2) (° C) depende en todo momento del cghb| 4.53 670 920 3 u = (2 .0 1 ,-2 .2 5 ) 1 cimiento que tenga el experimen 880 3.28 2 5u = (3.35, -3.75) 685 sobre el proceso. En el ejemplo de 2.54 845 3 7u = (4.69, -5.25) 700 tapas se han realizado cuan* 4.15 710 805 4 9u = (6.03, -6.85) experimentos más, cada uno a xm unidades de distancia del anterior, zm como lo muestra la tabla 9.3. Tabla 9.3 Experimentos adicionales en la dirección de máxim o decrecimiento Cabe notar que, para o b te ^ | los valores originales de la temperatura y la presión, basta con descodificar las unidades de la tabla utilizando las expresiones: T -6 5 0 P —975 X = 10 25 PO SICIÓ N
210
TEM PERATURA
PR ESIÓ N
T = 650 + 10*
ÍN D IC E D E
P
=
975+ 25 x
donde x x y x2 son los valores de la temperatura y la presión en unidades codificadas. La dirección de máximo decrecimiento se ha de tomar como un camino orientativo, pero . experimentos no tienen porqué coincidir exactamente con tal dirección. En el ejemplo de las tapas. valores en unidades originales resultantes de descodificar las cuatro posiciones se han adaptado ¿ ■ operabilidad del proceso. Como se puede observar, la porosidad ha ido disminuyendo excepto en el experimento 4, doaán ha vuelto a aumentar significativamente. Ello induce a pensar que se ha “atravesado” la superficie 5J que por lo tanto, no es recomendable proseguir experimentando por este camino, aunque exi«aí incertidumbre sobre la zona por donde se ha atravesado. Si ésta es la zona óptima, la superficie ha de mostrar una curvatura tal, que será neces^rJ utilizar modelos de segundo orden para aproximarla. En cambio, si no es así, pudiera ser que m. aproximación por modelos de primer orden fuese todavía lo suficientemente buena como pasJ continuar por este camino. En tal situación, se seguiría experimentando posteriormente a lo largo áq una dirección del steepest descent rectificada. En cualquier caso, la MSR permite experimentar secuencialmente utilizando un diseño á i primer orden para estimar el “modelo plano”, pudiendo añadir en un segundo bloque uno ám segundo orden, si se llega a la conclusión de que el modelo lineal no se ajusta suficientemente bieJ a la respuesta. En el ejemplo de las tapas, seleccionando el experimento 3 de la tabla 9.3 como el centro áá la nueva región de experimentación, se ha decidido utilizar un diseño de primer orden y se hM obtenido los resultados que aparecen en la tabla 9.4. El experimento señalado con una flecha es A experimento 3 de la etapa anterior; se ha considerado conveniente incluirlo para una mejor estimaciód de la respuesta.
INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIE DE RESPUESTA
Las réplicas de este experimento se puede obtener una estimación del error experimental de libertad. Asimismo, se puede obtener otra estimación del error con un grado de ias réplicas del primer experimento, que se en la tabla 9.2. Ponderando estas dos TEM PER A TU R A PRESIÓN ÍN D ICE DE se obtiene una estimación de <72 con tres <°C) (kg/cm 2) POROSID A D libertad de s2= 0.0318. Esta estimación, obtenida -1 (690) -1 (820) 2.20 réplicas, se denomina “error puro”, + 1 (710) -1 (820) 3.71 continuación se trata de repetir los pasos del -1 (690) + 1 (870) 2.86 - - para confirmar si el modelo lineal realiza una + 1 (710) +1 (870) 3.49 suficientemente buena a la superficie o si, por 0 (700) 0 (845) 2.53 existen indicios de curvatura. Aplicando el test 0 (700) 0 (845) 2.30 de (9.13) para los datos en la tabla 9.4 se obtiene: 0 (700) 0 (845) 2.54 -
+
s‘ l' '^nc e n tro
3.06 - 2.46 0.14J1/4 + 1/3 V
(9.19)
Tabla 9.4 Resultados del experimento 3 en el ejemplo de las llantas de aluminio.
■ valor estadísticamente significativo en la t de Student con tres grados de libertad. Por lo el test planteado en (9.8) se rechaza la hipótesis nula y se acepta que el modelo de segundo Po + P\ X\
P2 X2
P\2 X1 X2
Pll X1 + P22 x 2 + £
(9.20)
mejor a la respuesta. Así pues, ahora es el momento de comenzar a utilizar las estrategias de segundo orden, que máticamente representadas en la figura 9.7.
Fig. 9.7 Estrategias de segundo orden
211
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
9.6 A proxim ación cuadrática. D iseños centrales com puestos
En estos momentos de la experimentación se ha de añadir un segundo diseño al realizado anterio en la tabla 9.4 si se quiere estimar un modelo cuadrático con la precisión suficiente. El hecho de realizar la experimentación en dos tiempos puede provocar un efecto bloque el apartado 7.8 del capítulo 7 sobre efectos bloque si se quiere ampliar el tema), que puede afectar m estimación de los efectos si las condiciones experimentales del segundo diseño no se han selecci adecuadamente. Para que esto no ocurra, es decir, para que la estimación de los factores sea independíenle hecho de haber experimentado en dos bloques, el efecto bloque ha de ser ortogonal a efectos oe demás variables. Si además se desea que las estimaciones de los factores sean independientes entre sí. kxs diseños han de ser ortogonales en sus factores y ortogonales con los bloques. El primer diseño,
X
-1
-1
1
-1
-1
1
1
1
0
o o o
o o
ya cumple la condición de ortogonalidad, basta con multiplicar las columnas del diseño observar que todos los productos se anulan. El segundo diseño, denominado diseño estrella, contiene los experimentos d isp u „ siguiente forma
X
—a a
0
0 0
—a a
0
0
0
0
0
donde oc y el número de puntos centrales n0e se han de determinar según los criterios que >e continuación. El resultado de añadir un diseño factorial y un diseño estrella se conoce como compuesto o central comp osite design. La forma de tal diseño para tres factores se poedtaB figura 9.4. La selección de a y nQc está basada en dos criterios: el criterio de ortogonaliá^j: anteriormente y el criterio de rotabilidad. Se dice que un diseño es rotable si la estimación de la superficie es igual para todos los puntos equidistantes del centrc
INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIE DE RESPUESTA
tiemente de la dirección en que se encuentren; es decir, se puede girar la superficie sobre \ la precisión en la estimación es la misma. rotabilidad en diseños centrales compuestos sólo depende del valor de a y del número de que se haya realizado en el cubo sin contar los puntos centrales, N , a través de la fórmula, a
(9.23)
=
La condición de ortogonalidad en cambio, implica que las estimaciones de los parámetros en el 9.20) son independientes entre sí e independientes a su vez del efecto bloque. Para que esto han de cumplir dos condiciones: T_ida bloque debe contener un diseño ortogonal. La fracción del total de la suma de cuadrados de cada variable x en cada bloque debe ser igual a ia fracción del número total de observaciones distribuidas en cada bloque. Es decir, para cada . friable i y sobre cada bloque b se ha de cumplir:
j
(9.24)
=i
7=1
bij
N
i = Indicador de la variable i. = Indicador de la observación j de la variable i en el bloque b. nb = Número de observaciones en el bloque b. N = Número total de observaciones. Llamando nn_ al número de puntos centrales en el cubo y en el diseño estrella Oc y pectivamente, y k al número de factores en el diseño, al aplicar la condición de ortogonalidad (9.24) caso particular de los diseños compuestos centrales se obtiene la fórmula simplificada siguiente
a
=
N c {2k + noe) 2 { Nc + n oc)
(9.25)
Nc el número de puntos en el primer diseño exceptuando los puntos en el centro. (Nc será de la 2* o 2k P.) La tabla 9.5 muestra algunos diseños compuestos centrales con los correspondientes valores de ú se quiere obtener ortogonalidad y rotabilidad. Como se puede observar, algunas veces no se n conseguir los dos criterios exactamente. Volviendo al ejemplo de las tapas de aluminio, si se desea añadir un nuevo diseño ortogonal al ntado en la tabla (9.4) y tal que el conjunto sea rotable, basta con sustituir los valores de las tan tes: k=2, N = 4 y n0c= 3 en las expresiones (9.23) y (9.25), y se obtiene: a
4 (4
+ n oe)
2(4 + 3)
a = í[ a = V 2
(9.26)
la condición de ortogonalidad y rotabilidad respectivamente. Por lo tanto, si se han de cumplir las dos condiciones, el número de puntos centrales que ha de contener el diseño estrella será de n =3.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
k
2
3
4
5
5 (1 /2 )
6
F racción del cubo
1
1
1
1
Vi
1/2
Nc
4
8
16
32
16
32
B lo q u es en cu b o
-
2x4
2x8
4x8
-
2 x 16
N e= 2 k
4
6
8
10
10
12
fleo por bloque
3
2x2
2x2
2x4
6
4x2
nso
3
2
2
4
1
2
N total
14
20
30
54
33
54
a (ortogonalidad)
1 .4 1 4 2
1 .6 3 3 0
2 .0 0 0
2 .3 6 6 4
2 .0 0 0
2 .3 6 6 4
a (rotabilidad)
1 .4 1 4 2
1.6818
2 .0 0 0
2 .3 7 8 4
2 .0 0 0
2 .3 7 8 4
Generadores de
-
B =123
B =1234
B i= 1 2 3
-
B =123
5=1234
6=12345
B 2= 2 3 4 5
bloque Generadores del d iseñ o fraccion al
-
-
-
-
Tabla 9 .5 A lg u n o s d iseñ o s centrales com p u estos
a
4 (4 + noe) _ 2 (4 + 3)
r-
n.
= 3
La m atriz del diseño estrella resultante, jum o resultados de la experim entación, se puede en la tabla 9.6. Además, en la figura 9.8 -7 2 (6 8 5 ) 0 (8 4 5 ) 3 .0 2 localizar el conjunto de los experimentos 4 .4 0 0 (8 4 5 ) V ? (71 5 ) hasta el m om ento y desde el comienzo con 3 .9 0 0 (70 0 ) -V 2 (8 1 0 ) rentes estrategias utilizadas. 3 .7 6 0 (700) y fl (8 80) Con los datos de los dos diseños en 1jc§ 0 (8 45) 3 .2 0 0 (700) 9.4 y 9.6 se puede estim ar un modelo de 3.28 0 (700) 0 (8 45) orden por m ínim os cuadrados, resolví, 0 (8 45) 3.17 0 (7 0 0 ) ecuación (9.5) para el m odelo en (9.20). S; Tabla 9.6 D iseñ o estrella y resultados en el ejem p lo de se añade una variable con signos - 1 y 1 , se las tapas de alum inio con lo s puntos en la estrella a una estim ar el efecto bloque com o diferencia distancia de 1.41 prom edios de los dos bloques de de si los experim entos vienen de! La ecu ación de regresión es diseño o del segundo. Porosidad = 2 .8 4 + 0 .3 6 B + 0 .5 1 T + 0 .2 6 7=+ 0 .3 2 P 2 - 0 .2 2 T P El resultado del análisis poi p-valor Stdev. t-ratio Predictor C oef. sión se encuentra en la tabla 9.7. El 0 .0 0 0 2 .8 4 0 .0 4 8 5 9.65 Constante así obtenido explica un porcentaje 11.70 0 .0 0 0 B loque 0 .3 6 0.031 de la variabilidad en el índice de 0 .0 0 0 0.041 12.42 Temperatura 0.51 en función de los dos factores e 0 .0 0 0 0 .2 6 0 .0 4 3 6.07 (T emperatura) 2 0 .0 0 0 0 .3 2 0 .0 4 3 7.47 (Presión) presión y temperatura. 0 .0 05 T em p. • Presión -0 .2 2 0 .0 5 8 -3 .7 8 Se observa que existe bloque estadísticam ente signific. R-Sq(adj) = 96.7 % s = 0 .1 1 6 5 (8 g. 1.) R -Sq = 9 8 .0 % decir, el hecho de realizar el ex en dos tiempos diferentes ha af Tabla 9.7 R esultado del análisis por m ed io de regresión lin eal de lo s datos de la tabla 9 .6 respuesta con un aum ento de 0.71 TEM PERATURA
P R E S IÓ N
(°C)
(k g/cm 2)
ÍN D IC E D E P O R O S ID A D
INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIE DE RESPUESTA
del segundo al primer experimento. Este hecho induce a una investigación por parte de para encontrar las condiciones que han cambiado en las dos etapas y que provocan este la porosidad. de aceptar el modelo obtenido por regresión se ha de hacer una prueba de ajuste de los lo. Esta prueba se realiza comparando dos estimaciones independientes de a 2, una de las e totalmente de la bondad del ajuste del modelo, estimación de a 2 en la tabla 9.7 ha sido obtenida como un promedio de otras dos estimaciones: (9.28)
'total
D&ode s 2 es la obtenida a través de las seis «plicas (una vez eliminado el efecto bloque) y denomina estimación pura s 2 =0.011 con 4 g. 1. (9.29) Y : es la obtenida a través de los residuos :>rc falta de ajuste de los datos al modelo. A estimación se le denomina “estimación ?*:r falta de ajuste” y tendrá 3 g. 1. Llevando d v alor de (9.29) a (9.28) se obtiene saj2 =0.016 con 4 g. 1.
T emperatura (°C)
(9.30) Fig. 9.8
D irección del camino de máximo descenso
Por lo tanto, si el modelo se ajusta bien a los (steepest descent) los valores en (9.29) y (9.30) son estimaciones entes de o 2 y, según se vio en el capítulo 3, el cociente de ambos valores será un valor típico bución F de Snedecor con cuatro y cuatro grados de libertad. 2
ajuste
0.016
puro
0.011
=
1.45
(9.31)
es cierto. En consecuencia, se acepta que la aproximación a la respuesta en la región próxima iciones de 700 °C y 845 kg/cm 2 por el modelo y = 2.84 + 0.36 B + 0.51 Temp. + 0.26 Temp 2 + 0.32Presión1 - 0.22 Temp. * Presión
(9.32)
buena aproximación. Una vez obtenida la aproximación cuadrática a la respuesta, se ha de analizar si la región en que aproximado contiene las condiciones óptimas de porosidad. Para poder resolver este dilema se realizar el análisis canónico que se presenta en el próximo apartado.
Análisis canónico de la superficie rpretación del modelo resultante puede hacerse bien a través de curvas de nivel, o bien en del análisis canónico del modelo. El análisis gráfico es posible cuando se estudian dos o tres s. Si el número de factores aumenta no se pueden representar conjuntamente los factores y la sta en un mismo gráfico. Cuando el número de factores es alto, se puede trabajar con ciones sobre un subconjunto de dos o tres factores, pero entonces la interpretación de la cié es más compleja.
215
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Para k=2 factores, éstos se re en los ejes de ordenadas y abcisas tamente. Entonces, sustituyendo p valores de la temperatura y la presión en se obtiene el valor de la respuesta, el lleva al gráfico situándolo sobre el representado por el par de condiciones vez obtenida una cantidad suficiente de ** de la respuesta, se trazan líneas de niv valores de respuesta similar. Las líi* formadas representan la proyección sional de la respuesta en el plano de Temperatura mentación formado por los dos factores Veámoslo en el ejemplo de las Fig. 9.9. A n álisis gráfico de la porosidad por curvas de n ivel aluminio. La representación se ha re promediando el efecto bloque, ya que el efecto bloque no influye en la localización del óptimo, gráfico se han utilizado las variables en unidades originales. Del análisis gráfico se observa que las curvas de nivel son concéntricas y su valor conforme se acercan al punto central. Existe, por lo tanto, una única condición óptima en porosidad mínima en tom o a la condición: temperatura 690 °C y presión 835 Kg/cm2. Las coordenadas de tal punto también se pueden encontrar derivando la ecuación de la respecto a sus parám etros e igualando a 0 . ¿I Y
¿(2.84 + 0.36B + 0.51 T + 0.26T 2 + 0 .3 2 P 2 - 0 .2 2 T * p J
dT
dT
0.51 + 0.52 T —0.22 P = 0
d (2.84 + 0.36B + 0.51T + 0.26T 2 + 0.32P 2 - 0.22T * p] —— = -A -------------------------------------------------------------------------L = o.i.64 P —0.22 T = 0 dP dP T = - l . \ 5 , P = -0.39 Las coordenadas del punto crítico en unidades originales, así como el valor es porosidad, son: Pc (688.5 °C, 835.1 Kg/cm2) CY Pc = 2.19 (Bloque 1) Y p* = 2.91 (Bloque 2) A nálisis canónico El conjunto de todas las superficies cuadráticas se clasifican según su forma corresponde a la representación de la superficie con ejes de simetría paralelos a los ejes ce y centrada en el origen (de coordenadas 0 en todas las variables x). Las superficies que se obtienen de la metodología de superficie de respuesta nc cum plir las dos condiciones anteriores y, en tal caso, resulta difícil conocer el tipo de s se trata. Sin embargo, mediante las dos operaciones que a continuación se de recodificar la superficie para expresarla en su form a canónica. Estas dos operaciones ► U tilizar los ejes de simetría com o nuevos ejes de coordenadas. ► Seleccionar el punto crítico de la superficie como nuevo origen de coordenada
INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIE DE RESPUESTA
La ecuación resultante de la primera operación se denomina forma canónica A y, si se aplica la
condición, la ecuación resultante se denomina forma canónica B. 5: llamamos,
X II
II
xl x2 X3
b\ b-i b?,
b=
"
B=
b\ \ 1 1 2 bl2
l / 2 b }2 b22
••• 1 / 2 blk ••- 1 / 2 ¿?2At
blk
\ / l b 2k
...
1/2
—
_Xk_
A
(9.35)
bkk
_
o general de obtener las dos formas canónicas es muy simple y está basado en las propiedades cas de la matriz B. Para ello, primero expresaremos el modelo de segundo orden para la superficie de respuesta en matricial, Y = bn + X ’b + X ’ B X (9.36) Ahora, si M es la matriz en cuyas columnas están los vectores propios estandarizados de B. m v . mk, siendo Xr X2, ...,Á,k, sus valores propios, se cumple: BM = MA M ’= M (9.37) M ’BM = M ’M A ’ = A A es la matriz diagonal con X2, ...,A.k, en la diagonal. Dado que M ’M = /, se puede intercalar este producto de matrices en la ecuación (9.36), y ando convenientemente se obtiene Y
= b0 + ( x ' M ) ( M ' b ) + ( x ' M ) ( M ' B M ) ( M ' x )
(9.38)
Utilizando las propiedades en (9.37) en (9.38), la ecuación (9.36) puede reescribirse como, Form a canónica A Y = b0 + X ’O + X ’AX (9.39) X = M ’x y 0=M ’b La forma canónica A obtenida en (9.39) sólo contiene términos cuadráticos puros, ya que han desaparecido las interacciones. Si se representa de nuevo la superficie, pero ahora respecto a las nuevas \ ariables X, se observa que los ejes de simetría de la superficie son paralelos a los ejes de coordenadas. Para hallar la forma canónica B hay que determinar la distancia a la que se encuentran los runtos críticos de la superficie (máximo, mínimo, punto silla, zona de máximos, etc.) del origen de coordenadas. Si la zona crítica está dentro de la región de experimentación, se considera que la -proximación de la superficie será igual de válida alrededor del nuevo origen de coordenadas. Si en cambio la región crítica está lejos de la zona de experimentación, no tiene sentido extrapolar la superficie hasta la zona crítica y, por lo tanto, no se halla la forma canónica B. En el ejemplo de las tapas, la distancia del punto crítico al centro de experimentación es d
=
-yjl.152 + 0.392
=
1.2
(9.40)
y; por lo tanto, podemos considerar que la aproximación obtenida en (9.26) puede extenderse a la región alrededor de este punto.
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
Por consiguiente, para obtener la forma canónica B, se puede realizar la segunda operaci< cambiar el origen de coordenadas de (0,0) por (-1.15,-0.39), si se trabaja en unidades codifk originales, o de (0,0) por M f (-1.15,-0.39), si se trabaja con las coordenadas nuevas. Dado que el resultado final es independiente del orden en que se realicen estas dos open (cambio de ejes de coordenadas y traslación del origen), en aquellos casos en que se han calculado anterioridad las coordenadas del punto crítico, es más sencillo trabajar con las coordenadas del crítico en unidades originales x. Por lo tanto, si se aplica este cambio de origen en (9.38) antes de pasar a cambiar los ejes* obtiene la expresión Y
=
Y0 + [ { x - xí¡) ' M ) { M' b ) + [ [ x - x 0) M ) { M ' B M ) [ m '[x - x 0))
(9,
que se simplifica dando lugar a la forma canónica B , que aparece en (9.39) en su forma general F o rm a canónica B Y x,
218
=
=
M '(Xi —xio]d
Yq + Á.j X¡2 + A2 X 2 + ... + A¿ X ¿ =
M ' x ¡ - M 'x io
=
X ¡ - X io
Es decir, las nuevas coordenadas se pueden obtener trasladando xo (en unidades or.£: codificadas) y girando con A/, o girando con M para obtener las nuevas coordenadas X y trasl X 0 respecto a las coordenadas del punto estacionario (en las nuevas coordenadas). Con la ecuación (9.42) se está en situación de interpretar la superficie. El signo de los v propios \ determinarán el tipo de superficie, y su valor absoluto determina el tamaño de los simetría. La figura 9.9 contiene la clasificación de las superficies para dos factores. Para ini superficies con más factores se pueden seleccionar subgrupos de dos factores e intei proyección de la superficie en ellos. En el caso de las tapas de aluminio, para hallar la forma canónica B se han de obtener los propios y los vectores propios de la matriz B en el modelo (9.32). X =
b0 = ( 2 M )
Xl
b=
"0.5 f
_*2 _ M
-0.61 0.79
=
0.79 0.61
Aj
B=
0
=
0.40
0.26 - 0.11 A2
=
- 0 .1 1 " 0.32 0.18
Por lo tanto, llevando los valores de (9.43) a (9.42) se obtiene la forma canónica B: Y
=
2.55 + 0.36B
+
0.40 Xj2 +0.18 x
donde la relación entre las nuevas coordenadas y las anteriores es: Xx =
-0.61(jc1+ 1.15) + 0.79(jc2 + 0.39) =
0.79(jc1 + 1.15) + 0.61 (x 2 + 0.39)
=
-0.61^+0.79^-0.39
0.79x, + 0.61 * 2 - 1.15
\
IN T R O D U C C IÓ N A LA M E T O D O LO G ÍA D E SU PERFICIE D E RESPUESTA
.r, y x 2 los son valores de la presión y la tem p eratu ra en unidades codificadas. U na vez en la últim a etapa de la in v estig ació n (fig u ra 9.6) se ha de h acer un estu d io de la form a ca de la superficie si se desean co n o cer las co n d icio n es ó ptim as y la m an era en que se relacio n a sidad con los factores de control. A nalizando la form a can ó n ica se pu ed e co n testar a los objetiv o s p lan tead o s en el ap artad o 9.2. «?recian los siguientes hechos:
A
A
A
A
f ig u r a 9 .1 0 R ep r e se n ta c ió n d e s u p e r fic ie s cu a d rá tica s en d o s fa c to r e s, a ) M á x im o (>1 , y X, < 0 ) (o m ín im o (X , y ?L, >0»: 9>P unto s illa (Xt y X2 d e d istin to sig n o ); c) T eja h o r iz o n ta l (X2 = 0 ); d) T eja in c lin a d a (k2 = 0 ) y tér m in o lin ea l e n X >
M ÉTODOS ESTADÍSTICOS. CO N TRO L Y M E JO R A DE L A C A L ID A D
► Al ser positivos los coeficientes de los térm inos cuadráticos en la form a canónica B. e único punto donde se obtiene un índice de porosidad m ínim o. Las coordenadas de este son aproxim adam ente ( 6 8 8 .5°C, 835.1 k g/cm 2). ► Si se desean hacer predicciones del valor de la respuesta p ara determ inadas condiciones factores, se puede obtener el m odelo en unidades originales. N o obstante, hay que cuenta que el m odelo obtenido es una aproxim ación local de la superficie en la experim entación y que, cuanto m ás alejado de tal zona se esté, m enor precisión en la pr« se obtendrá. La m anera m ás sencilla de obtener el m odelo en unidades originaie* descodificando la ecuación (9.32) m ediante: x.
1
T - 700 ----------10
=
x?
=
P - 845 -----------25
para obtener el m odelo en unidades originales, Y
=
1087 •6 4- 0.36B - 2.85 T - 0.25 P + 0.0026 T 2 + 0.00051 P 2 - 0.00088 T * P
► L a porosidad cam bia m ás rápidam ente en la dirección de X x( X 2 = 0 ) que en la d e X 2 (X , = es debido a que el valor propio 'kl =0.39 es m ayor que X2 = 0.17. La dirección de m ínim o en porosidad viene determ inada por Xx
=
0
=
-0 .6 1 * ! + 0 .7 9 * 2 - 0 .3 9
y la de m áxim o por X2
=
0
=
0.79 x { + 0.61x2 + 1.15
es decir, m anteniendo sim ilares los valores de x } y x 2 , se logra la m ínim a variación porosidad al variar las condiciones de tem peratura y presión. ► D ada una porosidad lím ite, existe una variedad de com binación de condiciones tem peratura y la presión que perm ite trabajar con m enor porosidad. B asta con hallar la nivel apropiada para este valor y seleccionar cualquier com binación que quede en la interna de la curva de nivel.
IN T RO DU CCIÓN A LA M E TO DO LO GÍA DE SUPERFICIE D E RESPUESTA
ic io s Se realiza un experim ento con dos variables codificadas x, = (X ,-450)/10 y x 2 = (X2-130)/5 y se obtienen los siguientes resultados: ¿Es necesario el uso de un m odelo de segundo orden p ara aproxi x\ X2 y m arnos a la superficie estim ada p o r y? -1 -1 44.1 b ) R azonar si un m odelo de prim er orden se ajusta bien a la superficie de 1 -1 53.2 -1 1 47.3 respuesta representada por y. (U se algún tipo de test de ajuste del 1 1 56.4 m odelo.) 0 0 49.5 o ¿E stá el punto (X,,X2) = (268,98) en el cam ino de m áxim o decre 0 0 51.0 cim iento? di Dé un m odelo que perm ita predecir los valores de la respuesta a través de los valores de X, y X 2 sin codificar. U n experim entador ha realizado un diseño 2 5' 1 con cuatro puntos añadidos en el centro y desea añadir una estrella a una distancia axial a y nc0 puntos en el centro, ai ¿Q ué valor de se ha de seleccionar si se quiere conseguir rotabilidad? b) ¿Y si se quiere conseguir que los dos bloques sean ortogonales? c) ¿Se puede conseguir rotabilidad y ortogonalidad a la vez? R ealice un análisis canónico de la superficie: y = 6 . 8 8 + 0.0325 + 0.2588 x 2 - 0.1363 * 3 - 0.1466 (jc,)2-0.0053 ( * 2)2 + 0.1359 (x3)2 obtenida por un análisis de regresión usando las variables codificadas: x l=(xl-5)/3, x 2 =(jc^-4)/10 y x 3=(x3-25)/9 ¿C uáles son las coordenadas del punto estacionario y el valor de la respuesta en tal punto? b) ¿Q ué tipo de superficie es? c) R ealice un gráfico de contornos en función de x l y x 2 (variables codificadas originales) alrededor del punto estacionario, dejando fijo el valor de x 3 en la coordenada que posee el punto estacionario. U n experim entador realiza un experim ento con dos variables x t y x 2 alrededor del punto (90,20), para el que realiza cinco experim entos: a) A juste un m odelo a los datos y diga cuál de las siguientes observaciones estarían en la dirección del steep est ascent. El experim entador decide ahora com binar los dos e x p e rim e n to s de co o rd e n ad a s (XpX 2,y) = (43.25, 53, 65) y (34.75, 59,68) con las seis siguientes:
X,
80
100
x2
10
Y
11
X,
80
100
90
10
30
30
20
0
29
6
12
64.5 38
47.5
39
30.5
x2
50
56
62
43.25 53
59
Y
43
58
72
62
65
68
X,
34.75
43.25
39
39
39
39
x2
53
59
56
56
Y
71
68
71
56 72
56 73
72
34.75
b) A juste un m odelo de prim er orden a los datos. c) R ealice un test de falta de ajuste usando las réplicas. d) R ealice un dibujo de cóm o han sido expuestos los experim entos con los respectivos valores de la respuesta.
10
D iseñ o de p rod u ctos rob u stos
L as m etodologías de diseño de experim entos y superficie de respuesta presentadas en los capítulos anteriores han sido utilizadas para la determ inación de los factores que afectaban a una característica particular de calidad, para la selección de los niveles óptim os de tales factores, y p ara la estim ación local de la relación existente entre la respuesta y los factores de diseño en la región de las condiciones óptim as. En la práctica, m uchas características de calidad vienen afectadas p o r factores de difícil control o que no han podido ser controlados durante la obtención del producto, incluso p o r factores que aparecen una vez que el producto está en m anos del cliente. U na m anera de atacar este problem a sería m ediante el control de tales fuentes de variación, lo cual resulta caro y m uchas veces im posible. Por el contrario, se pueden diseñar productos o procesos robustos que sean insensibles a estas causas. E n este capítulo vam os a presentar la aplicación de las técnicas anteriorm ente citadas en la consecución de tales objetivos.
10.1 C o n c e p to d e p r o d u c to r o b u s to La definición que da el diccionario a la palabra robusto es “fuerte, vigoroso, sano, saludable” . Por ejem plo, decim os que un ciclista es robusto cuando su rendim iento queda poco afectado por fes cam bios que se producen en su entorno: pedalea con igual intensidad en días de sol o en días de ■ovia, no le afectan las críticas de los periódicos, se adapta a los diferentes tipos de bicicletas, etc. En la industria tam bién se desea obtener pro d u cto s robustos y serán aquellos que m antengan «is características de calidad con un m ínim o nivel de variabilidad. C om o verem os en el apartado 10.2, í>ta variabilidad en el nivel de calidad es debida a fa c to res externos (tem peratura am biente, hum edad, e:c.), internos (deterioro, etc.) y de producción (capacidad de los procesos de fabricación). V eam os dos situaciones en las que se desea obtener productos robustos, que serán analizadas en detalle a lo largo del capítulo. ► Se desea obtener una fórm ula para fabricar un suavizante de ropa. La característica de calidad que se estudia es su viscosidad. Se conocen el tipo de m ateria prim a, la cantidad de estabilizante, el Ph del producto y el tipo y la cantidad de sales que han de en trar en la fórm ula del producto. A hora bien, la viscosidad así obtenida puede verse alterada una vez que el
M ÉTODOS ESTADÍSTICOS. CO N T RO L Y M E JO RA DE LA C A LID A D
producto esté en m anos del cliente, debido al tiem po en que el envase del producto perm abierto o debido a características del agua de lavado. El suavizante que se desea ha de robusto a estos fa c to re s externos a su fórm ula, es decir, su viscosidad debe m antenerse en nivel aceptable sea cual sea el agua de lavado o el tiem po en que el envase esté abierto. ► Se desea diseñar un tubo calefacto r seleccionando los niveles de tres parám etros de di tem peratura interior y exterior del cilindro calefactor y proporción entre diám etro ex ten o r interior. El tubo resultante, adem ás de perm itir el paso de un flujo determ inado de calor pee superficie, ha de ser robusto, o insensible, a pequeñas variaciones en los parám etros de di E sta preocupación reciente en las em presas por obtener productos robustos ha sido modv por las dem andas actuales del cliente dentro de un entorno com petitivo m uy particular. U n m ism o producto puede ser fabricado en em presas situadas en zonas geográficas lejana-. cuales pueden ser aprovisionadas por diferentes proveedores, e incluso tener diseñados sus procesosdiferente m anera. Sin em bargo, cuando el cliente com pra un producto quiere que sea robusto a condiciones del m ercado o a otras tales com o las características culturales, condiciones ambien etc. El producto es identificado por la m arca y no por la em presa que lo fabrica. Un cliente no satisfecho puede reclam ar una com pensación económ ica por la falta de cal incluso puede cam biarse a un producto de la com petencia. E llo conlleva unas pérdidas económ i la em presa que se estim a que son directam ente proporcionales a la desviación cuadrática de| característica de calidad respecto a su valor nom inal u objetivo. A lgunos autores prefieren hablar de una función m atem ática que m ide la calidad de un p en función de la desviaciones cuadráticas de cada individuo respecto al valor nom inal. El ing G enichi Taguchi (1986), por ejem plo, define la función de pérdidas que presentam os en el apéndice ! El objetivo del diseñador es por lo tanto definir productos en los que las pérdidas debidas a fuentes de variación sean m ínim as. N o basta con fabricar bajo el nivel nom inal, hay que hacerlo la m ínim a variabilidad.
10.2 V a ria b ilid a d fu n c io n a l La variabilidad entre productos una vez que éstos están en m anos del cliente es inevitabieem bargo, si se identifican las causas de tales variaciones, se pueden tom ar m edidas con el reducirla. Las causas que originan tal variabilidad pueden englobarse en tres grupos: ► C ausas que provocan variabilidad en el p roceso que da lugar al producto, y que dete capacidad de aquél: variaciones en la m ateria prim a, m étodos de trabajo, m antenim iento. ► C ausas en el entorno en que se usa el producto: variaciones hum anas en el uso del condiciones am bientales, etc. ► C ausas relacionadas con las características internas del producto', envejecim iento, de te partes, etc. El efecto, en general im predicible, que estas causas producen sobre la característica de se denom ina “ruido” y, por extensión, a las causas de tal variabilidad se las denom ina fa e tó n ? Para reducir el ruido la em presa puede adoptar varias posturas. U na sería controlar los factores que estén a su alcance (aquellos que aparecen antes de que el producto salga de la em segm entar la producción de acuerdo con los hábitos del consum idor. E sta postura es en general y resulta im posible im aginársela im plantada totalm ente en las em presas. (E llo no quiere decir totalm ente descabellada; por ejem plo, algunas m ultinacionales del sector del autom óvil ya reduciendo al m áxim o el núm ero de proveedores, lo cual reduce una gran fuente de variabili
D ISEÑ O DE PRODUCTOS ROBUSTOS
tita , segunda estrategia m ás económ ica y eficaz, consistiría en tom ar contram edidas contra cada b s causas de variabilidad a lo largo de las etapas de desarrollo de un nuevo producto. L a tabla >;ar 1985) presenta en qué fases del desarrollo de un producto es posible actuar para el efecto de cada una de las causas de variabilidad.
C A U S A S D E V A R IA B IL ID A D (R U ID O )
E xternas (A m b ie n te)
Internas (D eterio ro)
P ro d u cció n (F a b rica ció n )
D is e ñ o d e l p rod u cto
O
O
O
C ontram edidas p o sib le s
D is e ñ o d el p r o ce so
X
X
O
Im p osib ilid a d de con tram ed id as
P r o c e so d e p ro d u cció n
X
X
O
FASES D EL D ESA RRO LLO D E UN PRO D U CTO
i X
T abla 10.1 C o n tra m ed id a s p o sib le s en cad a un a d e las fa se s d e l d esa rro llo d e un p rod u cto
Estas etapas, de una m anera sim plificada, son las siguientes: Etapa de diseño d el producto de acuerdo con las expectativas del cliente. Etapa de diseño d el proceso que ha de generar los productos diseñados en la etapa anterior. Etapa de producción de acuerdo con las etapas anteriores en la que se obtendrá el producto final. La estadística, com o ciencia que estudia los fenóm enos a través de la cuantificación de la ación procedente de los m ism os, es de una gran ayuda en estas fases. Así, en la fase de producción, m ediante la utilización d^l control estadístico de procesos (SPC ) trola el proceso para identificar la aparición de “causas asignables” de variabilidad y actuar sobre ie una m anera adecuada para m antener el proceso bajo control (en el capítulo 1 1 se presenta este ie una m anera m ás am plia). En general, la reducción de variabilidad utilizando sólo SPC (o p o r otra parte inspección del cto acab ad o ) re q u ie re in v e rsio n es e co n ó m ica s c o n sid e ra b le s (se le c c io n a r los m ejo res dores, aum entar el m antenim iento de las m áquinas, etc.); y el resultado final, una vez m ás, nderá de lo bien que esté diseñado el proceso. En el diseño del proceso de producción tam bién se pueden tom ar m edidas contra la variabilidad la producción, escogiendo m áquinas con la m ínim a capacidad o variabilidad, lo cual es tam bién so. Sin em bargo, sólo en la fase de diseño del producto se pueden tom ar m edidas contra cada una las diferentes causas de variabilidad. Las técnicas estadísticas que hem os denom inado diseño de rim entos robustos son técnicas que, aplicadas en las etapas del diseño del producto y del proceso, ucen una reducción considerable de la variabilidad final del producto en m anos del cliente y con sión económ ica, en general, inferior a cuando se utiliza sólo SPC.
10.3 M e to d o lo g ía d el d ise ñ o Las prim eras ideas para conseguir el aseguram iento de la calidad de un producto centrando los esfuerzos especialm ente en su fase de diseño, se deben al ingeniero G enichi Taguchi, quien com enzó a aplicar las técnicas de diseño de productos robustos a com ienzos de los años 80. G. Taguchi (1986) divide la etapa de diseño del producto en tres fases claram ente diferenciadas: ► D iseño p rim a rio : consiste en el diseño conceptual o funcional del producto p ara responder a una necesidad del m ercado. En esta fase utilizan conocim ientos especializados del dom inio.
MÉTODOS ESTADÍSTICOS. CO N TRO L Y M E JO R A DE LA C A LID A D
X
► D iseñ o se c u n d a r io , o d iseñ o de los p arám etro s: co n siste en la o b te n ció n de los valores n o m in a le s ó p tim o s de los fa c to re s, p ara m in im iza r la v a ria b ilid a d de las c a ra c te rístic a s de c a lid a d del p ro d u cto . E n e sta fase se n ece sita de la c o la b o ra c ió n de los técn ico s d e p ro d u c to y de p erso n al c o n o c e d o r de las té cn ica s e sta d ístic a s de d iseñ o y an álisis óe ex p erim en to s. ► D iseñ o te rc ia r io : d iseñ o de to le ra n cias, p a ra g a ra n tiz a r la m ín im a v a ria b ilid a d re q u e rid a c u a n d o la v a ria b ilid a d final del d iseñ o sec u n d a rio es to d a v ía ex cesiv a. E n este cap ítu lo p resen tarem o s las técn icas estad ísticas que ayudan a la co nsecu ció n de d iseño secundario o diseño de parám etro s. E stas técn icas co m p ren d en la selección de una m atriz de d iseño adecuad a y el análisis e interpretació n de los resultados. A pesar de que existe una m etod o lo g ía am p liam en te d iv u lg ad a d en o m in ad a “m eto d o lo g ía de T aguchi” , para llevar a cabo los objetiv o s an terio rm en te citad o s, en los últim o s años se han p resen tad o críticas en cuanto a sus aspectos estad ístico s y m eto d o ló g ico s y se han propuesto altern ativ as com o las de Box (1986), G rim a (1993), M ag h so o d lo o (1990), Ryan (1988), Shoem aker (1991), T ort-M artorell (1985), T ribus (1989) y W u (1987). E n este cap ítu lo hem os optado p o r to m ar aquellos asp ecto s del m éto d o de Taguchi que. siendo útiles por su sim plicidad, no se alejan dem asiad o de la técn ica óptim a. P or o tra p arte, aquellos asp ectos d ébiles en la m etodología, tales com o el análisis de los resu ltad o s, los hem os su stitu id o por m étodos alternativos. El lecto r interesad o en co n o cer los aspectos fu n d am en tales de la m etodologíde T aguchi puede dirigirse al apéndice 10.B.
10.4 D ise ñ o d e p a rá m e tr o s El diseño de parám etros consiste principalm ente en una estrategia de experim entación durante la etapa de diseño del producto o del proceso m ediante la cual, con un análisis adecuado de los resultados, se determ inan los niveles de los factores o parám etros del diseño, bajo los cuales se obtienen productos que cum plen el doble objetivo de presentar la característica de calidad lo m ás cercana al valor n o m in é deseado y con m ínim a variabilidad. La ex perim entación se realiza con los dos tipos de facto res que hem os introducido anteriorm ente y que hem os denom inado: ► factores de control, ► factores ruido. Los prim eros son los factores cuyos valores pueden ser seleccionados por el experim entador durante el diseño del producto (o proceso): tem peratura del horno, tiem po en el horno, porcentaje de enzim a, etc. L lam am os factores ruido a aquellos factores que, afectando a la característica de calidad del producto (bien en las fases iniciales de fabricación, o bien cuando el cliente utiliza el producto), no pueden ser controlados, bien por los costes que ello im plica o por otras causas, si bien en muchas situaciones será posible realizar experim entos con valores controlados de este tipo de factores. Algunos de estos factores son: la tem peratura am biente en la línea de fabricación, el conocim iento por parte de: operario del proceso, la hum edad relativa cuando se utiliza el producto, etc. La presencia de variabilidad, com o ya hem os com entado en al apartado 10.2, es consecuencia del ruido externo y del ruido interno. Es decir, de la variabilidad provocada por factores no controlables y la transm itida por los factores de control. D urante la experim entación, los factores de control y algunos de estos factores ruido son seleccionados y prefijados para conocer su efecto en la característica de calidad.
D ISEÑ O DE PRODUCTOS ROBUSTOS
Así, se podrán tom ar contram edidas contra la p resencia de variabilidad, si ocurre alguna de dos circunstancias: 1 Ruido externo: existen interacciones entre factores de control y factores ruido. Ello im plica que el efecto del factor ruido en la respuesta depende del nivel en que se encuentre el factor de control. En consecuencia, se podrá seleccionar un nivel de este últim o donde la respuesta sea más insensible al ruido externo (ver figura 1 0 . 1 ). I R uido interno: la relación entre los factores de control y la respuesta no es lineal. De esta m anera, se puede seleccionar aquel nivel del factor de control en que la respuesta sea m ás robusta al ruido interno. A continuación presentarem os un m étodo de selección de la m atriz de diseño, así com o la ra de analizar los resultados. Respuesta
Respuesta
Parámetro
10.1 V ariabilidad transm itida por un factor ru id o R d iferentes n iv e le s d el factor d e d ise ñ o D La variabilidad transm itida p o r e l fa cto r R al cam biar de R a R, e s la m ism a para cu a lq u ier n iv e l de D . La variabilidad transm itida por R e s d iferen te d ep en diend o d el n iv e l en q u e se en cu en tre e l fa cto r de d iseñ o D: e x is te por lo tanto una in tera cció n entre el factor de d ise ñ o y el fa cto r ruido. En e ste ejem p lo , c u a n d o D e stá en e l n iv e l D , la v a r ia b ilid a d transm itida e s m enor.
F ig . 10.2 R e la c ió n lin ea l y no lin ea l entre lo s parám etros d el p rod u cto (o p r o c e so ) y la ca racterística d e calid ad a) S i la rela c ió n entre e l parám etro y la resp u esta es lin ea l, la variab ilid ad qu e se transm ite a Y, por la r ela c ió n f(x ), e s de la m ism a m agn itu d en x 0 o en x ,. b) S in em b argo, si la rela c ió n entre e l parám etro d el d is e ñ o y la ca racterística no e s lin ea l, la variabilid ad se transm ite de m anera d iferen te, d ep en d ien d o d el v a lo r en q ue esté fija d o el parám etro. En x, la variabilidad transm itida e s m en or q u e en x ().
1Q-5 M a triz d e d iseñ o L¿> dos circunstancias anteriorm ente citadas pueden ser detectadas m ediante la experim entación, si se cciona adecuadam ente la m atriz de diseño y se analiza convenientem ente los resultados. En este apartado estudiarem os la selección de una m atriz de diseño para diseñar productos stos a la variabilidad externa. L a m etodología a seguir cuando se trabaja con ruido interno se sentará en el apartado 10.7 con un ejem plo.
MÉTODOS ESTADÍSTICOS. C O N T RO L Y M E JO R A D E LA C A LID A D
L a m atriz de diseño deberá perm itir estim ar un m odelo del tipo Y = p 0+
+ XpijX'Xj +
+ ’L (5klZ kZ¡ + X/3* X ,Z , + £
en el que una vez estim ados sus parám etros, su correcta interpretación debe perm itir alcanzar el v nom inal con la m ínim a variabilidad. ► A quellos efectos (iik que sean significativos nos perm itirán seleccionar los niveles de factores de control X. en que el producto sea m ás robusto a la variabilidad transm itida por factores ruido Z k. ► A quellos factores X ¿ que sean significativos pero que no interaccionen con factores perm itirán llevar la respuesta a su nivel nom inal. ► A unque la estim ación de los efectos de los factores ruido (3k en principio no es útil, p u e s» son factores que no se controlan, el conocim iento de su significación puede servir a los para replantear el diseño del producto o proceso. P or lo tanto, el diseño seleccionado debe perm itir estim ar, com o m ínim o, los efectos a los factores y será de ayuda si adem ás perm ite estim ar los efectos asociados a los factores ruido. Las soluciones dadas a este problem a han sido principalm ente tres: ► D iseñar por separado las m atrices p ara los factores de control y para los factores ruide • las dos para dar lugar a una m atriz producto. E sta m atriz producto puede ser obtenida a de los diseños 2k p propuestos en los capítulos 7 y 8 y tam bién de los orthogcn^L propuestos por Taguchi (1986). ► R ealizar un diseño fraccional de resolución V con todos los factores de control i estudiados conjuntam ente. ► S eleccionar diseños especiales de resolución I V que no confundan las interacciones a L a prim era opción es la m ás sencilla. A dem ás, perm ite seleccionar un grado de frac* d iferente para cada tipo de factores. E n general, el diseño para los factores ruido suele fraccionado de lo que se acostum bra cuando se trabaja con factores de control. E llo es debida estam os tan interesados en la estim ación, libre de confusiones, de las interacciones entre f; A unque la tercera opción conlleva la realización de m enos experim entos que la segunda, la m atriz producto está m ás difundida en la industria y es m ás fácil que sea sele personal poco experto. Es esta la razón principal que nos ha hecho decidim os por presentar en este capítulo aunque existen otras razones de tipo analítico (con esta m atriz se puede des la variabilidad debida al ruido en: La por los factores ruido que han int< experim ento y el ruido ajeno a estes zl Factores ruido z2 Matriz externa L a m atriz de diseño se z3 Factores de diseño dos entradas tal com o aparece en La x l, x2, x3. . . Por una parte aparecen los k factores com binados según un diseño 2 k_P y. r factores ruido com binados según Matriz producto 2r q. Por consiguiente, se obtierex Matriz interna condiciones experim entales. U na vez a lea to riza d o experim entación de las 2 kp - 2 ^ experim entales, se realiza cada e. F ig . 10.3 D is e ñ o d e la m atriz d e ex p e rim e n ta ció n 2kp • 2r_<* m ide la característica de C a lid a d -
--- DISEÑ O DE PRODUCTOS ROBUSTOS
ELimz pueden ser consideradas com o prototipos idénticos de un producto diseñado con los niveles de los piram etros de la parte izquierda de la tabla y som etidos a diferentes condiciones de los factores ruido. Si la m uestra fuese lo suficientem ente grande, la representación gráfica en histogram as de la característica de calidad en estos individuos daría una idea general de la distribución de la calidad del producto; bastaría con observar el centro de la distribución y su dispersión. E sta m anera intuitiva de interpretar la m atriz de diseño ha dado lugar a un análisis de los datos basándose en la inform ación obtenida para cada “fila” o condición de los parám etros de diseño. U na vez m ás, existen diferencias en el tratam iento de estos datos. R em itim os al lector al apéndice I >B si quiere obtener inform ación sobre el m étodo seguido por Taguchi basado en la señal ruido. N osotros introducirem os al lector dos m étodos de análisis que creem os que m ejoran sustancialm ente el enfoque expuesto en dicho apéndice: ► El prim ero está basado en el análisis de los datos directam ente de la m atriz producto. Para llevarlo a cabo se obtendrán la m edia y la variabilidad para cada condición de diseño y se aplicarán las técnicas de análisis de los capítulos 7 y 8 . Ello p erm itirá estim ar los parám etros de un m odelo del tipo:
y = p 0+ x p , x + z p ijx x 7 + e
(io.3)
► Para aplicar el segundo m étodo juntarem o s los factores de control y los factores ruido en una única m atriz 2 (k+r)(p+q) y pasarem os a estim ar los parám etros del m odelo en ( 1 0 . 1 ) que es sensiblem ente diferente al m odelo en (10.3), puesto que incorpora los factores ruido en su estructura. D ebem os decir que, si uno planifica analizar los resultados del experim ento con la segunda opción, puede seleccionar la m atriz producto de tal form a que el diseño 2 (k+r) (p+q) resultante sea óptim o en el sentido de m áxim a resolución a costa de, en general, no reproducir todas las condiciones de los factores ruido para cada condición de los factores de control. A continuación presentam os el ejem plo de suavizante donde se aplicarán los m étodos de análisis aquí m encionados.
10.6 E je m p lo d e p r o d u c to r o b u sto a ru id o ex tern o : su a v iz a n te El experim ento que se presenta a continuación está relacionado con un suavizante de ropa. L a característica de calidad que se estudiará es la viscosidad del producto; es deseable que sea lo m ínim a posible y robusta a factores externos. En un principio se han seleccionado cinco + FACTORES D E CO NTROL factores de control partícipes en la fórm ula del M 2 T ip o d e m ateria p rim a MI A suavizante, y tres factores ruido que aparecen una C an tid ad de esta b iliz a n te baja alta B vez el suavizante está en m anos del cliente final. P h d el p ro d u cto 2 .5 3 .5 C La tabla 10.2 presenta estos factores ju n to con los SI S2 D T ip o d e sa les niveles en que se trabajó. baja alta C an tid ad d e sa les E El diseño seleccionado ha sido un 2 5-2 • 2 3 1 con generadores: + F A C T O R E S R U ID O ► D = A B y E = B C para los factores < 1 0 d ía s > 1 0 d ías M T ie m p o q u e el p ro d u cto está abierto de control, dura b lan d a N T ip o de agua ► 0 = M N para los factores ruido. fría tem p lad a O T em p eratu ra d el a gu a N ótese que, si ju n tam o s dos diseños de la form a 2 kp y 2 rq, el resultado se podrá interpretar com o un Tabla 10.2 F actores q ue tom an parte en la ex p erim en ta ció n co n su s n iv e le s -
MÉTODOS ESTADÍSTICOS. CO N TRO L Y M E JO R A DE L A C A L ID A D
diseño 2(k+r) (p+q) que, en general, no es de m áxim a resolución. E n este caso podem os considerar diseño com o un 2 8~3. L a m atriz del diseño ju n to con los resultados de la viscosidad m edida en centipoise> encuentra en la tabla 10.3.
M .P R IM A
E S T A B IL Z .
PH
T . SA LES
C . SA LES
-
-
-
+
+
T IE M P O
-
+
-
+
T. AGUA
-
-
+
+
°C A G U A
+
-
-
+
3200
4500
175
1560
+
-
-
-
+
3 7 .5
4 2 .5
300
2 4 2 .5
-
+
-
-
-
1600
475
1 3 7 .5
60
+
+
-
+
-
1900
2200
3 0 2 .5
3660
-
-
+
+
-
125
1 1 2 .5
965
1900
+
-
+
-
-
250
325
325
1920
-
+
+
-
+
50
1 1 2 .5
445
2050
+
+
+
+
+
175
9 7 .5
4 9 2 .5
340
Tabla 10.3 M atriz d e d ise ñ o y resu ltad o d el ex p e r im e n to para e l e je m p lo d el su a v iza n te
E n la parte izquierda están definidos los niveles en que se han colocado los factores de c :*j para todas las condiciones de ruido situadas en la parte superior derecha de la tabla. Para cada anq¡ estas condiciones se obtienen cuatro suavizantes (en el orden de experim entación preestableció.: L son som etidos a las condiciones de ruido que vienen dadas por los niveles de la parte superior d de la m atriz Así, en la prim era fila aparecen los cuatro suavizantes fabricados con la fórm ula d e __ p or la m ateria prim a M I, el estabilizante E l , con ph 2.5, con el tipo de sal S2 y con una cañ ó * sal alta. Estos, com o todos los dem ás, han sido som etidos a las cuatro condiciones de ruido. M . P R IM A
E S T A B IL IZ .
PH
T. SA LES
C. SA LES
Y
L O G (s)
-
-
-
+
+
-
-
-
+ +
-
+ +
-
-
-
+
-
-
-
-
+ +
+
-
-
+ +
2 3 5 8 .7 1 5 5 .6 5 6 8 .1 2 0 1 5 .6 7 7 5 .6 7 0 5 .0 6 6 4 .4 2 7 6 .3
3 .2 8 2 .1 3 2 .8 5 3 .1 4 2 .9 2 2 .9 0 2 .9 7 2 .2 5
+
+ + + +
-
-
+
+
+
Tabla 1 0 .4 M e d ia y v ariab ilid ad en e l e je m p lo d el su a v iza n te
Análisis de los datos. M étodo de matriz producto C om o hem os com entado anteriorm ente, para cada condición experim ental de los factores deberem os hallar la m edia y la variabilidad a lo largo de las condiciones de ruido, y ob'.tzr resultados de la tabla 10.4. Para estim ar los parám etros del m odelo (10.3) p ara la m edia, por una part¿ w variabilidad po r otra, se pueden utilizar los m ism os procedim ientos utilizados en los cap
D ISEÑ O DE PRODUCTOS ROBUSTOS
EFECTOS
MEDIA
LOGN(S)
m ed ia
9 3 9 .9
2 .8 1
A+BD
-3 0 3 .6
-0 .4 0
B+AD+CE
-1 1 7 .7
-0 .0 1
C+BE
-6 6 9 .2
-0 .0 9
D+AB
8 3 3 .3
0 .1 8
E+BC
-1 5 2 .3
-0 .3 0
AC+DE
7 4 .2
0 .0 3
AE+CD
-9 9 2 .0
-0 .5 3
10.5 E fe c to s so b re la m ed ia y la M tñ lid ad en e l e je m p lo d e l su a v iza n te M ateria prim a; B = E sta b iliza n te; C = Ph; Tipo de sa les; E = C antidad de sa le s)
Para ello se tom arán com o respuestas la m edia, x , y una transform ación logarítm ica de la variabilidad, ln(s). (El uso de la transform ación logarítm ica es m uy com ún cuando se m odela la varianza debido a que los residuos no siguen la distribución norm al. En este ejem plo, adem ás, es doblem ente aconsejable esta transform ación p o r existir un rango m uy am plio de variación en los datos.) A p lic an d o el alg o ritm o de los sig n o s a las dos respuestas, se obtienen las estim aciones de los efectos para la m edia y el logaritm o de la variabilidad que aparecen en la tabla 10.5. L lev an d o esto s re su ltad o s a un g ráfico en papel probabilístico norm al se obtienen los gráficos representados en la figura 10.4.
E+BC A+BD AE+CD
F ig. 10.4 R ep rese n ta c ió n en p a p el p r o b a b ilístic o norm al de lo s e fe c to s so b re la m ed ia A ) y sobre la variab ilid ad B ). (A = M ateria prim a; B = E sta b iliza n te; C = Ph; D = T ip o d e sa les; E = C an tid ad d e sa le s)
Se puede apreciar que los grupos de efectos significativos son: ► A E + C D , C + B E y D + A B para la m edia, ► A E + C D , A + B D y E + B C para la variabilidad. A unque existen confusiones debido al fraccionam iento del experim ento, los expertos en el tem a ccciiideraron que no tenía sentido la existencia de la interacción A E y BE, así com o que D era un fuerte c » d id a to a tener influencia en la viscosidad m edia, lo cual por otra parte tiene bastante sentido. Por lo ficco. para el estudio de la m edia se seleccionaron C, D y su interacción CD. En el estudio de la variabilidad se seleccionaron com o posibles efectos significativos (a falta de « p e rim e n to s para confirm arlo) los efectos A, £ y su interacción AE. Con los resultados del análisis se pueden obtener los m odelos que perm itan una aproxim ación i c e al en la zona de experim entación (ver el capítulo 9 para aproxim aciones m ás com plejas) de la s e d i a y la variabilidad de la viscosidad en función de los factores de diseño. Esios m odelos son: ► Viscosidad m edia = 940 - 335 Ph + 417 T. Sales -496 Ph • T. Sales + e ► Logn(s) = 281 - 0.20 M. prim a - 0.15 C. sales - 0.27 M. prim a
V (e) = 259.5 2
C. Sales + e
V (e) = 0.14 3 2
En ninguno de los dos m odelos se ha detectado evidencia alguna de com portam iento anóm alo c los residuos; por lo tanto, a continuación pasarem os a seleccionar aquellos niveles que optim icen fck> dos funciones.
M ÉTODOS ESTADÍSTICOS. C O N T RO L Y M E JO R A DE LA C A L ID A D
%
Optim ización de la variabilidad Se desea un suavizante con una viscosidad lo m ás robusta posible a influencias de factores ruido. e>*_» se traduce en que la variabilidad de la viscosidad del suavizante fabricado bajo una fórm uii determ inada (m ism as condiciones de los facto res de control) ha de ser m ínim a. Del análisis de la figura 10.5 se extrae qm¿ ello se consigue fabricando el suavizante con: ► m ateria prim a: M 2, ► cantidad de sales: alta. E n ta l caso la v a ria b ilid a d m ed o j esperada en los suavizantes, independiera-m ente de los valores en que trabaje en ! ■ dem ás factores de control, será de logn(s) = 2.81 - 0.2 - 0.15 - 0.27 = 2 F ig . 10.5 G rá fico d e la in tera cció n m ateria prim a • can tid ad de s = exp (2.19) = 8.93 centipoises sa les en e l e stu d io d e la variab ilid ad .
Optim ización de la viscosidad media Para la selección de aquellos niveles de los factores ph y tipo de sales que m inim icen la viscosid preciso analizar la interacción entre ellos, y para ello se ha construido la figura 10.5. L os n iv e le s de los fa c to re s de co n tro l m inim izan la viscosidad son por lo tanto: ► Ph: 2.5 ► Tipo de sales: SI A dem ás, la viscosidad m edia esperada estos suavizantes será de: Vise, m edia = 940+ 335-417-496= 362 centij P or lo tanto, se concluye que el diseñe su av iz a n te ro b u sto al ru id o e x tern o q \m definido por: ► m ateria prim a: M 2 ► cantidad de sales: alta F ig. 1 0.7 G rá fico d e la in tera cció n ph tip o d e sa le s e n el ► ph: 2.5 estu d io d e la v is c o sid a d m ed ia ► tipo de sales: S I D e los suavizantes fabricados en tales condiciones se esperará u n a viscosidad m edia de centipoises con una variabilidad de ¿=8.93 centipoises.
Análisis de los datos. M étodo de una única matriz (Box-Jones) C om o com entam os en el apartado 10.3 de este capítulo, las técnicas de diseño robusto a la variabi externa se basan en la interacción existente entre factores de control y factores ruido. Este heprovoca que la característica de calidad, al verse afectada p o r diferentes condiciones de factores varíe de m anera diferente dependiendo del nivel en que se encuentre el factor de control.
DISEÑ O D E PRODUCTOS ROBUSTOS
En el análisis realizado anteriorm ente, en ningún m om ento se ha trabajado con interacciones
ih¿:ores de control y factores ruido. Para que estas interacciones, que aparecen en el m odelo puedan ser analizadas, se tienen que ordenar las condiciones ex perim entales de la m atriz com o si pertenecieran a una m atriz única de un diseño fraccional con ocho factores en 32 utos. m atriz producto estaba form ada p o r dos diseños, de generadores: D=AB y E = B C en el diseño 2 5 2 para los factores de control 0 = M N en el diseño 2 3 1 para los factores ruido. Si los interpretam os conjuntam ente tendrem os un diseño 2(5+3) (2+1) = 2 8-3, con tres generadores: E= BC y 0 = M N y con relación de definición: 1= A B D = E B C = M N O = A C D E = A B D M N O = E B C M N O = A C D E M N O . C om o se puede com probar, aunque este diseño es de resolución ///, perm ite estim ar sin ones las interacciones entre factores de control y factores ruido. Para analizar el problem a del suavizante com o un diseño 2 8-3 , los datos han sido colocados tal aparecen en la tabla 1 0 .6 , y para las estim aciones de los efectos que se encuentran en la tabla se ha utilizado la regla de los signos. Podem os clasificar los efectos estim ados en tres grupos: 1 El grupo que incluye los factores de control y las interacciones entre ellos. 2 El grupo que incluye los factores ruido y las interacciones entre ellos. 5 El grupo que incluye interacciones de factores de control con factores ruido. Los efectos significativos (tanto efectos principales com o interacciones) pertenecientes a s del prim er grupo determ inarán los fa c to re s de control que influyen en la viscosidad m edia del trizante. Los efectos significativos asociados a factores pertenecientes al segundo grupo nos inform arán aquellos fa c to res ruido que afecten a la viscosidad media. D ebido a la naturaleza de estos factores se podrán seleccionar sus niveles óptim os. (E sta inform ación es realm ente im portante en aquellos s en que exista la posibilidad de cam biar el proceso para pasar a controlar algún factor ruido.) Los factores del tercer grupo que posean efecto significativo identificarán los factores de control que pueden ser seleccionados para que la variabilidad transm itida p o r los factores ruido sea n ín im a. A dem ás, quedarán perfectam ente identificados aquellos fa c to res ruido que p rovocan tal friabilidad. (U na vez m ás esto puede hacer p ensar a los técnicos del p roblem a en la posibilidad de :am biar el diseño del proceso, el m étodo de distribución de los productos,.etc.) En el ejem plo que nos ocupa, llevando los datos de la tabla 10.7 al papel probabilístico norm al se observa que los grupos de efectos significativos son: A E + C D , C+BE, D+AB, M + N O , O +M N, CN, C D M + A E M y A C N + D E N Se observa que: ► aparecen los m ism os factores de control afectando a la v iscosidad m edia que en el análisis trabajando con la m atriz producto: A E + C D , C + B E, D + A B . P or las m ism as consideraciones anteriores seleccionaríam os C, D y CD com o los que contribuyen a la viscosidad; ► los factores ruido M = “Tiem po en que el recipiente del suavizante está abierto” y O = “T em peratura del agua” influyen notablem ente en la viscosidad m edia. E stos factores dependen totalm ente del cliente, pero existe la posibilidad de desarrollar un recipiente de suavizante que cierre herm éticam ente, de tal form a que el factor M no sea tan im portante; ► el grupo de interacciones CN, C D M + A E M y A C N + D E N puede ser utilizado para controlar la variabilidad en la viscosidad, seleccionando aquellos niveles de los factores de control en que el suavizante es m ás robusto a cam bios en los factores ruido.
MÉTODOS ESTADÍSTICOS. CO N TRO L Y M E JO RA DE L A C A L ID A D
M. PRIMA
ESTABILZ.
PH
T. SALES
C. SALES
TIEMPO
T. AGUA
°C AGUA
VISCOSIDAD
-
-
-
+
+
-
-
+
3200
+
-
-
-
+
-
-
+
3 7 .5
-
+
-
-
-
-
-
+
16 0 0
+
+
-
+
-
-
-
+
1900
-
-
+
+
-
-
-
+
125
+
-
+
-
-
-
-
+
250
-
+
+
-
+
-
-
+
50
+
+
+
+
+
-
-
+
175
-
-
-
+
+
+
-
-
4500
+
-
-
-
+
+
-
-
4 2 .5
-
+
-
-
-
+
-
-
475
+
+
-
+
-
+
-
-
2200
-
-
+
+
-
+
-
-
1 1 2 .5
+
-
+
-
-
+
-
-
325
-
+
+
-
+
+
-
-
1 1 2 .5
+
+
+
+
+
+
-
-
9 7 .5
-
-
-
+
+
-
+
-
175
+
-
-
-
+
-
+
-
300
+
-
-
-
-
+
-
1 37 .5
+
+
-
+
-
-
+
-
3 0 2 .5
-
-
+
+
-
-
+
-
965
+
-
+
-
-
-
+
-
325
-
+
+
-
+
-
+
-
445
+
+
+
+
+
-
+
-
4 9 2 .5
-
-
-
+
+
+
+
+
1 560
+
-
-
-
+
+
+
+
2 4 2 .5
,
-
+
-
-
-
+
+
+
60
+
+
-
+
-
+
+
+
3660
-
-
+
+
-
+
+
+
1900
+
-
+
-
-
+
+
+
1920
-
+
+
-
+
+
+
+
2050
+
+
+
+
+
+
+
+
340
Tabla 1 0 .6 M atriz d e d is e ñ o 2 8 3 y resu lta d o s de la ex p er im en ta c ió n en e l p rob lem a d e l su a v iza n te
M E D IA
9 3 9 .9
M +NO
5 6 9 .8
AN
3 3 9 .8
DO
-2
BN
1 3 0 .2
EO
-3 1 7 .7
A+BD
- 3 0 3 .6
N +M O
-2 0 .5
B+AD+CE
- 1 1 7 .7
O+M N
5 0 4 .0
CN
9 1 9 .2
ACM +DEM
-2 0 4 .5
C+BE
-6 6 9 .2
AM
6 0 .8
DN
-3 4 3 .9
CDM +AEM
-6 4 0 .2
D +AB
8 3 3 .3
BM
-8 3 .3
EN
-3 0 5 .8
ACN+DEN
-6 8 1 .1
E+BC
- 1 5 2 .3
CM
-6 6 .1
AO
5 1 .1
CDN +AEN
242
AC+DE
7 4 .2
DM
3 0 9 .5
BO
1 9 2 .7
ACO +D EO
- 1 8 1 .7
AE+CD
-9 9 2 .0
EM
-61.1
CO
- 1 2 .0
CDO +AEO
- 2 7 1 .7
T abla 10.7 E stim a ció n d e lo s e fe c to s en e l e je m p lo d el su a v iza n te para e l d ise ñ o 2 8 3 (e x c e p to en lo s se is ú ltim o s g ru p o s, s e han o m itid o las in te r a c c io n e s d e o rd en 3 0 su p erior)
D ISEÑ O DE PRODUCTOS ROBUSTOS
5¿ consideram os las interacciones C N y A C N com o las de m ayor contribución con el factor y la A E M para el factor M, los gráficos en las figuras 10.7 y 10.8 ayudan notablem ente en la ion y selección de las condiciones óptim as de diseño. Com o se puede observar en la figura 10.7, la naturaleza de esta interacción no perm ite un nivel para los factores M. prim a y ph tales que la variación transm itida p or el tipo de m ínim a. En todo caso los gráficos sugieren que tal vez con un ph interm edio se puedan lograr esperanzadores. De la interpretación de la figura 10.8 en la que está representada la interacción de m. prim a • c. sales factor ruido tiem po abierto se obtienen m ejores resultados.
Ph (2.5)
Ph (3.5)
M. prima (M I) Viscosidad media M. prima (M 2)
Blanda
Dura
Tipo de agua
F ig . 10.7 G rá fico de la in tera cció n m . prim a • ph • tip o d e agua.
M. prima (M I)
235
M . prima (M2)
C. sal (alto) V iscosidad m edia
V iscosidad media C. sal (bajo)
< 1 0 días
> 1 0 días Tiem po abierto
< 1 0 días
> 1 0 días Tiem po abierto
F ig . 10.8 G rá fico d e in tera cció n entre m. prim a • c . sa les • tie m p o abierto.
Se observa que trabajando con la m ateria prim a y la cantidad de sales a un “m ism o nivel” ( M I mtidad de sal baja y M 2 con cantidad de sal alta), la variabilidad transm itida es m ucho menor. Por lo tanto, concluim os que para obtener un suavizante con m ínim a viscosidad y robusto al externo, hem os de trabajar con: ph de 2.5 y sales del tipo S I si querem os conseguir m ínim a viscosidad; con m. prim a del tipo M 2 y cantidad alta de sales o con m enos sal si se trabaja con la m ateria prim a M \ si se desea conseguir un suavizante robusto a la variabilidad transm itida p or el efecto del tiem po abierto. C om o el lector habrá com probado, esta últim a fo rm a de analizar los experim entos permite ?r m ás sobre el producto, ya que quedan identificados: \o s 1actores ruido que tienen influencia en la m edia: M y 0 \ los factores ruido que pueden ser contrarrestados por m edio de una selección adecuada del diseño: M y N.
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA. DE LA CALIDAD
Sin em bargo, con el prim er m étodo de análisis de la m atriz producto, la variabilidac para cada condición de diseño tiene una com ponente debida a aquellos factores ruido controlados en la experim entación y, p or lo tanto, podríam os d ecir que el producto resultante robusto” que el obtenido con el m étodo de la única m atriz. Por la experiencia que hem os ido adquiriendo en la aplicación de las técnicas de diseños de experim entos, no podem os decir que un m étodo de análisis sea m ejor que el contrario, am bos son válidos y co m plem entarios. D el análisis conjunto los técnicos pueócti im portantes conclusiones tanto p ara el objetivo particular que les ocupa com o para futuras experim entación. (En todos los análisis aquí considerados se ha asum ido que el orden de exp erim en ta ^: aleatorio. En la práctica algunos experim entadores no cum plen este requisito, fabrican seguidos para cada condición de la m atriz de diseño y los som eten uno detrás de otro a las de ruido. El experim entador que se encuentre en esta situación está rom piendo u n a de las que se basan los análisis aquí presentados y para un correcto análisis de los datos tendrá que técnicas de análisis de varianza denom inada split-plot (M illiken y Johnson (1984).)
10 .7 E je m p lo d e p r o d u c to r o b u sto a ru id o in te r n o : tu b o c a le fa c to r
236
Se entiende por ruido interno la variabilidad que presentan ciertas características de c productos debido a que los valores que realm ente tom an sus factores de diseño no son los o, si lo son al principio, sufren una cierta variación a k> tiem po. De form a análoga al caso de la existencia de ruido m etodología que se propone consta de las siguientes fases: ► E stablecer una hipótesis sobre el m odelo de la respues^. ► S e le c c io n a r un d iseñ o ap ro p ia d o q u e p erm ita parám etros del m odelo. ► E stim ar los parám etros del m odelo. ► A nalizar la m edia y la varianza en la respuesta. C om o ya com entam os en el apartado 10.4 se pueóc variación transm itida p or los factores internos y m in im iz a rá relación entre éstos y la respuesta es no lineal (ver figura 1 Fig. 10.9 S ección cilin d rica del P ara poder d etectar este tipo de relaciones no lineale* tubo ca le fa cto r experim entar con diseños que así nos lo perm itan. Al diseños, los denom inados diseños centrales com puestos, fueron presentados en el capítulc El ejem plo que vam os a presentar se trata del diseño de un tubo calefactor, tal aparece en la figura 10.9, en el que la característica a estudio es el flujo de calo r que superficie. El objetivo es obtener un tubo de flujo 1400 cal/seg y lo m ás robusto posible ¿ variaciones en los parám etros de diseño. E stos son: ► T I ¡Tem peratura en el exterior del cilindro (°C). ► T2 ¡Tem peratura en el interior del cilindro (°C). ► b ¡D iám etro exterior del cilindro (cm.). ► a ¡D iám etro interior del cilindro (cm .). Para la realización del experim ento se tom a un tubo de 1 cm de largo, con un conductividad térm ica de k=0.92 cal/seg cm °C. C om o se conoce la ley física que relaci calor con los parám etros de diseño:
D ISEÑ O D E PRODUCTOS ROBUSTOS
Flujo = 2 ^ (T 2-T l)/ln(b/a) (10.5) ralta experim entar. Sin em bargo, vam os a seguir los pasos que seguiría el experim entador en desconocer tal ley, aunque los datos serán obtenidos al sustituir los parám etros de diseño en la
El m odelo que el experim entador desea estim ar será un de segundo orden del tipo:
TI
T2
-
-
-
9 0 9 .7
p0+ z p , x t + z pyx Xj + z pjsp, + £ (io.6) ello se han seleccionado las condiciones experim entales que en la tabla 1 0 . 8 , rasándose en las diseños que se presentaron en el capítulo 9. relés de los factores son:
+
-
-
3 0 3 .2
-
+
-
4 2 4 5 .1
+
+
-
3 6 3 8 .7
N IV E L E S D E L O S F A C T O R E S
3 3 0 .5 1 1 0 .2
-
+
+
1 542.1
+
+
+
1 3 2 1 .8
0
1 1 8 8 .8
0
1 3 8 1 .5
3 1°C
0
-1 .2
0
9 9 6 .2
9 5 .5 °C
0
1.2
0
1 29.2
0
0
-1 .2
2 2 4 8 .4
0
0
1.2
2 8 7 1 .7
0
0
0
7 7 7 .3
+ 1.2
T1
19
2 0°C
2 5 °C
30°C
T2
2 9 .5 °C
35°C
6 2 .5 °C
9 0°C 1.3
+ +
0
+1
1.2
-
0
0
1.1
-
+
1.2
-1
1 .0 8
FLUJO
-1 .2
-1 .2
r
r
1 .3 2
A plicando las técnicas expuestas en el capítulo 9 el m odelo -.ado por m ínim os cuadrados es el que aparece en (10.7) una vez esado en unidades originales. En éste, e representa la parte del - que no queda explicada por el m odelo.
T abla 1 0 .8 R esu lta d o s de la e x p e rim en ta ció n c o n e l tubo ca lefa cto r o b te n id o s d e la fórm u la físic a
Flujo = 57199 + 270.4 (T2-T x) - 95421 r - 193.1 (T2-T x) r + 39605 r 2 + e (10.7) Si se realiza un análisis canónico a esta superficie utilizando las técnicas del capítulo 9, se v a que esta aproxim ación local de la superficie representa una cresta no estacionaria. L a curvatura cresta la da la relación cuadrática del flujo con r, y la no estacionalidad la da la relación lineal T2-T {). P or lo tanto, para m inim izar la variabilidad transm itida p or los factores ruido, debem os ir la relación cuadrática existente entre el flujo y r. Veamos lo que ocurre si hacemos fijo T2-T¡ = 50°C. En tal caso el m odelo anterior queda de la form a F lujo = 7 0 7 1 9 - 105076 r + 39605 r2 + e
(10.8)
tnsm isión de la variabilidad debido al ruido interno puede obtenerse a través de la expresión *F u n c i ó n
= x
<9F u n c i óon n / 1 ,2 / d X i ] s x.
(10.9)
este caso particular tom a la form a: F lu jo
10" 11 —16.6r + 6.3r
( 10.10)
"al expresión, para un valor fijo de Sr 2 , es decreciente en el intervalo (1, 1.3) y tiene un m ínim o 3. n consecuencia, si fijam os r =1.3 conseguim os un tubo calefactor lo m ás robusto p o sib le al te m o (por supuesto que r no tiene que ser estrictam ente 1.3; este resultado debe de arse posteriorm ente con el de la m edia de flujo que se desee). C abe notar que el valor lado para r será válido para cualquier valor de T2-T v a p esar de que ha sido hallado con un ticular de T2-T { =50.
237
MÉTODOS ESTADÍSTICOS. CO N T RO L Y M E JO R A DE LA C A L ID A D
U na vez m inim izada la varianza, el valor m edio del flujo de este calefactor se puede co n ses seleccionando adecuadam ente el valor de T2-T x . Así, si se sustituye en el m odelo general (10 “ valor r =1.3, se obtiene F lujo = 84.15 + 19.37 (T2 - T x) + e y se logra el flujo deseado varío T2~Tr Puesto que el valor objetivo era 1400 cal/seg el valor de <7 -1 ha de situarse en 73 °C. 4 En general podem os d ecir que la m etodología de diseño de productos robustos a ruido i ► utiliza las relaciones no lineales de la característica a estudio con determ inados factores seleccionar un nivel de estos últim os en el que la variación transm itida sea m ínim a, ► utiliza las relaciones lineales de la característica a estudio con determ inados factores para el valor m edio de la característica a su valor nom inal.
1 0 ,8 D iseñ o d e to le r a n c ia s En el apartado 10.3 hem os citado el diseño de tolerancias com o una de las fases diferenciadas etapa de diseño de un producto o proceso, al cual se recurre cuando una vez aplicada la fase de de parám etros la variabilidad resultante no es todavía satisfactoria. En el diseño de tolerancias se tom an decisiones sobre la variabilidad que se está dis“ adm itir en las com ponentes de un producto. U na de las im plicaciones es que hay que poner cotas de variación a los parám etros de P ara ello hay que evaluar la variabilidad transm itida por cada com ponente del diseño en el final, a partir del m odelo estim ado en el diseño de parám etros. La aplicación del diseño de tolerancias es costosa en general, ya que conlleva la selec proveedores m ás caros, m áquinas m ás capaces, m antenim iento m ás rígido, etc. En el ejem plo del tubo calefactor del apartado 10.7, se trataría de seleccionar proveedores de tubos calefactores que fuesen m ás capaces en el sum inistro de tubos de dete proporción r = b/a. Es decir, aquellos cuya sr fuese menor. A sim ism o habría que seleccionar precisos de m edida, etc. A aquellos lectores que deseen am pliar el tem a les recom endam os la lectura de Taguchi • i
7C
D ISEÑ O DE PRODUCTOS ROBUSTOS
A p é n d ic e 10A . F u n c ió n d e p ér d id a s El ingeniero G enichi Taguchi introdujo una nueva filosofía de la calidad im pulsada por los cam bios que los sistem as productivos h an experim entado en los últim os años. Taguchi da una medida de calidad de un producto basada en la pérdida económ ica que supone la variación de las características de tal producto respecto de los valores nominales para los cuales está definido. En general, dada una característica de calidad Y con valor nom inal T, la relació n existente entre diferentes valores de ta l característica y las pérdidas económ icas ocasionadas por tales variaciones puede ser aproxim ada por una función cuadrática P(y): P ( y ) = k ( y - T) 2
(10.12)
Tal función puede ser interpretada com o una función determ inante de la calidad de un individuo cuya característica de calidad tiene el valor y. A unque la relación real sea m ás com pleja, P(y) puede ser considerada com o una aproxim ación local obtenida con los térm inos cuadráticos del desarrollo de Taylor de la función teórica en torno el valor m ínim o r. La figura 10.A.1 representa la función P(y). C om o se observa, cuanto más alejado se esté del valor nom inal, m ás pérdidas se ocasiona al cliente y, p or lo tanto, según la definición anterior, m enos calidad tiene el producto. C uando el producto está en el valor nom inal T, el coste del producto es el m ínim o que se puede obtener. Por otra parte el valor de la constante k queda determ inada en el m om ento que se conoce las pérdidas en cualquier valor de la característica distinta del valor nom inal. P or ejem plo si se conoce la pérdida en el valor y = ¿*, k se obtendrá m ediante la fórm ula k = — SPl... ( a - T )2
(10.13)
Sin em bargo, cuando se habla de un producto, se engloban las diferentes unidades fabricadas por el proceso considerado. Tales unidades presentarán variabilidad en cuanto a la característica de calidad a estudio y, por \o tanto, cada u na de ellas poseerá diferente calidad. Por consiguiente, la pérdida esperada para un proceso en su conjunto, en cuanto a una carac Función de pérdidas P(y) te rística de calid ad d eterm in ad a, se o b ten d rá prom ediando la calidad de las diferentes unidades producidas. Esta calidad se obtiene hallando el valor esperado de la función de pérdidas P(y), L ( y ) = E ( P ( y ) ) = E ( k ( y - r ) 2) = k ( a 2 +
( m ~ t )2 )
donde jj y a 2 representan la m edia y la varianza que presenta la característica una vez está en m anos de] cliente. D ado q ue en genera] se procurará que M = £ (y ) = T (1 0 .2 5 ) se tendrá L(y) = k G 2 (10.16) De (10.16) se deduce que no basta con centrar un proceso en su valor nom inal, sino que hay que hacerlo con la m ínim a variabilidad.
P (a)
P(r) x Característica del producto
F igura 10.A .1
F u n ció n d e pérdidas
y
=a
II
MÉTODOS ESTADÍSTICOS. C O N T RO L Y M EJO RA D E LA C A L ID A D
A p é n d ic e 1 0 B M é to d o d e T a gu ch i L as aportaciones de G enichi Taguchi a la ingeniería de la calidad son u n ánim em ente reconocidas com o u na de las m ás im portantes en los últim os tiem pos (Box 1988), (K ackar 1985), (Ross 1988). A él deben las prim eras ideas para dar m ayor énfasis a la etapa de diseño del producto en la m ejora de la calidad, tal com o se ha com entado en el apartado 1 0 .2 . E squem áticam ente, esta m etodología puede resum irse en las siguientes etapas: a. Identificación de los factores de diseño, de los factores de ruido y de sus niveles ae experim entación. El diseñador del producto debe identificar las variables que presum iblem ente afectan a características de interés, así com o los niveles a los que conviene experim entar. Igualm ente deberá identificar los factores de ruido y decidir entre qué niveles de estos factores se desea que el producto sea insensible. b. C onstrucción de las m atrices de diseño (para los factores de control y para los factores d t ruido), y planificación del experim ento. Las m atrices de diseño, tanto para los factores de control com o para los de ruido, son. tn esencia, del tipo de las com entadas en los capítulos 7 y 8 , aunque Taguchi utiliza >a* denom inados orthogonal arrays (ver Taguchi (1986)). Los experim entos se realizan para cada una de las condiciones de la m atriz de factores de (m atriz externa) en cada u n a de las condiciones de los factores de control (m atriz intei form ando la llam ada m atriz producto. (V éase la figura 10.B.1.) c. R ealizar los experim entos y evaluar el estadístico adecuado. U na vez obtenidos los resultados experim entales para cad a una de las condiciones de la ir._ m de diseño, se calculan dos estadísticos: la m edia y el denom inado “proporción señal-ruido' L a optim ización de los valores de los factores de diseño se resuelve en dos etapas: i) D eterm inar los factores que afectan a la proporción señal-ruido y escoger los v alo re> lo m axim izan. ii) Seleccionar algún factor que, teniendo influencia sobre el nivel de la respuesta tenga m efecto lo m enor posible sobre la prporción señal-ruido. E ste será el factor que se utilizará para llevar la respuesta al nivel deseado.
zl F a c to re s d e ru id o
z2 M a tr iz e x te rn a
F a c to re s d e d is e ñ o x l x l x 3 ...
M a tr iz in t e r n a
M a tr iz p ro d u c to
F igu ra 1 0 .B .1 : M atriz p rod u cto se g ú n e l p lan ex p erim en ta l p ro p u esto por T agu ch i
Taguchi propone diferentes proporciones señal-ruido según el objetivo que se persiga. Así, si i que se pretende es m inim izar la respuesta, se deberá trabajar en las condiciones que m axim icei
d is e ñ o
0 ( x ) = —lO log
y 1=1 72 y »: n
DE
PRODUCTOS ROBUSTOS
(10.18)
Si el objetivo es que la respuesta sea lo m ayor posible, se m axim iza: 0 ( x ) = —lO log 'Z « ( V * 5 ) 2 '
(10.19)
Y si se trata de m antener la respuesta en su valo r nom inal, se m axim izará: 0(x)
Y¿ lO lo g —s
donde: x: Vector que representa una determ inada com binación de niveles de los factores de diseño. Y:. R espuesta en la condición i-ésim a de la m atriz externa. ti: N úm ero de condiciones experim entales de la m atriz externa. s2: V arianza de las respuestas obtenidas en cada una de las condiciones experim entales definidas por la m atriz externa, para un determ inado valor de X . d. A nalizar la significación de los efectos. Los resultados se analizan m ediante tablas de análisis de la varianza. E sta técnica de análisis de la significación de los efectos es uno de los aspectos m ás controvertidos del m étodo de Taguchi. (Box (1986), entre otros, ha realizado un detallado análisis crítico sobre este aspecto.) R ealización de experim entos confirm atorios. A ntes de dar definitivam ente por bueno el resultado obtenido, Taguchi propone la realización de una serie de experim entos \>ara coTYfvcmax qvxe Vas cowd\c‘\oY\es obtenidas com o óptim as son efectivam ente las m ejores.
241
M ÉTODOS ESTADÍSTICOS. CO N T RO L Y M E JO RA D E LA C A L ID A D
E jercicios 10.1.
C on el objetivo de fabricar un m aterial que, tras haber sido usado durante un cierto tiem po baj condiciones extrem as diferentes, presentase el m ínim o desgaste en una prueba estándar, siend ese desgaste lo m ás independiente posible de aquellas condiciones externas, se realizaro n och
C O N D IC IO N E S E X T E R N A S
FA CTO RES A
B
C
D
E
el
c2
c3
c4
c5
c6
c7
c8
-1
-1 -1 1 1 -1 -1 1 1
-1
1 1 -1 -1 -1 -1 1 1
-1 1 1 -1 1 -1 -1 1
12 6 9 8 16 18 14 16
12 10 10 8 14 26 22 13
10 3 5 5 8 4 7 5
13 5 4 4 8 2 5 4
3 3 2 3 3 3 3 11
3 4 1 4 2 3 4 4
16 20 3 9 20 7 19 14
20 18 2 9 33 10 21 30
17
22
7
12
10
8
18
25
1 -1 1 -1 1 -1 1
-1 -1 -1 1 1 1 1
D is e ñ o actu al
a) Encuentre el diseño óptim o del producto razonando el m étodo que se ha utilizado para llegar a a b) ¿Q ué factor transm ite m ás variabilidad en el desgaste? (S uponer a A2 = a B2 = 0 C2 = ctd2 = o E2) c) C om parar el diseño óptim o óptim o con las condiciones actuales 242
10.2.
Se dispone de tres factores controlables A, B, C y un factor ruido 0. Tras conducir i experim ento adecuado se obtiene: M E D IA
A
B
c
AB
AC
BC
ABC
7 .8 0 .3
0 .5 -0 .8
0 .4 0.1
-1 -0 .2
0 .8 0 .3
0 .2 0 .0
-0 .1 0 .5
0 .2 0 .2
E fe c to n iv e l (m ed ia ) E fe c to v ariab le (lo g S)
¿C uál sería la m anera de conseguir una respuesta lo m ás baja posible con el mínimo i variabilidad? 10.3.
En un departam ento de u n a em presa se quieren conocer los factores que influyen ex i contenido de CO en determ inado m otor con el fin de red u cir su presencia. Para ello se m seleccionado siete factores A, B, C, D, E, F, G, y se han realizado bajo ocho co n d io rm experim entales diferentes tres experim entos en condiciones adversas al proceso. L os resulta#! obtenidos de C O (en gram os) están en la tabla siguiente: A
B
c
D
E
F
G
N°
1
2
3
4
5
6
1
1 2 3 4 5 6 7 8
1 1 1 1 2 2 2 2
1 1 2 2 1 1 2 2
1 1 2 2 2 2 1 1
1 2 1 2 1 2 1 2
1 2 1 2 2 1 2 1
1 2 2 1 1 2 2 1
1 2 2 1 2 1 1 2
Ri
Ri
R3
1 .0 4 1 .4 2 1.01 1 .5 0 1 .2 8 1 .1 4 1 .33 1.33
1 .2 0 1 .7 6 1 .23 1 .87 1 .3 4 1 .2 6 1 .4 2 1 .5 2
1 .5 4 2 .1 0 1 .5 2 2 .2 5 2 .0 5 1 .88 2 .1 0 2 .1 3
a) ¿Q u ^ factores afi a la m edia y a la van A lidad del contenido en 0 0 b) ¿C u áles son M c o n d icio n es óptim as i trabajo? ¿Q ué concern* ción m edia se espera a contrar? ¿C on qué « bilidad?
C on trol estad ístico de p rocesos
siderem os que el proceso de relleno de botellas de agua m encionado en el capítulo 3, que tenía de icificaciones 2 0 0 ± 2 cm 3, está en estado de control rellenando con una m edia jj= 2 0 0 cm 3 y dación típica a = 0.7 cm 3. Supongam os que cad a hora se tom an datos del contenido de un núm ero rm inado de botellas. ¿Q ué estrategia se ha de seguir, basándose en esta inform ación, para poder ctar lo antes posible cam bios en el proceso que provoquen el relleno de botellas fuera de rancias? B n este capítulo se presentará la herram ienta estadística denom inada control estadístico de :eso s (C EP o SPC en térm inos anglosajones), que ayudará a llevar a cabo los objetivos que sentamos en el siguiente apartado, uno de los cuales es el anteriorm ente planteado con la línea de >otellado. El C E P utiliza gráficos de control que dependen del tipo de característica a estudio y de latu raleza de cada proceso. Los gráficos que presentarem os en este capítulo son los que esponden a las situaciones m ás generales que presentan los procesos. Para aquellas situaciones m ás ;cíficas, se recom ienda al lector la bibliografía que se propone al final del libro: B ox y K ram er )2), D ouglas y M ontgom ery (1991), M acG reg o r (1990) y M ontgom ery (1991) entre otros.
I E volu ción del C E P y objetivos técnicas de control estadístico de procesos com enzaron a ser desarrolladas en 1920 en E E U U por V. Shew art, cobrando especial im portancia su utilización durante la S egunda G uerra M undial en m presas de arm am ento. H asta entonces las pruebas de calidad que se adoptaban en las em presas )an basadas principalm ente en la inspección de los productos una vez acabados, elim inando los ctuosos. Este procedim iento se reveló ineficaz p or los m otivos expuestos en el capítulo 1 de este y el control de la calidad se desplazó al proceso de fabricación. A partir de entonces el control de procesos ha ido evolucionando respondiendo a las sidades de la industria dando lugar a dos corrientes. L a prim era, que sigue denom inándose control lístico de procesos (Statistical Process C ontrol, SPC), ha estado m ás relacionada con las industrias oducción en serie y se desarrolló principalm ente a p artir de la crisis de los años 70 en em presas ionadas con el sector de autom oción. A la segunda corriente se la denom ina control adaptad v o o n ático de procesos (A utom atic P rocess C ontrol, A PC ) y ha estado m ás ligada a e m p r e s a s de
MÉTODOS ESTADÍSTICOS. C O N TR O L Y MEJORA DE LA CALIDAD
%
producción continua, como pueden ser las empresas químicas. Hoy en día la utilización de unas técnicas u otras es compartida cada vez más por ambos sectores industriales. En este capítulo presentaremos el CEP remitiendo al lector a la lectura de Box y Kramer (1992> si desea comparar ambas técnicas o encontrar referencias sobre la práctica de APC. En primer lugar, podemos decir que los objetivos principales del CEP son los siguientes: 1) Minimizar la producción defectuosa. 2) Mantener una actitud de mejora continua del proceso. 3) Comparar la producción respecto a las especificaciones. Para poder llevar a cabo estos objetivos hay que tener en cuenta, como diría Bill Hunter, que todo proceso genera un producto, pero además genera información. Información que se puede obtener tomando datos numéricos de las características de los productos que salen del proceso y tratándola adecuadamente. La información permite “escuchar” el proceso y poder llevar a cabo los objetivos anteriormente citados. Con la actual filosofía de la calidad total, no basta con conseguir el objetivo 1) de minimizar la producción defectuosa; hay que mantenerse en una mejora continua, tal como se comentó en el capítulo 1 , y los estándares internos de fabricación se han de ir cambiando independientemente de las especificaciones externas del cliente. Además, las técnicas de CEP han de ser aplicadas lo más próximas posible al proceso que genere la información para poder disminuir el tiempo de reacción ante el proceso. Por ello, han de ser sencillas de utilizar e interpretar para que los operarios puedan utilizarlas sin apenas necesitar la ayuda de los especialistas en CEP. Para un correcto seguimiento de este capítulo es recomendable que se revisen los concepto> desarrollados en los capítulos 3 y 4.
11.2 Proceso en estado de control En el apartado 3.1 del capítulo 3 se definió un proceso en estado de control como aquel que sólo esta afectado por causas comunes de variación. En la tabla 3.1 del mismo capítulo se presentaron las principales características asociadas a las causas comunes y asignables, una de las cuales es la posibilidad de modelar matemáticamente la variabilidad asociada al efecto de las primeras. Para presentar las filosofía de los gráficos de control es necesario identificar el modelo que subyace en un proceso en estado de control, es decir, se ha de clasificar la característica de interés bajo los modelos más comunes presentados en el capítulo 4: ley Normal, Binomial y Poisson.
11.2.1 Comportamiento esperado de las observaciones individuales en un proceso en estado de control Volvamos al ejemplo del proceso de relleno de botellas de agua que, en estado de control, trabaja con media |u=200 cm 3 y desviación típica a =0.7 cm3. Supongamos que se toma una botella a intervalos de tiempo fijo y se anota su contenido en un gráfico como el que aparece en la figura 1 1 . 1 . Como ya se mencionó en el apartado 4.1, el modelo matemático que caracteriza tal proces-r \a ley normal y observamos que “Ya mayoría” de estas botellas están dentro de unos representados por p±3o del proceso. En este caso particular, los límites son 197.9 y XL obtenidos por el conocimiento previo que se tenía de los parámetros (en el apartado 11.4.1 ^ cómo estimar estos parámetros cuando sean desconocidos). Además, observamos que
n
aparecen de forma aleatoria alrededor del valor central representado por la media. Supongamos ahora que durante el proceso de toma de datos se desajusta la máquina de relleno en 1 cm 3 pasando a rellenar con media 2 0 1 cm 3 e igual disper sión, tal como muestra la figura 1 1 .2 .a. Observamos que ha habido un aumento considerable de las observaciones apare ciendo por encima de la media. Incluso, alguna de estas observaciones aparece más allá de los límites marcados por el proceso anterior. Si, en cambio, el desajuste de la máquina provoca un aumento en la variabilidad del proceso de relleno, pasando de a=0.7 a a = 1 , los valores en la figura 1 1 .2 .b aparecen más dispersos, aunque en tomo al mismo valor central. Se observa que el contenido de alguna de las botellas va más allá de los límites originales. De lo hasta aquí expuesto se intuye que una herram ienta de control de aparición de causas asignables podría ser un gráfico que contenga: ► una línea central que representa a la media del proceso; ► dos límites, superior e inferior, a distancia de 3 a de la línea central. Así, el control se realizaría tomando un individuo del proceso, midiendo la característica de interés y anotando este valor en el gráfico. Si estos valores surgen más allá de los límites se interpreta como que una causa asignable ha entrado en el proceso. (Lo mismo ocurre si se detecta cualquier otro patrón de tendencia en los datos, como se verá en el apartado 11.4.4.) Uno de los inconvenientes que presentan los gráficos así construidos es que si el desajuste en el proceso es “pequeño”, la aparición de botellas más allá de los límites de ± 3 a puede no ocurrir o hacerlo con mucha demora. Por ello es necesario obtener los límites de
CONTROL ESTADÍSTICO DE PROCESOS
N úm ero de observación
Fig. 11.1 Contenido en cm 3 de 50 botellas de agua de un proceso en estado de control
245
N ú m ero d e o b se rv ac ió n
N úm ero de observ ació n
Fig. 11.2 Contenido en 50 botellas cuando el proceso se ha desajustado: a) la m edia de 2 0 0 cm 3 a 201 cm 3. b) la desviación típica de 0.7 cm 3 a 1 cm 3 con media de 200 cm 3
X
MÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
control de modo que se acorte el tiempo de detección de un desajuste sin que, por otro lado, aumente mucho la probabilidad de “falsas alarmas”. Esto se puede conseguir en el proceso de embotellado si, en lugar de tomar una botella cada vez. se toma una muestra de botellas y se analiza el comportamiento del contenido medio de la muestra Como se vio en el apartado 4.9, la distribución muestral de la media de un proceso en estado de contre. es N (jn, Gl 4ñ) y, por lo tanto, el gráfico de control tendrá los límites más estrechos.
11.2.2 Comportamiento de la media de un proceso en estado de control
201.1
200.0
198.9 20
60
40 Núm ero de observación
Fig. 11.3 Gráfico del contenido m edio de 4 botellas con p=20Q y a = 0 .7 (observaciones 1-20), con p = 2 0 1 y <5=0.1 (Observaciones 21-40) y con jj = 2 0 0 y a = l (últimas 2 0 observaciones)
DESAJUSTE DEL PROCESO EN MEDIA
n= 1 n= 2
0.5 a
1a
1.5 a
2a
0.6 % (4 64) 1.3 %* 1 4 %**
2.3 % (130) 4.5 % 5 .6 % (52) 6.7 % 10.2 % (28) 8.8 % 15.9 % (18) 16.3 % 4 3 .2 % (6)
6.7 % (44) 12.9 % 19 % (14) 18.7 % 3 4.4 % (7) 2 4 .2 % 50 % (5) 42.5 % 89.3 % (2)
15.9 % (18) 2 9.2 % 4 3 .2 % (6) 4 0 .4 % 6 7.9 % (3) 4 9 .9 % 84.1 % (2) 7 4 .9 % 9 9 .6 % (1)
(271)*** n= 3
n= 4
n = 5
1.9% 1.6 % (181) 2 .6 % 2.7 % (130) 5 .0 % 5.1 % (52)
Tabla 11.1 Probabilidad de detección de cambios en la media del proceso * Tomando n observaciones aisladas. ** Tomando m edias de n observaciones. *** N° de muestras de tamaño n que se han de tomar para que exista una probabilidad de al m enos 95% de detectar el cam bio en el proceso.
La figura 11.3 ha sido obtenida al toma: cuatro botellas y anotar el contenido medio en las tres situaciones que se han trabajado en el apartado 11.2.1. Se observa que, al ser los lím ites más estrechos, el poder de detección aumenta En efecto, se observa un mayor número de observaciones fuera de límites, y ademas el tiempo que transcurre desde que se produce el cambio hasta que se detecta es mucho menor que cuando se tomaba única botella. De hecho, se puede comparar a poder de detección del gráfico de la para distinto tam año de muestra función del cambio que se produce ei proceso. La tabla 11.1 presenta un comparativo para cuando el desajuste realiza en media. Se puede observar que para c moderados de 2 a o más, la probabili detección cuando se trabaja con muestra es mucho mayor que cuando trabaja con el mismo número de vaciones individuales. Además, hay tener en cuenta en todos los casos qi¿e obtener n observaciones individuales deben esperar n unidades de tiempo. k> implica que el proceso está proch con este desajuste durante más tiempo Por otra parte se observa que cambio es de 1.5 a o menos, nin^, los dos métodos de control, el de vaciones individuales o el de m« muy eficaces. En el apartado 1 presentan gráficos alternativos p o n tipo de cambios.
71
CONTROL ESTADÍSTICO DE PROCESOS
En el siguiente apartado profundizaremos sobre algunos de los aspectos más importantes de la estructura de los gráficos de control, tales como los límites del gráfico, la frecuencia de muestreo, quién ha de utilizarlos, etc.
11.3 ¿Qué es un gráfico de control? M etodología Un gráfico de control es un gráfico en el que se representa el comportamiento de un proceso anotando sus datos ordenados en el tiempo. El objetivo principal de los gráficos de control es detectar lo antes posible cambios en el proceso que puedan dar lugar a la producción de unidades defectuosas, y ello se consigue minimizando el tiempo que transcurre desde que se produce un desajuste hasta que se detecta. Asimismo, como ya se mencionó en el apartado 11.1, el CEP hay que verlo también como una herramienta de mejora continua de la calidad de los productos, puesto que hoy en día se mide la calidad de un producto como un valor que es inversamente proporcional a la variabilidad que presentan sus características de calidad en el cliente (ver apartado 3.1). Puesto que reducir la variabilidad debido a las causas comunes resulta más complejo, en general el CEP ayuda a la detección de causas asignables para tomar acciones en función de su naturaleza. Por lo tanto, el objetivo primordial de los gráficos es la detección rápida de la presencia de causas asignables en un proceso y para ello son importantes los siguientes puntos: 1) El riesgo que se está dispuesto a admitir cada vez que se decida que una causa asignable ha entrado en el proceso. 2) El cambio mínimo en el valor del parámetro que se desea detectar. 3) El tiempo medio esperado entre desajustes. Se entiende que un gráfico de control da “falsas alarmas” cuando las observaciones de un proceso en estado de control llevadas al gráfico son interpretadas erróneamente como señales de aparición de causas asignables. Para que esto no ocurra con frecuencia, se toman los límites tales que la probabilidad de falsa alarma sea del orden de un 3%c, es decir, se ha de estar muy seguro para aceptar que el proceso ha cambiado. Para ello, en el caso de la distribución normal los límites de control se han de situar a una distancia de la línea central de tres desviaciones típicas del estadístico que se sitúa en el gráfico. En cuanto al punto (3), el tiempo medio en que se producen los desajustes en el proceso determinará la frecuencia de muestreo: cuanto más estable es un proceso menos inversión (tiempo y dinero) debe dedicarse a controlarlo. Puesto que se ha de minimizar el tiempo de detección de Un Cambio en el prOCeSO, la frecuencia de Cambio en media del proceso muestreo ha de ser superior a la del tiempo esperado entre cambios, tal como muestra la
n_í
fisura 11.4.
Por otra parte, además del tiempo medio entre desajustes, es importante estimar los costes de producir fuera de control en este tiempo, de tomar datos del proceso y de ajustarlo y, en función de ellos, realizar una política de control lo más óptima posible. En el ejemplo de la figura 11.4, la opción 7(1) es más cara desde el punto de vista
1 1 1 l
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1
1
/
J
1
1
1
T(2\
Fig. 11.4 Frecuencia de muestreo T ( l ) y T (2) para un proceso en que se controla la media
247
X
MÉTODOS ESTADÍSTICOS. C O N T R O L Y M EJORA DE LA CALIDAD
del coste de control que la opción T(2), ya que la frecuencia de muestreo es mayor, pero tal vez beneficios obtenidos al detectar antes un cambio en el proceso sean mayores en 7(1). Por último, de poco o nada sirve lo hasta aquí expuesto, si la información que emana de hm gráficos de control tarda en ser “escuchada” por aquellas personas que directamente pueden sv* sobre el proceso, o no se le presta la debida atención. Es decir, poner en marcha un sistema de c o m flj estadístico de procesos no consiste en: > rellenar plantillas de recogida de datos por parte de los operarios, para ser llevados a fin-L arj mes a un gráfico por parte de los técnicos y posteriormente ser archivados; ► realizar un gráfico con los límites obtenidos la primera vez que se implemento el CEP cuales se observan que poco tienen que ver con la situación actual del proceso. El CEP es una técnica que ha de ser utilizada cerca del proceso y, por lo tanto, es recome que sean los operarios los que la utilicen. Para ello, los gráficos de control han de ser s e ñ a l.:: construir e interpretar. En cuanto a la actualización de los límites de control en los gráficos, hemos de decir c_c límites no se han de cambiar mientras no se tenga evidencia de que el sistema de causas comunecambiado o de que cambia el procedimiento de toma de datos. A continuación presentamos los gráficos de control más comunes clasificados, de acuero: el tipo de característica que se controla, en gráficos de control para variables y para atributos
11.4 G ráficos de control para variables 248
Se denominan así los gráficos de control para características continuas del producto o del proce >: como: contenido en cm 3 de un líquido, peso de un saco de pienso, viscosidad de una resina, i de una tinta, temperatura de un horno, etc., las cuales, cuando el proceso está en estado de distribuyen en general según la ley norm al1. Un proceso del cual se está controlando una característica continua puede abandonar >de control por verse afectada su media, su variabilidad o ambas a la vez. Por consiguiente, h construir gráficos para controlar ambos parámetros por separado, no sólo la media. El control de la media del proceso se realiza, siempre que se pueda, a través de las muestras de tamaño n, tal como se vio en el apartado 1 1 .2 .2 . Si de las mismas muestras se calcula la desviación típica muestral s, se puede c gráfico de control para a utilizando la distribución teórica de s presentada en el apartado 4.8 °
2 *
"
( »
2
2
- * ) " '
Así, tomando los percentiles adecuados de la chi-Cuadrado, se tendría un gráfico para r que este gráfico no es simétrico). En la práctica, el cálculo de la varianza muestral resulta personal poco familiarizado con la estadística y se recurre a calcular el rango de variación que se define como la diferencia entre las observaciones extrem as. Se puede matemáticamente que existe una relación entre s2 y el rango muestral para muestras de tamaf»: relación es:
1 Si no se distribuyen las observaciones individuales, si lo hacen las m edias para tamaño suficientem ente grarna: central del lím ite.)
X
CO NTROL ESTADÍSTICO DE PROCESOS
s=a=-^~
(ii.2>
d2
¿onde d2 se puede encontrar, para diferentes tamaños de muestra, en la tabla H del apéndice 1 al final ¿el libro. A continuación se presentan los gráficos más utilizados para características continuas.
11.4.1 Gráficos X -R CEP utilizando gráficos X -R se lleva a cabo tomando muestras de n individuos (entre dos y seis), A culando la media y el recorrido muestral y llevando estos valores a los gráficos correspondientes. Las muestras han de ser obtenidas de tal forma que contengan individuos homogéneos, es decir, producidos bajo las mismas condiciones; así, los estadísticos que se obtengan de ellos, la media y el recorrido, serán buenos estimadores de los parámetros del proceso. Es decir, debe procurarse que, jurante el tiempo que el proceso fabrica los individuos que forman parte de una muestra, sólo hayan ¿¿ruado causas comunes de variabilidad. Los límites en los gráficos se colocan en El
Límite superior Gráfico X
Límite central Límite inferior
Gráfico R
aln V o „
Límite superior
D4 R
Límite central
R
Límite inferior
D3 R
o (11-3) x
249
— A2 R
(H -4)
donde los valores de A 2, D 3 y D4 se pueden encontrar, para distintos tamaños de muestra, en la tabla H del apéndice 1 al final del libro. En aquellos casos en que no se tenga una estimación de los parámetros del proceso en el momento de implementar los gráficos de control, o se desee recalcularlos, se han de seguir los siguientes pasos: 1) Tomar k (al menos 20) muestras de tamaño n (entre dos y seis) de forma consecutiva y a intervalos de tiempo iguales, calculando la media y el rango de cada muestra: X¡
=
— + X,2* ' "
+ X ‘"
R i
=
m a x .ix y ) - m in.(xy)
j
=
1
, 2
, 3
( H- 5)
2) Calcular la media de las k medias muéstrales y la media de los k rangos: x
=
— k
_ R
=
í> , ---k
3) Calcular los límites de control del gráfico mediante las expresiones (11.3) y (11.4).
( 1 1 .6 )
MÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
4) Llevar los valores de las medias y los rangos de las muestras obtenidas a los gráficos y comprobar que no hay ningún tipo de comportamiento anómalo en ninguno de ellos. En iül caso, pasar al apartado siguiente. Si existe evidencia de que durante la construcción del gráfico el proceso no ha estado bajv control, se han de buscar las causas asignables y actuar sobre ellas. Sólo en este caso s r reconstruirá el gráfico eliminando las anomalías y comenzando en el paso 2). En aquellos c a s o s en que hayan variado notablemente las características del proceso, debe comenzarse desde d principio. 5) Mantener los límites de control calculados en el apartado 3) y establecer un plan de control el futuro con el objetivo de realizar un seguimiento del proceso. Para ello, dependiendo de las características del proceso (coste de inspección, producen» diaria, coste de producir fuera de especificaciones) se toman muestras de tamaño n en intervalos áe tiempo determinado y se lleva la media muestral, Je., y el recorrido, Rr a los gráficos correspondiente*. Una llamada de atención en uno de los gráficos, equivale a que una causa asignable ha entrad» en el proceso. En este caso, se ha de buscar la causa asignable y deben tomarse las acciones adecuadas para llevar al proceso a su estado de control. Cuando la construcción de los gráficos se hace manualmente, existen plantillas que han siáo adoptadas con pequeñas variantes en las empresas. En ellas, además del espacio reservado para ta l gráficos, existen casillas donde se debe anotar toda la información que pueda ayudar a una posterior interpretación del gráfico. Un ejemplo de esta plantilla se presenta al final del capítulo. El gráfico de la figura 11.3 es un caso particular del uso del gráfico X . En él, los límites se han calculado a partir de las primeras 2 0 observaciones que se encuentran en la tabla 1 1 .2 . Límite superior = 200 + 0.729 x 1.48 = 201.1 Límite central = 200 Límite inferior = 200 - 0.729 x 1.48 = 198.9 Como ya se comentó en el apartado 11.2.2, con este gráfico se han detectado cambios en ei proceso debidos a cambios en la media y también a un incremento de la variabilidad. Para el gráfico de la variabilidad, se llevan los rangos de la tabla 11.2 a un gráfico como el ae la figura 11.5, donde los límites de control se han calculado a partir del rango medio y los valores oc D3 = 0 y D 4 = 2.282 correspondientes a una muestra de tamaño 4. Los límites así calculados son los siguientes:
U C L=3.382
R =1.482
LCL=0.000 15
30
45
60
Número de observación Fig. 11.5 Gráfico R para la variabilidad del proceso de embotellado. Con p = 200 y a = 0 .7 (observaciones 1-20), con |i=201 y o = 0.7 (obser vaciones 21-4 0 ) y con jj=200 y o = 1 (últimas 20 observaciones)
Límite superior = 2.282 x 1.48 = 3.38 Límite central = 1.48 Límite inferior = Ox 1.48 = 0 Como se puede observar en e l gráfico R, el aumento de la media c e proceso a partir de la observación 20 provoca un ligero incremento en los rangos, aunque este aumento es más manifiesto cuando aumenta la varia bilidad del proceso a partir de la obser vación 40, llegando incluso a salir los rangos fuera de los límites.
71
CONTROL ESTADÍSTICO DE PROCESOS
3
X x
* 2
1
2 0 2 .0 1 6
2 0 0 .2 1 8
2 0 0 .5 8 8
1 9 9 .9 3 0
2 0 0 .6 8 8
2 .0 8 5
2
2 0 0 .3 9 0
2 0 0 .1 8
1 9 8 .3 8 5
1 9 9 .1 2 0
1 9 9 .5 2 0
2 .0 0 5
X
*4
M E D IA
3
2 0 0 .0 8
1 9 9 .4 2 0
2 0 0 .0 4 5
1 9 9 .9 8 5
1 9 9 .8 8 4
0 .6 6 5
4
1 9 8 .5 8 4
2 0 1 .0 1 1
2 0 0 .2 6 0
2 0 0 .0 9 7
1 9 9 .9 8 8
2 .4 2 7
5
1 9 9 .4 1 3
1 9 9 .4 5 3
2 0 0 .0 1 2
2 0 0 .7 2 0
1 9 9 .9 0 0
1 .3 0 6
6
1 9 9 .7 0 1
1 9 8 .7 6 1
2 0 0 .0 0 1
2 0 0 .1 1 8
1 9 9 .6 4 5
1 .3 5 7
7
1 9 9 .3 8 0
2 0 0 .4 9 1
2 0 0 .3 6 1
2 0 0 .0 5 7
2 0 0 .0 7 2
1 .1 1 1
8
2 0 1 .4 3 5
2 0 0 .2 7 9
1 9 9 .7 2 7
2 0 0 .5 1 3
2 0 0 .4 8 8
1 .7 0 7 0 .9 7 4
9
1 9 9 .4 4 0
1 9 9 .1 5 5
1 9 9 .9 6 6
2 0 0 .1 2 9
1 9 9 .6 7 2
10
2 0 0 .8 5 7
2 0 1 .0 2 1
1 9 9 .5 2 6
2 0 0 .6 5 4
2 0 0 .5 1 5
1 .4 9 6
11
2 0 0 .4 4 5
1 9 9 .9 3 3
2 0 0 .0 3 0
1 9 9 .0 4 4
1 9 9 .8 6 3
1 .4 0 1
12
2 0 0 .1 0 9
2 0 0 .9 0 0
2 0 0 .1 1 6
2 0 1 .7 5 1
2 0 0 .7 1 9
1 .6 4 2
13
1 9 9 .9 8 5
2 0 0 .0 0 6
2 0 0 .6 5 9
2 0 0 .6 0 0
2 0 0 .3 1 2
0 .6 7 3
14
2 0 0 .5 8 0
1 9 9 .9 3 4
1 9 9 .7 8 9
1 9 9 .6 9 9
2 0 0 .0 0 1
0 .8 8 1
15
1 9 9 .7 9 6
1 9 9 .7 5 9
1 9 9 .8 8 0
2 0 0 .3 4 0
1 9 9 .9 4 4
0 .5 8 1
16
1 9 9 .2 7 7
2 0 0 .7 2 2
1 9 8 .3 9 8
2 0 0 .4 1 0
1 9 9 .7 0 2
2 .3 2 4
17
2 0 0 .6 1 2
1 9 8 .6 0 5
1 9 9 .1 9 4
1 9 9 .9 9 8
1 9 9 .6 0 2
2 .0 0 7
18
1 9 9 .8 9 9
2 0 1 .0 2 7
1 9 9 .9 9 8
2 0 0 .8 0 6
2 0 0 .4 3 2
1 .1 2 9
19
2 0 0 .3 1 0
1 9 9 .9 9 8
2 0 0 .5 7 1
1 9 9 .2 5 0
2 0 0 .0 3 2
1 .3 2 2
20
1 9 8 .6 9 2
1 9 8 .6 5 0
2 0 0 .6 8 6
2 0 1 .1 9 1
1 9 9 .8 0 5
2 .5 4 1
X = 200
R = 1.48
Tabla 11.2 Contenido en cm 3 de 20 muestras de tamaño 4 de botellas de agua
11.4.2 Gráfico de observaciones individuales y gráfico de rangos móviles Estos gráficos son similares a los gráficos X -R con la diferencia de que los primeros se utilizan en aquellos casos en que se obtiene una única observación en cada instante. Algunas situaciones en las que esto ocurre son: ► sólo puede obtenerse una observación por lote o partida de material; ► en procesos continuos o de batch en los cuales no tiene sentido hablar de “individuos”; ► se requiere realizar una comparación directa con las especificaciones. Para la implementación de los gráficos de observaciones individuales y de rangos móviles se han de seguir los pasos presentados para los gráficos X -R , teniendo en cuenta que, al ser n= 1, se tendrán que realizar algunas modificaciones. Así, con las k observaciones obtenidas según el paso 1) del apartado 11.4.1 se estima la media del proceso, ja, según, k
x
= ¡1 =
X* J—— donde K
x observación i-ésima y
k total de observaciones
El rango medio se obtiene promediando los rangos móviles obtenidos al hacer muestras de tamaño v d e la siguiente manera: para obtener R f se toman las primeras w observaciones (xv x v ...,jO y se calcula el rango. R, se obtiene a partir de {x2, x v ..., xw+J), y asi sucesivamente. Así, se obtiene la media üe rangos,
X
MÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
k-w+l
R
t,Ri
( 11 ~
= — ^ -----k -w +l
donde: k: total observaciones, w: n° de observaciones utilizadas en el cálculo del rango móvil, Rr. rango del grupo móvil (;c,...,x+w,), R: media de rangos móviles, De esta manera el control estadístico de la media del proceso se realiza llevando b s observaciones individuales a un gráfico que tiene de límites, Límite superior
_ „ R x + 3— d2
Límite central
x
Límite inferior
o *x- - 3— 2
Para el control estadístico de la variabilidad se utilizan los rangos móviles calcu anteriormente, siendo el gráfico similar al gráfico R en (11.4). En ambos gráficos para el cálculo de valores d2, D ? y D4 se considera n=w. Hay que notar que w ha de ser seleccionado de tal manera que los elementos en un mismo sean lo más homogéneos posibles. Un valor de w muy utilizado es w=2, y en tal caso d. aproximadamente 9/8. El gráfico de observaciones individuales es menos sensible que el gráfico X , como ya comentó en el apartado 11.2.1. Además, si la distribución de los datos no sigue una ley normal. w que tener mucho cuidado en la interpretación del gráfico. Téngase en cuenta por otra parte, que el hecho de que los valores R i no sean total independientes también dificulta la interpretación del gráfico de la variabilidad.
11.4.3 Gráfico de medias móviles El gráfico de medias móviles, o gráfico MA (.Moving Average), es un gráfico para controlar media del proceso y se emplea en general en aquellos casos en los que, obteniéndose observadoindividuales del proceso, se desea analizar el mismo con la sensibilidad que permite un gráfico medias. Para ello, las medias móviles se obtienen de igual manera que se han obtenido los rang móviles en el apartado anterior y los límites de control se obtienen ahora directamente de ( 1 1 para n -w . Estos gráficos “suavizan” el comportamiento observado en el de observaciones individuales } muestran mejor la tendencia del proceso. Por otra parte, y tal como ocurría en el gráfico de ran móviles, las observaciones no son independientes, lo cual dificulta la interpretación.
11.4.4 Interpretación de los gráficos de control El objetivo de la utilización de los gráficos de control para el seguimiento de un proceso es primordialmente el de detectar cualquier evidencia de que la media y la variabilidad del proceso no se
K
--------------------------------------------------------------------------------------------------------------------------------------------------------------- CONTROL ESTADÍSTICO DE PROCESOS
han mantenido constantes a lo largo del tiempo. Es decir, se pretende detectar la aparición de causas asignables de variabilidad. Con tal objetivo en el gráfico se han representado dos cotas o límites de variabilidad las cuales evidencian la presencia de tales causas si son sobrepasadas. Este patrón de inestabilidad fue el que se mantuvo durante los primeros años de la implantación de los gráficos Shewart. Los gráficos así construidos tenían varios inconvenientes: ► Permanecían impasibles ante aquellas causas asignables que afectaban al proceso sin llegar a provocar individuos fuera de límites. ► Detectaban algunas anomalías demasiado tarde. ► No tenían en cuenta la información histórica del proceso. Para contrarrestar los puntos anteriormente citados, se incorporaron nuevos patrones de inestabilidad. Estos últimos tienen la particularidad de ser tan poco probables de ser presenciados en un proceso bajo control como el hecho de obtener una observación fuera de límites; además, tienen en cuenta el comportamiento histórico del proceso a corto plazo. Para la detección de tales patrones, se han de dividir las dos áreas alrededor del límite central en tres zonas: A, B y C. Las figuras 11.6.a y 11.6.b presentan los patrones más utilizados en la interpretación de los gráficos de control. Si alguno de los ocho patrones presentados aparece en el gráfico, se interpreta que el proceso está siendo afectado por causas asignables. En tal caso, si se está seguro de cuál es la causa que ha provocado la anomalía y se sabe cómo actuar sobre ella, se han de tomar las acciones adecuadas para llevar al proceso a su estado de control. Nótese, además, que cuanto más se muestrea más posibilidades existen de obtener falsas alarmas y tomar, por lo tanto, acciones que, en lugar de disminuir la variabilidad del proceso, la aumentan. Por lo tanto, no se ha de actuar si no se está seguro de la presencia de causas asignables y se conoce su identidad. Patrón 1 Un punto fuera de los límites
Patrón 3 4 puntos de 5 al mismo lado de B
Patrón 2 2 puntos de 3 al mismo lado de A
Patrón 3 8 puntos consecutivos al mismo lado de C
Fig. 11.6.a Patronee 1-4
j
MÉTODOS ESTADÍSTICOS. C O N TR O L Y MEJORA DE LA CALIDAD
Patrón 5 15 puntos consecutivos en la zona C
Patrón 6 8 puntos seguidos a los dos lados de la línea central y ninguno en C
L. S.
L. S.
L.C.
L.l. Patrón 7 14 puntos seguidos alternados
Patrón 8 6 puntos seguidos creciendo o decreciendo
L. S.
L. S.
Fig. 11,6.b Patrones 5-8 de inestabilidad
Generalmente, cuesta identificar una causa asignable entre todas las posibles. En la práctica lo que se hace es estar atento al proceso cuando éste comienza a mostrar anomalías y tratar de analizar u disposición de los datos entre los cuales van apareciendo estos patrones de inestabilidad. La manera en que aparecen las anomalías puede ayudar a identificar las causas asignables per: no existe una regla general ya que: ► cada proceso tiene unas características particulares que hacen que un tipo de inestabilidades sean más frecuentes que otras; ► dado un patrón de inestabilidad, las causas que pueden provocarlo son variadas y dependen totalmente del proceso con el que se está trabajando. Por consiguiente, para la interpretación de los gráficos de control es primordial conocer el proceso En general, las causas que afectan a la media del proceso son aquellas que cuando intervienen afectan a todo el producto de forma parecida. Por el contrario, las causas que afectan a la variabilidad afectan sólo a una parte del producto. Por supuesto que ciertas causas pueden afectar a la media y a la variabilidad del proceso a la vez. Por ello, si se trabaja con los gráficos X -R es recomendable analizar el comportamiento de 1¿ media y el recorrido por separado. Primero el comportamiento del gráfico Ry que es más sensible a cambios en el proceso, después el gráfico X y finalmente los dos a la vez. (No tiene sentido interpretar el gráfico X si el gráfico R no está bajo control.) Recomendamos al lector la lectura del manual de AT&T (1985) sobre el control estadístico de procesos si desea ampliar el tema de interpretación de los gráficos de control. Por último hemos de insistir en el hecho de que el objetivo en la interpretación de un gráfico de control es analizar si el proceso se comporta de una forma estable a lo largo del tiempo. Este análisis no pretende comparar las características del proceso con sus especificaciones o tolerancias. Cuando tal comparación sea necesaria se realizará un estudio de capacidad, tal como se describe en el apartado 11.4.5, el cual será fiable sólo cuando el proceso esté bajo control.
n
CONTROL ESTADÍSTICO DE PROCESOS
11.4.5 Estudios de capacidad Considerem os el proceso de relleno de VARIABILIDAD A CORTO PLAZO botellas utilizado a lo largo de este capítulo. (Capacidad de máquina) Cuando tal proceso está en estado de control, a la amplitud del intervalo de variabilidad de las OTRAS VARIACIONES observaciones individuales, se la denomina debidas a cambios de: Tum o capacidad. A tal capacidad contribuirán entre Operario M ateria prima otros, las características de las máquinas, el personal, el servicio de mantenimiento del proceso, la forma de la boca de la botella, etc., VARIABILIDAD A LARGO PLAZO que varían a lo largo del tiempo. Por este (capacidad de proceso) motivo se habla de capacidad a largo plazo. También podemos preguntamos sobre la capacidad de la máquina embotelladora por Fig. 11.7 Capacidad de máquina y de proceso, capacidad a corto y a largo plazo sí sola. En tal caso nos referimos estrictamente a la variabilidad atribuible a la máquina cuando el resto de las características a) permanecen lo más homogéneas posible, lo cual ocurre a corto plazo y, por lo tanto, se denomina a esta capacidad de máquina, capacidad a corto plazo. ^ La idea de “capacidad” sugiere una □ característica positiva, de forma que cuanto más mejor, pero en este contexto, capacidad = b) variabilidad y, por lo tanto, cuanto menos mejor. La capacidad es una característica - \ innata a cada máquina o proceso e independiente de las tolerancias o especificaciones del producto que genera. Es C ap a c id a d más, la capacidad de una máquina se puede especificar incluso antes de ser vendida y, por Figura 11.8 Histogramas representando la variabilidad de un proceso supuesto, antes de saber las tolerancias del producto que va a elaborar. Si tomásemos 40 botellas obtenidas del proceso de rellenado estando éste en estado de control, un histograma de los contenidos de agua obtenidos no tendría, seguramente, ninguna de las formas que se indican en la figura 1 1 .8 .a, sino que sería del tipo de la figura 1 1 .8 .b recordando a una distribución normal. Como esta variabilidad debida a causas aleatorias sigue una distribución normal, la capacidad de una máquina se define tradicionalmente como la amplitud 6 a , intervalo que contiene el 9 9 .7 ^ de las unidades. Actualmente, y especialmente en el sector del automóvil, prefiere hablarse ce n t e incluso 10a, intervalos que dejan fuera 63.4 y 0.6 unidades por millón respectivamente le equivale prácticamente a hablar del total de la producción. Los estudios de capacidad son una herramienta fundamental para la racion^iza*: :c re de calidad. Es necesario saber lo que la máquina es realmente capaz de hacer \ las personas involucradas en la fabricación, sino también los comerciales clientes las características de los productos.
rl
\
255
MÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
256
Para el cálculo de la capacidad de una máquina el proceso a seguir es el siguiente: 1. Asegurarse de que la máquina se encuentra en estado de control. 2. Tomar un mínimo de 50 unidades consecutivas (normalmente entre 50 y 100), midiendo pac* cada una la característica que se quiere estudiar estudiar. 3. Verificar la normalidad de los datos. Esta verificación suele hacerse representando la función distribución de los datos en papel probabilístico normal. 4. Estimar la desviación tipo del proceso o, directamente, su capacidad. Puede verse una explicación detallada de este procedimiento en el libro de J.L. Vacher^ Mejora continua de la calidad (ver bibliografía). La capacidad del proceso se determina igual que la capacidad de una máquina pero a partir át muestras tomadas en toda la variedad de condiciones en que debe trabajar la máquina (variedad ác tumos, operarios, materias primas, etc.), y se toma el intervalo de 6 a para definirla. Una vez se tienen los datos, éstos se representan en un gráfico de control para asegurarse de qpr no existen causas de variabilidad asignables. Si, por ejemplo, se presentan puntos fuera de límites, debe identificarse la causa que ha producido esa variación inusual y eliminarla. Si no se es capaz áe identificar cuál ha sido la causa, no hay razón para eliminar el dato, y debe considerarse, al m e o » provisionalmente, que esa variación forma parte del proceso. Por otra parte, las tolerancias del producto deben ser fijadas al concebir el producto en fünció» de las necesidades y expectativas de los clientes (no en función de las características del procesoobviamente). Sin embargo, una vez definidas las especificaciones de un producto es necesario compararlas con la capacidad del proceso. Dado un proceso y dadas unas especificaciones diremos que un proceso es capaz, si puear producir dentro de las especificaciones exigidas, es decir, si su capacidad es menor que las; tolerancias. Para poder comparar estas dos características se define un índice, el índice de capacidad que es una medida de lo que se puede conseguir con el proceso teniendo en cuenta las especificaciones. Los índices de capacidad son universalmente empleados en la relación de las empresas con los proveedores y con los clientes. Así por ejemplo Ford, empresa pionera en la filosofía de mejora continua de la calidad, impone a sus proveedores que la dispersión de la máquina o proceso debe estar contenida dentro de la especificaciones del producto que compra. El índice de capacidad viene definido, dependiendo de si es para una máquina (corto plazo i o para un proceso (largo plazo), de la manera siguiente: _ Cm = _ C p
=
Tolerancia -------------8(7
=
Tolerancia -------------6a
=
---------------
---------------
LTS — LTI Capacidad de maquina 8(7
(11.9»
LTS - LTI Capacidad de proceso 6cr
La diferencia de la definición estriba en que para poder conseguir que el Cp sea aceptable comparando con las especificaciones, se ha de ser más estricto en el Cm de las máquinas que componen el proceso. El valor de Cp da una idea de la variabilidad transmitida por el proceso a los individuos. Si Cp>l se dice que el proceso es capaz; si por el contrario, Cp< l, se dice que no es capaz. En general es preferible que el C sea superior a 1, ya que aquellos procesos con Cp en tomo a 1 han de ser vigilados rigurosamente ya que pequeños descentramientos respecto del valor nominal pueden ocasionar la aparición de un número elevado de individuos defectuosos.
CONTROL ESTADÍSTICO DE PROCESOS
Asimismo, el índice Cp se puede considerar como una medida de lo implantado que está el .ram a de aseguramiento de calidad en una empresa; por ejemplo, en las empresas de oción, pioneras en la aplicación de programas de calidad, se habla de C >1.33 o incluso ores. Para aquellos procesos que no están centrados en el valor nominal, los índices de capacidad muestran la posibilidad de la máquina, o proceso en su caso, de producir dentro de tolerancias caso de que se consiga centrarlos. Es decir, es un índice que indica la capacidad potencial de r cum plir con las especificaciones, pero no tiene por qué coincidir con el comportamiento Para subsanar este hecho se define un nuevo índice de capacidad que se desvía del valor de Cp to mayor es el descentramiento del proceso respecto al valor nominal. Estos índices denominados y Cpk, dependiendo de si se refieren a máquinas o a procesos, vienen definidos de la siguiente era: LTl LTS - X X - LTl LTS - X Cml = pu 3(7 3(7 4cr 4(7 ( 11. 10)
Cm k.
=
mínimo \( c mu », Cm ,) i)
Cpk,
=
mínimo \[ c pu ’, Cpl,))
Es fácil comprobar que Cmk < Cm y Cplc < Cp. En el caso de procesos centrados y simétricos, la ■tedia del proceso coincide con el punto medio de las especificaciones (valor nominal) y, por lo tanto, ^ verifica Cnik = Cmy Cpk = Cp . Ocurre que cuanto mayor es la diferencia entre los dos índices mayor e> el descentramiento. Los valores Cmk y Cpk podrían ser interpretados como índices de capacidad p respecto a la tolerancia más próxima. La tabla 11.3 muestra la relación existente entre distintos valores de Cp y Cpk, y el porcentaje que tales procesos producen dentro de especificaciones cuando están en estado de control. Cabe notar que para valores negativos de Cpk el porcentaje fuera de especificaciones es similar, independientemente del valor de C . En el ejemplo de la planta embotelladora podemos realizar un estudio de capacidad con los datos de la tabla 11.2 sabiendo que las especificaciones del cliente son 200 ± 2 cm3. La capacidad de este proceso puede ser estimada a través del rango medio obtenido con grupos de cuatro observaciones utilizando la expresión (11.2). Así, capacidad del proceso = 6 í = 6 x 1.48/2.06 = 4.32 Para los índices de capacidad, observamos que el proceso está centrado en el valor nominal, entonces Cp = Cpk.= 4/4.32 = 0.93 La producción defectuosa se puede hallar utilizando la distribución de referencia que es la ley normal (200, 0.72): Pr(jc < 198) + Pr(* > 202) = Pr z -
1 9 8 -2 0 0 0.72
+ Pr z >
202
-
200
0.72
j = 2 * Pr(z > 2.78) = 2.4 % o
En consecuencia, el proceso de embotellado tiende a producir cinco botellas de cada 1.000 fuera de especificaciones, lo cual puede ser un número no demasiado elevado. Sin embargo, el hecho de que el valor Cp sea aproximadamente 1 implica que hay que tener cuidado con este proceso, ya que si por alguna causa se descentra, el porcentaje defectuoso se eleva rápidamente, tal como muestra la tabla 11.3.
MÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
K
Cp
0.33
0.33
0.33
0.67
0.67
0.67
0.67
Cpk
0.33
0
-0.33
0.67
0.33
0
-0.33
|i = N
\X = N ±C
[L = N ± 2 o
H= N
^1 = N ± g
[i = N ± 2 c
(i = N ± 3 g
31.7 %
52.3 %
84.3 %
4 .6 %
16%
50 %
84.1%
M edia % Fuera de tolerancias
1
1
1
0.33
Media
|x = N
|i = N ± 2 c
% Fuera de tolerancias
0.3 %
15.9 %
50%
1
1.33
0
-0.33
1.33
0.67
0.33
-0.33
(i = N ± 3 g
^ = N ±4g
ll
Cp Cpk
1
(i = N ± 2 g
|i = N ± 3 g
¡i = N ± 5 c
84.1 %
63 ppm
2.3 %
15.9 %
84.1%
1.33
0.67
0.67
N = valor nominal. Tabla 11.3 Relación entre los índices de capacidad Cp y Cpk, y el % fuera de tolerancias
11.5 Gráficos de control para atributos Existen situaciones en que la característica de calidad que interesa controlar no es una característica medible, sino que es cierto atributo que puede poseer o no el producto. Incluso se pueden estudiar varias cualidades del mismo producto y analizar si permanecen estables a lo largo del tiempo. A veces el atributo va ligado a una característica medible, por ejemplo, cuando en la línea de relleno de botellas presentado a lo largo de este capítulo se controla el número de las mismas que salen fuera de tolerancias. En tales casos, aunque resulta más fácil realizar el control por atributos que por variables, perderemos la información continua que nos puede aportar un control por variables del contenido de cada botella. Un punto muy importante que hay que tener en cuenta en los gráficos de control por atributos, pues de no considerarlo lleva a interpretaciones erróneas en cuanto al funcionamiento del proceso: es el criterio empleado para decidir si un individuo posee la característica a estudio. Tal criterio ha de ser claro y no ha de cambiar mientras se mantienen los límites de control, en caso contrario se han de recalcular los límites y comenzar de cero.
11.5.1 Gráfico P El gráfico P se utiliza cuando los individuos de un proceso se clasifican en defectuosos-no defectuosos, enfermos-sanos, fuera-dentro de tolerancias, etc., y se desea controlar la proporción p de individuos en uno de estos grupos. El control del proceso se realiza anotando la proporción de individuos defectuosos en el gráfico. Los límites del gráfico P son hallados utilizando el modelo teórico que sigue el estadístico a controlar p, que como ya se presentó en el apartado 4.2 puede ser obtenido de la ley binomial. Los límites del gráfico serán obtenidos de tal forma que la probabilidad de ocurrencia más allá de los límites estando el proceso en estado de control sea entorno a un 3%c. Estos límites serán prácticamente simétricos respecto el límite central para tamaños de muestra suficientemente grande y np> 5, (debido a la convergencia a la ley normal), y no tanto cuando las muestras sean pequeñas.
CONTROL ESTADÍSTICO D E PROCESOS
El control de la proporción p se realiza analizando el comportamiento de las proporciones •ales a lo largo del tiempo. Para ello, se aconseja tomar muestras de tamaño lo suficientemente s como para dar oportunidad a que aparezcan, al menos, tres o cuatro unidades defectuosas. Por ejemplo, si extraemos muestras de tamaño 10 en un proceso que genere un 5% de íduos defectuosos difícilmente podremos detectar un aumento en la proporción defectuosa a un . puesto que en ambos casos la mayoría de las muestras no contendrán individuos defectuosos. El r de detección de este cambio, sin embargo, aumenta si las muestras se toman de tamaño 1 0 0 . Una vez presentadas las puntualizaciones anteriores pasemos a la construcción del gráfico. *mos que a diferencia de los gráficos por variables, aquí sólo hay un parámetro independiente del ^r>:eso que es la proporción p (la variabilidad muestral en este parámetro una vez elegido n es p(l-p)/ri). Pasos a seguir en la implementación del gráfico P (supondremos que se clasifican los individuos según sean o no defectuosos) 1) Investigar si existe información histórica de la proporción p de individuos defectuosos generados por el proceso en estado de control. En tal caso construir el gráfico como en 5), sustituyendo la estimación del parámetro. 2) Seleccionar ni permitiendo que aparezcan al menos cuatro defectuosos en media en una muestra. Tomar k (al menos 20) muestras de tamaño ni (n no tiene por qué ser fija) de forma consecutiva y a intervalos de tiempo iguales. 3) Calcular la fracción de individuos defectuosos para cada muestra. Pi
=
n° defectuosos en muestra i
i
( 11. 11)
= 1,2
4) Calcular la estimación de p a través del total de individuos defectuosos encontrados. P
=
^L¡ni Pi 2 , «i
_
( Total defectuosos VTotal muestreado
259
( 11.12)
El valor p será una estimación de la proporción p de defectuosos del proceso si éste ha permanecido estable, sólo afectado por causas comunes, durante la toma de las muestras. 5) Calcular los límites de control del gráfico mediante las fórmulas que siguen. (Si se trabaja con p en %, los límites son iguales excepto que debe aparecer 1 0 0 -p en lugar de 1 -p.) Límite superior Límite central
p
(i - p )
(L .S.) (.L . C.)
(11-13)
Límite inferior Nótese que los valores de los límites superior e inferior cambian con el tamaño del subgrupo: cuanto mayor es n más precisión se tiene en la estimación del parámetro p y antes se detecta un cambio en el proceso. Los límites de control así elegidos están basados en la aproximación a la normal. En general, esta aproximación es válida para la mayoría de los procesos industriales en los cuales la proporción defectuosa se puede estimar en partes por cien. En aquellos otros procesos industriales en los cuales se habla de defectos por mil, se utiliza más la aproximación a la ley Poisson.
MÉTODOS ESTADISTICOS. C O N T R O L Y M EJORA D E LA C A LID A D ------------------------------------------------------------------------------------------ ------------------------- K
6)
Llevar los valores de los p xobtenidos de las k muestras al gráfico, y comprobar que no haya evidencia de que alguna causa asignable haya estado actuando durante la recogida de los datos. En tal caso pasar al apartado siguiente. Si se detecta alguna anomalía, antes de implementar los gráficos aquí construidos se han de identificar las causas asignables y emprender las acciones pertinentes. Sólo en este caso se pueden eliminar las observaciones anómalas y reconstruir el gráfico comenzando por el paso 4). Una vez más, si el cambio en el proceso ha sido notable se ha de comenzar por el apartado 2 ). 7) Mantener los límites de control calculados en el apartado 5) y establecer un plan de control para el futuro con el objetivo de detectar cambios en la proporción de individuos defectuosos que genera el proceso. Este plan contendrá: ► el criterio a utilizar para clasificar a un individuo como defectuoso, que será idéntico al utilizado para calcular los límites; ► el número de individuos que contendrá cada grupo, n\ ► la frecuencia de muestreo. Los dos primeros puntos ya se han tratado anteriormente. En cuanto a la frecuencia de muestreo. que ya se comentó en parte en el apartado 11.3, dependerá de varios factores, entre ellos el ritmo de producción, el coste de inspección y las exigencias de los clientes. Además, esta frecuencia no tiene por qué ser fija. Por ejemplo, puede ser severa cuando se pone un proceso en marcha y algo más relajada cuando el proceso es estable a unos niveles de calidad aceptables. Una vez establecido el plan, los pasos a seguir serán: PROPORCIÓN TAMAÑO DE NÚM. BOTELLAS ► Extraer una muestra de tamaño nr LA MUESTRA DEFECTUOSA DEFECTUOSAS MUESTRA ► Contar el número de elementos defec 100 6% 6 1 tuosos y hallar /?., la fracción defectuosa 4.7 % 150 2 7 ► Llevar p i al gráfico. 4 .2 % 120 5 3 ► Ajustar los límites si n. no es fijo manie10 % 100 4 10 niendo el valor de p. 5.7 % 8 140 5 ► Comprobar si existe evidencia de 7.8% 90 7 6 alguna causa asignable ha entrado en 4 % 100 7 4 proceso. 2% 100 2 8 ► Emprender acciones: actuar cuando al^ 1% 100 1 9 causa asignable entre en el proceso 6% 150 9 10 seguir mientras no haya evidencia de 8.3 % 145 12 11 Existen plantillas para el gráfico3.8 % 130 5 12 para el caso en que el control se r 6% 100 6 13 manualmente. En ellas es conve6 .9 % 160 11 14 apuntar, aparte de la información sis 2 .5 % 120 3 15 cativa del proceso, cualquier incidencia 10% 140 14 16 haya ocurrido durante la toma de datos > 4 % 100 4 17 pueda ayudar a la interpretación del c 7.8 % 90 7 18 tamiento del proceso. 6 % 100 6 19 A continuación construiremos el 9 % 100 9 20 de control para la proporción de Total Total = 136 defectuosas en el proceso de em botella: = 2.335 criterios seguidos para rechazar una Tabla 11.4 Botellas defectuosas encontradas en 20 muestras. sido, además de comparar el contenido
CONTROL ESTADÍSTICO DE PROCESOS
tlcaciones del cliente, defectos de las botellas, mal etiquetado y defectos de cierre. Los datos dos se encuentran en la tabla 11.4. Para la implementación del gráfico P estimaremos la proporción de botellas defectuosas, ’o la proporción de botellas defectuosas encontradas en estas 2 0 muestras y no el promedio de rroporciones de cada una de las muestras. Por lo tanto, P
=
136 2.335
5.82 %
A partir de (11.13) se obtiene el gráfico de control de la figura 11.9 que en este caso por ser el "o de muestra variable, no tiene los límites fijos. Para las dos primeras muestras se obtiene, L. superior = 5.82 + 3^5.82 (100 —5.82) / 100 Muestra 1 n
=
100
=
12.84
=
0
L. central = 5.82 L. inferior = 5.82 - 3^5.82 (100 - 5.82) / 100
(11.15) L. superior = 5.82 + 3^5.82 (100 —5.82) / 150 Muestra 2 n
= 150
=
11.55
=
0.09
El control de la proporción defectuosa se realizará tomando muestras de botellas a intervalos de nempo fijo y llevando la proporción defectuosa hallada al gráfico de control, que mantendrá el límite central en p = 5.82 %, y los límites superior e inferior variables según la expresión (11.13).
Gráfico p
N úm ero de muestra
11.5.2 Gráfico NP
Fig. 11.9 Gráfico P para la proporción de botellas defectuosas
El gráfico NP se aplica al mismo tipo de problemas que el gráfico P, pero cuando el tamaño de muestra es fijo. En tales casos, el control de la calidad en el proceso se puede realizar por el número de individuos defectuosos observados en lugar de la proporción defectuosa. El primero es más fácil de construir que el segundo, ya que no hace falta hallar la fracción defectuosa, y si se quiere interpretar en términos de proporciones sólo se tiene que dividir por n la escala vertical del gráfico. Para la construcción del gráfico se utiliza de distribución de referencia la ley binomial (n, p). En esta distribución, el número medio de individuos defectuosos es igual a np y la varianza igual a np( 1-p). Como en el apartado anterior, sólo se realiza un gráfico y éste controlará el número medio de unidades defectuosas en n.
MÉTODOS ESTADÍSTICOS. C O N T R O L Y M EJORA D E LA CALIDAD
Una vez seleccionado n, si no se conoce p se ha de estimar su valor. Para ello es recome seguir los pasos que a continuación se señalan, puesto que además de dar una estimación óe comprueban si el proceso ha estado bajo control durante la estimación del parámetro. Los pasos a seguir son: 1) Investigar si existe información histórica de la proporción p de individuos defectuosos genera el proceso. En tal caso elegir n y construir los gráficos basándose en los límites: Límite superior
np + 3 yjnp ( l - p)
(L .S .)
Lím ite central
np
(L.C .)
Límite inferior
np —3 y]np{ 1 - p)
(L. /.)
n i
pasando directamente al paso 7). 2) Seleccionar n permitiendo que al menos aparezcan cuatro o cinco defectuosos en medn muestra. Tomar k (al menos 20) muestras de tamaño n de forma consecutiva y a interv tiempo iguales. 3) Contar el número de defectuosos en cada muestra. d. = n p t
con
i'= 1 , 2 ,
k
4) Calcular el número medio de defectuosos por muestra promediando por el total de mi 262
v ¿I k
=
n
P\ +
P 2 +
••• +
Pk
np
Este valor será un estimador de np, la media teórica de elementos defectuosos del grupos de tamaño n. 5) Calcular los límites de control del gráfico mediante las fórmulas en (11.16), su stim y valor de np por su estimador n p. Nótese que la amplitud del gráfico, o cotas de variabilidad permisible en estado de aumenta con el tamaño del subgrupo. Ello no quiere decir que se consiga menos cuanto mayor es el valor de ny sino todo lo contrario. (Dejamos al lector tal compi se puede obtener simplemente con un cambio de la escala dividiendo por n.) Al igual que en los gráficos P estos límites están basados en la aproximación de la la normal bajo las condiciones comentadas en el apartado 4.2. 6) Llevar los valores del número de defectuosos por grupo al gráfico, y comprobar que obtención de las muestras el proceso ha estado bajo control. En tal caso tom ar el obtenido de np para el futuro y pasar a la fase siguiente. Si existe evidencia de que alguna causa asignable ha entrado en el proceso, antes de se ha de identificar tal causa y tomar las medidas adecuadas. Sólo en tal caso se el información de los grupos afectados y se reconstruirán los gráficos a partir del p***| aquellos casos que las medidas correctivas hayan producido un cambio signifii naturaleza del proceso, se deberá comenzar el proceso desde el paso 1 ). 7) M antener los límites de control calculados siempre y cuando no se cambie el diseño d d y el criterio de clasificación de los productos, y establecer un plan de control para e. como se comentó para el gráfico P.
CONTROL ESTADÍSTICO DE PROCESOS
Gráfico C (2) ocasiones la característica que nos interesa controlar no es el número de individuos sino el número de defectos que aparecen en un individuo. Este tipo de control puede ser to que los presentados anteriormente puesto que: d individuo puede no ser defectuoso y presentar defectos; d carácter defectuoso puede ser de distinta magnitud dependiendo de la cantidad de defectos gue presenta. En aquellos procesos que no generan individuos, como por ejemplo, los procesos continuos, nos puede interesar el control del número de defectos por cierta unidad definida: metro, metro . hora, etc. Otros ejemplos en los que se puede aplicar estos gráficos son cuando se desea el n° de pasajeros que toman un vuelo determinado por día, o el n° de camas ocupadas en un por semana, o el n° de personas que pasan por una caja registradora de unos grandes almacenes En uno u otro caso, este tipo de control puede ser llevado tomando la distribución de referencia fct jey Poisson (X), donde X representa el número medio de ocurrencias por unidad de tiempo, ie. etc. Cuando X es suficientemente grande se puede hacer una aproximación de la ley Poisson por la nial, tal como se vio en el apartado 4.3. Para la implementación del gráfico de control hay que tener en cuenta que sólo hay un parámetro idiente a controlar, X, ya que la varianza en la ley Poisson es también X. Supondremos en lo que que se mide el número de defectos de estampación por metro cuadrado de tela. Los pasos que se deben seguir en la construcción del gráfico C son los siguientes: ] > Seleccionar lo que va a ser una unidad de medición: un individuo, un metro de cable, un metro cuadrado de tela, una hora, etc., permitiendo que en tal unidad ocurran en media al menos 1 0 ocurrencias del fenómeno a estudio. I \ Investigar si existe información histórica del parámetro X: número medio de defectos por metro cuadrado. En tal caso construir los gráficos basándose en los límites: Límite superior =
A + 3\/A
(L.S.)
Límite central
=
A
(L.C.)
Límite inferior
=
A - 3 VA
(L. /.)
(11.18)
pasando directamente al paso 5). 3) Tomar k (al menos 20) piezas de un metro cuadrado de tela de forma consecutiva y a intervalos de tiempo iguales. Contar el número de defectos en cada pieza y calcular el valor medio A =
Í 4 1
'
= 1’ 2 ’- ’ h
(1119)
i=l k
llevando este valor a la expresión (11.18). Cuando el valor de X no es muy grande, la convergencia a la normal no es muy buena. En tales casos el límite inferior suele ser negativo, lo cual no tiene ningún sentido, y se sustituye por 0 .
Llamado gráfico C porque controla las no-conformidades. Aunque en la mayoría de libros se utiliza la notación de la letra C en lugar de la X, nosotros utilizaremos esta última.
263
MÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
4) Acomodar los datos obtenidos en 3) y seguir las mismas reglas de control que con los gráficos anteriores. 5) Con los gráficos definitivos, establecer un plan de control para el futuro. Como ejemplo de aplicación presentamos los datos de la tabla 11.5, que recogen el número defectos de estampación encontrados por m 2 en un proceso textil. A partir de estos datos, durante recogida de los cuales se puede comprobar en la figura 1 1 . 1 0 que el proceso ha estado bajo control, elaborará el gráfico de control a utilizar en un futuro. A partir de estos datos se puede estimar el valor de X utilizando la expresión (11.19),
X
=
| >
feclos.
2 ^ unidades
=
m 30
=
7.83
(11
y, por lo tanto, los límites de control del gráfico C se mantendrán en 7.83 ± 3VX83 , tal como ap en la figura 1 1 . 1 0 .
264
NÚM. DE
NÚM. DEFECTOS
NÚM. DE
NÚM. DEFECTOS
OBSERVACIÓN
POR m2
OBSERVACIÓN
POR m 2
1
9
16
6
2
9
17
9
3
7
18
13
4
14
19
7
5
8
20
6
6
5
21
11
7
5
22
5
8
5
23
8
9
6
24
10
10
9
25
6
11
4
26
5
12
7
27
10
13
4
28
8 9
14
11
29
15
10
30
9 Total = 235
Número de observación
Tabla 11.5 N° de defectos de es por m 2 en un proceso de estam
Fig. 11.10 Gráfico C para el númer: estampación por m2 en un proceso
U
-------------------------------------------------------------------------------------------------------------------------------------- — — ------------- CONTROL ESTADÍSTICO DE PROCESOS
11.5.4 Gráfico U El gráfico U se utiliza para el mismo tipo de problemas que el gráfico C, pero en aquellos casos en que no se puede tomar una unidad del mismo tamaño para controlar el número de defectos. A continuación se presentan algunos ejemplos donde esto ocurre y que pueden ser representativos de las situaciones generales: ► Puede resultar difícil tomar exactamente un metro cuadrado de tela, por lo que se toman piezas similares de aproximadamente un metro cuadrado. ► En el control del número de personas que acuden a una máquina registradora en una tienda, en lugar de tomar las mediciones en intervalos de tiempo iguales, se toman las mediciones en intervalos más flexibles. ► Cuando se mide el número de defectos por lote, éste puede no contener un número fijo de individuos. En el gráfico U se colocan igualmente el número de defectos por unidad, pero ahora no tiene porqué ser un valor entero. La distribución de referencia en la cual está basado el gráfico U puede ser calculada a través de la ley Poisson. En efecto, si ci = n° de defectos en la muestra i, n. = unidades inspeccionadas en la muestra i, u = c .J n. será el n° de defectos por unidad en la muestra i, los valores ux seguirán una distribución de Poisson de media: 265
“
=
i
2>.
=
( 1 1 .2 1 )
1
Cuando en lugar de tomar una unidad tomamos nx unidades, la variabilidad muestral de V[u,]
=
=
JL
es, (11.22)
y, por lo tanto, los límites de control del gráfico U se obtendrán a partir de las expresiones (11.18), ( 1 1 .2 1 ) y ( 1 1 .2 2 ) como, Límite superior Límite central y
Limite inferior
¿7 + 3 — \n t
(L .S.)
ü
(L.C.)
IÜ u —3 — v n.
(L .I.)
—
Por lo tanto, los pasos a seguir en la implementación del gráfico U serán para el gráfico C con la diferencia que:
(11.23)
id é n tic o s
a
lo s s e g u id o s
>. el valor que se lleva al gráfico es u , el número medio de defectos por unidad, y no el número de defectos encontrados en la muestra (conteniendo n unidades); *• los límites de control no son fijos sino que dependen del tamaño de muestra.
MÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
r
11.6 Otros gráficos de control 11.6.1 Gráfico CUSUM El gráfico CUSUM (sumas acumuladas) puede ser aplicado en áreas muy variadas tales como contra! de procesos industriales, administración, ciencias médicas, marketing, comercio, biología, etc. En esar capítulo presentaremos la aplicación de los gráficos CUSUM al control de procesos industriales. Los gráficos de control CUSUM surgieron como una alternativa a los gráficos Shewart pont detectar cambios moderados en los parámetros del proceso (en tomo a 0.5-2 a, siendo a la desviación estándar de los valores observables). Las diferencias principales entre los dos gráficos se deben ¿ Vmi objetivos que persiguen. Mientras que el objetivo de los gráficos Shewart es detectar la aparición de causas asignabk»; de variabilidad, el objetivo del CUSUM es algo diferente. Durante el control con CUSUM se fabricar en torno a un valor nominal o target T y se pretende detectar cualquier evidencia alejamiento por parte del proceso de T en una magnitud superior a un valor preestablecido. Este valor T puede ser, dependiendo de la característica a estudio: ► Un valor constante: el valor nominal de una variable continua, la varianza del proceso G:. proporción de individuos defectuosos /?, etc. ► Un valor no constante: los valores que predice un modelo teórico. Para la presentación de los gráficos CUSUM nos basaremos en el caso particular en el que pretende controlar la media de cierta característica y en tal caso T=\x. A igual que en los gráficos X -R se han de tomar muestras de tamaño n del proceso, a interde tiempo equidistantes, y se ha de calcular la media x . y el recorrido, R x. A partir de estos datos, en cada instante k, se obtiene el estadístico Ck: k
Ck = X (*¿ “ ^)» siendo en este caso particular T = ¡i i=i que es el que se llevará al gráfico CUSUM. Este valor acumula las discrepancias de los \ observados respecto al valor nominal. Si el proceso está bajo control produciente media |x=Ty los sumandos positivos y negativ as compensarán unos con otros y observaremos a Ck alrededor de 0 (u otro valor fijo), tal como se m la figura 1 1 . 1 1 . Por el contrario, si la media del proceso no con 7", las discrepancias de los valores observados T se acentuarán en un sentido, dependiendo de >c superior o inferior al verdadero valor de p, y por k el gráfico CUSUM tendrá una apariencia similar a las presentadas en la figura 1 1 . 1 2 . Fig. 11.11 Gráfico C U SU M cuando el proceso está Por lo tanto, en un gráfico CUSUM la bajo control con T=ja del valor representado no tiene tanto interés come gráficos Shewart, pues aquí la importancia la tiene la pendiente que forma una trama de puntos En consecuencia, una trama de puntos horizontales, sea cual sea su magnitud, pueoe interpretada como que en ese período de tiempo no hay evidencia de que la media del proceso T. Por el contrario, el alejamiento de la horizontal da pruebas de cambios en la media del cuanto mayor sea la pendiente, mayor será la discrepancia entre |i y T.
CONTROL ESTADÍSTICO DE PROCESOS
Fig. 11.12 gráficos C U SU M cuando el proceso no está bajo control: a) jj > T. b) ja< T
Por ejemplo, la figura 11.13 presenta un que se ha mantenido con media \x=T al enzo de la im plem entación del gráfico SUM; posteriormente la media del proceso ha a ser más pequeña, volviendo a su valor ial T durante un período intermedio. Al final la media del proceso nuevamente ia a un valor mayor que T. Si comparamos esta iente creciente con la anterior decreciente, mos sospechar que el último cambio experi:ado en la media es de mayor magnitud. Como ya se ha mencionado, el análisis de los Fig. 11.13 gráfico C USU M para la media de un proceso os CUSUM se hará analizando la pendiente de r am a de observaciones seguidas. Por lo tanto, los límites de control en lugar de estar formados por paralelas estarán formados por dos “pendientes”, que representarán las máximas pendientes tidas antes de concluir que hay pruebas de que causas asignables están actuando en el proceso t ocando un cambio en media superior a la admitida. La pendiente de los límites de control dependerá de cuatro factores: ► La escala del gráfico. ► La variabilidad innata del proceso, <7 . ► El cambio en el parámetro del proceso que se pretende detectar. ► El riesgo que se admite tomar en las decisiones (a). En cuanto a la escala del gráfico se recomienda que la escala del eje vertical (o escala CUSUM) •jerga la siguiente relación con la escala del eje horizontal (o escala del tiempo), 1 unidad escala horizontal = 2 cr escala vertical = A, (11.25) ¿onde cr es la desviación estándar del estadístico del cual se obtienen las sumas acumuladas. Por ejemplo, si c e=5, y colocamos las observaciones en el gráfico CUSUM con una separación de un centímetro en la horizontal, en la escala vertical un centímetro representará 1 0 unidades de la característica que se mida. La variabilidad innata del proceso influye directamente en los límites de control: a mayor variabilidad más fácil es encontrar tramas de puntos en pendiente y más acentuadas pueden ser éstas estando el proceso bajo control. Por lo tanto, para la construcción del gráfico se ha de estimar cr , o desviación estándar del estadístico obtenido de la muestra. Esta puede tomar diferentes expresiones dependiendo de la característica que se estudie, y puede ser estimada de la misma manera que en los gráficos Shewart.
267
X
MÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
Algunas de las formas que puede tomar cr son: si se toma la medida de cierta característica que varía con desviación típica ay si se toman proporciones de individuos defectuosos; ► yjnp (l - p ) si se toma número de individuos defectuosos; ► VA si se toma número de ocurrencias por unidad. A continuación daremos las pautas a seguir en la construcción de los gráficos CUSUM. ello nos referiremos al caso particular en el que se quiera controlar la media de un proceso que. en momento de la implementación del CUSUM, esté centrada en el valor nominal \x=T. 1) Tomar muestras de tamaño ri a intervalos de tiempo equidistantes y obtener la media, x . \ recorrido, R., de la característica a estudio para cada una de las muestras. 2) Calcular en cada instante la suma acumulada de las discrepancias de los valores obtenida 1) con el valor nominal T=\x. i=l 3) Obtener una estimación de a e = se = s /y f ñ . Ésta puede ser obtenida en función del r medio de un número suficientemente grande de muestras como: R /d 2
268
(11
(1
S‘ " 4~n 4) Determinar el nivel de probabilidad a , o riesgo que se está dispuesto a asumir en la decisiones, en cada uno de los lados del gráfico. ( a = 0.00135 en los gráficos Shewan i 5) Definir el factor de escala del gráfico. Es recomendable que 1 unidad horizontal =2 se unidad vertical = A 6)
Determinar el menor cambio D en media que se quiere detectar y calcular 5 = D /s
7) Obtener, a partir de 5, la distancia principal d _ 2 1 n (1-/3/a) S2
o, si [5 es pequeña, d = ~ ~
2 ln ( a )
donde (3 es la probabilidad de no detectar un cambio de D unidades en la media, y e 6 = arctg (D / 2Á) 8)
A partir de d y 0 construir la plantilla que definen los límites de control, tal como >e la figura 11.14. Para la interpretación del gráfico CUSUM, el punto O en la plantilla se ha de último valor de Ck obtenido. Si alguno de los puntos anteriores queda cubierto por la interpreta que alguna causa asignable ha entrado en el proceso y ha provocado un cambio superior a D unidades. Además se ha de tener en cuenta que: ► el primer punto cubierto por la plantilla muestra el momento en que el proceso ha bajo control; ► si los puntos están cubiertos por encima de la plantilla es que la media del proceso ha ► si los puntos están cubiertos por debajo de la plantilla es que la media del proceso ha
CONTROL ESTADÍSTICO DE PROCESOS
Er
la interpretación de los gráficos de la manera aquí expuesta hay que precauciones. La primera es que la d del proceso ha de permanecer , para ello se ha de llevar un control ¿e la misma. En segundo lugar, los gráficos así s no son muy eficaces en la detección os graduales en media o en los cambios « rg en y desaparecen rápidamente del Por lo tanto es recomendable usar los CUSUM para detectar “saltos” en la del proceso y paralelamente los gráficos para ayudamos a interpretar otro tipo alias.
M om ento en que el proceso cam bia
Fig. 11.14 control
Gráfico de control C U S U M con la plantilla de
y G ráficos EW M A gráfico EWMA (Exponentially Weighted Moving Average), o gráfico de medias móviles con pesos :nciales, fueron introducidos en 1971 por Wortham y Ringer, una vez más para suplir la deficiencia ftots gráficos Shewart en detectar determinados alejamientos del proceso de su estado de control. Esta necesidad surgió de las empresas de procesos químicos. Tales procesos, ante la presencia causas asignables, veían modificados sus parámetros generalmente de una manera muy lenta y de gradual, no a saltos. Cuando tal hecho ocurría, la aplicación de gráficos Shewart era insensible a tales cambios o, en mejor de los casos, de efectos muy retardados. Por otra parte los gráficos CUSUM tampoco eran uados puesto que los cambios no eran escalonados y, por consiguiente, se interpretaba mal el íonamiento de los procesos. El gráfico EWMA posee “memoria”, pero ésta es de diferente naturaleza que la de los gráficos SUM. Mientras que estos últimos daban igual peso a cualquier instante en el pasado, lo que se denomina “memoria de elefante”, los priüseros dan pesos a los datos de una manera exponencial: contribuyendo en mayor SHEWART CUSUM cantidad al presente y cada vez menos 100 100 cuanto más alejados están en el pasado, lo 50-1I 504que se denomina “memoria humana”. Este 0 o I I I I II I I I I I I hecho queda plasmado en la figura 11.15. Una característica que diferencia a los gráficos EWMA del resto es que la interpretación del gráfico se hace en 100 — función del comportamiento esperado del proceso en el instante siguiente. Para ver todos estos puntos definamos primero el estadístico a utilizar en el gráfico EWMA. Este es una media, Fig. 11.15 Pesos de los datos en la interpretación del gráfico en el pero con pesos exponenciales, presente t para gráficos Shewart, C U SU M y EW M A
269
M ÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
EWMA
9t+1
=
+ A(l —A)yM + A(l - A ) y f_ 2 + A ( l - A ) y t_3 + ...
(113'.
Tal estadístico depende de los datos anteriores a través de un peso que decrece de formm exponencial. Operando con la anterior expresión, yt.
h y t + (l - A) [a y t_x + A (l - a ) y t_2 + A (l - a ) yt_3 + .. .j y t+1
=
ii
¿yt+{l -¿)y,
yt+i = y, +*{yt - yt) se llega a la expresión y,+, = y, + A e, En ella, a y t+l se le denomina “predicción” para el instante í+1 hecha en el instante r. y paNfl obtenerse a partir de la “predicción” en el instante t - 1 hecha para t y el “error de predicción”, conresiB por un factor de X. Hay que entender que este estadístico así construido no predice el valor que se va a obtrmtw el proceso, puesto que el valor previsto para observaciones independientes de un proceso en estaái control es la media. En cambio, es un valor que acumula la información del pasado, permitieró^ detectar pequeños cambios graduales en la media del proceso. Así, si el proceso está afectado únicamente por causas comunes, el estadístico yJ+, se ors por suma de datos independientes distribuidos según una ley normal de parámetros W(n,G; v r»;r tanto, yt+l seguirá una distribución normal con: 270
E[ y , +l] -
ÁE[ y , ] + A ( l - X) E[ y t_1] + A(l - x f E[y,_2] + A(l - A) 3 E[ y E [ y t+i] = / í ¿ A ( 1 - A ) k= 0
v [9,+l} =
= H
A2 V [y, ] + A2 (l - a ) 2 y [y,_t ] + A2 (l - a )4 V [y,_2] + A2 (l - a ) &V [y,_3] v [yf+i] =
a-
X (i - a )
*=0
Es decir, al ser yí+, distribuido según una control definidos por
= o-
A 2 - A
Límite superior =
¡u + 3 a ^(A 12 - A)
Límite central
/i
=
Límite inferior =
^ - 3cj ^(A 12 - A)
y construir así el gráfico de control EWMA. En él representaremos las predicciones >r_ é í+1. Si se detecta alguna de las anomalías descritas en el apartado de gráficos X -R. ñc i medidas oportunas en el tiempo t. Además, recomendamos añadir en el gráfico EWMA las observaciones originales : con sus límites correspondientes, ya que así,
CONTROL ESTADÍSTICO DE PROCESOS
► no se pierde las referencias reales de la característica de calidad bajo estudio; ► permite calcular de una manera sencilla los valores del EWMA, yt+l, en cada instante. La sensibilidad los gráficos EWMA para detectar cambios en el proceso depende del valor que e X. Si X - 1, el valor de EWMA depende totalmente de las observaciones más recientes y el rtamiento del gráfico es similar al del gráfico Shewart. Sin embargo, conforme X - 0 se da más al comportamiento histórico del proceso, y en tal caso estamos acercándonos al tratamiento de los neos CUSUM. Aunque la elección de X es libre y ajuicio del investigador, si se usan los gráficos *MA para aplicarlos sobre procesos que en estado de control generan observaciones que se pueden iderar independientes, X será seleccionado en función del cambio que se desea detectar. Para aquellos procesos que en “estado de control” generan datos dependientes, bien porque las asignables no se pueden eliminar o bien porque las mediciones se toman muy seguidas, por pío cuando se realizan lecturas automáticas, no se recomienda la aplicación de estos gráficos, sino variante de los mismos que se presenta al final del capítulo.
7 El precontrol precontrol se utiliza como un método de control estadístico de procesos, que responde al objetivo controlar la variabilidad del proceso que pueda provocar la aparición de individuos fuera de andas. Tal variabilidad puede ser provocada tanto por causas comunes como asignables. Respondiendo a tal objetivo, algunos casos en que se utiliza el precontrol son: ► procesos en los que existe una variación importante de la característica a controlar dentro de su margen de tolerancias; ► procesos de corta duración en los que se sabe que existen problemas de “puesta a punto” al comienzo de la producción, pero requieren poco seguimiento posteriormente. Por lo tanto, la intervención en el proceso sólo se realiza en función de la posición del individuo cto de sus especificaciones, y se dice que un proceso está en estado de control si permanece dentro las líneas de precontrol que a continuación presentamos, independientemente de si está afectado por as asignables de variabilidad. El gráfico precontrol se construye de acuerdo con las especificaciones del producto, y se divide zr. tres zonas a cada lado de la línea central que son pintadas de diferentes colores: verde, amarillo y ■ojo. A los límites que separan las zonas verdes de las amarillas se las denomina líneas de precontrol. La implementación de estos gráficos se lleva a cabo de la siguiente manera: 1) Construir el gráfico tal como se ha comentado anteriormente. 2) Para determinar si el proceso es capaz, tomar cinco mediciones consecutivas del proceso. Si todas caen en la zona verde, se considera que el proceso está en estado de control y se ha de continuar la producción en las condiciones actuales. Si en cambio, al menos una no cae en la zona verde, se considera que el proceso no está bajo control y se ha de intentar reducir la variabilidad, bien identificando causas asignables o bien utilizando técnicas de diseño de experimentos. Una vez realizadas las acciones adecuadas se comienza otra vez. 3) Una vez el proceso está bajo control, tomar dos mediciones consecutivas periódicamente. La posición de estas unidades determinará las medidas que se deban tomar: ► Si las dos caen en la zona verde, o una en la verde y una en la amarilla, se continúa. ► Si las dos caen en la zona amarilla al mismo lado se ha de ajustar el proceso. ► Si las dos caen en la zona amarilla en distinto lado, se ha de estar atento al proceso para una posible intervención.
X
MÉTODOS ESTADÍSTICOS. C O N T R O L Y M EJORA DE LA CALIDAD
Z ona Roja Tolerancia Superior Zona Amarilla Zona Verde Lineas Pre-Control
V alor Nominal Zona Verde Z ona Amarilla Tolerancia Inferior Zona Roj¡
Fig. 11.16 Gráfico precontrol
frecuencia =
► Si alguna cae en la zona roja, se ha De parar la producción, buscar las causas q-jer han provocado esta unidad defectuosa y eliminarlas. Nótese que siempre que se actúe sobre eá proceso se ha de comenzar el precontrol m partir del paso 2 ). La frecuencia del muestreo variar en función de la salida del siendo recomendable tomar dos unidades una frecuencia de:
tiempo medido entre dos paradas del proceso
lo cual hace que aquellos procesos que se comporten bien sean muestreados con poca frecuenci*. Los gráficos precontrol son muy sensibles cuando actúan sobre procesos en los que 6 es que las especificaciones y obligan a una mejora del proceso. Sin embargo, para aquellos pi que 6 es mucho menor que el intervalo de especificaciones, el precontrol permite producir unidades sin actuar sobre el proceso.
272
11.8 G ráficos de control para observaciones dependientes El presente capítulo ha tratado el control estadístico de procesos en el supuesto de que el estado de control muestre observaciones independientes entre sí. Con tal hipótesis, toda evi no aleatoriedad era interpretada como presencia de causas asignables y, por tanto, se debían e acciones para encontrar las causas asignables y actuar adecuadamente sobre ellas. Sin embargo, existen procesos que muestran dependencia entre las observaciones presencia de ciertas causas asignables, que actúan continuamente sin poder ser elimin¿c¿¡ procesos continuos son un claro ejemplo de estos procesos. En tales procesos, la aplicación técnicas clásicas de SPC conlleva la aparición continua de patrones anómalos sin que se pueda sobre ellos en la mayoría de las veces. La estrategia a seguir para el control de procesos con datos dependientes es, por tanto, a la presentada en este capítulo, existiendo dos maneras de analizar y, en consecuencia, de La primera se sigue d SPC y consiste en acomodar los Zt anteriores al modelo que sigue la \ Proceso del proceso. Tales modelos, asi Yt gráficos de control apropiados, et = Zt + Yt Nominal estimados empleando la met: Xt Jenkins (1976). La segunda técnica u Ecuación de denomina control estadístico y Control y adaptativo, de procesos (ASPC* > en, además de realizar un control Fig. 11.17 Esquem a del control adaptativo de procesos del proceso para la detección
CONTROL ESTADÍSTICO DE PROCESOS
les de variabilidad, realizar ajustes en el proceso siempre y cuando éste se aleje blemente de su valor nominal. La figura 11.17 presenta un esquema de esta técnica. Igualmente es necesario estimar el modelo que sigue el proceso Zt, afectado por causas comunes, rer el mecanismo de corrección del proceso o función de transferencia Yt = F(Xt, Xt l,...)y siendo variable del proceso que puede ser modificada convenientemente para ajustar el proceso una 4 A Yr Si además se incluyen los criterios de costes, la estrategia de control varía. Una vez más que quiera ampliar conocimientos sobre el tema puede hacerlo a través de las lecturas ndadas al comienzo del capítulo.
M ÉTODOS ESTADÍSTICOS. C O N T R O L Y M EJORA DE LA CALIDAD
Ejercicios 11.1.
En un cierto proceso de fabricación, una de las operaciones consiste en efectuar un corte er. pieza de plástico. Dicho corte debe tener una profundidad especificada en los planos. D ad: en el procesado posterior de dichas piezas se tenían problemas debido a piezas con cone> adecuados, un ingeniero decide recoger información del proceso. Para ello recogió datos de 25 conjuntos de piezas cada uno a intervalos de tiempo de 15 y midió la profundidad del corte obtenido. Los datos obtenidos son los de la tabla adjunta PROFUNDIDAD DEL CORTE
CONJUNTO N°
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
160.0 159.7 159.2 159.5 159.6 159.8 159.7 159.2 159.4 159.5 159.4 159.5 159.7 159.3 159.7 159.1 159.2 160.0 159.9 159.5 159.9 159.6 159.8 159.3 159.3
159.5 159.5 159.7 159.7 159.3 160.5 160.2 159.6 159.3 159.5 159.6 160.0 159.3 159.9 158.8 158.9 159.8 159.9 159.7 160.6 159.9 159.5 159.4 160.3 159.7
159.6 159.5 159.7 159.2 159.6 160.2 159.5 159.6 159.3 159.5 159.6 160.0 159.3 159.9 158.8 158.9 159.8 159.9 159.7 160.6 159.9 159.5 159.4 160.3 159.7
159.7 159.5 159.5 159.2 159.5 159.3 159.0 160.0 159.9 158.9 159.8 159.3 159.4 158.5 160.6 159.6 159.8 160.3 159.6 160.6 159.5 159.7 160.0 159.9 160.1
159.7 160.0 160.2 159.1 159.4 159.5 159.7 159.9 159.5 159.5 159.8 159.4 159.2 159.5 159.1 159.7 159.7 159.3 159.3 159.8 161.0 159.5 159.7 160.0 160.1
X
R
159.7 159.6 159.7 159.3 159.5 159.9 159.6 159.7 159.6 159.5 159.4 159.6 159.4 159.4 159.5 159.5 159.7 160.0 159.7 159.9 160.0 159.9 159.8 160.0 159.8
0.5 0.5 1.0 0.6 0.3 1.2 1.2 0.8 0.6 1.3 1.5 0.7 0.5 1.4 1.8 0.8 0.8 1.2 0.8 1.1 1.5 1.6 0.8 1.3 0.8
a) Represente las medias de cada conjunto de cinco piezas, en secuencia temporal y c información que contiene dicho gráfico. b) Represente la secuencia temporal de evolución de la amplitud y, a la vista de la inf obtenida con los dos gráficos anteriores, haga un resumen del comportamiento de les la operación de corte. 11.2.
En una determinada empresa, se producen piezas A y B que se ensamblan tal como se en la figura: Los siguientes datos (en mieras) co h mediciones de la dimensión b de la p i e a 1 _______ son las medias y rangos de 24 subgrupos I hora) de cuatro unidades cada uno. Les b 3 tomaron durante los tres tumos de «r —— — ------------------- ---------producción.
CONTROL ESTADÍSTICO DE PROCESOS
K
TURNO 3
TURNO 2
TURNO 1
R
R
SUB
X
R
SUB
X
1
2 8 8 .5 0
16
9
2 9 6 .0 0
2
17
2 9 6 .0 0
6
2
2 8 1 .7 5
19
10
2 9 2 .7 5
12
18
3 0 1 .2 5
26
X
SUB
3
2 9 4 .2 5
15
11
2 8 9 .2 5
22
19
2 9 6 .7 5
23
4
2 8 4 .7 5
17
12
2 9 9 .0 0
8
20
2 9 4 .0 0
13
5
2 9 3 .0 0
28
13
2 8 2 .7 5
9
21
2 9 6 .0 0
18
6
2 9 3 .0 0
18
14
2 9 6 .0 0
16
22
2 9 8 .0 0
16
7
2 9 1 .2 5
17
15
2 8 4 .2 5
21
23
2 8 9 .5 0
19
8
3 0 0 .2 5
3
16
2 9 5 .0 0
20
24
2 8 5 .0 0
15
a) Representar y comentar el gráfico medias-rangos. La capacidad del proceso (6 a ) de fabricación de la pieza B con respecto a la dimensión de b es de 45.6. b) ¿Que relación hay, y bajo que condiciones entre la capacidad del proceso y los límites de control? ¿Se cumple en este caso? 11.3.
Después de un lamentable accidente, una empresa de ascensores decide implantar el control estadístico en su proceso de fabricación de pernos. Para ello, se toman cuatro pernos en cada tumo y se someten a una prueba de resistencia. Los datos, después de ocho días de trabajo son los siguientes: DÍA
TURNO 1
TURNO 2
TURNO 3
X
X
X
R
R
1
2 7 .0
5
2 5 .3
11
2 6 .5
3
2
2 9 .0
2 12 11
2 6 .5
28
2 6 .5
24
2 1 .5
13
2 5 .5
13
1 7 .8
33
1 9 .3
35
12
3
3 0 .8
4
2 4 .3
5
2 3 .5
18
3 0 .5
14
2 9 .3
6
2 6 .8
12
8.1
4
1 0 .3
3
7
3 0 .3
18
3 0 .0
15
2 0 .0
10
8
5 .3
12
1 4 .8
14
1 8 .0
9
X = 2 2 .7 9
Realizar los gráficos de control que se crea convenientes y comentarlos.
R
R = 1 3 .7 9
11.4.
Se quiere realizar un gráfico de control x -R tomando muestras de cuatro unidades. Se comprueba que los límites de control LCL y UCL toman los valores de la tolerancia inferior y superior respectivamente, y el valor nominal coincide con LC. ¿Cuál es la proporción esperada de piezas defectuosas?
11.5.
En una máquina que produce bobinas de papel aparecen en promedio 0.7 manchas cada 10 metros. Cada treinta minutos el operador observa pasar 10 m de papel y anota el número de manchas en un gráfico. ¿Cuál es el gráfico adecuado y cuáles son los límites de control?
11.6.
Una máquina produce piezas de mica. Se toman 50 piezas consecutivas y se mide el grosor: 8 .0
1 2 .5
1 2 .5
1 4 .0
1 3 .5
1 2 .0
1 4 .0
1 2 .0
1 0 .0
1 0 .0
1 0 .5
8 .0
1 5 .0
9 .0
1 3 .0
1 1 .0
1 0 .0
1 4 .0
1 4 .5 1 1 .0
1 2 .0
1 0 .5
1 3 .5
1 1 .5
1 2 .0
1 5 .5
1 4 .0
7 .5
1 1 .5
1 1 .0
1 2 .0
1 2 .5
1 5 .5
1 3 .5
1 2 .5
1 7 .0
8 .0
1 1 .0
1 1 .5
1 7 .0
1 1 .5
9 .0
9 .5
1 1 .5
1 2 .5
1 4 .0
1 1 .5
1 3 .0
1 3 .0
1 5 .0
MÉTODOS ESTADÍSTICOS. C O N T R O L Y MEJORA DE LA CALIDAD
a) Realizar el estudio de capacidad de los datos anteriores, dando el valor de la media. .2 desviación tipo y la capacidad de la máquina. b) Si se consideran aceptables las piezas entre 6.75 y 15.75, ¿es capaz dicha máquina? ¿Cúal e> Cp? ¿Qué fracción de la producción será defectuosa? c) Hacer el estudio gráfico para que sólo el 1% de las piezas sean más grandes de 14.0 y sólo jz. 3% sean más pequeñas que 7. ¿Cuáles serán los nuevos valores de la media, desviación tipo j capacidad? 11.7.
Una característica de calidad de un producto con tolerancias (7.9, 12.1), se distribuye segúr. normal 7V(10, 1). El proceso se descentra y pasa a fabricar alrededor de 10.5. ¿Qué se p-c-. decir de la capacidad del proceso?
11.8.
Un fabricante de botellas de PVC detecta que el número de botellas producidas es inferior a que debería ser, dado el consumo de materia prima (PVC). Se sospecha que la diferencia =* debida a que se producen botellas con un peso superior al especificado (33 ± 0.4gr. • Pjc* comprobarlo se decide realizar un estudio de capacidad pesando 50 botellas. Los ^ recogidos, en gramos, son: 33.0 32.6 33.0 32.8 32.6
276
32.7 32.9 32.8 33.4 33.3
33.0 32.8 33.0 33.5 33.0
33.2 33.4 32.4 32.6 33.1
32.7 32.7 33.1 33.4 32.9
33.1 33.0 33.0 32.7 32.9
32.9 33.4 33.2 32.8 33.1
33.1 32.9 33.1 32.8 33.1
33.2 33.0 33.3 33.1 32.5
32.9 33.2 32.9 32.9 33.0
a) Realizar un estudio de capacidad, determinando la media y la desviación tipo. b) ¿Qué porcentaje de piezas se puede esperar que no estén dentro de los límites especifica c) Según el estudio realizado, para conseguir que como máximo se produjesen el 1% de bo con exceso de peso y un 5% con un peso inferior al especificado, ¿debería variar la medfafl la desviación tipo? ¿Cuáles son los valores que se deberían tomar? 11.9.
Una empresa de helados se dedica en una de sus plantas a la fabricación de hel.^i:» chocolate. El helado es vendido en tarrinas de 1.5 di. Se decide comenzar un estudio j del proceso, y para ello se extraen cuatro tarrinas durante la producción, a intervalos ck de 10 minutos. Las medidas de las pesadas están en la tabla que sigue: NsGRUPO 1 2 3 4 5 6 7 8 9 10 11 12
R 202 200 202 201 210 202 198 206 206 208 198 204
201 202 201 200 196 206 196 204 204 214 201 204
198 212 208 200 200 205 202 204 203 213 199 202
199 202 201 202 198 203 199 206 204 207 198 206
4 12 7 2 14 4 6 2 3 7 3 4
X 200.00 204.00 2 03.00 200.75 2 01.00 2 04.00 198.75 205.00 204.25 210.50 199.00 204.00
Hacer un estudio del proceso e interpretarlo.
N~GRUPO 13 14 15 16 17 18 19 20 21 22 23 24
203 214 192 207 205 204 205 202 204 206 204 206
204 212 198 208 214 208 204 202 206 206 202 205
204 206 204 206 215 196 205 208 209 206 204 204
203 208 198 204 212 196 204 208 202 210 207 202
R I 1 _ ESQH * 1 ¡:|1! w
12
3BIJH
6
jfld
■í -
A péndice. Tablas estadísticas
A.
Probabilidades acumuladas, para una variable aleatoria con distribución binomial.
B.
Probabilidades acumuladas, para una variable aleatoria con distribución de Poisson.
C.
Áreas de cola de la distribución normal estandarizada.
D.
Distribución de t de Student, valores de t que dejan el área de cola indicada, en función de ios grados de libertad de la distribución.
E.
Ordenadas de la distribución de t de Student, en función de los grados de libertad.
F.
Distribución Chi-cuadrado, valores que dejan el área de cola indicada en función de los grados de libertad.
G .l Distribución de F de Snedecor, valores que dejan un área de cola de 0.25 en función de los grados de libertad de la distribución. G.2 Distribución de F de Snedecor, valores que dejan un área de cola de 0.10 en función de los grados de libertad de la distribución. G.3 Distribución de F de Snedecor, valores que dejan un área de cola de 0.05 en función de los grados de libertad de la distribución. G.4 Distribución de F de Snedecor, valores que dejan un área de cola de 0.01 en función de los grados de libertad de la distribución. G.5 Distribución de F de Snedecor, valores que dejan un área de cola de 0.001 en función de los grados de libertad de la distribución. H.
Factores para la construcción de gráficos de control.
277
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Tabla A .l Probabilidades acumuladas, para una variable aleatoria con distribución binomial
P n
JC
0.05
0.10
0.15
0.20
0.25
030
0.35
0.40
0.45
0.54
2
0 1
0.9025 0.9975
0.8100 0.9900
0.7225 0.9775
0.6400 0.9600
0.5625 0.9375
0.4900 0.9100
0.4225 0.8775
0.3600 0.8400
0.3025 0.7975
C25 a 0.750Í
3
0 1
0.8574 0.9927 0.9999
0.7290 0.9720 0.9990
0.6141 0.9393 0.9966
0.5120 0.8960 0.9920
0.4219 0.8438 0.9844
0.3430 0.7840 0.9730
0.2746 0.7182 0.9571
0.2160 0.6480 0.9360
0.1664 0.5747 0.9089
0 1251 0.5001
0.8145 0.9860 0.9995 1.0000
0.6561 0.9477 0.9963 0.9999
0.5220 0.8905 0.9880 0.9995
0.4096 0.8192 0.9728 0.9984
0.3164 0.7383 0.9492 0.9961
0.2401 0.6517 0.9163 0.9919
0.1785 0.5630 0.8735 0.9850
0.1296 0.4752 0.8208 0.9744
0.0915 0.3910 0.7585 0.9590
00625
0.7738 0.9774 0.9988 1.0000 1.0000
0.5905 0.9185 0.9914 0.9995 1.0000
0.4437 0.8352 0.9734 0.9978 0.9999
0.3277 0.7373 0.9421 0.9933 0.9997
0.2373 0.6328 0.8965 0.9844 0.9990
0.1681 0.5282 0.8369 0.9692 0.9976
0.1160 0.4284 0.7648 0.9460 0.9947
0.0778 0.3370 0.6826 0.9130 0.9898
0.0503 0.2562 0.5931 0.8688 0.9815
2 3 4
0.7351 0.9672 0.9978 0.9999 1.0000
0.5314 0.8857 0.9842 0.9987 0.9999
0.3771 0.7765 0.9527 0.9941 0.9996
0.2621 0.6554 0.9011 0.9830 0.9984
0.1780 0.5339 0.8306 0.9624 0.9954
0.1176 0.4202 0.7443 0.9295 0.9891
0.0754 0.3191 0.6471 0.8826 0.9777
0.0467 0.2333 0.5443 0.8208 0.9590
0.0277 0.1636 0.4415 0.7447 0.9308
5
1.0000
1.0000
1.0000
0.9999
0.9998
0.9993
0.9982
0.9959
0.9917
0 2 3 4
0.6983 0.9556 0.9962 0.9998 1.0000
0.4783 0.8503 0.9743 0.9973 0.9998
0.3206 0.7166 0.9262 0.9879 0.9988
0.2097 0.5767 0.8520 0.9667 0.9953
0.1335 0.4449 0.7564 0.9294 0.9871
0.0824 0.3294 0.6471 0.8740 0.9712
0.0490 0.2338 0.5323 0.8002 0.9444
0.0280 0.1586 0.4199 0.7102 0.9037
0.0152 0.1024 0.3164 0.6083 0.8471
5 6
1.0000 1.0000
1.0000 1.0000
0.9999 1.0000
0.9996 1.0000
0.9987 0.9999
0.9962 0.9998
0.9910 0.9994
0.9812 0.9984
0.9643 0.9963
0 2 3 4
0.6634 0.9428 0.9942 0.9996 1.0000
0.4305 0.8131 0.9619 0.9950 0.9996
0.2725 0.6572 0.8948 0.9786 0.9971
0.1678 0.5033 0.7969 0.9437 0.9896
0.1001 0.3671 0.6785 0.8862 0.9727
0.0576 0.2553 0.5518 0.8059 0.9420
0.0319 0.1691 0.4278 0.7064 0.8939
0.0168 0.1064 0.3154 0.5941 0.8263
0.0084 0.0632 0.2201 0.4770 0.7396
5 6 7
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
0.9998 1.0000 1.0000
0.9988 0.9999 1.0000
0.9958 0.9996 1.0000
0.9887 0.9987 0.9999
0.9747 0.9964 0.9998
0.9502 0.9915 0.9993
0.9115 0.9819 0-9913
0 2 3 4
0.6302 0.9288 0.9916 0.9994 1.0000
0.3874 0.7748 0.9470 0.9917 0.9991
0.2316 0.5995 0.8591 0.9661 0.9944
0.1342 0.4362 0.7382 0.9144 0.9804
0.0751 0.3003 0.6007 0.8343 0.9511
0.0404 0.1960 0.4628 0.7297 0.9012
0.0207 0.1211 0.3373 0.6089 0.8283
0.0101 0.0705 0.2318 0.4826 0.7334
0 004é 0.03*5 0 1495 03614 0.6214
5 6
1.0000 1.0000
0.9999 1.0000
0.9994 1.0000
0.9969 0.9997
0.9900 0.9987
0.9747 0.9957
0.9464 0.9888
0.9006 0.9750
0 8342 09SG2
2 4
0
1 2 3
5
0
1 2 3 4 278
6
7
0 1
1
8
1
9
1
o rsi :: i 06T5 0 9 T*
n
APÉNDICE
Tabla A.2. Probabilidades acumuladas, para una variable aleatoria con distribución binomial.
P n
X
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
9
7 8
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
0.9999 1.0000
0.9996 1.0000
0.9986 0.9999
0.9962 0.9997
0.9909 0.9992
0.9805 0.9980
10
0
4
0.5987 0.9139 0.9885 0.9990 0.9999
0.3487 0.7361 0.9298 0.9872 0.9984
0.1969 0.5443 0.8202 0.9500 0.9901
0.1074 0.3758 0.6778 0.8791 0.9672
0.0563 0.2440 0.5256 0.7759 0.9219
0.0282 0.1493 0.3828 0.6496 0.8497
0.0135 0.0860 0.2616 0.5138 0.7515
0.0060 0.0464 0.1673 0.3823 0.6331
0.0025 0.0233 0.0996 0.2660 0.5044
0.0010 0.0107 0.0547 0.1719 0.3770
5 6 7 8 9
1.0000 1.0000 1.0000 1.0000 1.0000
0.9999 1.0000 1.0000 1.0000 1.0000
0.9986 0.9999 1.0000 1.0000 1.0000
0.9936 0.9991 0.9999 1.0000 1.0000
0.9803 0.9965 0.9996 1.0000 1.0000
0.9527 0.9894 0.9984 0.9999 1.0000
0.9051 0.9740 0.9952 0.9995 1.0000
0.8338 0.9452 0.9877 0.9983 0.9999
0.7384 0.8980 0.9726 0.9955 0.9997
0.6230 0.8281 0.9453 0.9893 0.9990
0 2 3 4
0.5688 0.8981 0.9848 0.9984 0.9999
0.3138 0.6974 0.9104 0.9815 0.9972
0.1673 0.4922 0.7788 0.9306 0.9841
0.0859 0.3221 0.6174 0.8389 0.9496
0.0422 0.1971 0.4552 0.7133 0.8854
0.0198 0.1130 0.3127 0.5696 0.7897
0.0088 0.0606 0.2001 0.4256 0.6683
0.0036 0.0302 0.1189 0.2963 0.5328
0.0014 0.0139 0.0652 0.1911 0.3971
0.0005 0.0059 0.0327 0.1133 0.2744
5 6 7 8 9
1.0000 1.0000 1.0000 1.0000 1.0000
0.9997 1.0000 1.0000 1.0000 1.0000
0.9973 0.9997 1.0000 1.0000 1.0000
0.9883 0.9980 0.9998 1.0000 1.0000
0.9657 0.9924 0.9988 0.9999 1.0000
0.9218 0.9784 0..9957 0.9994 1.0000
0.8513 0.9499 0.9878 0.9980 0.9998
0.7535 0.9006 0.9707 0.9941 0.9993
0.6331 0.8262 0.9390 0.9852 0.9978
0.5000 0.7256 0.8867 0.9673 0.9941
10
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0.9998
0.9995
0 2 3 4
0.5404 0.8816 0.9804 0.9978 0.9998
0.2824 0.6590 0.8891 0.9744 0.9957
0.1422 0.4435 0.7358 0.9078 0.9761
0.0687 0.2749 0.5583 0.7946 0.9274
0.0317 0.1584 0.3907 0.6488 0.8424
0.0138 0.0850 0.2528 0.4925 0.7237
0.0057 0.0424 0.1513 0.3467 0.5833
0.0022 0.0196 0.0834 0.2253 0.4382
0.0008 0.0083 0.0421 0.1345 0.3044
0.0002 0.0032 0.0193 0.0730 0.1938
5 6 7 8 9
1.0000 1.0000 1.0000 1.0000 1.0000
0.9995 0.9999 1.0000 1.0000 1.0000
0.9954 0.9993 0.9999 1.0000 1.0000
0.9806 0.9961 0.9994 0.9999 1.0000
0.9456 0.9857 0.9972 0.9996 1.0000
0.8822 0.9614 0.9905 0.9983 0.9998
0.7873 0.9154 0.9745 0.9944 0.9992
0.6652 0.8418 0.9427 0.9847 0.9972
0.5269 0.7393 0.8883 0.9644 0.9921
0.3872 0.6128 0.8062 0.9270 0.9807
10
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
0.9999 1.0000
0.9997 1.0000
0.9989 0.9999
0.9968 0.9998
2 3 4
0.5133 0.8646 0.9755 0.9969 0.9997
0.2542 0.6213 0.8661 0.9658 0.9935
0.1209 0.3983 0.6920 0.8820 0.9658
0.0550 0.2336 0.5017 0.7473 0.9009
0.0238 0.1267 0.3326 0.5843 0.7940
0.0097 0.0637 0.2025 0.4206 0.6543
0.0037 0.0296 0.1132 0.2783 0.5005
0.0013 0.0126 0.0579 0.1686 0.3530
0.0004 0.0049 0.0269 0.0929 0.2279
0.0001 0.0017 0.0112 0.0461 0.1334
5 6 7
1.0000 1.0000 1.0000
0.9991 0.9999 1.0000
0.9925 0.9987 0.9998
0.9700 0.9930 0.9988
0.9198 0.9757 0.9944
0.8346 0.9376 0.9818
0.7159 0.8705 0.9538
0.5744 0.7712 0.9023
0.4268 0.6437 0.8212
0.2905 0.5000 0.7095
1 2 3
11
1
12
1
11 13
0 1
279
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
Tabla A.3. Probabilidades acumuladas, para una variable aleatoria con distribución binomial.
P n
X
0.05
0.10
0.15
0.20
0.25
030
035
0.40
0.45
0.50
13
8 9
1.0000 1.0000
1.0000 1.0000
0.9998 1.0000
0.9990 0.9999
0.9960 0.9993
0.9874 0.9975
0.8666 0.9539
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
0.9999 1.0000 1.0000
0.9997 1.0000 1.0000
0.9679 0.9922 0.9987 0.9999 1.0000
0.9302 0.9797
10 11 12
1.0000 1.0000 1.0000 1.0000 1.0000
0.9959 0.9995 1.0000
0.9888 0.9983 0.9999
0 1
0.2288 0.5846 0.8416 0.9559 0.9908
0.1028 0.3567 0.6479 0.8535 0.9533
0.0440 0.1979 0.4481 0.6982 0.8702
0.0024 0.0205 0.0839 0.2205 0.4227
0.0001 0.0009 0.0065 0.0287 0.0898
0.9885 0.9978 0.9997 1.0000 1.0000
0.9561 0.9884 0.9976 0.9996 1.0000
0.7805 0.9067 0.9685 0.9917 0.9983
0.6405 0.8164 0.9247 0.9757 0.9940
0.0008 0.0081 0.0398 0.1243 0.2793 0.4859 0.6925 0.8499 0.9417 0.9825
0.0002 0.0029 0.0170 0.0632 0.1672 0.3373 0.5461 0.7414 0.8811 0.9574
0.2120 0.3953 0.6047 0.7880 0.9102
10 11 12 13
1.0000 1.0000 1.0000 1.0000
0.9985 0.9998 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
0.0178 0.1010 0.2811 0.5213 0.7415 0.8883 0.9617 0.9897 0.9978 0.9997
0.0068 0.0475 0.1608 0.3552 0.5842
5 6 7 8 9
0.4877 0.8470 0.9699 0.9958 0.9996 1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000
0.9998 1.0000 1.0000 1.0000
0.9989 0.9999 1.0000 1.0000
0.9961 0.9994 0.9999 1.0000
0.9886 0.9978 0.9997 1.0000
0.9713 0.9935 0.9991 0.9999
0 1 4
0.4633 0.8290 0.9638 0.9945 0.9994
0.2059 0.5490 0.8159 0.9444 0.9873
0.0874 0.3186 0.6042 0.8227 0.9383
0.0352 0.1671 0.3980 0.6482 0.8358
0.0134 0.0802 0.2361 0.4613 0.6865
0.0047 0.0353 0.1268 0.2969 0.5155
0.0016 0.0142 0.0617 0.1727 0.3519
0.0005 0.0052 0.0271 0.0905 0.2173
0.0001 0.0017 0.0107 0.0424 0.1204
O.OOOC 0.0005 0.003“ 0.01** 0.0592
5 6 7 8 9
0.9999 1.0000 1.0000 1.0000 1.0000
0.9978 0.9997 1.0000 1.0000 1.0000
0.9832 0.9964 0.9994 0.9999 1.0000
0.9389 0.9819 0.9958 0.9992 0.9999
0.8516 0.9434 0.9827 0.9958 0.9992
0.7216 0.8689 0.9500 0.9848 0.9963
0.5643 0.7548 0.8868 0.9578 0.9876
0.2608 0.4522 0.6535 0.8182 0.9231
10 11
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
0.9999 1.0000 1.0000 1.0000 1.0000
0.9993 0.9999 1.0000 1.0000 1.0000
0.9972 0.9995 0.9999 1.0000 1.0000
0.4032 0.6098 0.7869 0.9050 0.9662 0.9907 0.9981 0.9997 1.0000 1.0000
0.4401 0.8108 0.9571 0.9930 0.9991 0.9999 1.0000 1.0000 1.0000 1.0000
0.1853 0.5147 0.7892 0.9316 0.9830
0.0743 0.2839 0.5614 0.7899 0.9209
0.0281 0.1407 0.3518 0.5981 0.7982
0.0100 0.0635 0.1971 0.4050 0.6302
0.0033 0.0261 0.0994 0.2459 0.4499
0.0010 0.0098 0.0451 0.1339 0.2892
0.0003 0.0033 0.0183 0.0651 0.1666
0.0001 0.0010 0.0066 0.0281 0.0853
0.9967 0 9995 0.9999 1.0000 1.0000
0.9765 0.9944 0.9989 0.9998 1.0000
0.9183 0.9733 0.9930 0.9985 0.9998
0.8103 0.9204 0.9729 0.9925 0.9984
0.6598 0.8247 0.9256 0.9743 0.9929
0.4900 0.6881 0.8406 0.9329 0.9771
0.3288 0.5272 0.7161 0.8577 0.9417
0.1976 0.3660 0.5629 0.7441 0.8759
14
2 3
4
280
15
2
3
12
13 14 16
0 1 2 3 4 5 6 7
8 9
0.9745 0.9937 0.9989 0.9999 1.0000
0.1509 0.303é
0.5001 0 696* 0 8*5 0 9401 090* 0 9Sȣr 0 999? 1.0GH 0 CO* I
o yxs
0
o _ z rr 0 4841 05*1
0 7 -m l
Tí -------------------------------------------------------------------------------------------------------------------------------------------------------
EL ENTORNO DE LA CALIDAD TOTAL
Tabla A.4. Probabilidades acumuladas, para una variable aleatoria con distribución binomial.
P m
X
0.05
0.10
0.15
0.20
0.25
030
035
0.40
0.45
0.50
16
10 11 12 13 14 15
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
0.9997 1.0000 1.0000 1.0000 1.0000
0.9984 0.9997 1.0000 1.0000 1.0000
0.9938 0.9987 0.9998 1.0000 1.0000
0.9809 0.9951 0.9991 0.9999 1.0000
0.9514 0.9851 0.9965 0.9994 0.9999
0.8949 0.9616 0.9894 0.9979 0.9997
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0
0.4181 0.7922 0.9497 0.9912 0.9988
0.1668 0.4818 0.7618 0.9174 0.9779
0.0631 0.2525 0.5198 0.7556 0.9013
0.0225 0.1182 0.3096 0.5489 0.7582
0.0075 0.0501 0.1637 0.3530 0.5739
0.0023 0.0193 0.0774 0.2019 0 J8 8 7
0.0007 0.0067 0.0327 0.1028 0.2348
0.0002 0.0021 0.0123 0.0464 0.1260
0.0000 0.0006 0.0041 0.0184 0.0596
0.0000 0.0001 0.0012 0.0064 0.0245
0.9999 1.0000 1.0000 1.0000 1.0000
0.9953 0.9992 0.9999 1.0000 1.0000
0.9681 0.9917 0.9983 0.9997 1.0000
0.8943 0.9623 0.9891 0.9974 0.9995
0.7653 0.8929 0.9598 0.9876 0.9969
0.5968 0.7752 0.8954 0.9597 0.9873
0.4197 0.6188 0.7872 0.9006 0.9617
0.2639 0.4478 0.6405 0.8011 0.9081
0.1471 0.2902 0.4743 0.6626 0.8166
0.0717 0.1662 0.3145 0.5000 0.6855
14
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
0.9999 1.0000 1.0000 1.0000 1.0000
0.9994 0.9999 1.0000 1.0000 1.0000
0.9968 0.9993 0.9999 1.0000 1.0000
0.9880 0.9970 0.9994 0.9999 1.0000
0.9652 0.9894 0.9975 0.9995 0.9999
0.9174 0.9699 0.9914 0.9981 0.9997
0.8338 0.9283 0.9755 0.9936 0.9988
15 16
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
1.0000 1.0000
0.9999 1.0000
0
0.3972 0.7735 0.9419 0.9891 0.9985
0.1501 0.4503 0.7338 0.9018 0.9718
0.0536 0.2241 0.4797 0.7202 0.8794
0.0180 0.0991 0.2713 0.5010 0.7164
0.0056 0.0395 0.1353 0.3057 0.5187
0.0016 0.0142 0.0600 0.1646 0.3327
0.0004 0.0046 0.0236 0.0783 0.1886
0 0001 0.0013 0.0082 0.0328 0.0942
0.0000 0.0003 0.0025 0.0120 0.0411
0.0000 0.0001 0.0007 0.0038 0.0154
6 7 8 9
0.9998 1.0000 1.0000 1.0000 1.0000
0.9936 0.9988 0.9998 1.0000 1.0000
0.9581 0.9882 0.9973 0.9995 0.9999
0.8671 0.9487 0.9837 0.9957 0.9991
0.7175 0.8610 0.9431 0.9807 0.9946
0.5344 0.7217 0.8593 0.9404 0.9790
0.3550 0.5491 0.7283 0.8609 0.9403
0.2088 0.3743 0.5634 0.7368 0.8653
0.1077 0.2258 0.3915 0.5778 0.7473
0.0481 0.1189 0.2403 0.4073 0.5927
10 11 12 13 14
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000
0.9998 1.0000 1.0000 1.0000 1.0000
0.9988 0.9998 1.0000 1.0000 1.0000
0.9939 0.9986 0.9997 1.0000 1.0000
0.9788 0.9938 0.9986 0.9997 1.0000
0.9424 0.9797 0.9942 0.9987 0.9998
0.8720 0.9463 0.9817 0.9951 0.9990
0.7597 0.8811 0.9519 0.9846 0.9962
15 16
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
1.0000 1.0000 1.0000
0.9999 1.0000 1.0000
0.9993 0.9999 1.0000
0.3774 0.7547 0.9335
0.1351 0.4203 0.7054
0.0456 0.1985 0.4413
0.0144 0.0829 0.2369
0.0042 0.0310 0.1113
0.0011 0.0104 0.0462
0.0003 0.0031 0.0170
0.0001 0.0008 0.0055
0.0000 0.0002 0.0015
0.0000 0.0000 0.0004
17
1 2
3 4
5 6 7 8 9
10 11 12 13
18
1 2
3 4 5
17 19
0 1 2
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
---------------------------------------------------------------------------------------------------------------
X
Tabla A.5. Probabilidades acumuladas, para una variable aleatoria con distribución binomial
p n
X
0.05
0.10
0.15
0.20
0.25
OJO
03 5
0.40
0.45
0.5Í
19
3
0.9868 0.9980
0.6841 0.8556
0.4551 0.6733
0.2631 0.4654
0.1332 0.2822
0.0591 0.1500
0.0230 0.0696
0.0077 0.0280
0.0G22 o.oo^e
0.9463 0.9837 0.9959 0.9992 0.9999 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
0.8369 0.9324 0.9767 0.9933 0.9984 0.9997 1.0000 1.0000 1.0000 1.0000
0.6678 0.8251 0.9225 0.9713 0.9911 0.9977 0.9995 0.9999 1.0000 1.0000
0.4739 0.6655 0.8180 0.9161 0.9674
0.2968 0.4812 0.6656 0.8145 0.9125
0.0777 0.1727 0.3169 0.4940 0.6710
0.0311 0.0S35 ; 0.1^9* 0-3231
0.9895 0.9972 0.9994 0.9999 1.0000
0.9653 0.9886 0.9969 0.9993 0.9999
0.1629 0.3081 0.4878 0.6675 0.8139 0.9115 0.9648 0.9884 0.9969 0.9994
0.8159 0.9129 0.9658 0.9891 0.9972
1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000
0.9999 1.0000 1.0000 1.0000
0.9995 0.9999 1.0000 1.0000
0.6 ~€Z 0-82&* : 0.91éf 0 .9 6 C 0.9Sto* 0 99^% 0.995* l.OOM l.OOW
0.0032 0.0243 0.0913 0.2252 0.4148
0.0002 0.0021 0.0121 0.0444 0.1182 0.2454 0.4166 0.6010 0.7624 0.8782
0.0000 0.0005 0.0036 0.0160 0.0510
0.0000 0.0001 0.0009 0.0049 0.0189
O.OOOC 0.0001 1 O.GOG 0.0013 1 00C5?
0.6172 0.7858 0.8982 0.9591 0.9861
0.0008 0.0076 0.0355 0.1071 0.2375 0.4164 0.6080 0.7723 0.8867 0.9520
0.1256 0.2500 0.4159 0.5956 0.7553
0.0553 0.1299 0.2520 0.4143 0.5914
o-ccr* 0.05— 0.13 I t 0.2517 0.4119
0.9961 0.9991 0.9998 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 \ .0000
0.9829 0.9949 0.9987 0.9997 1.0000 1.0000 1.0000 1.0000 1.0000 \ .0000
0.9468 0.9804 0.9940 0.9985 0.9997
0.8725 0.9435 0.9790 0.9935 0.9984
0.7507 0.8692 0.9420 0.9786 0.9936
1.0000 1.0000 1.0000 1.0000 \ .0000
0.9997 1.0000 1.0000 1.0000 \ .0000
0.9985 0.9997 1.0000 1.0000 \ .0000
0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998 1.0000 1.0000
6 7 8 9 10 11 12 13 14
0.9998 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
0.8850 0.9648 0.9914 0.9983 0.9997 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
15 16 17 18
1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000
0 1 2 3 4
0.3585 0.7358 0.9245 0.9841 0.9974
0.0388 0.1756 0.4049 0.6477 0.8298
5 6 7 8 9
0.9997 1.0000 1.0000 1.0000 1.0000
0.1216 0.3917 0.6769 0.8670 0.9568 0.9887 0.9976 0.9996 0.9999 1.0000
0.9327 0.9781 0.9941 0.9987 0.9998
0.0115 0.0692 0.2061 0.4114 0.6296 0.8042 0.9133 0.9679 0.9900 0.9974
10 11 12 13 14
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 \.o o o o
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 \ .0000
1.0000 1.0000 1.0000 1.0000 1.0000
0.9994 0.9999 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 \ .0000
1.0000 1.0000 1.0000 1.0000 \ .0000
4 5
20
15 16 17 18
19
0.50H
----------------------------------------------------------------------------------------------------------------------------------------------------
EL ENTORNO DE LA CALIDAD TOTAL
Tabla B.l. Probabilidades acumuladas, para una variable aleatoria con distribución de Poisson.
X
X
0
1
2
3
4
5
6
7
8
9
10
11
0.2
0.819 0.670 0.549 0.449
0.982 0.938 0.878 0.809
0.999 0.992 0.977 0.953
1.000 0.999 0.997 0.991
1.000 1.000 1.000 0.999
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
2.5
0.368 0.223 0.135 0.082
0.736 0.558 0.406 0.287
0.920 0.809 0.677 0.544
0.981 0.934 0.857 0.758
0.996 0.981 0.947 0.891
0.999 0.996 0.983 0.958
1.000 0.999 0.995 0.986
1.000 1.000 0.999 0.996
1.000 1.000 1.000 0.999
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
3.0 3.5 4.0 4.5
0.050 0.030 0.018 0.011
0.199 0.136 0.092 0.061
0.423 0.321 0.238 0.174
0.647 0.537 0.433 0.342
0.815 0.725 0.629 0.532
0.916 0.858 0.785 0.703
0.966 0.935 0.889 0.831
0.988 0.973 0.949 0.913
0.996 0.990 0.979 0.960
0.999 0.997 0.992 0.983
1.000 0.999 0.997 0.993
1.000 1.000 0.999 0.998
5.0 5.5 6.5
0.007 0.004 0.002 0.002
0.040 0.027 0.017 0.011
0.125 0.088 0.062 0.043
0.265 0.202 0.151 0.112
0.440 0.358 0.285 0.224
0.616 0.529 0.446 0.369
0.762 0.686 0.606 0.527
0.867 0.809 0.744 0.673
0.932 0.894 0.847 0.792
0.968 0.946 0.916 0.877
0.986 0.975 0.957 0.933
0.995 0.989 0.980 0.966
7.0 7.5 8.0 8.5
0.001 0.001 0.000 0.000
0.007 0.005 0.003 0.002
0.030 0.020 0.014 0.009
0.082 0.059 0.042 0.030
0.173 0.132 0.100 0.074
0.301 0.241 0.191 0.150
0.450 0.378 0.313 0.256
0.599 0.525 0.453 0.386
0.729 0.662 0.593 0.523
0.830 0.776 0.717 0.653
0.901 0.862 0.816 0.763
0.947 0.921 0.888 0.849
9.0 9.5
0.000 0.000
0.001 0.001
0.006 0.004
0.021 0.015
0.055 0.040
0.116 0.089
0.207 0.165
0.324 0.269
0.456 0.392
0.587 0.522
0.706 0.645
0.803 0.752
10 11 12 13 14
0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000
0.003 0.001 0.001 0.000 0.000
0.010 0.005 0.002 0.001 0.000
0.029 0.015 0.008 0.004 0.002
0.067 0.038 0.020 0.011 0.006
0.130 0.079 0.046 0.026 0.014
0.220 0.143 0.090 0.054 0.032
0.333 0.232 0.155 0.100 0.062
0.458 0.341 0.242 0.166 0.109
0.583 0.460 0.347 0.252 0.176
0.697 0.579 0.462 0.353 0.260
15 16 17 18 19
0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000
0.000 0.000 0.000 0.000 0.000
0.001 0.000 0.000 0.000 0.000
0.003 0.001 0.001 0.000 0.000
0.008 0.004 0.002 0.001 0.001
0.018 0.010 0.005 0.003 0.002
0.037 0.022 0.013 0.007 0.004
0.070 0.043 0.026 0.015 0.009
0.118 0.077 0.049 0.030 0.018
0.185 0.127 0.085 0.055 0.035
20
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.001
0.002
0.005
0.011
0.021
0.4 0.6 0.8
1.0 1.5 2.0
6.0
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
------------------------------------------------------------------------------------------------------------------
71
Tabla B.2. Probabilidades acumuladas, para una variable aleatoria con distribución de Poisson.
X
X
12
13
14
15
16
17
18
19
20
21
22
23
4.0 4.5 5.0 5.5
1.000 0.999 0.998
1.000 1.000 0.999 0.998
1.000 1.000 1.000 0.999
1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000
1.000 1.000 1.000
1.000
1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
6.0 6.5
0.991 0.984
1.000 1.00C
7.0 7.5
0.973 0.957
8.0
1.000
0.996
0.999
0.999
1.000
0.997 0.994
0.999
1.000
1.000 1.000
1.000 1.000
1.000
0.993 0.987
1.000
1.000 1.000
1.000 1.000
0.978
0.990
0.998 0.995
0.999 0.998
1.000 0.999
1.000 1.000
1.000 1.000
1.000 1.000
1.000 1.000
1.000 1.000 1.000 1.000
0.936 0.909 0.876 0.836
0.966
0.983 0.973 0.959 0.940
0.992 0.986 0.978 0.967
0.996
0.998 0.997 0.995 0.991
0.999 0.999 0.998 0.996
1.000 0.999 0.999 0.998
1.000 1.000 1.000 0.999
1.000 1.000 1.000 1.000
1.000 1.000 1.000 1.000
i ooc 1 ooc 1 ooc 1CW
0.864
11 12 13 14
0.792 0.689 0.576 0.463 0.358
0.917 0.854
0.973 0.944
0.997 0.991
0.998 0.995
1 ooc 1o »
0.573 0.464
0.675 0.570
0.764 0.669
0.963 0.930 0.883
0.979 0.957 0.923
0.988 0.975 0.952
0.999 0.998 0.994
1.000 0.999
0.899 0.835 0.756
0.986 0.968 0.937 0.890 0.827
0.993 0.982
0.772
0.951 0.907 0.844
0.997 0.992 0.983
0-9m I 0 99* I 0 9 T. I
15 16 17 18 19
0.268 0.193 0.135 0.092 0.061
0.363 0.275 0.201 0.143 0.098
0.466 0.368 0.281 0.208 0.150
0.568 0.467 0.371 0.287 0.215
0.664
0.749
0.917 0.868 0.805 0.731 0.647
0.967
0.659 0.564 0.469 0.378
0.875 0.812 0.736 0.651 0.561
0.947
0.566 0.468 0.375 0.292
0.819 0.742 0.655 0.562 0.469
0.911 0.861 0.799 0.725
0.942 0.905 0.855 0.793
0J6 I c* I 0 J5 - I
20
0.039
0.066
0.105
0.157
0.221
0.297
0.381
0.470
0.559
0.644
0.721
24
25
26
27
28
29
30
31
32
33
34
12
0.999 0.998 0.995
1 000 0.999 0.997
1.000 1.000 0.999
1.000 1.000 0.999
1.000 1.000 1.000
1.000 1.000 1.000
1.000 1.000 1.000
1.000
13 14
1.000 1.000
1.000 1.000 1.000
1.000 1.000 1.000
1.000 1.000 1.000
15 16 17 18 19
0 989 0978 0.959 0.932 0.893
0.994 0.987
0.998 0.996 0.991 0.983 0.969
0.999 0.998 0.995 0.990 0.980
1.000
0.975 0.955 0.927
0.997 0.993 0.985 0.972 0.951
0.999 0.997 0.994
1.000 0.999 0.999 0.997
0.988
0.993
1.000 1.000 0.999 0.998 0.996
1.000 1.000 1.000 0.999 0.998
1.000 1.000 1.000 1.000 0.999
1.000 1.000 1 000 1 000 0999
20
0.843
0.888
0.922
0.948
0.966
0.978
0.987
0.992
0.995
0.997
0999
8.5 9.0 9.5 10 284
0.996
0.949 0.926 0.898
0.781 0.682
0.993 0.989 0.982
0.986 0.971
1.000 i ooc
i »
.
1
EL ENTORNO DE LA CALIDAD TOTAL
Tabla C Áreas de cola de la distribución normal estandarizada.
z
.
0
.
1
. 2
. 3
. 4
. 5
. 6
. 7
. 8
. 9
0 .0 _ 0 .1 _ 0 .2 _ 0 .3 _ 0 .4 _
0 .5 0 0 0 0.4602 0 .4 2 0 7 0.3821 0.3446
0.4960 0 .4 5 6 2 0.4168 0.3783 0.3409
0.4 9 2 0 0.4 5 2 2 0.4 1 2 9 0.3745 0.3372
0.4880 0.4483 0.4090 0.3707 0.3336
0.4840 0.4443 0.4052 0.3669 0.3300
0.4801 0.4404 0.4013 0.3632 0.3264
0.4761 0 .4 3 6 4 0.3974 0 .3 5 9 4 0 .3 2 2 8
0.4721 0.4325 0.3 9 3 6 0 .3 5 5 7 0.3192
0.4681 0 .4 2 8 6 0 .3 8 9 7 0 .3 5 2 0 0 .3 1 5 6
0.4641 0.4 2 47 0.3859 0.3483 0.3121
0 .5 _ 0 .6 _
0.3085 0.2743 0.2420 0.2119 0.1841
0 .3 0 5 0 0 .2 7 0 9 0 .2 3 8 9 0 .2 0 9 0 0 .1 8 1 4
0.3015 0 .2 6 7 6 0 .2 3 5 8 0.2061 0 .1 7 8 8
0.2981 0.2643 0.2327 0.2033 0.1762
0.2946 0.2611 0.2296 0.2005 0.1736
0.2912 0.2578 0.2266 0 .1 9 7 7 0.1711
0 .2 8 7 7 0.2546 0 .2 2 3 6 0.1949 0 .1685
0 .2843 0 .2 5 1 4 0 .2206 0 .1 9 2 2 0 .1 6 6 0
0 .2 8 1 0 0 .2483 0 .2 1 7 7 0 .1 8 9 4 0 .1635
0 .2776 0.2451 0 .2 1 4 8 0 .1 8 6 7 0.1611
0.1587 0 .1 3 5 7 0.1151 0.0968 0.0808
0 .1 5 6 2 0 .1335 0.1131 0.0951 0.0793
0.1539 0 .1 3 1 4 0.1112 0.0934 0.0778
0.1515 0 .1292 0.1093 0.0918 0 .0 7 6 4
0.1492 0.1271 0.1075 0.0901 0.0749
0.1469 0.1251 0.1056 0.0885 0.0735
0.1446 0.1230 0.1038 0.0869 0.0721
0.1423 0 .1 2 1 0 0 .1 0 2 0 0 .0853 0.0708
0.1401 0 .1190 0.1003 0.0838 0 .0 6 9 4
0 .1379 0.1 1 70 0.0985 0.0823 0.0681
0.0668 0 .0 5 4 8 0 .0 4 4 6 0.0359 0 .0 2 8 7
0 .0 6 5 5 0 .0 5 3 7 0 .0 4 3 6 0.0351 0.0281
0.0643 0.0526 0 .0 4 2 7 0.0344 0 .0 2 7 4
0.0630 0.0516 0.0418 0 .0336 0.0268
0.0618 0.0505 0.0409 0.0329 0.0262
0 .0 6 0 6 0.0495 0.0401 0 .0322 0.0256
0.0594 0.0485 0.0392 0 .0314 0 .0250
0 .0 5 8 2 0 .0475 0 .0 3 8 4 0 .0 3 0 7 0 .0 2 4 4
0.0571 0.0465 0.0375 0.0301 0 .0 2 3 9
0 .0 5 59 0.0455 0 .0 3 6 7 0 .0 2 9 4 0 .0233
0 .0 2 2 8 0 .0 1 7 9 0 .0 1 3 9 0 .0 1 0 7 0 .0 0 8 2
0 .0 2 2 2 0 .0 1 7 4 0 .0 1 3 6 0 .0 1 0 4 0 .0 0 8 0
0 .0 2 1 7 0.0170 0.0132 0 .0102 0.0078
0 .0212 0 .0166 0 .0129 0.0099 0 .0075
0.0207 0.0162 0.0125 0.0096 0.0073
0.0202 0.0158 0.0122 0.0094 0.0071
0.0197 0 .0154 0.0119 0.0091 0 .0069
0 .0 1 9 2 0 .0 1 5 0 0 .0 1 1 6 0.0089 0 .0 0 6 8
0 .0188 0 .0146 0 .0113 0 .0 0 8 7 0.0066
0 .0183 0 .0143 0 .0110 0 .0 0 84 0 .0 0 6 4
2 -9_
0.0062 0 .0 0 4 7 0 .0035 0 .0 0 2 6 0 .0 0 1 9
0 .0 0 6 0 0.0045 0 .0 0 3 4 0.0025 0 .0 0 1 8
0 .0059 0.0044 0 .0033 0 .0 0 2 4 0 .0018
0.0057 0.0043 0 .0 0 3 2 0 .0023 0 .0 0 1 7
0.0055 0.0041 0.0031 0.0023 0.0016
0 .0 0 5 4 0.0040 0.0030 0.0022 0.0016
0.0052 0.0039 0.0029 0.0021 0.0015
0.0051 0 .0 0 3 8 0.0028 0.0021 0.0015
0.0049 0 .0 0 3 7 0 .0 0 2 7 0.0020 0 .0 0 1 4
0.0 0 48 0.0 0 36 0.0 0 26 0.0 0 19 0 .0 0 1 4
3 .0 _ 3 -l_ 3 .2 _ 33_ 3 .4 _
0.0013 0 .0 0 1 0 0 .0 0 0 7 0 .0005 0.0003
0.0013 0 .0 0 0 9 0 .0 0 0 7 0.0005 0.0003
0.0013 0.0009 0.0006 0.0005 0.0003
0 .0 0 1 2 0.0009 0.0006 0 .0 0 0 4 0.0003
0.0012 0.0008 0.0006 0.0004 0.0003
0.0011 0.0008 0 .0 0 0 6 0 .0 0 0 4 0.0003
0.0011 0.0008 0.0006 0.0004 0.0003
0.0011 0 .0 0 0 8 0.0005 0 .0 0 0 4 0.0003
0 .0 0 1 0 0 .0 0 0 7 0.0005 0 0004 0.0003
0.0 0 10 0 .0 0 07 0.0005 0 .0003 0 .0 0 02
3 .5 _ 3 .6 _ 3 .7 _ 3 .8 _ 3.9__
0 .0 0 0 2 0.0002 0.0001 0.0001 0 .0 0 0 0
0 .0 0 0 2 0 .0 0 0 2 0.0001 0.0001 0 .0 0 0 0
0.0002 0.0001 0.0001 0.0001 0.0000
0.0002 0.0001 0.0001 0.0001 0.0000
0.0002 0.0001 0.0001 0.0001 0.0000
0 .0002 0.0001 0.0001 0.0001 0.0000
0.0002 0.0001 0.0001 0.0001 0.0000
0 .0 0 0 2 0.0001 0.0001 0.0001 0 .0 0 0 0
0.0002 0.0001 0.0001 0.0001 0.0 0 0 0
0 .0 0 02 0.0001 0.0001 0.0001 0 .0 0 00
0 .8 _ 0.9 _ 1.0_
13_ 1 .4 . l.S _ 1.6_ 1.7_ 1.8_ !•* _ 2.0 _ 22_ 2 .3 _ 2 -4_ 2.5 _ 2.6 _ 2-7_ 2 .8 _
285
n
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
Tabla D Distribución de t de Student, valores de t que dejan el área de cola indicada, en función de los grados de libertad de la distribución.
P
286
V
0.4
0.25
0.1
0.05
0.025
0.01
0.005
1 2 3
4
0.325 0.289 0 .2 7 7 0.271
1.000 0 .8 1 6 0.765 0.741
3.078 1.886 1.638 1.533
6.314 2.920 2.353 2.132
12.706 4.303 3.182 2.776
31.821 6.965 4.541 3 .7 4 7
6 3 .6 5 7 9.925 5.841 4 .6 0 4
S 6 7 8 9
0 .2 6 7 0.265 0.263 0.262 0.261
0 .7 2 7 0 .7 1 8 0.711 0 .7 0 6 0 .703
1.476 1.440 1.415 1.397 1.383
2.015 1.943 1.895 1.860 1.833
2.571 2 .447 2.365 2.306 2.262
3.365 3.143 2 .9 9 8 2.896 2.821
4.032 3 .7 0 7 3 .4 9 9 3.355 3 .2 5 0
4.773 4 .317 4.029 3.833 3 .690
5.893 5.208 4.785 4.501 4 .2 9 7
6.869 5.959 5.408 5.041 4.781
10 11 12 13 14
0.260 0.260 0.259 0.259 0 .2 5 8
0 .7 0 0 0 .6 9 7 0.695 0 .694 0 .692
1.372 1.363 1.356 1.350 1.345
1.812 1.796 1.782 1.771 1.761
2 .228 2.201 2 .179 2 .160 2.145
2 .7 6 4 2.718 2.681 2.650 2 .6 2 4
3 .1 6 9 3 .1 0 6 3.055 3.012 2.977
3.581 3 .4 9 7 3 .428 3 .372 3 .326
4 .1 4 4 4.025 3.930 3.852 3 .7 8 7
4 .5 8 7 4 .4 3 7 4 .318 4.221 4 .1 4 0
15
0 .2 5 8 0 .2 5 8 0 .2 5 7 0 .2 5 7 0 .2 5 7
0.691 0 .690 0 .689 0 .688 0 .688
1.341 1.337 1.333 1.330 1.328
1.753 1.746 1.740 1.734 1.729
2.131 2 .120 2 .110 2.101 2.093
2.602 2.583 2.567 2.552 2.539
2 .9 4 7 2.921 2.898 2.878 2.861
3 .286 3 .252 3 .222 3 .1 9 7 3 .1 7 4
3.733 3 .6 8 6 3 .646 3.610 3 .5 7 9
4.073 4.015 3 .965 3 .922 3 .883
0 .2 5 7 0 .2 5 7 0 .2 5 6 0 .2 5 6 0.256
0 .6 8 7 0.686 0.686 0.685 0.685
1.325 1.323 1.321 1.319 1.318
1.725 1.721 1.717 1.714 1.711
2.086 2.080 2.074 2.069 2.064
2.528 2.518 2.508 2.500 2.492
2.845 2.831 2 .819 2 .807 2 .797
3.153 3.135 3 .1 1 9 3 .1 0 4 3.091
3 .5 5 2 3 .5 2 7 3 .5 0 5 3 .4 8 5 3 .4 6 7
3.850 3.819 3.792 3.768 3.745
0.256 0.256 0 .2 5 6 0 .256 0 .256
0 .6 8 4 0 .6 8 4 0 .6 8 4 0.683 0.683
1.316 1.315 1.314 1.313 1.311
1.708 1.706 1.703 1.701 1.699
2.060 2.056 2.052 2.048 2.045
2.485 2 .479 2.473 2 .467 2 .462
2 .7 87 2 .779 2.771 2 .763 2 .756
3.078 3 .0 6 7 3 .0 5 7 3.047 3.038
3 .4 5 0 3.435 3.421 3.408 3 .396
3.725 3.706 3.690 3 .6 7 4 3 .659
0 .256 0.255 0 .2 5 4 0 .2 5 4 0.253
0.683 0.681 0 .679 0 .6 7 7 0 .674
1.310 1.303 1.296 1.289 1.282
1.697 1.684 1.671 1.658 1.645
2.042 2.021 2 .000 1.980 1.960
2 .457 2.423 2.390 2 .358 2.326
2.750 2.704 2.660 2 .617 2.576
3 .030 2.971 2.915 2.860 2 .807
3.385 3 .307 3.232 3.160 3 .090
3.646 3.551 3.460 3.373 3.291
16 17
18 19 20
21 22 23 24 25 26 27 28
29
i
30 40 60 120 co
0.001
0.0005
127.320 3 1 8 .3 1 0 14.089 2 2 .3 2 6 7.453 10.215 5.598 7 .173
63 6 .6 0 0 3 1.5 9 6 12.924 8.610
0.0025
EL ENTORNO DE LA CALIDAD TOTAL
X
.ibla E Ordenadas de la distribución de / de Student, en función de los grados de libertad. t
i
V
0
0.25
0.5
0.75
1
1.25
t 1.5
1.75
2
2.25
2.5
2.75
3
1 2 3 4
0.318 0.354 0.368 0.375
0.300 0.338 0.353 0.361
0.255 0.296 0.313 0.322
0.204 0.244 0.261 0.270
0.159 0.192 0.207 0.215
0.124 0.149 0.159 0.164
0.098 0.114 0.120 0.123
0.078 0.088 0.090 0.091
0.064 0.06S 0.068 0.066
0.053 0.053 0.051 0.049
0.044 0.042 0.039 0.036
0.037 0.034 0.030 0.026
0.032 0.027 0.023 0.020
5
0.380
0.366
0.328
0.276
0.220
0.168
0.125
0.091
0.065
0.047
0.033
0.024
0.017
6
D.3S3
0.369
0.332
0.280
0.223
0.27D
0.226
0.090
0.064
0.04J
0.031
0.022
a .o ts
7
0.385 0.387 0.388
0.372 0.373 0.375
0.335 0.337 0.338
0.283 0.285 0.287
0.226 0.228 0.229
0.172 0.173 0.174
0.126 0.127 0.127
0.090 0.090 0.090
0.063 0.062 0.062
0.044 0.043 0.042
0.030 0.029 0.028
0.021 0.019 0.018
0.014 0.013 0.012
0.389 0.390 0.391 0.391 0.392
0.376 0.377 0.378 0.378 0.379
0.340 0.341 0.342 0.342 0.343
0.288 0.289 0.290 0.291 0.292
0.230 0.231 0.232 0.233 0.234
0.175 0.176 0.176 0.177 0.177
0.127 0.128 0.128 0.128 0.128
0.090 0.089 0.089 0.089 0.089
0.061 0.061 0.060 0.060 0.060
0.041 0.040 0.040 0.039 0.039
0.027 0.026 0.026 0.025 0.025
0.018 0.017 0.016 0.016 0.015
0.011 0.011 0.010 0.010 0.009
0.392 0.393 0.393 0.393 0.394
0.380 0.380 0.380 0.381 0.381
0.344 0.344 0.345 0.345 0.345
0.292 0.293 0.293 0.294 0.294
0.234 0.235 0.235 0.235 0.236
0.178 0.178 0.178 0.178 0.179
0.128 0.128 0.128 0.129 0.129
0.089 0.089 0.089 0.088 0.088
0.059 0.059 0.059 0.058 0.058
0.038 0.038 0.038 0.037 0.037
0.024 0.024 0.023 0.023 0.023
0.015 0.015 0.014 0.014 0.014
0.009 0.009 0.009 0.008 0.008
0.394 0.394 0.394 0.395 0.395
0.381 0.382 0.382 0.382 0.382
0.346 0.346 0.346 0.347 0.347
0.294 0.295 0.295 0.295 0.296
0.236 0.236 0.237 0.237 0.237
0.179 0.179 0.179 0.179 0.179
0.129 0.129 0.129 0.129 0.129
0.088 0.088 0.088 0.088 0.088
0.058 0.058 0.058 0.058 0.057
0.037 0.037 0.036 0.036 0.036
0.023 0.022 0.022 0.022 0.022
0.014 0.013 0.013 0.013 0.013
0.008 0.008 0.008 0.008 0.007
0.395 0.395 0.395 0.395 0.396
0.382 0.383 0.383 0.383 0.383
0.347 0.347 0.348 0.348 0.348
0.296 0.296 0.296 0.296 0.297
0.237 0.237 0.238 0.238 0.238
0.180 0.180 0.180 0.180 0.180
0.129 0.129 0.129 0.129 0.129
0.088 0.088 0.088 0.088 0.088
0.057 0.057 0.057 0.057 0.057
0.036 0.036 0.036 0.036 0.035
0.022 0.022 0.021 0.021 0.021
0.013 0.013 0.012 0.012 0.012
0.007 0.007 0.007 0.007 0.007
40 45 50
0.396 0.396 0.396 0.397 0.397
0.383 0.384 0.384 0.384 0.385
0.348 0.348 0.349 0.349 0.350
0.297 0.297 0.298 0.298 0.298
0.238 0.239 0.239 0.239 0.240
0.180 0.180 0.181 0.181 0.181
0.129 0.129 0.129 0.129 0.129
0.088 0.088 0.087 0.087 0.087
0.057 0.056 0.056 0.056 0.056
0.035 0.035 0.034 0.034 0.034
0.021 0.021 0.020 0.020 0.020
0.012 0.012 0.011 0.011 0.011
0 .007 0.006 0.006 0.006 0.006
OO
0.399
0.387
0.352
0.301
0.242
0.183
0.130
0.086
0.054
0.032
0.018
0.009
0.004
8 9 10 11
12
» 13 14
15 16
17 18
19 20 21
22 23 24 25 26 27 28
29 30 35
71
M ÉTODOS ESTADÍSTICOS. CO NTROL Y MEJORA DE LA CALIDAD
Tabla F Distribución Chi-cuadrado, valores que dejan el área de cola indicada en función de los grados de libertad.
V
1 2 3 4
5 6 7 8
9
288
10 11 12 13 14 15
16 17 18
19 20 21 22 23 24 25
26 27 28
29 30 40
50 60 70 80
90 100
P
0.25
0.1
0.05
0.025
0.01
0.005
0.1 0 0.5 8 1.21 1.92
1.32 2.7 7 4.11 5.39
2.71 4.61 6.25 7 .78
3.84 5.99 7.81 9.49
5.02 7 .3 8 9.35 11.14
6.63 9.22 11.34 13.28
7.88 10.62 12.84 14.86
1.61 2 .2 0 2.83 3.49 4 .17
2 .6 7 3 .45 4.25 5.07 5.90
6.63 7 .8 4 9 .0 4 10.22 11.39
9 .2 4 10.64 12.02 13.36 14.68
11.07 12.59 14.07 15.51 16.92
12.83 14.45 16.01 17.53 19.02
15.09 16.81 18.48 2 0 .0 9 2 1 .6 7
16.75 18.55 2 0 .2 8 21.95 2 3 .5 9
3 .9 4 4 .5 7 5.23 5.89 6 .5 7
4.8 7 5.58 6.30 7.0 4 7.79
6.74 7.58 8.44 9.30 10.17
12.55 13.70 14.85 15.98 17.12
15.99 17.28 18.55 19.81 21 .0 6
18.31 19.68 21.0 3 2 2 .3 6 2 3 .6 8
2 0 .4 8 2 1 .9 2 2 3 .3 4 2 4 .7 4 2 6 .1 2
23.21 2 4 .7 2 2 6 .2 2 2 7 .6 9 2 9 .1 4
2 5 .1 9 26.76 28.30 2 9 .8 2 31.32
6 .2 6 6.91 7 .5 6 8.23 8.91
7 .2 6 7 .9 6 8 .67 9 .3 9 10.12
8.55 9.31 10.09 10.86 11.65
11.04 11.91 12.79 13.68 14.56
18.25 19.37 2 0 .4 9 2 1 .6 0 2 2 .7 2
22.31 2 3 .5 4 2 4 .7 7 2 5 .9 9 2 7 .2 0
2 5 .0 0 2 6 .3 0 2 7 .5 9 2 8 .8 7 3 0 .1 4
2 7 .4 9 2 8 .8 5 3 0 .1 9 31.5 3 3 2 .8 5
30 .5 8 3 2 .0 0 33.41 34.81 36 .1 9
32.80 34 .2 7 35.72 37.16 38.58
8.26 8.90 9 .5 4 10.20 10.86
9.59 10.28 10.98 11.69 12.40
10.85 11.59 12.34 13.09 13.85
12.44 13.24 14.04 14.85 15.66
15.45 16.34 17.24 18.14 19.04
23 .8 3 24.93 2 6 .0 4 2 7 .1 4 2 8 .2 4
28.41 2 9 .6 2 30.81 32.01 3 3 .2 0
31.41 3 2 .6 7 33.9 2 3 5 .1 7 3 6 .4 2
3 4 .1 7 3 5 .4 8 3 6 .7 8 3 8 .0 8 3 9 .3 6
3 7 .5 7 38.93 4 0 .2 9 4 1 .6 4 4 2 .9 8
40 .0 0 41.40 42.80 44 .1 8 4 5 .5 6
10.52 11.16 11.81 12.46 13.12
11.52 12.20 12.88 13.56 14.26
13.12 13.84 14.57 15.31 16.05
14.61 15.38 16.15 16.93 17.71
16.47 17.29 18.11 18.94 19.77
19.94 2 0 .8 4 21.75 2 2 .6 6 2 3 .5 7
29.3 4 3 0.43 3 1.53 3 2.6 2 33.71
3 4 .3 8 3 5 .5 6 3 6 .7 4 3 7 .9 2 39.0 9
37 .6 5 3 8 .8 9 40.11 4 1 .3 4 4 2 .5 6
4 0 .6 5 4 1 .9 2 4 3 .1 9 4 4 .4 6 4 5 .7 2
44.31 4 5 .6 4 4 6 .9 6 4 8 .2 8 4 9 .5 9
46.93 4 8 .2 9 49.64 50.99 52.34
13.79 2 0.71 2 7 .9 6 3 5 .5 0
14.95 2 2 .1 6 2 9 .6 8 3 7 .4 6
16.79 2 4 .4 3 32.3 5 4 0 .4 7
18.49 26.51 3 4 .7 6 4 3 .1 9
2 0 .6 0 2 9.0 5 3 7 .6 9 4 6 .4 6
24.48 33 .6 6 42.95 52.30
34.8 0 4 5.6 2 56.33 6 6 .9 8
40.2 6 51.81 6 3 .1 6 7 4 .3 9
4 3 .7 7 55 .7 6 6 7 .5 0 7 9 .0 8
4 6 .9 8 5 9 .3 4 7 1 .4 2 8 3 .3 0
50.89 6 3 .6 9 7 6 .1 7 88 40
53.67 6 6 .7 7 79.52 91.98
4 3 .2 5 5 1 .1 4 5 9 .1 7 6 7 .3 0
4 5 .4 2 5 3 .5 2 6 1 .7 4 7 0 .0 5
4 8 .7 5 57.15 6 5 .6 4 7 4 .2 2
51.7 4 6 0 .3 9 69.1 3 7 7 .9 3
55.33 6 4 .2 8 73.2 9 8 2.3 6
6 1 .7 0 71.15 80.63 9 0 .1 4
7 7 .5 7 88.13 98.65 109.14
85.5 2 9 6 .5 7 107.56 118.49
9 0 .5 3 101.88 113.14 1 24.34
9 5 .0 3 106.63 118.14 129.56
100.44 112.34 124.13 135.82
104 24 116 35 128.32 140.19
0.995
0.99
0.975
0.95
0.9
0.75
0.0 0 0.01 0 .0 7 0.21
0 .0 0 0 .0 2 0.11 0 .3 0
0.0 0 0.05 0 .2 2 0 .4 8
0 .0 0 0 .1 0 0.35 C.71
0.02 0.21 0.58 1.06
0.41 0 .68 0 .99 1.34 1.73
0.55 0 .8 7 1.24 1.65 2.09
0.83 1.24 1.69 2 .1 8 2 .7 0
1.15 1.64 2 .1 7 2.73 3.33
2.16 2.6 0 3 .0 7 3 .5 7 4 .0 7
2 .5 6 3.05 3 .5 7 4.11 4 .6 6
3.25 3 .8 2 4 .4 0 5.01 5.63
4.60 5.14 5.70 6 .2 6 6 .8 4
5.23 5.81 6.41 7.01 7 .6 3
7 .4 3 8.03 8 .64 9 .2 6 9.89
ni cwTADMr» ni: i a r-ai in»n tat»i
A.
.ib la G. 1 Distribución de F de Snedecor, valores que dejan un área de rola de 0.25 en función de los grados de libertad de la distribución.
v2
1
2
3
4
5
vi 6
7
8
9
10
12
1 2 J 4
5.83 2.57 2.02 1.81
7.50 3.00 2.28 2.00
8.20 3.15 2.36 2.05
8.58 3.23 2.39 2.06
8.82 3.28 2.41 2.07
8.98 3.31 2.42 2.08
9.10 3.34 2.43 2.08
9.19 3.35 2.44 2.08
9.26 3.37 2.44 2.08
9.32 3.38 2.44 2.08
9.41 3.39 2.45 2.08
5 6 7 8 9
1.69 1.62 1.57 1.54 1.51
1.85 1.76 1.70 1.66 1.62
1 88 1.78 1.72 1.67 1.63
1.89 1.79 1.72 1.66 1.63
1.89 1.78 1.71 1.66 1.62
1.89 1.78 1.71 1.65 1.61
1.89 1.78 1.70 1.64 1.60
1.89 1.78 1.70 1.64 1.60
1.89 1.77 1.69 1.64 1.59
1.89 1.77 1.69 1.63 1.59
1.89 1.77 1.68 1.62 1.58
10 15 20 25 30
1.49 1.43 1.40 1.39 1.38
1.60 1.52 1.49 1.47 1.45
1.60 1.52 1.48 1.46 1.44
1.59 1.51 1.47 1.44 1.42
1.59 1.49 1.45 1.42 1.41
1.58 1.48 1.44 1.41 1.39
1.57 1.47 1.42 1.40 1.38
1.56 1.46 1.42 1.39 1.37
1.56 1.46 1.41 1.38 1.36
1.55 1.45 1.40 1.37 1.35
1.54 1.44 1.39 1.36 1.34
40 60 120
ao
1.36 1.35 1.34 1.32
1.44 1.42 1.40 1.39
1.42 1.41 1.39 1.37
1.40 1.39 1.37 1.35
1.39 1.37 1.35 1.33
1.37 1.35 1.33 1.31
1.36 1.33 1.31 1.29
1.35 1.32 1.30 1.28
1.34 1.31 1.29 1.27
1.33 1.30 1.28 1.25
1.31 1.29 1.26 1.24
v2
15
20
25
30
35
vi 40
50
60
100
120
ao
1 2 3 4
9.49 3.41 2.46 2.08
9.58 3 43 2 46 2.08
9.63 3.44 2.46 2.08
9.67 3.44 2.46 2.08
9.69 3.45 2.47 2.08
9.71 3.45 2.47 2.08
9.74 3.46 2.47 2.08
9.76 3.46 2.47 2.08
9.80 3.47 2.47 2.08
9.80 3.47 2.47 2.08
9.85 3.48 2.47 2.08
5 6 7 8
9
1.88 1.76 1.68 1.62 1.57
1.88 1.76 1.67 1.61 1.56
1.88 1.75 1.67 1.60 1.56
1.88 1.75 1.66 1.60 1.55
1.88 1.75 1.66 1.60 1.55
1.88 1.75 1.66 1.59 1.54
1.87 1.75 1.66 1.59 1.54
1.87 1.74 1 66 1.59 1.54
1.87 1.74 1.65 1.59 1.53
1.87 1.74 1.65 1.58 1.53
1.87 1.74 1.65 1.58 1.53
10 15 20 25 30
1.53 1.43 1.37 1.34 1.32
1.52 1.41 1.36 1.33 1.30
1.52 1.40 1.35 1.31 1.29
1.51 1.40 1.34 1.31 1.28
1.51 1.39 1.33 1.30 1.28
1.51 1.39 1.33 1.29 1.27
1.50 1.38 1.32 1.29 1.26
1.50 1.38 1.32 1.28 1.26
1.49 1.37 1.31 1.27 1.25
1.49 1.37 1.31 1.27 1.24
1.48 1.36 1.29 1.25 1.23
40 60 120
1.30 1.27 1.24
1.24 1.21 1.18 1.14
1.22
1.20
1.19 1.16
1.21 1.18 1.14 1.09
1.21 1.17 1.13 1.08
1.19 1.15
1.22
1.26 1.23 1.20 1 18
1.23
ao
1.28 1.25 1.22 1.19
1.25
1.25
1.22
1.21
1.19 1.16
1.18 1.15
1.16 1.13
1.12
1.10 1.00
289
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Tabla G.2 Distribución de F de Snedecor, valores que dejan un área de cola de 0 . 1 0 en función de los grados de libertad de la distribución.
290
v2
1
2
3
4
5
vi 6
7
8
9
10
12
1 2 3 4
39.8 6 8.53 5.54 4 .54
49.5 0 9.00 5.46 4.32
53.59 9.16 5.39 4.19
55.83 9.24 5.34 4.11
57.24 9.29 5.31 4.05
58.20 9.33 5.28 4.01
58.91 9.35 5.27 3.98
59.44 9.37 5.25 3.95
59.86 9.38 5.24 3 .9 4
60 .2 0 9 .39 5.23 3.92
60.71 9.41 5.22 3.90
5 6 7 8 9
4.06 3.78 3.59 3.46 3.36
3.78 3.46 3.26 3.11 3.01
3.62 3.29 3.07 2.92 2.81
3.52 3.18 2.96 2.81 2.69
3.45 3.11 2.88 2.73 2.61
3:40 3.05 2.83 2.67 2.55
3.37 3.01 2.79 2.62 2.51
3.34 2.98 2.75 2.59 2.47
3.32 2.96 2.72 2.56 2 .4 4
3.30 2.94 2.70 2.54 2.42
3.27 2.90 2.67 2.50 2.38
10 15 20 25 30
3.28 3.07 2.97 2.92 2.88
2.92 2.70 2.59 2.53 2.49
2.73 2.49 2.38 2.32 2.28
2.61 2.36 2.25 2.18 2 .1 4
2.52 2.27 2.16 2.09 2.05
2.46 2.21 2.09 2.02 1.98
2.41 2.16 2.04 1.97 1.93
2.38 2.12 2.00 1.93 1.88
2.35 2.09 1.96 1.89 1.85
2.32 2.06 1.94 1.87 1.82
2.28 2.02 1.89 1.82 1.77
40 60 120 oo
2 .84 2.79 2.75 2.71
2.44 2.39 2.35 2.30
2.23 2.18 2.13 2.08
2.09 2.04 1.99 1.94
2.00 1.95 1.90 1.85
1.93 1.87 1.82 1.77
1.87 1.82 1.77 1.72
1.83 1.77 1.72 1.67
1.79 1.74 1.68 1.63
1.76 1.71 1.65 1.60
1.71 1.66 1.60 1.55
v2
15
20
25
30
35
vi 40
50
60
100
120
ao
1 2 3 4
61.2 2 9.42 5.20 3 .8 7
61.7 4 9.44 5.18 3.84
62.05 9.45 5.17 3.83
62.26 9.46 5.17 3.82
62.42 9.46 5.16 3.81
62.53 9.47 5.16 3.80
62.69 9.47 5.15 3.80
62.79 9.47 5.15 3.79
63.01 9.48 5.14 3.78
63 .0 6 9.48 5.14 3.78
63.63 9.49 5.13 3.76
5. 6 7 8 9
3 .24 2.87 2.63 2.46 2.34
3.21 2.84 2.59 2.43 2.30
3.19 2.81 2.57 2.40 2 .2 7
3.17 2.80 2.56 2.38 2.25
3.16 2.79 2.54 2.37 2.24
3.16 2.78 2.53 2.36 2.23
3.15 2.77 2.52 2.35 2.22
3.14 2.76 2.51 2.34 2.21
3.13 2.75 2.50 2.32 2.19
3.12 2.74 2.49 2.32 2.18
3.10 2.72 2.47 2.29 2.16
10 15 20 25 30
2.24 1.97 1.85 1.77 1.72
2.20 1.92 1.79 1.72 1.67
2.17 1.89 1.76 1.68 1.63
2.16 1.87 1.74 1.66 1.61
2.14 1.86 1.72 1.64 1.59
2.13 1.85 1.71 1.63 1.57
2.12 1.83 1.69 1.61 1.55
2.11 1.82 1.68 1.59 1.54
2.09 1.79 1.65 1.56 1.51
2 .08 1.79 1.64 1.56 1.50
2.06 1.76 1.61 1.52 1.46
40 60 120 ao
1.66 1.60 1.55 1.49
1.60 1.54 1.48 1.42
1.57 1.50 1.44 1.39
1.54 1.48 1.41 1.34
1.52 1.45 1.39 1.32
1.51 1.44 1.37 1.30
1.48 1.41 1.34 1.27
1.47 1.40 1.32 1.24
1.43 1.36 1.28 1.20
1.42 1.35 1.26 1.17
1.38 1.29 1.19 1.00
EL ENTORNO DE LA CALIDAD TOTAL
"fcKa G.3 Distribución de F de Snedecor, valores que dejan un área de pe i ie 0.05 en función de los grados de libertad de la distribución.
v2
1
2
3
4
5
vi 6
7
8
9
10
12
1 2 3 4
161.45 18.51 10.13 7.71
199.50 19.00 9.55 6.94
215.71 19.16 9.28 6.59
224.58 19.25 9.12 6.39
230.16 19.30 9.01 6.26
233.98 19.33 8.94 6.16
236.77 19.35 8.89 6.09
238.88 19.37 8.85 6.04
240.54 19.38 8.81 6.00
241.88 19.40 8.79 5.96
243.90 19.41 8.74 5.91
5 6 7 8 9
6.61 5.99 5.59 5.32 5.12
5.79 5.14 4.74 4.46 4.26
5.41 4.76 4.35 4.07 3.86
5.19 4.53 4.12 3.84 3.63
5.05 4.39 3.97 3.69 3.48
4.95 4.28 3.87 3.58 3.37
4.88 4.21 3.79 3.50 3.29
4.82 4.15 3.73 3.44 3.23
4.77 4.10 3.68 3.39 3.18
4.74 4.06 3.64 3.35 3.14
4.68 4.00 3.57 3.28 3.07
10 15 20 25 30
4.96 4.54 4.35 4.24 4.17
4.10 3.68 3.49 3.39 3.32
3.71 3.29 3.10 2.99 2.92
3.48 3.06 2.87 2.76 2.69
3.33 2.90 2.71 2.60 2.53
3.22 2.79 2.60 2.49 2.42
3.14 2.71 2.51 2.40 2.33
3.07 2.64 2.45 2.34 2.27
3.02 2.59 2.39 2.28 2.21
2.98 2.54 2.35 2.24 2.16
2.91 2.48 2.28 2.16 2.09
40 60 120 ao
4.08 4.00 3.92 3.84
3.23 3.15 3.07 3.00
2.84 2.76 2.68 2.60
2.61 2.52 2.45 2.37
2.45 2.37 2.29 2.21
2.34 2.25 2.17 2.10
2.25 2.17 2.09 2.01
2.18 2.10 2.02 1.94
2.12 2.04 1.96 1.88
2.08 1.99 1.91 1.83
2.00 1.92 1.83 1.75
v2
15
20
25
30
35
vi 40
50
60
100
120
ao
1 2 3 4
245.95 19.43 8.70 5.86
248.01 19.45 8.66 5.80
249.26 19.46 8.63 5.77
250.09 19.46 8.62 5.75
250.69 19.47 8.60 5.73
251.14 19.47 8.59 5.72
251.77 19.48 8.58 5.70
252.19 19.48 8.57 5.69
253.04 19.49 8.55 5.66
253.25 19.49 8.55 5.66
254.32 19.50 8.53 5.63
5 6 7 8 9
4.62 3.94 3.51 3.22 3.01
4.56 3.87 3.44 3.15 2.94
4.52 3.83 3.40 3.11 2.89
4.50 3.81 3.38 3.08 2.86
4.48 3.79 3.36 3.06 2.84
4.46 3.77 3.34 3.04 2.83
4.44 3.75 3.32 3.02 2.80
4.43 3.74 3.30 3.01 2.79
4.40 3.71 3.27 2.97 2.76
4.40 3.70 3.27 2.97 2.75
4.37 3.67 3.23 2.93 2.71
10 15 20 25 30
2 85 2.40 2.20 2.09 2.01
2.77 2.33 2.12 2.01 1.93
2.73 2.28 2.07 1.96 1.88
2.70 2.25 2.04 1.92 1.84
2.68 2.22 2.01 1.89 1.81
2.66 2.20 1.99 1.87 1.79
2.64 2.18 1.97 1.84 1.76
2.62 2.16 1.95 1.82 1.74
2.59 2.12 1.91 1.78 1.69
2.58 2.11 1.90 1.77 1.68
2.54 2.07 1.84 1.71 1.62
40 60 120 ao
1.92 1.84 1.75 1.67
1.84 1.75 1.66 1.57
1.78 1.69 1.60 1.51
1.74 1.65 1.55 1.46
1.72 1.62 1.52 1.42
1.69 1.59 1.49 1.39
1.66 1.56 1.46 1.34
1.64 1.53 1.43 1.32
1.59 1.48 1.37 1.24
1.58 1.47 1.35 1.22
1.51 1.39 1.25 1.00
M ÉTO D O S E S T A D ÍST IC O S . C O N T R O L Y M EJO R A DE LA C A L ID A D
- X
----------
Tabla G.4 Distribución de F de Snedecor, valores que dej an un área de cola de 0 . 0 1 en función de ios grados de libertad de la distribución.
292 j
v2
1
2
3
4
5
vi 6
7
8
9
10
12
1 2 3 4
4052 98.5 0 34.1 2 21.2 0
5000 99.0 0 30.8 2 18.00
5403 9 9 .1 7 29.4 6 16.69
5624 99.25 28.71 15.98
5764 99.30 28.24 15.52
5859 99.33 27.91 15.21
5928 99.36 27.6 7 14.98
5981 99.37 27.49 14.80
6022 99.39 27.3 4 14.66
6056 99.40 27.23 14.55
6106 99.42 27.05 14.37
5 6 7 8 9
16.26 13.74 12.25 11.26 10.56
13.27 10.92 9.55 8.65 8.02
12.06 9.78 8.45 7.59 6.99
11.39 9.15 7.85 7.01 6.42
10.97 8.75 7.46 6.63 6.06
10.67 8.47 7.19 6.37 5.80
10.46 8.26 6.99 6.18 5.61
10.29 8.10 6.84 6.03 5.47
10.16 7.98 6.72 5.91 5.35
10.05 7.87 6.62 5.81 5.26
9.89 7.72 6.47 5.67 5.11
10 15 20 25 30
10.04
7 .7 7 7 .5 6
7.56 6.36 5.85 5.57 5.39
6.55 5.42 4.94 4.68 4.51
5.99 4.89 4.43 4.18 4.02
5.64 4.56 4.10 3.85 3.70
5.39 4.32 3.87 3.63 3.47
5.20 4.14 3.70 3.46 3.30
5.06 4.00 3.56 3.32 3.17
4.94 3.89 3.46 3.22 3.07
4.85 3.81 3.37 3.13 2.98
4.71 3.67 3.23 2.99 2.84
40 60 120
5.18 4.98 4.79 4.61
4.31 4.13 3.95 3.78
3.83 3.65 3.48 3.32
3.51 3.34 3.17 3.02
3.29 3.12 2.96 2.80
3.12 2.95 2.79 2.64
2.99 2.82 2.51
2.89 2.72 2.56 2.41
2.80 2.63 2 .47 2.32
2.66
ao
7.31 7 .0 8 6.85 6.63
v2
15
20
25
30
35
vi 40
50
60
100
120
ao
1 2 3 4
6157 99.43 26.8 7 14.20
62 0 9 99.45 26.6 9 14.02
6240 99.46 26.58 13.91
6261 99.47 26.50 13.84
6276 99.47 26.45 13.79
6287 99.47 26.41 13.75
6302 99.48 26.35 13.69
6313 99.48 26.32 13.65
63 3 4 99.49 26.2 4 13.58
63 3 9 99.49 26.22 13.56
6365 99.50 26.10 13.50
5
9.55 7.40 6.16 5.36 4.81
9.45 7.30 6 .0 6 5.26 4.71
9.38 7.23 5.99 5.20 4.65
9.33 7.18 5.94 5.15 4.60
9.29 7.14 5.91 5.12 4.57
9.24 7.09 5.86 5.07 4.52
9.20 7.06 5.82 5.03 4.48
9.13 6.99 5.75 4.96 4.41
9.11 6.97 5.74 4.95 4.40
9.02
7 8 9
9.72 7.56 6.31 5.51 4.96
10 15 20 25 30
4.56 3.52 3.09 2.85 2.70
441 3.37 2.94 2.70 2.55
4.31 3.28 2.84 2.60 2.45
4.25 3.21 2.78 2.54 2.39
4.20 3.17 2.73 2.49 2.34
4.17 3.13 2.70 2.45 2.30
4.12 3.08 2.64 2.40 2.24
4.08 3.05 2.61 2.36
4.01 2.98 2.54 2.29 2.13
4.00 2.96 2.52 2.27
3.91 2.87 2.42 2.17
2. 11
2.01
40 60 120
2.52 2.35 2.19 2.04
2.37
2 .2 7
2.20
2.06
2.02
2.10
2.03
1.84
1.93 1.78
1.86
1.94 1.76 1.59
1.88
2.03
2.15 1.98 1.81 1.64
2.11
2.20
1.70 1.52
1.66
1.94 1.75 1.56 1.37
1.92 1.73 1.53 1.32
1.80 1.60 1.38
6
1
ao
8.68 8.10
1.88
1.70
2.66
2.21
1.47
2.50 2.34 2.18
6.88 5.65 4.83 4.31
1.00
EL ENTORNO DE LA CALIDAD TOTAL
1Í
Tabla G.5 Distribución de F de Snedecor, valores que dejan un área de col?, de 0 .0 0 1 en función de los grados de libertad de la distribución.
v2
1
2
3
4
5
vi 6
7
8
9
10
12
1 2 3 4
405273 998.50 167.04 74.14
499908 999.01 148.49 61.25
540466 999.18 141.11 56.18
562408 999.27 137.09 53.44
576324 999.33 134.58 51.71
585830 999.34 132.84 50.53
592895 999.39 131.58 49.66
598037 999.39 130.61 49.00
602264 999.40 129.86 48.47
605499 999.42 129.24 48.05
610565 999.42 50.00 47.41
5 6 7 8 9
47.18 35.51 29.24 25.41 22.86
37.12 27.00 21.69 18.49 16.39
33.20 23.7 18.77 15.83 13.90
31.08 21.92 17.20 14.39 12.56
29.75 20.80 16.21 13.48 11.71
28.83 20.03 15.52 12.86 11.13
28.16 19.46 15.02 12.40 10.70
27.65 19.03 14.63 12.05 10.37
27.24 18.69 14.33 11.77 10.11
26.92 18.41 14.08 11.54 9.89
26.42 17.99 13.71 11.19 9.57
10 15 20 25 30
21.04 16.59 14.82 13.88 13.29
14.91 11.34 9.95 9.22 8.77
12.55 9.33 8.10 7.45 7.05
11.28 8.25 7.10 6.49 6.12
10.48 7.57 6.46 5.88 5.53
9.93 7.09 6.02 5.46 5.12
9.52 6.74 5.69 5.15 4.82
9.20 6.47 5.44 4.91 4.58
8.96 6.26 5.24 4.71 4.39
8.75 6.08 5.08 4.56 4.24
8.45 5.81 4.82 4.31 4.00
40 60 120 oo
12.61 11.97 11.38 10.83
8.25 7.77 7.32 6.91
6.59 6.17 5.78 5.42
5.70 5.31 4.95 4.62
5.13 4.76 4.42 4.10
4.73 4.37 4.04 3.74
4.44 4.09 3.77 3.47
4.21 3.86 3.55 3.27
4.02 3.69 3.38 3.10
3.87 3.54 3.24 2.96
3.64 3.32 3.02 2.74
v2
15
20
25
30
35
vi 40
50
60
100
120
oo
1 2 3 4
615844 999.45 127.37 46.76
620788 999.47 126.41 46.10
624047 999.51 125.84 45.70
625976 999.48 125.44 45.43
627686 999.51 125.15 45.24
628601 999.48 124.95 45.09
630172 999.50 124.81 44.88
631225 999.50 124.46 44.75
633331 999.51 124.07 44.47
633850 999.51 123.96 44.40
636256 999.48 123.52 44.05
5 6 7 8 9
25.91 17.56 13.32 10.84 9.24
25.39 17.12 12.93 10.48 8.90
25.08 16.85 12.69 10.26 8.69
24.87 16.67 12.53 10.11 8.55
24.72 16.54 12.41 10.00 8.45
24.60 16.44 12.33 9.92 8.37
24.44 16.31 12.20 9.80 8.26
24.33 16.21 12.12 9.73 8.19
24.11 16.03 11.95 9.57 8.04
24.06 15.98 11.91 9.53 8.00
23.79 15.75 11.70 9.33 7.81
10 15 20 25 30
8.13 5.53 4.56 4.06 3.75
7.80 5.25 4.29 3.79 3.49
7.60 5.07 4.12 3.63 3.33
7.47 4.95 4.01 3.52 3.22
7.37 4.86 3.92 3.43 3.13
7.30 4.80 3.86 3.37 3.07
7.19 4.70 3.76 3.28 2.98
7.12 4.64 3.70 3.22 2.92
6.98 4.51 3.58 3.09 2.79
694 4.48 3.54 3.06 2.76
6.76 4.31 3.38 2.89 2.59
40 60 120
3.40 3.08 2.78 2.51
3.15 2.83 2.53 2.27
2.98 2.67 2.37 2.12
2.87 2.55 2.26 1.99
2.79 2.47 2.18 1.90
2.73 2.41 2.11 1.84
2.64 2.32 2.02 1.73
2.57 2.25 1.95 1.66
2.44 2.12 1.81 1.52
2.41 2.08 1.77 1.45
2.23 1.89 1.54 1.00
OO
293
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
Tabla H Factores para la construcción de gráficos de control
n 2 3 4 5 6
d2
D3 0 0 0
3.2 6 7 2.575 2.282 2.115 2.0 04 1.924 1.864 1.816
1.880
1.128
1-023 0.729
1.693 2.0 5 9
0.5 7 7 0.483 0.419
2.326 2 .5 3 4 2.7 0 4 2.847
d
4
7 8 9
0.373 0.3 3 7
2.970
0 0 0.076 0.136 0 .1 8 4
10 11 12
0.308 0.285 0.266
3.078 3.173 3.258
0.223 0.2 5 6 0 .2 8 4
1.777 1.744 1.716
13 14
0.249 0.235
3.336 3.4 0 7
0.308 0.329
1.692 1.671
15 16 17 18 19
0.223 0.212 0.203 0.194 0.1 8 7
3.472 3.532 3.588 3.640 3.689
0.348 0.3 6 4 0.379 0.392 0.4 0 4
1.652 1.636 1.621 1.608 1.596
20
0.180 0.173
24
0 .1 6 7 0.1 6 2 0.1 5 7
3.735 3.778 3.819 3.858 3.895
0.414 0.425 0.434 0.443 0.452
1.586 1.575 1.566 1.557 1.548
25
0.153
3.931
0.459
1.541
21 22 23
A 2: Gráfico de medios ; factores para los límites de control. d2: Gráfico de rangos ; factores para la línea central. Dv Da: Gráfico de rangos ; factores para los límites de control.
✓
Indice alfabético
üicafonzar 89, 95, 138 mimo de Yates 142-144, 153, 154, 176, 177, 204 Abül>is exploratorio de los datos 90, 94, 108, 118 ■ kpac 93-95, 113, 114, 116, 164, 179-183, 1*8. 191-193, 198-200, 210, 212-216 ■ i yi -ar 95, 152, 164, 179, 181, 183, 185-187 feaEsSorming 35 C afaiad total 15, 18, 21, 23, 244 Car*ndad 15, 16, 69, 83, 135, 2 0 1 , 223-225, 154-258, 275, 276 G w a asignable 48, 49, 60, 225, 245, 250, 253, 254. 260, 267, 269, 271 j ^nún 48, 49, 60, 244, 248, 249, 273 rmiamental 34 potencial 36 pnmuina 35, 36 im nal 32 C i^: PDCA 20, 203 16, 18, 22, 223-226, 229, 233, 239, 247, 257, 261 ~ ^ íiiv id a d 15, 16 C —rfición experimental 139, 145, 146, 151, 175, 199, 230 fa de los efectos 128, 154, 169, 175 de calidad 16, 36, 255 ion 36, 37, 39-42, 56, 57, 63, 193 56, 57, 63 d 15, 19, 188 de ortogonalidad 2 1 2
Criterio de rotabilidad 212 Cultura de la calidad 21 Curvas de nivel 132, 202, 204, 215, 216 Datos apareados 105 inconsistentes 128 Densidad 23, 28, 47, 50-52, 54-56, 60, 62, 63, 66-68,74,76-78, 106, 12S, 129, 13$, 157 Densidad condicional 55 de probabilidad 23, 28, 47, 50-52, 54-56, 60, 63, 6 6 , 6 8 , 74, 76-78 de probabilidad conjunta 54, 56 marginal 55 Desviación tipo 23, 67, 70, 83, 92, 94, 97, 107, 111, 115, 135, 145-147, 256, 276 Diagrama 33-37, 39-42, 94, 129, 130 bivariante 37, 39, 42, 129, 130 causa-efecto 36, 42 de barras 33 de Pareto 31-34 Diferencia de medias 86 , 95, 97, 98 Diseño central compuesto 204, 205. 2.2 de experimentos 18, 22, 23, 130, 135, 223. 225,271 de productos robustos 23, 223, 225, 238 de tolerancias 226, 238 en bloques aleatorizados 10 2 estrella 205, 212-214 factorial 136, 153, 154, 162-165, 179, 199, 200, 205, 212 factorial a dos niveles 136, 155 primario 225
295
ic
METODOS ESTADISTICOS. CONTROL Y MEJORA DE LA CALIDAD
296
secundario 226 terciario 226 Distribución 19, 20, 23, 30, 47, 48, 52, 53, 55, 62, 63, 65, 67-71, 73-79, 81, 82, 88-90, 9295, 100, 102, 105-108, 112-114, 117, 121, 123, 146, 147, 149, 184, 215, 229, 231, 233, 246-248, 252, 255-257, 261, 263, 265, 270 Efecto aditivo 93, 114 bloque 93, 114, 179, 181, 183, 188, 191, 192, 199, 212-216 principal 140-143, 150, 176, 196, 199 Estadísticamente significativa 89, 94, 96, 105 Estadístico de prueba 94, 95, 123 Estado de control 49-52, 59, 6 8 , 243, 244, 246248, 250, 253, 255-259, 262, 269-272 Estimador 75, 79, 8 8 , 90, 97, 111, 116, 119, 1 2 0 , 262 Estrategia experimental 130 secuencial 130, 131, 147, 158, 175, 177, 187-189 Estructura organizativa 17 Evaluación 20, 138 Experimentar 127, 130, 132, 136, 152, 175, 192, 203, 205, 209, 210, 236, 237, 240 Experimentos independientes 70 Factor de control 227, 232 de escala de la t-Student 111 Fracción complementaria 173, 174, 188, 191 Frecuencia absoluta 28, 29 relativa 28, 29, 51, 54, 60 Gestión de la calidad total 21 Grado de libertad 145, 183, 192, 211 Gráfico C 263, 264 CUSUM 266-268 de control 246-248, 254, 256, 260, 261, 263, 264, 269, 270, 275 de observaciones individuales 251, 252 EWMA 269, 270 NP 261 P 258-262 R 250, 252, 254 Shewart 271 U 265 Heterocedasticidad 109, 110 Hipótesis alternativa 8 6 , 90, 96, 111 Hipótesis nula 8 6 , 89, 95, 96, 98, 110, 111, 113, 211
Histograma 28-30, 48, 50, 51, 54, 60, 103, 255 Igualdad de varianzas poblacionales 8 8 , 90, 102
Independencia de las diferencias 94 de las poblaciones 90 Indice de capacidad 256, 257 Innovación 15, 18, 19 Inspección 16-18, 30, 225, 243, 250, 260 Intervalo de confianza 97-99 de confianza para la diferencia de medias 9~ Límite de control 248 Mantenimiento 15, 18, 19, 35, 47, 72, 224, 225 238, 255 Media muestral 74, 83, 119, 250 poblacional 52, 119 ponderada de las varianzas muéstrales 1 1 1 fracciones 172, 173, 175, 177, 188 Mejora continua 15, 18-20, 244, 247, 256 Método de matriz producto 230 de Taguchi 226, 240, 241 Modelo de segundo orden 207, 211, 214, 217, 221, 237 Muestra aleatoria simple 74, 79, 94 Muestreo 16, 17, 45, 247, 248, 260, 272 Nivel codificado 137, 138 Normalidad de las poblaciones 89 Planificar 19, 72, 89, 113, 130 Plantilla 26, 33, 250, 256, 268, 269 Población conceptual 51, 54, 59, 61, 74 Población normal 75, 121 Proceso en estado de control 49-52, 59, 6 8 , 244, 246, 247, 258, 259, 270, 272 Productividad 16, 22, 93, 110, 111, 113, 116, 117 Producto robusto 223, 229, 236 Quality function deployement (QFD) 18 Rango 30, 41, 128, 129, 154, 202, 231, 248252, 257 Recogida de datos 25, 26, 41, 45, 89, 90, 9395, 113, 203, 248 Región de operabilidad 206 Relación no causal 129 Réplica 139, 163, 164 Residuo 151 Resolución 22, 34, 45, 87, 92, 110, 114, 172, 173, 175, 177, 178, 183-185, 187, 189-191. 195, 196, 198, 200, 203, 228-230, 233
X
Responsabilidad 19, 22, 48 Recurso humano 130 Riesgo 91, 247, 267, 268 Ruido externo 226, 227, 229, 232, 235, 236 Ruido interno 226, 227, 236-238 Sesgado 30 Sistema 48, 49, 6 8 , 134, 135, 139, 144, 145, 149, 158, 188, 193, 248 Suceso 74 Tolerancia 30, 69, 275 Tratamiento 23, 89, 91, 92, 94, 95, 111, 113, 115, 117, 118, 229, 271 Valor de prueba 39, 40 Valor previsto 115, 151, 270 Variabilidad funcional 224 Variable aleatoria 23, 49, 51-54, 60, 62, 65-67, 70, 74, 76, 121 Variable oculta 129, 154 Varianza 23, 51, 52, 58, 62, 71, 73, 77-81, 8 8 , 90, 97, 105, 108-111, 115-121, 133, 141, 144-146, 152, 231, 236, 238, 239, 241, 248, 61, 263, 266 Volante de Deming 20
ÍNDICE ALFABÉTICO
297
Bibliografía
ABRA 64] AT&T851 150X76] 1BOX86]
:BOX87] 'BOX881
^0X921 'BRIT80] CHUN681 'DEMI82] [DEMI83] [DOUG91] GRIM93] ÍHOGG78] [IMAI86] [1SHI85] [ISHI85] ÍJOHN71] [JOHN70] ÍJURA51] [JURA80] [JURA90] [KACK85]
M .; s t e g u n , i. Handbook o f Mathemcitical Functions pover. N ueva York, 1964. & T. S tatistical Q uality Control Handbook. A SQ C , 1985. b o x , G .; j e n k i n s , G. Time series analysis forecastin g and control. H olden-D ay, C alifornia, 1976. b o x , G .; FUNG, C. Studies in Q uality Improvement. M inimizing Transmitted Variation by P aram etrer Design. C enter for Q uality and Productivity Im provem ent, R eport N um . 8, U niversity o f W isconsinM adison, 1986. b o x , G. Em pirical M odel-Building and Response Surfaces. D raper, N orm an Richard, John W iley & Sons, N ueva York, 1987. BOX, GEORGE E.P.; h u n t e r , w i l l i a m G .; h u n t e r , j . S t u a r t . Estadística p a ra investigadores. R everté, Barcelona, 1988. b o x , G .E .; KRAMER. Statistical Process M onitoring and Feedback Adjustment. Technom etrics, 1992. b r i t i s h s t a n d a r d s i n s t i t u t i o n . Guide to D ata analysis and quality control using cusum techniques. 1980. c h u n g , k a i l a i . A course in P robability Theory. H artcolurt, B race & world, Inc., N ueva York, 1968. d e m i n g , w. E d w a r d s . Out o f the Crisis. MIT, M assachussets, 1982. d e m i n g , w. E d w a r d s . Quality, P roductivity and C om petitive Position. M IT C enter for A dvanced Engineering Study, C am bridge- M assachussets, 1983. d o u g l a s , c.; m o n t g o m e r y , d .c . Introduction to Statistical Quality Control Second Edition. Wiley, 1991. g r i m a , p . A portaciones m etodologicas a l diseño de produ ctos robustos. Tesis doctoral. U niversitat P olitécnica de C atalunya, 1993. h o g g , r .; c r a i g , A. Introduction to m athem atical statistics. M acm illian, N ueva York, 1978. i m a i , m a s a a k i . Kaizen, the key to Japanis com petitive success the Random House. N ueva York, 1986. is h i k a w a , k a o r u . Guía de control de calidad. Ed. U N IPU B , N ueva York, 1985. is h i k a w a , k a o r u . Wath is Total Q uality Control? T he Japanese way, Prentice-H all. Inc. E nglew ood clidds, N ueva York, 1985. j o h n , p e t e r . Statistical design and analysis o f experiments. T he M acM illan Com pany. N ueva York (1971) JOHNSON, n o r m a n ; k o t z , Sa m u e l . D istributions in Statistics: Continuous U nivariate D istributions 1 and 2. H oughton M ifflin Com pany, Boston. 1970. j u r a n , j . m . Q uality Control Handbook. M cG raw -H ill, N ueva York, 1951. j u r a n & g r y n a . Q uality Planning and Analysis. M cG raw -H ill, 1980. j u r a n , j .m . Juran y la planificación para la calidad. Ed. D íaz de Santos, B arcelona, 1990. k a c k a r , r . n . “O ff-L ine Q uality C ontrol, P aram etrer D esign, and the Taguchi M ethod. ” Journal o f Q uality Technology, vol. 17, N ° 4 , 1985. a b r a m o w it z , at
299
MÉTODOS ESTADÍSTICOS. CONTROL Y MEJORA DE LA CALIDAD
[K A N 0 8 7 ] [K A R A 9 1 ] [K H U R 8 7 ]
X
T G C a s to t a l Q u a lity C re a tio n . IC G C , T o k y o , 1 9 8 7 . C T C : L a s a b id u r ía ja p o n e s a . E d ic io n e s G e s tió n 2 0 0 0 S .A ., B a r c e lo n a , 1 9 9 1 . k h u r i , a . i ; c o r n e l l , j . a . R e s p o n s e S u rfa c e s. D e s ig n a n d A n a ly s e s . M a rcel D ek k er, In c. A S G C Q u a lity P r e ss, 1 9 8 7 . [L U K A 5 6 ] l u k a c s , E. “P r o c e d in g s 3 d B e r k e le y S y m p o s iu m o n M a th e m a tic a l S ta tistic s.” P r o b a b ilid a d 2 . pp 1 9 5 -2 1 4 , 1 9 5 6 . [M A C G 9 0 ] M A CG REG O R , j . f . A D iffe re n t V iew o f th e F u n n e l E x p e rim e n t. J.Q .T ., 1 9 9 0 . [M A G H 9 0 ] m a g h s o o d l o o , s . “T h e E x a c t R e la tio n o f T a g u c h i’s S ig n a l-to - N o is e R a tio to H is Q u a lity L o ss F u n c tio n ” . J o u r n a l o f Q u a lity T e c h n o lo g y , v o l. 2 2 , n° 1, 1 9 9 0 . [M IL L 8 4 ] m i l l i k e n & J o h n s o n . A n a ly s is o f M e s s y D a ta . v o l. 1 D e s ig n e d E x p e r im e n ts, V an N o stra n d R e in h o k l N u e v a Y ork, 1 9 8 4 . [M O N T 9 1 ] m o n t g o m e r y , D .C .; m a s t r a n g e l o , C .M . S o m e S t a t i s t i c a l P r o c e s s C o n tr o l M e th o d s f o r A u to c o r r e la te d D a ta J o u r n a l o f Q u a lity T e ch n o lo g y, v o l. 2 3 , n° 3 , 1 9 9 1 . [P A T E 82] p a t e l , j a g d i s h K .; r e a d , C a m p b e l l B. H a n d b o o k o f th e n o r m a l d is tr ib u tio n . M . D ek k e r , N u e v a Y o tk . kano
,
n o n a k i.
k a r a t s u , h a ijm e .
1982. [P E Ñ A 8 6 ] [R O S S 8 8 ] [R Y A N 8 8 ] [S H E W 3 1 ]
, D .; p r a t , a . C ó m o c o n tr o la r la c a lid a d . M a n u a le s IM P L , M in iste r io d e In d u stria y E n e r g ía M ad rid , 1 9 8 6 . r o s s , P J . T a g u ch i T e c h n iq u e s f o r Q u a lity E n g in e e rin g . M c G r a w -H ill, N u e v a Y ork, 1 9 8 8 . r y a n , T.P. T agu ch V s A p p r o a c h to E x p e r im e n ta l D e s ig n : S o m e C o n c e rn s. Q u a lity P r o g ress, 1988. s h e w h a r t , w .a . E c o n o m ic c o n tr o l o f Q u a lity o f M a n u fa c tu r e d P ro d u c t. A m e r ic a n S o c ie ty fo r Q C peñ a
1931. [S H O E 9 1 ] [S N E D 3 7 ] [T A G U 8 6 ] 300 [T O R T 8 5 ]
[T R IB 8 9 ] [V A C H 9 2 ] [W U 8 7 ]
, a .c .; t s u i , c . f .; w u , j e f f . “E c o n o m ic a l E x p e rin icn ta tio n M e th o d s fo r R o b u st D e s ig n T e c h n o m e tric s , v o l. 3 3 , n° 4 , 1 9 9 1 . s n e d e c o r , g . w . S ta tis tic a l M e th o d s. C o le g ía te P ress, A m e s , Io w a , 1 9 3 7 . t a g u c h i , G . I n tro d u tio n to Q u a lity E n g in e e r in g : D e s ig n in g Q u a lity In to P r o d u c ts a n d P r o c e s s e s A sia n P r o d u c tiv ity O rg a n iz a tio n , T o k y o , 1 9 8 6 . t o r t - m a r t o r e l l , j . D is e ñ o s f a c t o r ia l e s f r a c c ió n a le s . A p lic a c ió n a l c o n tr o l d e c a lid a d m e d ia n te ( i d is e ñ o d e p r o d u c to s y p r o c e s o s . T e sis d o cto ra l. U n iv e r sita t P o lité c n ic a d e C a ta lu n y a , 1 9 8 5 . t r i b u s , M .; s z o n y i , g . A n A lte r n a tiv e V iew o f th e T a g u c h i A p p r o a c h . Q u a lity P ro g r e ss, 1 9 8 9 . v a c h e t t e , j . l . M e jo r a c o n tin u a d e la c a lid a d . E d ic io n e s C e a c , S .A ., B a r c e lo n a , 1 9 9 2 . w u , C .F .J .; m a o , S .S .; m a , f . s . A n I n v e s tig a tio n o f O A - B a s e d M e th o d s f o r P a r a m e te r D esis*: O p tim ita tio n . C en ter for Q u a lity and P r o d u c tiv ity Im p r o v em e n t, R ep o rt N u m . 2 4 , U n iv e r sity o f sh o em a k er
W is c o n sin -M a d i so n , 1 9 8 7 .
Métodos estadísticos Control y mejora de la calidad El o b je tiv o fu n d a m e n ta l de este lib ro es s a tis fa c e r las n e ce sid a d e s y ex pe cta tiva s, en c u a n to a fo rm a c ió n e s ta d ís tic a , de lo s e s tu d ia n te s de in g e niería y de to d o s a q u e llo s té c n ic o s , in g e n ie ro s y c ie n tífic o s que q u ie re n u tiliz a r m é to d o s e s ta d ís tic o s para a ce le ra r la a d q u is ic ió n de c o n o c im ie n to s . Tras e x p o n e r la im p o rta n c ia de lo s c o n c e p to s de la c a lid a d to ta l y s itu a r la e s ta d ís tic a c o m o u n o de s u s p ila re s fu n d a m e n ta le s , se p re s e n ta n las h e rra m ie n ta s b á sica s para la m ejora de la c a lid a d y se tra ta n , de fo rm a c o n c e p tu a l y re su m id a , lo s e le m e n to s b á s ic o s de la v a ria b ilid a d y de su m e d id a en la te o ría de la p ro b a b ilid a d . E sto s c o n c e p to s , a co m p a ñ a d o s de n u m e ro s o s e je m p lo s , so n u tiliz a d o s para p re s e n ta r a c o n tin u a c ió n lo s m é to d o s de c o m p a ra c ió n de d o s o m ás p o b la c io n e s , ta n to para el ca so de d is e ñ o s to ta lm e n te a le a to rio s c o m o para d is e ñ o s en b lo q u e c o m p le to s a le a to riza d o s. Tam bién se p re se n ta n con d e ta lle las té c n ic a s de d is e ñ o de e x p e rim e n to s , ta n to en su v e rs ió n c lá sica de d is e ñ o s fa c to ria le s y fa c to ria le s fra c c ió n a le s , c o m o en su v e rs ió n de m é to d o s de T ag uchi para el d is e ñ o de p a rá m e tro s en in g e n ie ría de ca lid a d , así co m o lo s a s p e c to s re la c io n a d o s c o n el c o n tro l e s ta d ís tic o de p ro ce so s. La fu e n te p rin c ip a l de in fo rm a c ió n ha s id o la e x p e rie n c ia a d q u irid a p o r lo s a u to re s d u ra n te las m ú ltip le s a se so ría s re a lizada s a to d o tip o de o rg a n is m o s p ú b lic o s y p riv a d o s , ta n to n a c io n a le s co m o in te rn a c io n a le s . Este c o n ta c to in te n s o con la re a lid a d p e rm ite la o b te n c ió n de d a to s reale s y la a p lic a c ió n de lo s m é to d o s e s ta d ís tic o s a p ro b le m a s re le va n te s para el p ú b lic o a q u ie n va d irig id o el te xto . LOS AUTORES: El c a te d rá tic o A l b e r t P r a t , D o c to r In g e n ie ro In d u s tria l; el p ro fe s o r X a v i e r T o r t - M a r t o r e l l , D o c to r In g e n ie ro In d u s tria l y M áster p o r la U n iv e rs id a d de W is c o n s in -M a d is o n ; el p ro fe s o r P e r e G r i m a , D o c to r In g e n ie ro In d u s tria l, y la p ro fe s o ra L o u r d e s P o z u e t a , L ic e n c ia d a en M a te m á tica s y M á ste r p o r la U n ive rsid a d de W is c o n s in -M a d is o n , p e rte n e ce n al D e p a rta m e n to de E sta d ís tic a e In v e s tig a c ió n O p e ra tiv a de la UPC e im p a rte n d o c e n c ia en la E sco la T é cn ica S u p e rio r d 'E n g in y e rs In d u s triá is de B a rce lo n a (ETSEIB). L o s a u to re s de esta o b ra han e je rc id o d o c e n c ia e in v e s tig a c ió n en la U n ive rsid a d de W is c o n s in y a c tu a lm e n te in v e s tig a n en el c a m p o de la e s ta d ís tic a in d u s tria l en la UPC. A s im is m o m a n tie n e n v ín c u lo s c o n el m u n d o de la em presa.
a
K A lfaom ega G ru p o E d ito r