1.6 Teorema de Tchebyscheff Tchebyscheff y y Regla Empírica La desviación estándar es una medida de la fluctuación (dispersión) que hay en los datos. Ha sido definida como un valor calculado con el empleo de fórmulas. Sin embargo, es posible preguntar qué es realmente. Es un tipo de medida con la que es posible comparar la variabilidad de un conjunto de datos con otro. Esta “medida” particular puede comprenderse aun más al examinar dos proposiciones: el teorema de Tchebyscheff y la Regla empírica. Teorema Teorema de Tchebysc heff
Dado un número k mayor o igual que 1 y un conjunto de n mediciones, por lo menos
1 (1 / k 2 ) x100% de las mediciones está dentro dentro de k desviaciones estándar de su media.
f ri Por lo menos
1 (1 / k 2 )
x ks
ks
Este teorema establece que a menos de dos desviaciones estándar de la media ( k 2) siempre se encontrará por lo menos el 75% (es decir, el 75% o más) de los datos. 1
1 2
k
1
1 2
2
1
1 4
0.75 , por lo menos 75%
En la gráfica 1.7 se muestra una distribución que ilustra por lo menos el 75% de los datos. S
75%
x Gráfica 1.6.1
2s
x
x
2s
Si se considera el intervalo que abarcan tres desviaciones estándar a cada lado de la media ( k 3) , el teorema establece que siempre se encontrará por lo menos el 89% (es decir, el 89% o más) de los datos. S
1 89%
x
3s
x
1 k
2
1
1 3
2
1
1 9
0 . 89
89 %
La gráfica 3.8 muestra una distribución que ilustra por lo menos el 89% de los datos. x
3s
Gráfica 1.6.2
El teorema estable que:
Ninguna de las mediciones quedan en el intervalo
x s a x s
Por lo menos el 75% de las mediciones quedan en el intervalo x 2 s a x 2 s Por lo menos el 89% de las mediciones se encuentran en el intervalo x 3s a x 3s
A un que el primer enunciado no es del todo útil, los otros dos valores de k proporcionan información valiosa respecto a la proporción de las mediciones que quedan en ciertos intervalos. Los valores k 2 y k 3 no son los únicos valores de k que se pueden utilizar; por ejemplo, la proporción de mediciones que se localizan dentro de k 2.5 desviaciones estándar de la media es por lo menos 1 1 /(2.5)
2
0.84
Ejemplo 1.6.1
La media y varianza de una muestra de n 25 mediciones son 75 y 100, respectivamente. Aplique el teorema de Tchebysheff para describir la distribución de las mediciones. Solución:
Los datos son x 75 y s 2 100 . La desviación estándar es s 100 10 . La distribución de las mediciones está centrada respecto a x 75 y el teorema de Tchebysheff establece Tchebysheff establece que:
Por lo menos el 75% de las mediciones quedan en el intervalo x 2s a x 2 s es decir 75 2(10) es decir, de 55 a 95. Por lo menos el 89% de las mediciones se encuentran en el intervalo x 3s a x 3s es decir 75 3(10) es decir, de 45 a 105.
Como el teorema de Tchebysheff se Tchebysheff se aplica a cualquier distribución, se dice que es muy conservador. Ésta es la razón por la cual en este teorema se enfatiza que “por lo menos 1 (1 / k 2 ) ”. Otra regla para describir la variabilidad de un conjunto de datos no funciona para todos los conjuntos de datos, pero sí se sí se aplica muy bien cuando los datos se “acumulan” y dan lugar a la conocida forma de campana que se ilustra en la grafica 3.9. A medida que la distribución de sus datos se parece más a la curva con forma de campana, la regla se vuelve más exacta. Como la distribución de datos con forma de campana se presenta muy a menudo en la naturaleza, la regla tiene con frecuencia aplicaciones prácticas. Por esta razón se le llama regla empírica.
10 0
80
a i c n e u c e r F
60
40
20
0 15
20
25
Edad
Gráfica 1.6.3
Dada una distribución de mediciones que tiene una forma aproximada de campana:
El intervalo
El intervalo x 2 s a x 2 s contiene aproximadamente el 95.44% El intervalo x 3s a x 3s contienen aproximadamente el 99.74%
x s a x s contiene aproximadamente el 68.26%
La distribución con forma de campana que se muestra en la gráfica 3.9 regularmente se conoce como distribución normal.
En la gráfica 1.6.4 se muestran los intervalos de una, dos y tres desviaciones estándar alrededor de la media de una distribución normal aproximada. Estas proporciones suelen no ocurrir de manera exacta en una muestra, aun que los valores observados están próximos cuando se extrae una gran muestra de una población distribuida normalmente.
34.13%
34.13%
13.59%
13.59%
2.15%
x
3s
2.15%
x
2 s x s
x
x s
x 2 s x 3s
68.26% 95.44% 99.74% Gráfica 1.6.4
Ejemplo 1.23
En un estudio de tiempos y movimientos practicado en una fábrica se midió el tiempo que tomaba a cada uno de n 40 obreros terminar una operación específica. Se encontró que la media y la desviación estándar eran 12.8 y 1.7, respectivamente. Describe los datos de la muestra mediante la regla empírica. Solución.
x s 11.1
x x s 12.8
12.8 –1.7 = 11.1 12.8 +1.7 = 14.5
14.5 68.26%
x
9.4
2s
x 12.8
12.8 – 3.4 = 9.4 12.8 + 3.4 = 16.2
x
2s x 3s
14.5
7.7 95.44%
Gráfica 1.6.5 El tiempo que tomaba a cada uno de n operación específica, en el 68.26%, 95.44% y 99.74%
x
x
3
12.8
17.9
12.8 –5.1 = 7.7 12.8 +5.1 =17.9
99.74%
40 obreros terminar una
Según la regla empírica, se espera que aproximadamente 68.26% de las mediciones estén en el intervalo de 11.1 a 14.5, que aproximadamente 95.44% se localicen en el intervalo de 9.4 a 16.2 y que todas o casi todas estén en el intervalo de 7.7 a 17.9
Apli Ap li cac ió n del d el t eor ema de d e Tcheby Tch ebysh sh eff y l a regla reg la empír em pír ic a
E l teorema teorema de Tchebysheff se puede demos demostrar trar matemáticament atemáticamente. e. Se Se aplica a cualquier conjunto de mediciones de una muestra o una población, grande o pequeña, con forma de campana o sesgada. El teorema de Tchebysheff proporciona un límite inferior para la fracción de mediciones se encontrará en un intervalo formado como x ks . Por lo menos 1 (1 / k 2 ) de las mediciones estará en este intervalo y ¡quizá más! La regla empí empírica rica es una “regla “regla práctica” que se usa como herramienta herramienta descriptiva sólo cuando los datos tienden a tener una forma parecida a la de una campana (los datos tienden a agruparse alrededor del centro de la distribución). Cuando se utilizan utilizan estas dos herram herramient ientas as para describir describir un conjunto conjunto de de mediciones, el teorem teorema a de Tchebysheff siempre se cumplirá, cumplirá, pero es una estimación muy conservadora de la fracción de las mediciones que se encontrarán en un intervalo en particular. Si se puede usar la regla empírica (datos con forma de campana), esta regla le proporcionará una estimación más exacta de la fracción de mediciones que hay en el intervalo.