Problemas de estimación de una muestra
Una sola muestra: estimación de la media (I)
Media muestral ҧ → estimación puntual para la media de la población . Teniendo la fórmula ҧ
= , con una muestra grande, producirá un valor de ത procedente de una una distribución muestral muestral con varianza pequeña. Probable que ҧ sea una estimación muy precisa de cuando n es grande ≥ 30 .
Establecer intervalo de confianza.
Estimación por intervalos de
Seleccionar una muestra.
≥ 30 Se puede establecer un intervalo de confianza para considerando la distribución distribución muestral de ത .
Teorema del límite central
Si se tiene un grupo numeroso de variables independientes con un mismo modelo de distribución, la suma de ellas se distribuye según una distribución normal. Ejemplo:
Tirar una moneda al aire (Bernoulli). Al realizar 50 tiradas, la suma de las 50 variables (independientes) se distribuye según una distribución normal.
Distribución muestral de ത ≈ distribución normal, con:
ҧ =
Una sola muestra: estimación de la media (II)
, ҧ =
Al escribir / para el valor por arriba del cual se tiene un área de /2 bajo la curva normal:
Intervalo de confianza de cuando se conoce
ҧ = media de una muestra aleatoria de tamaño .
Intervalo de confianza de 100 1 − % para :
Una sola muestra: estimación de la media (III)
Para muestras pequeñas de poblaciones no normales, no se puede esperar un grado de confianza preciso. Para muestras ≥ 30 y forma de la distribución no muy sesgada, se garantizan buenos resultados.
, límites de confianza: Θ y Θ Para los valores de las v.a. = ҧ − / Límite inferior: Θ = ҧ + / Límite superior: Θ
Una sola muestra: estimación de la media (IV)
Muestras diferentes producirán valores diferentes de ҧ y diferentes estimaciones para intervalos de . La anchura de los intervalos está dada por: / .
Estimaciones por intervalos de para muestras diferentes
Ejemplo 1
Se encuentra que la concentración promedio de zinc que se obtiene en una muestra de mediciones en 36 sitios diferentes de un rio es de 2.6 gramos por mililitro. Calcule los intervalos de confianza del 95% y 99% para la concentración media de zinc en el rio. Suponga que la desviación estándar de la población es de 0.3 gramos por mililitro. La estimación puntual de μ es ҧ = 2.6. El valor que deja un área de 0.025 a la derecha y, por lo tanto, una área de 0.975 a la izquierda es . = 1.96. En consecuencia, el intervalo de confianza del 95% es:
Tamaño del intervalo: 0.20
Ejemplo 1
Para calcular un intervalo de confianza del 99% encontramos el valor z que deja un área de 0.005 a la derecha y de 0.995 a la izquierda. Por lo tanto, usando la tabla, . = 2.575 y el intervalo de confianza de 99% es:
Tamaño del intervalo: 0.26
Una sola muestra: estimación de la media (V)
Intervalo de confianza = estimado de la estimación puntual.
La magnitud de error de cálculo de a partir de ҧ: |ҧ -|.
Porcentaje de confianza en que la diferencia no exceda a /
.
En el ejemplo 1:
Ejemplo 2
95% de confianza de que la media muestran ҧ = 2.6 difiere de la . media verdadera μ en una cantidad menor que 1.93 = 0.1 99% de confianza en que la diferencia es menor que 2.575 0.13
.
=
Una sola muestra: estimación de la media (VI)
Si se usa ҧ como estimación de , se tiene 100 1 − % de confianza en que el error no exceda una cantidad específica cuando el tamaño de la muestra sea: / = = error o tolerancia
Una sola muestra: estimación de la media (VII)
Para la fórmula anterior es necesario conocer la varianza de la población de la cual se tomó la muestra. En caso que no se conozca, tomar una muestra n ≥ 30 para una estimación de . Entonces se toma: ≈
Ejemplo 3
¿Qué tan grande debe ser la muestra del ejemplo anterior si queremos tener 95% de confianza en que nuestra estimación de diferirá por lo menos de 0.05? La desviación estándar de la población es = 0.3. Entonces, por medio de la fórmula anterior: (1.96)(0.3) = = 138.3 0.05
Límites de confianza unilaterales (I)
Tratados anteriormente = bilaterales: límite superior y límite inferior. Interés de un solo límite:
Determinar medida de resistencia a la tensión (peor caso: menor resistencia). relativamente grande no fuera redituable o deseable: límite de confianza superior. Composición media de mercurio en el agua de un río: medida del límite superior.
Límites de confianza unilaterales obtención
Similar a los intervalos bilaterales.
Cálculo:
Límites de confianza unilaterales conociendo el valor de
Si ത es la media de una muestra aleatoria de tamaño n a partir de una población con varianza , los límites unilaterales del 100 1 − % para son dados por:
Límite unilateral superior: ҧ + / Límite unilateral inferior: ҧ − /
Ejemplo 4
En un experimento de pruebas psicológicas se seleccionan al azar 25 sujetos y se miden sus tiempos de reacción, en segundos, ante un estimulo particular. La experiencia sugiere que la varianza en los tiempos de reacción ante los diferentes tipos de estímulos es de 4 s2 y que la distribución del tiempo de reacción es aproximadamente normal. El tiempo promedio para los sujetos fue de 6.2 segundos. Calcule un limite superior del 95% para el tiempo medio de reacción. Lo que da el limite superior del 95% es:
En consecuencia, tenemos un 95% de confianza en que el tiempo promedio de reacción es menor que 6.858 segundos.
El caso en que se desconoce
Se tiene una muestra aleatoria a partir de una distribución normal, entonces la variable aleatoria: Tiene una distribución t de Student con n-1 grados de libertad.
Intervalo de confianza de cuando se desconoce
ҧ = media de una muestra aleatoria de tamaño .
Intervalo de confianza de 100 1 − % para :
Límites de confianza unilaterales desconociendo el valor de
Si ത es la media de una muestra aleatoria de tamaño n a partir de una población con varianza , los límites unilaterales del 100 1 − % para son dados por:
Límite unilateral superior: ҧ + / Límite unilateral inferior: ҧ − /
Ejemplo 5
El contenido de acido sulfúrico de 7 contenedores similares es de 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Calcule un intervalo de confianza del 95% para el contenido promedio de todos los contenedores suponiendo una distribución aproximadamente normal. La media muestral y la desviación estándar para los datos dados son:
ҧ = 10 y
= 0.283
Usando la tabla de distribución t, se tiene: . = 2.447para = 6 grados de libertad. En consecuencia, el intervalo de confianza del 95% para μ es:
Concepto de intervalo de confianza en una muestra grande
Se recomienda un tamaño de muestra ≥ 30, entonces se puede reemplazar con . Entonces:
Y una distribución de la población no muy sesgada, s estará muy cerca de la verdadera.
Ejemplo 6
Se obtienen las calificaciones de matemáticas del Examen de Aptitudes Escolares (SAT, por sus siglas en ingles) de una muestra aleatoria de 500 estudiantes del ultimo ano de preparatoria del estado de Texas. Se calculan la media y la desviación estándar muestrales, que son 501 y 112, respectivamente. Calcule un intervalo de confianza del 99% de la calificación promedio de matemáticas en el SAT para los estudiantes del ultimo año de preparatoria del estado de Texas. Como el tamaño de la muestra es grande, es razonable utilizar la aproximación normal. Usando la tabla, se tiene . = 2.575. Por lo tanto, un intervalo de confianza del 99% para μ es:
Error estándar de una estimación puntual
Estimación puntual: proporcionan un solo número que se extrae de un conjunto de datos experimentales. Estimación del intervalo de confianza: intervalo razonable para el parámetro dados los datos experimentales. Los intervalos “cubren” el parámetro. Una medida de la calidad de un estimador insesgado es su varianza: ҧ
=
Error estándar o desviación estándar:
ҧ =
Límite de confianza:
Estimación puntual y estimación por intervalos:
Intervalos de confianza (I)
Buena información de desconocido de una distribución normal o de una distribución no normal con una muestra grande.
Interés: valor posible de una observación futura.
Por ejemplo:
Control de calidad: necesitar utilizar los datos observados para predecir una nueva observación. Proceso de manufactura de una pieza de metal, se puede evaluar basándose en si la pieza cumple con las especificaciones de resistencia de tensión.
Intervalos de confianza (II)
Obtener un intervalo de predicción:
Población normal con media desconocida. Varianza conocida. ത ҧ = Varianza de :
Intervalo de predicción para una observación futura cuando se conoce
Variable aleatoria normal: − ҧ
nueva observación y ҧ se toma de la muestra.
Ejemplo 7
Debido a la disminución en las tasas de interés el First Citizens Bank recibió muchas solicitudes para hipoteca. Una muestra reciente de 50 créditos hipotecarios dio como resultado un promedio en la cantidad de prestamos de $257,300. Suponga una desviación estándar de la población de $25,000. En el caso del siguiente cliente que llena una solicitud de crédito hipotecario calcule un intervalo de predicción del 95% para la cantidad del crédito. La predicción puntual de la cantidad del crédito del siguiente cliente es ҧ = $257,300. El valor z aquí es . = 1.96. Por lo tanto, un intervalo de predicción del 95% para la cantidad de un crédito futuro es:
El intervalo: ($207,812.43, $306,787.57)
Intervalo de predicción para una observación futura cuando se desconoce
Variable aleatoria normal: − ҧ
nueva observación y ҧ se toma de la muestra.
Ejemplo 8
Un inspector de alimentos selecciono aleatoriamente 30 paquetes de carne de res 95% magra. La muestra dio como resultado una media de 96.2% con una desviación estándar muestra de 0.8%. Calcule un intervalo de predicción del 99% para la condición baja en grasa de un paquete nuevo. Suponga normalidad. Para v = 29 grados de libertad, . = 2.756. Por lo tanto, un intervalo de predicción del 99% para una observación nueva es: