METODOS Y DISTRIBUCIONES DE MUESTREO Introducción al muestreo muestreo.. a. Concepto e importancia Es la actividad por la cual se toman ciertas muestras de una población de elementos de los cuales vamos a tomar ciertos criterios de decisión, el muestreo es importante porque a través de él podemos hacer análisis hacer análisis de situaciones de una empresa o empresa o de algún campo de la sociedad sociedad.. b. Terminología Terminología básica para el muestreo Los nuevos términos, los cuales son recuentemente usados en inerencia estadístic estadística a son! Estadístico! "n estadístico es una medida usada para describir alguna característica de una muestra , tal como una media aritmética, una mediana o una desviación estándar de una muestra. #arámetro! "na parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana o una desviación estándar de una población. Cuando los dos nuevos términos de arriba son usados, por e$emplo, el proceso de estimación en inerencia estadística estadística puede puede ser descrito como le proceso de estimar un parámetro a partir del estadístico correspondiente, tal como usar una media muestral % un estadístico para estimar la media de la población %un parámetro&.
'istribución en el muestreo! Cuando el tama(o de la muestra %n& es más peque(o que el tama(o de la población %)&, dos o más muestras pueden ser e*traídas de la misma población. "n cierto estadístico puede ser calculado para cada una de las muestras posibles e*traídas de la población. "na distribución distribución del del estadístico obtenida de las muestras es llamada la distribución en el muestreo del estadístico. #or e$emplo, si la muestra es de tama(o + la población de tama(o - %elementos , , /, C&, es posible e*traer - muestras % /, /C 0 C& de la población. #odemos calcular la media para cada muestra. #or lo tanto, tenemos - medias muéstrales para las - muestras. Las - medias muéstrales orman una distribución. La distribución de las medias es llamada la distribución de las medias muéstrales, o la distribución en el muestreo de la media. 'e la misma manera, la distribución de las proporciones %o porcenta$es& obtenida de todas las muestras posibles del mismo tama(o, e*traídas de una población, es llamada la distribución en el muestreo de la proporción. Error Estándar! La desviación estándar de una distribución, en el muestreo de un estadístico, es recuentemente llamada el error estándar del estadístico. estadístico. #or e$emplo, la desviación estándar de las medias de todas la muestras posibles del mismo tama(o, e*traídas de una población, es llamada el error estándar de la media. 'e la misma manera, la desviación estándar de las proporciones de todas las muestras posibles del mismo tama(o, e*traídas de una población, es llamada el error estándar de la proporción. La dierencia entre los términos 1desviación estándar1 1error de estándar1 es que la primera se reiere a los valores originales, valores originales, mientras que la última está relacionada con valores valores calculados. calculados. "n estadístico es un valor valor calculado, calculado, obtenido con los elementos incluidos en una muestra. Error muestral o error de muestreo La dierencia entre el resultado obtenido de una muestra %un estadístico& el resultado el cual deberíamos haber obtenido de la población %el parámetro correspondiente& se llama el error muestral o error de muestreo. "n error de muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población, sino que se toma una muestra para estimar las características características de la población. El error muestral es medido por el error estadístico, en términos de probabilidad probabilidad,, ba$o la curva normal. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. 2ientras más peque(o el error muestras, maor es la precisión de la estimación. 'eberá hacerse notar que los errores cometidos en una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no determinadas, no son
considerados como errores muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta completa de la población.
TIPOS DE DISTRIBUCIONES MUESTRALES •
Distribución de la media ()
•
Distribución de la variancia (2)
•
Distribución de la proporción ()
•
Distribución de la diferencia de medias ()
•
Distribución de la diferencia proporciones ()
•
Distribución del cociente de variancias ( )
CMO SE CONSTRU!E EMP"RICAMENTE UNA DISTRIBUCIN MUESTRAL#
De una población nita de tamaño N, se extraen al azar todas las muestras posibles (K ) de igual tamaño n.
Se calcula el estadístico muestral de inters para cada muestra!
Se organizan " presentan los valores del estadístico muestral calculados en una tabla de distribución de probabilidad! E3T42C45 )E3
Estimar qué va a ocurrir respecto a algo (o qué est ocurrie!"o# o qué ocurri$%# a pesar "e ser u! eleme!to mu& clarame!te esta"'stico# est mu& e!raia"o e! !uestra coti"ia!i"a") De!tro "e ello# a"ems *acemos estimacio!es "e!tro "e u! i!tervalo "e posi+ili"a"es) ,or e-emplo. /creo que termi!aré la tarea e! u!os 012 "'as3) 4o que *acemos e! el terre!o "el a!lisis "e "atos es aplicar matiacio!es téc!icas a este *+ito) 5amos a "e"icar este "ocume!to al co!cepto "e estimaci$!# come!a!"o co! la estimaci$! pu!tual) Después !os ocuparemos "e "esarrollar u! mo"elo "e estimaci$! por i!tervalo "o!"e i"e!ti6caremos los eleme!tos 7u!"ame!tales# co! su sig!i6ca"o & s'm+olo) Y# por 8ltimo# *a+r que "esarrollar c$mo se calcula! esos eleme!tos) Estimación de parámetros Es el procedimiento utilizado para conocer las características de un parámetro poblacional, a partir del conocimiento de la muestra. Con una muestra aleatoria, de tamaño n, pode mos efectuar una estimación de un valor de un parámetro de la población; pero también necesitamos precisar un:
I n t e r v a l o d e c o n fi a n z a
Se llama así a un intervalo en el ue sabemos ue está un parámetro, con un nivel de confianza específico. Nivel de confianza
!robabilidad de ue el parámetro a estimar se encuentre en el intervalo de confianza. Error de estimación admisible
"ue estará relacionado con el radio del intervalo de confianza.
Estimación de la media de una población El intervalo de confianza, para la media de una población, con un nivel de confianza de 1 − α , siendo X la media de una muestra de tamaño n # σ la desviación típica de la población, es:
El error máximo de estimación es:
Cuanto mayor sea el tamaño de la muestra, n, menor es el error. Cuanto mayor sea el nivel de confianza, $%&, mayor es el error.
Tamaño de la muestra
Si aumentamos el nivel de confianza, aumenta el tamaño de la muestra . Si disminuimos el error, tenemos ue aumentar el tamaño de la muestra .
El tiempo ue tardan las ca'eras de un supermercado en cobrar a los clientes si(ue una le # normal con media desconocida # desviación típica ),* minu tos. !ara una muestra aleatoria de +* clientes se obtuvo un tiempo medio de *,+ minutos.
1 Calcula el intervalo de confianza al nivel del *- para el tiempo medio ue se tarda en cobrar a los clientes.
! ndica el tamaño muestral necesario para estimar dic/o tiempo medio con un el error de 0 ),* minutos # un nivel de confianza del *-.
n " #
Estimación de una proporción Si en una población, una determinada característica se presenta en una proporción p, la proporción p$ , de individuos con dic/a característica en las muestras de tamaño n, se distribuirán se(1n:
%ntervalo de confianza para una proporción
El error máximo de estimación es:
En una fábrica de componentes electrónicos, la proporción de componentes finales defe ctuosos era del +)-. 2ras una serie de operaciones e inversiones destinadas a me'orar el re ndimiento se analizó una muestra aleatoria de *)) componentes, encontrándose ue ) de ellos eran defectuosos. 3"ué nivel de
confianza debe adoptarse para aceptar ue el rendimiento no /a sufrido variaciones4 p 5 ).+
5 $ % p 5).6
p75 )8 *)) 5 ).$6
E 5 ).+ % ).$6 5 ).)+
& 9$ % z & 8 + $.$+ 5 ).6<6<$ % ).6<6< 5 ).$=$> ).6<6< % ).$=$> 5 ).?=? 'ivel de confianza( )*)!+
T9M9:O DE MUESTR9 En estadística el tama$o de la muestra es el número de su$etos que componen la muestra e*traída de una población, necesarios para que los datos obtenidos sean representativos de la población.
%Cu&l de'e ser el tama$o de la muestra# 'eterminar el tama(o de la muestra que se va a seleccionar es un paso importante en cualquier estudio de investigación. #or e$emplo, un investigador desea determinar la prevalencia de problemas oculares en ni(os en edad escolar quiere reali6ar una encuesta. La pregunta importante que debe ser contestada en todas las encuestas de muestra es! 17Cuántos participantes deben ser elegidos para una encuesta81 3in embargo, la respuesta no puede ser dada sin tener en cuenta los ob$etivos circunstancias de las investigaciones.
La elección del tama(o de la muestra depende de consideraciones no estadísticas estadísticas. Las consideraciones no estadísticas pueden incluir la disponibilidad de los recursos, la mano de obra, el presupuesto, la ética el marco de muestreo. Las consideraciones estadísticas incluirán la precisión deseada de l a estimación de la prevalencia la prevalencia esperada de los problemas oculares en ni(os en edad escolar. #ara determinar el tama(o adecuado de las muestras es necesario seguir los tres criterios!
(. Ni)el de *recisión El nivel de precisión, también llamado error de muestreo, es el rango en donde se estima que está el valor real de la población. Este rango se e*presa en puntos porcentuales. #or lo tanto, si un investigador descubre que el 9:; de los agricultores de la muestra han adoptado una tecnología recomendada con una tasa de precisión de <=mn< >;, el investigador puede concluir que entre el ?>; el 9>; de los agricultores de la población han adoptado la nueva tecnología.
+. Ni)el de con,ian-a El intervalo de conian6a es la medida estadística del número de veces de cada @:: que se espera que los resultados se encuentren dentro de un rango especíico. #or e$emplo, un intervalo de conian6a de A:; signiica que los resultados de una acción probablemente cubrirán las e*pectativas el A:; de las veces. La idea básica descripta en el Teorema del límite central es que cuando una población se muestrea muchas veces, el valor promedio de un atributo obtenido es igual al valor real de la población. En otras palabras, si un intervalo de conian6a es del A>;, signiica que A> de @:: muestras tendrán el valor real de la población dentro del rango de precisión.
. /rado de )aria'ilidad 'ependiendo de la población ob$etivo los atributos a considerar, el grado de variabilidad varía considerablemente. Cuanto más heterogénea sea una población, maor deberá ser el tama(o de la muestra para obtener un nivel óptimo de precisión. Ten en cuenta que una proporción de >>; indica un nivel más alto de variabilidad que un @:; o un B:;.
Esto se debe a que @:; B:; signiica que una gran maoría no posee o posee el atributo en cuestión. E*isten muchos enoques para determinar el tama(o de la muestra, incluendo el uso de un censo en el caso de poblaciones más peque(as, el uso de tablas publicadas, imitar un tama(o de muestra de estudios similares aplicar órmulas para calcular un tama(o de la muestra.
(.(0 POBLACIN.1 Llamado también universo o colectivo, es el con$unto de todos los elementos que tienen una característica común. "na población puede ser inita o ininita. Es población finita cuando está delimitada conocemos el número que la integran, así por e$emplo! Estudiantes de la "niversidad "T). Es población infinita cuando a pesar de estar delimitada en el espacio, no se conoce el número de elementos que la integran, así por e$emplo! Todos los proesionales universitarios que están e$erciendo su carrera.
(.+0 MUESTRA.1 La muestra es un subcon$unto de la población. E$emplo! Estudiantes de +do 3emestre de la "niversidad "T). 3us principales características son!
Representativa.1 3e reiere a que todos cada uno de los elementos de la población tengan la misma oportunidad de ser tomados en cuenta para ormar dicha muestra.
Adecuada y válida.- 3e reiere a que la muestra debe ser obtenida de tal manera que permita establecer un mínimo de error posible respecto de la población. #ara que una muestra sea iable, es necesario que su tama(o sea obtenido mediante procesos matemáticos que eliminen la incidencia del error.
(.0 ELEMENTO O INDI2IDUO "nidad mínima que compone una población. El elemento puede ser una entidad simple %una persona& o una entidad comple$a %una amilia&, se denomina unidad investigativa.
2) FÓRMULA ARA !AL!ULAR "L #AMA$% &" LA MU"'#RA #ara calcular el tama(o de la muestra suele utili6arse la siguiente órmula!
'onde! n el tama(o de la muestra. ) tama(o de la población.
'esviación estándar de la población que, generalmente cuando no se tiene su valor , suele utili6arse un valor constante de :,>. D alor obtenido mediante niveles de conian6a. Es un valor constante que, si no se tiene su valor, se lo toma en relación al A>; de conian6a equivale a @,A? %como más usual& o en relación al AA; de conian6a equivale +,>B, valor que queda a criterio del investigador. e Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utili6arse un valor que varía entre el @; %:,:@& A; %:,:A&, valor que queda a criterio del encuestador. La órmula del tama(o de la muestra se obtiene de la órmula para calcular la estimación del intervalo de conian6a para la media, la cual es!
'e donde el error es!
'e esta órmula del error de la estimación del intervalo de conian6a para la media se despe$a la n, para lo cual se sigue el siguiente proceso! Elevando al cuadrado a ambos miembros de la órmula se obtiene!
2ultiplicando racciones!
Eliminando denominadores!
Eliminando paréntesis!
Transponiendo n a la i6quierda!
Factor común de n!
'espe$ando n!
5rdenando se obtiene la órmula para calcular el tama(o de la muestra!
() ""ML%' *LU'#RA#*+%' @& Calcular el tama(o de la muestra de una población de >:: elementos con un nivel de conian6a del A>;
Solución3 Geali6ando el gráico que representa el A>; de conian6a se obtiene!
3e tiene )>::, para el A>; de conian6a D @,A?, como no se tiene los demás valores se tomará
e :,:>.
Geempla6ando valores de la órmula se tiene!
+& Calcular el tama(o de la muestra de una población de >:: elementos con un nivel de conian6a del AA;
Solución3 Geali6ando el gráico que representa el AA; de conian6a se obtiene!
3e tiene )>::, para el AA; de conian6a D +,>B, como no se tiene los demás valores se tomará e :,:>. Geempla6ando valores en la órmula se obtiene!
#H @ #G5#5GC45)
#rueba de proporciones de una muestra Cuando el ob$etivo del muestreo es evaluar la valide6 de una airmación con respecto a la proporción de una población, es adecuado utili6ar una prueba de una muestra. La metodología de prueba depende de si el número de observaciones de la muestra es grande o peque(o. Como se habrá observado anteriormente, las pruebas de grandes muestras de medias proporciones son bastante seme$antes. 'e este modo, los valores estadísticos de prueba miden la desviación de un valor estadístico de muestra a partir de un valor propuesto. 0 ambas pruebas se basan en la distribución normal estándar para valores críticos. Iui6á la única dierencia real entre las ambas radica en la orma corno se obtiene la desviación estándar de la distribución de muestreo. Esta prueba comprende el cálculo del valor estadístico de prueba D
#osteriormente este valor es comparado con el valor de D, obtenido a partir de una tabla normal a un nivel de signiicación seleccionado. Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden ser de una o dos colas.
La primera alternativa establece una prueba de cola derecha, la segunda, i6quierda la tercera, una prueba de dos colas.
E4em*lo ilustrati)o En un estudio se airma que - de @: estudiantes universitarios traba$an. #ruebe esta aseveración, a un nivel de signiicación de :,:+>, respecto a la alternativa de que la proporción real de los estudiantes universitarios traba$an es maor de lo que se airma, si una muestra aleatoria de ?:: estudiantes universitarios revela que +:: de ellos traba$an. La muestra ue tomada de @:::: estudiantes . Los datos son!
Como en los datos aparece el tama(o de la población, se debe veriicar si el tama(o de la nuestra es maor que el >;. 3e rempla6a valores en la siguiente órmula!
*ttp.;;es)scri+")com;"oc;0<=0>?@>;,RUEB91DE1AI,OTESIS1,9R91491MEDI91 ,OB49CION94scri+"
*ttp.;;)mo!ogra6as)com;tra+a-os>;calculo1"el1tama!o1muestra;calculo1 "el1tama!o1muestra)s*tml
*ttp.;;*tml)ri!co!"elvago)com;"istri+ucio!1por1muestreo)*tml *ttp.;;support)mi!ita+)com;es1m;mi!ita+;=;topic1li+rar&;+asic1statistics1a!"1 grap*s;*&pot*esis1tests;+asics;!ull1a!"1alter!ative1*&pot*eses;
,RUEB9 DE AI,OTESIS U!a prue+a "e *ip$tesis es u!a prue+a esta"'stica que se utilia para "etermi!ar si eiste su6cie!te evi"e!cia e! u!a muestra "e "atos para i!7erir que cierta co!"ici$! es vli"a para to"a la po+laci$!) U!a prue+a "e *ip$tesis eami!a "os *ip$tesis opuestas so+re u!a po+laci$!. la *ip$tesis !ula & la *ip$tesis alter!ativa) 4a *ip$tesis !ula es el e!u!cia"o que se pro+ar) ,or lo ge!eral# la *ip$tesis !ula es u! e!u!cia"o "e que F!o *a& e7ectoF o F!o *a& "i7ere!ciaF) 4a *ip$tesis alter!ativa es el e!u!cia"o que se "esea po"er co!cluir que es ver"a"ero) Co! +ase e! los "atos "e la muestra# la prue+a "etermi!a si se "e+e rec*aar la *ip$tesis !ula) ,ara tomar la "ecisi$! se utilia u! valor p) Si el valor p es me!or que o igual al !ivel "e sig!i6ca!cia# que es u! pu!to "e corte que uste" "e6!e# e!to!ces pue"e rec*aar la *ip$tesis !ula) U! error com8! "e percepci$! es que las prue+as esta"'sticas "e *ip$tesis est! "iseGa"as para seleccio!ar la ms pro+a+le "e "os *ip$tesis) E! reali"a"# u!a prue+a ma!te!"r la vali"e "e la *ip$tesis !ula *asta que *a&a su6cie!te evi"e!cia ("atos% e! 7avor "e la *ip$tesis alter!ativa)
#$emplo de cómo se realiza una prueba de %ipótesis b&sica Uste" pue"e seguir seis pasos +sicos para co!6gurar & realiar correctame!te u!a prue+a "e *ip$tesis) ,or e-emplo# el gere!te "e u!a 7+rica "e tu+er'as "e+e
asegurarse "e que el "imetro "e los tu+os sea "e 0 cm) El gere!te sigue los pasos +sicos para realiar u!a prue+a "e *ip$tesis) '*
De+e "etermi!ar los criterios para la prue+a & el tamaGo "e muestra !ecesario a!tes "e recolectar los "atos) =) Especi6car las *ip$tesis) E! primer lugar# el gere!te 7ormula las *ip$tesis) 4a *ip$tesis !ula es. la me"ia "e la po+laci$! "e to"os los tu+os es igual a 0 cm) Hormalme!te# esto se escri+e como. A . J K 0 4uego# el gere!te elige e!tre las siguie!tes *ip$tesis alter!ativas. +ondición ue se probar&
4a me"ia "e la po+laci$! es me!or que el o+-etivo)
4a me"ia "e la po+laci$! es ma&or que el o+-etivo)
4a me"ia "e la po+laci$! es "i7ere!te "el o+-etivo) Como tie!e que asegurarse "e que los tu+os !o sea! ms gra!"es !i ms pequeGos "e 0 cm# el gere!te elige la *ip$tesis alter!ativa +ilateral# que esta+lece que la me"ia "e la po+laci$! "e to"os los tu+os !o es igual a 0 cm) Hormalme!te# esto se escri+e como A =. J L 0 ) Determi!ar la pote!cia & el tamaGo "e la muestra para la prue+a) El gere!te utilia u! clculo "e pote!cia & tamaGo "e la muestra para "etermi!ar cu!tos tu+os tie!e! que me"ir para te!er u!a +ue!a pro+a+ili"a" "e "etectar u!a "i7ere!cia "e )= cm o ms co! respecto al "imetro o+-etivo) @) Elegir u! !ivel "e sig!i7ica!cia (tam+ié! "e!omi!a"o al7a o %)
El gere!te seleccio!a u! !ivel "e sig!i6ca!cia "e )0# que es el !ivel "e sig!i6ca!cia ms utilia"o) ?) Recolectar los "atos) Recoge! u!a muestra "e tu+os & mi"e! los "imetros) 0) Comparar el valor p "e la prue+a co! el !ivel "e sig!i6ca!cia) Después "e realiar la prue+a "e *ip$tesis# el gere!te o+tie!e u! valor p "e )?) El valor p es me!or que el !ivel "e sig!i6ca!cia "e )0) 2) Deci"ir si rec*aar o !o rec*aar la *ip$tesis !ula) El gere!te rec*aa la *ip$tesis !ula & co!clu&e que el "imetro me"io "e to"os los tu+os !o es igual a 0 cm)
9cerca "e las *ip$tesis !ula & alter!ativa U!a prue+a "e *ip$tesis eami!a "os *ip$tesis opuestas so+re u!a po+laci$!. la *ip$tesis !ula & la *ip$tesis alter!ativa) 4a ma!era e! que se co!6gura! estas *ip$tesis "epe!"e "e lo que se i!te!ta "emostrar) -ipótesis nula (-.)
4a *ip$tesis !ula esta+lece que u! parmetro "e po+laci$! es igual a u! valor) 4a *ip$tesis !ula suele ser u!a a6rmaci$! i!icial que los i!vestiga"ores especi6ca! +as!"ose e! i!vestigacio!es previas o e! su co!ocimie!to) -ipótesis alternativa (- /)
4a *ip$tesis alter!ativa esta+lece que el parmetro "e po+laci$! es "i7ere!te "el valor "el parmetro "e po+laci$! e! la *ip$tesis !ula) 4a *ip$tesis alter!ativa es lo que uste" po"r'a pe!sar que es cierto o espera pro+ar que es cierto)