1. ALGUNAS DEFINICIONES BÁSICOS Para dar comienzo al módulo virtual relacionado con la distribución de muestreo de la media aritmética ( x ), a continuación continuación se presentan las definiciones definiciones básicas básicas que a juicio del tutor son pilar fundamental para abordar el curso.
Población. Es la totalidad de los elementos los cuales contienen las características de interés Muestra. Es un subconjunto de observaciones que se seleccionan de una población y que tienen las características de interés.
Elemento. Es la unidad por la cual se solicita información o que son medidas. El elemento depende del objetivo que persiga el estudio
Unidad de muestreo. Corresponde al elemento o los elementos disponibles en la población susceptibles de ser seleccionados en alguna etapa del proceso de muestreo.
Unidades Unidades de enumeración enumeración. También conocidos conocidos como conglomerado conglomerados, s, se utilizan cuando no es factible muestrear las unidades de enumeración directamente.
Conglomerado. Es un conjunto de unidades que se encuentran físicamente cerca. Población estadística. Es un conjunto de mediciones sobre todos los elementos del universo resultando en lo que se conoce como poblaciones multivariadas listado o de todas todas las unid unidade ades s de mues muestre treo o dispon disponibl ibles es para para su Marco muestral. Es un listad selección en una etapa del muestreo.
ESTADÍSTICO: es cualquier función de las observaciones de una muestra. Desde otro punto de vista son son valores que describen describen las características características de una muestra, estos estos valores son variables pues pues dependen de las fluctuaciones de la muestra. Entre los estadísticos más conocidos se tienen: la media muestral
x la varianza muestral s 2
la desviación estándar muestral s la proporción muestral P . Estos estadísticos tienen amplio uso en los procesos de muestreo cuando el interés es sacar conclusiones en poblaciones con base en la información de muestras.
PARÁMETRO: Es un valor constante que describe las características propias de una población estadística, estadística, Generalmente los parámetros en estadística estadística se denotan con letras griegas como la media poblacional µ y la desviación estándar poblacional σ .
UN ESTIMADOR: Es una regla o método que dice como calcular la estimación de un parámetro basándose en la información de una muestra, generalmente se expresa como una fórmula. Por
UNA ESTIMACIÓN: Es un valor particular de un parámetro obtenido de los valores de una muestra. Para mostrar la relación entre estadístico, parámetro y estimador en los procesos inferenciales se presenta el siguiente cuadro: Cuadro 1.
ESTADÍSTICO Media muestral
PARÁMETRO Media poblacional
n
∑ Xi
i
n
ˆ = µ
i =1
n Varianza poblacional pobl acional estimada
N
( X j − X )
∑
2
σ
n −1
Desviación estándar muestral
2
( X i − X )
i =1
2
( X j − µ )
2 n
i =1
=
N
Desviación estándar N
∑
n
S =
i
Varianza poblacional pobl acional
i =1
∑
∑ X
N
n
S 2 =
n
i =1
µ =
i =1
Varianza muestral mues tral
∑
Media poblacional estimada
N
∑ X x =
ESTIMADOR
σ =
n −1
( X i − µ ) 2
∑ ˆ σ
2
=
i =1
n −1
Desviación estándar poblacional estimada n
∑
i =1
N
( X j − X ) 2
ˆ = σ
( X i − X ) 2
i =1
n −1
3. CONCEPTOS PRELIMINARES DE MUESTREO En investigación científica muchas de las veces es imposible hacer un estudio exhaustivo de los elementos de la población o lo que se conoce como un estudio poblacional o censo, para este caso, se hace necesario valerse de las técnicas de muestreo para tomar sólo una parte la cual debe ser representativa de la población de estudio. En este punto vale aclarar que el objetivo del curso no corresponde a realizar diseños de muestre muestreo o para investigac investigación ión científ científica ica sino sino en conoce conocerr la distribu distribución ción que sigue sigue la media media muestral siendo necesario conocer algunos tópicos iniciales de muestreo.
3.1 MUESTREO PROBABILISTICO Para enmarcarlo en este tipo de muestreo debe cumplir con las siguientes condiciones
Se puede definir el conjunto de muestras posibles Conocer para cada una de las muestras posibles la probabilidad
El proc proced edim imie ient nto o sele selecc ccio iona nado do debe debe dar dar a cada cada elem elemen ento to de la pobl poblac ació ión n una una probabilidad diferente de cero La selección debe ser aleatoria
3.2 MUESTREO NO PROBABILISTICO Es aquel muestreo muestreo que no cumple con las condiciones condiciones citadas citadas del muestreo aleatorio. aleatorio. Se vale del conocimiento y la opinión personal para identificar los elementos de la población que se van a incluir en la muestra. Son de este tipo: (Muestreo por conveniencia, por juicios, por prorrateo) Cuando se hace muestreo probabilístico se tienen 3 casos que son los siguientes
MUESTRAS ORDENADAS CON REPETICIÓN Si se tiene una población de tamaño N y se quiere tomar tomar una muestra muestra de tamaño n. El número de muestras ordenadas con repetición de N elementos tomados de a n esta dado por:
N n N: Número de elementos distintos disponibles en la población n: Número de elementos escogidos en la muestra
MUESTRAS ORDENADAS SIN REPETICIÓN) Si se tiene tiene una poblaci población ón de tama tamaño ño N y se quiere quiere tomar tomar una una mues muestra tra de tamaño tamaño n. El número de muestras ordenadas sin repetición de N elementos tomados de a n esta dado por:
P
N
El término
n
=
N !
( N
−n
)!
. Cuando
N = n , entonces
P
N
N N
!
= N
.
P se lee N permutado n y se relaciona con el número de permutaciones u
N
n
ordenaciones que se pueden hacer de N elementos tomados de a n. El símbolo símbolo N ! se lee N factorial y esta representado por el producto de los enteros positivos desde N hasta 1. N ! = ( N )( N
−
1)( N − 2)( N − 3)... ( N − N )
Se asume que 0! = 1 Ejemplo: el resultado de cuatro factorial es.
4! = ( 4)(3)(2)(1)(0! ) 4! = 24
MUESTRAS NO ORDENADAS SIN REPETICIÓN Si se tiene una población de tamaño N y se quiere tomar tomar una muestra muestra de tamaño n. El número de muestras no ordenadas si repetición de N elementos tomados de a n esta dado por:
N
El término
N
C
n
=
( N
N ! −n
)!(n!)
C se lee N combinado n y se relaciona con el número de combinaciones o n
muestras no ordenas sin repetición que se pueden obtener de N elementos de la población tomados de a n. Visto de otra forma es el número de diferentes agrupaciones de N objetos tomados de a n que pueden ocurrir sin tener en cuenta el orden. Ilus Ilustr trac ació ión: n: para para most mostra rarr de form forma a simp simple le los los resu result ltad ados os para para cada cada uno uno de los los caso casos s mencionados anteriormente se presenta el siguiente ejemplo. Ejemplo 1. Suponga que se tiene el conjunto S=(A, B, C, D) una población de N=4 elementos. Si el interés interés es tomar tomar una muestra muestra de tamaño tamaño 2 de esa població población n se tienen los siguient siguientes es resultados.
a) Muestras ordenadas con repetición Elemento de la población (A, B, C, D) Tamaño de la población N=4 Tamaño de la muestra n = 2 Número de muestras posibles ordenadas con repetición N
n
=
4
2
= 16 Muestras posibles AA AB AC AD
BA BB BC BD
CA CB CC CD
DA DB DC DD
b) Muestras ordenadas sin repetición) Elemento de la población (A, B, C, D) Tamaño de la población N=4 Tamaño de la muestra que se quiere tomar n = 2 Número de muestras posibles ordenadas sin repetición
P
N
n
P 2
4
=
N !
=
( N
=
(4
−n
4! −
)!
=
4! ( 4 − 2)!
)
2!
( 4)(3)(2)(1) ( 2)(1)
= 12 Muestras posibles AB AC AD
BA BC BD
CA CB CD
DA DB DC
c) Muestras no ordenadas sin repetición En la literatura estadística es conocido también como muestreo sin reposición Elemento de la población (A, B, C, D) Tamaño de la población N=4 Tamaño de la muestra que se quiere tomar n = 2 Número de muestras posibles no ordenadas sin repetición
N
N !
=
C ( N − n )!(n!) .
N
n
C n
=
=
(4
4! −
)
2 ! (2! )
( 4)(3)( 2)(1) (2)(1)(2)(1)
=
24 4
=
6
Muestras posibles cuyas parejas se muestran como sigue AB AC AD
BC BD CD
Note que a diferencia del muestreo ordenado sin repetición, si ya fue elegida la muestra AB no puede ser elegida la muestra BA.
DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO MUESTRAL : Es la distribución de valores de un estadís estadístic tico o muest muestral ral obtenid obtenido o este este como como una una varia variable ble aleator aleatoria. ia. De manera manera más más concretamente, corresponde a la distribución de todas las muestras que pueden ser escogidas siguiendo un esquema de muestreo determinado. Para Para sabe saberr la distr distrib ibuci ución ón que que sigue sigue la media media mues muestra trall de mane manera ra fácil fácil nos nos vale valemo mos s del del siguiente ejemplo. Ejemplo 2. Suponga que se tiene el conjunto S=(2, 4, 6, 8) una población de N=4 elementos y se quiere tomar una muestra de tamaño 2 de esa población.
Cálculo de parámetros Tomando los 4 elementos que tiene la población para calcular la media poblacional se tiene lo siguiente. 1 2 3 4 i 2 4 6 8 x i
MEDIA POBLACIONAL 4
∑ Xi µ =
µ =
2
i =1
4
+4+6+8 4
=5
VARIANZA POBLACIONAL N
∑ σ
2
=
( X j − µ )
2
i =1
N 4
∑ σ
2
=
2
σ
2
=
( X j − µ )
2
i =1
4 2
2
(2 − 5) + (4 − 5) + (6 − 5) + (8 − 5)
2
4 σ
2
=
9 + 1+ 1+ 9 4
=5 2
Es sólo una coincidencia que la media poblacional sea igual a la varianza poblacional( µ = σ )
Desviación estándar poblacional σ
= 5 = 2,236067978
En resumen: media poblacional µ = 5 , varianza poblacional σ 2 = 5 , desviación estándar poblacional σ = 2.236067978
Cálculo de los estadísticos Los estadísticos se calculan a partir de los datos de las muestras que para esta ilustración se toman con repetición. Como se conoce, los elementos de la población son (2, 4, 6, 8) El número de muestras posibles con repetición de tamaño 2 que se pueden tomar de los 4 elementos de la población son. N
n
=
42
= 16 16
muestras po posibles
Las 16 muestras que pueden resultar al tomar muestras de tamaño 2 de una población de 4 elementos se muestran en la siguiente tabla. Tabla 1. Descripción de las muestras posibles Numero de de mu muestra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Promedio( x i
Muestra (2,2) (2,4) (2,6) (2,8) (4,2) (4,4) (4,6) (4,6) (6,2) (6,4) (6,6) (6,8) (8,2) (8,4) (8,6) (8,8)
)
2 3 4 5 3 4 5 6 4 5 6 7 5 6 7 8
Hay que observar que x i es una variable aleatoria que puede tomar 16 posibles valores, por tanto, la media de dichas medias muestrales es: 16
∑ x x i =
i =1
16
i
x i =
2 +3 + 4 +5 +3 + 4 +5 +6 + 4 +5 +6 +7 +5 +6 +7 +8 16
Para estar en concordancia con la notación estadística en adelante se hace µ
x
= xi
. Por lo
tanto,
=5
µ x
La media muestral µ x también se puede obtener a partir del concepto de valor esperado de la siguiente forma A partir de la tabla 1 se construye una tabla de probabilidad para
x i
Tabla 2. Tabla de frecuencias y probabilidades para x i I
x i
ni
p ( x i )
1 2 3 4 5 6 7 Total
2 3 4 5 6 7 8
1 2 3 4 3 2 1 16
1/16 2/16 3/16 4/16 3/16 2/16 1/16 1
Al calcular el valor esperado de x i es decir E ( x i ) 7
∑( x E ( x i ) =
i
)( p( x i )
i =1
7
E ( x i ) = ( 2)(1 / 16 ) + (3)( 2 / 16) + ( 4)(3 / 16 ) + (5)( 4 / 16) + (6)(3 / 16) + (7)( 2 / 16) + (8)(1 / 16)
E ( x i )
=
( 2 / 16) + (6 / 16) + (12 / 16) + (20 / 16) + (18 / 16) + (14 / 16) + (8 / 16)
E ( x i ) =80 / 16
E ( x i ) = 5
De los anteriores resultados si puede concluir que al tomar una muestra se espera que la media de dicha muestra sea igual a la media poblacional, µ x
= µ .
Como se puede ver
µ
x
= 5 , al igual que µ = 5
CÁLCULO DE LA VARIANZA MUESTRAL Tomando los valores de x i que resultan en la tabla 1 se puede calcular la varianza muestral que para efectos de notación estadística se simbolizará como σ x n
σ
x
2
∑ =
i =1
( X j − µ x ) 2
, Por cálculos anteriores µ x
σ
x
σ x
=
=5
n −1 16
2
2
2
∑ =
( X j − 5) 2
i =1
16
(2 − 5) 2 + (3 − 5) 2 + (4 − 5) 2 + (5 − 5) 2 + (3 − 5) 2 + (4 − 5) 2 + (5 − 5) 2 + (6 − 5) 2 + (4 − 5) 2 + (5 − 5) 2 + (6 − 5) 2 + (7 − 5) + (5 − 5) 2 + (6 − 5) 2 + (7 − 5) 2 + (8 − 5) 2 16 σ
2 x
=
9 + 4 + 1+ 0 + 4 + 1+ 0 + 1+ 1+ 0 + 1+ 4 + 0 + 1+ 4 + 9 16
σ
2
x
σ
2
x
=
40 16
= 2.5
Obsérvese que la varianza muestral es diferente de la varianza poblacional 2 x
σ
2
≠ σ
2,5 ≠ 5
Pero en la práctica para conocer la varianza muestral sólo basta con tener conocimiento de cómo es la varianza poblacional y hacer σ
2 x
=
σ
2
n
Es decir, la varianza muestral es igual a la varianza poblacional dividida entre el tamaño de la muestra. En este sentido se tiene que 2 σ = x
5 2
2
σ x
= 2 .5
VARIANZA DE LA MEDIA MUESTRAL EN POBLACIONES FINITAS Cuando el muestreo se hace en poblaciones finitas o el muestreo es sin repetición visto anteriormente, la varianza de la media muestral se obtiene obtiene mediante la formula
σ
2 x
=
σ
2
n
N − n , el término N − 1
N − n N − 1
se llama factor de corrección por finitud
Ejemplo 2. Suponga que se tiene el conjunto S=(2, 4, 6, 8) una población de N=4 elementos y se quiere tomar una muestra de tamaño 2 sin repetición de esa población. El número de muestras de tamaño 2 sin repetición de 4 elementos elementos de la población estará dada por.
N
N !
=
C ( N − n )!(n!) . n
N
C n
=
(4
4! −
)
2 ! (2! )
= 6 muestras sin repetición Tabla 3. Descripción de las muestras posibles de tamaño 2 sin repetición Numero de de mu muestra 1 2 3 4 5 6
Muestra (2,4) (2,6) (2,8) (4,6) (4,8) (6,8)
Promedio( x i
)
3 4 5 5 6 7
Igual que en el ejemplo 2, al realizar los cálculos usted puede obtener que La media poblacional µ = 5 La varianza publacional es σ 2 = 5
Tomando los datos de la tabla 3, la madia muestral esta dada por
=5
La media muestral µ x
La varianza muestral esta dada por n
σ
∑
2
i =1
=
x
( X j − µ x ) 2 n
6
σ
∑
2
σ
x
2
=
i =1
=
x
( X j − 5) 2 n
(3 − 5) 2 + (4 − 5) 2 + (5 − 5) 2 + (5 − 5) 2 + (6 − 5) 2 + (7 − 5) 2 6 σ
x
2
=
4 +1 + 0 + 0 +1 + 4 6
=
10 6
= 1,66667
La varianza muestral es igual a 1,66667
Pero en la práctica si se conoce la varianza poblacional bastaría con hacer
σ
2 x
σ
2
σ
x
σ
= 2 x
2
n
N − n N − 1
5 4 − 2
= 2 4 − 1 1,66667
=
En muestreo se utiliza el factor de corrección si la relación
n N
> 0.05
En adelante para no utilizar con el factor de corrección se trabajará sobre poblaciones infinitas