INSTITUCIÓN UNIVERSITARIA POLITECNICO GRANCOLOMBIANO TRABAJO COLABORATIVO ESTADSITICA II
INTEGRANTES: JORGE LUIS DIAZ GLORIA INES BONILLA LUZ MARINA LARA JESSICA TATIANA LOPEZ JEFFERSON ANDREY CALDERON
PROFESOR: PATRICIA CASTILLO
AÑO 2018
ACTIVIDAD Parte 1
1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. En ese sentido, escoja un tipo de muestreo y argumente la viabilidad de esta técnica para la base de datos dada . Para seleccionar una muestra debe tenerse en cuenta el cómo seleccionar los elementos que formarán parte de la muestra (tipo de muestreo) y cuántos elementos debemos seleccionar (Tamaño de muestra).
TIPO DE MUESTREO ESCOGIDO: Con el fin de obtener una muestra representativa, confiable y aleatoria, donde todos los datos de la población tengan la misma probabilidad de ser escogidos, yo propongo utilizar el Muestreo Aleatorio Simple. Este método además tiene la ventaja de facilitar el armado de la muestra. Adicionalmente al obtener la muestra mediante este método aseguramos que las generalizaciones serán razonables. Ahora en cuanto a Cómo seleccionar la muestra pues en este caso debe ser aleatoriamente, para lo cual podemos usar la generación de números aleatorios que es una facilidad de Excel. Posteriormente tomaremos de la población total la cantidad de registros que nos arroje el tamaño de la muestra. Ahora voy a trabajar para obtener el tamaño de la muestra resolviendo los puntos planteados en el numeral 2. 2. Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando adecuadamente y justificando: Bueno debemos aclarar que esta variable es de tipo cualitativo y que la Población es finita. a) Fórmula a desarrollar : Teniendo en cuenta que la variable Género es cualitativa y que la Población es finita, utilizaremos la siguiente fórmula:
donde : n = Tamaño de la muestra que es lo que estamos buscando N= Tamaño de la Población que es = 60.356 registros b) Estimación de la Proporción de mujeres: Dentro de la fórmula se denota con p. Observamos en la Población total la cantidad de registros cuyo género es Mujer. Esto es 31.969 registros por lo tanto:
Estos registros serán escogidos de la población total mediante la generación de números aleatorios y constituirá la Muestra.
2. Intervalo de confianza para dos variables numéricas
Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja “muestra” y realizar lo siguiente: ●
●
●
Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y mujeres. Según los resultados, ¿Existen diferencias? Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables. Realice lectura de resultados. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y determine, la escolaridad de los hombres y de las mujeres de forma individual.
●
Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los niveles de escolaridad para los hombres y mujeres.
RTA: HOMBRES
MUJERES
Clase
Frecuencia
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
21 6 9 12 8 21 8 9 10 6 3 30 1 4 2 2 9 1 1 0
6,77 Media 6,00 Mediana 11,00 Moda 4,78 Desv. Est. -0,82 Curtosis 70,65 Coef. Var. 0,31 Asimetria 162 G. L. Intervalo de confianza 6,03 7,51
Clase Frecuencia
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
26 1 5 11 6 25 10 11 11 7 7 47 7 7 8 3 13 0 1 1
7,95 Media 8,00 Mediana 11,00 Moda 4,81 Desv. Est. -0,89 Curtosis 60,57 Coef. Var. -0,09 Asimetria 206 G. L. Intervalo de confianza 7,29 8,61
Histograma Hombres 35 30 25 a i c n e u c e r F
20 15 10
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19
Clase
Histograma Mujeres
a i c n e u c e r F
50 45 40 35 30 25 20 15 10
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19
Clase
t hombres t mujeres 1,9759 1,9719
Se realizó el histograma y las diferencias son muy pocas, se tomó una muestra de 380 personas, podemos ver que las mujeres son más estudiadas que los hombres. Si hay diferencias entre hombres y mujeres, las mujeres en la mayoría de niveles son las más estudiadas que los hombres. También podemos ver dentro de los niveles académicos el bachiller es que más tienen las personas encuestadas siendo las mujeres las mayores es este nivel, además podemos darnos cuenta que de la muestra de las personas los que están en
niel escolar la mayoría son hombre esto quiere decir que es ese sector hay más hombres niños que niñas. De la muestra de 380 personas que se encuestaron arrogo resultado que hay 56% corresponde a mujeres y el 44% corresponde a Hombres por lo anterior también arrogo datos importantes de los niveles académicos, que el 32% tienen el nivel académico de media, siguiendo con la básica primaria con un 27% , siguiendo con básica secundaria con un 14%, nivel académico de superior o universitaria con un 12%, preescolar con un 10% y personas de la cuales porque son bebes o porque no decidieron estudiar un porcentaje de 4%. Adema de eso estos resultados de nivel académico según hombre y mujer arrogan los siguientes resultados: De los 380 personas encuestadas se tomó una muestra y no tomamos encuentra la edad, solo escolaridad y sexo de los cuales según las personas encuestadas en el nivel académico Media que esta desde el grado 10° al 13° tiene el 34% para mujeres y el 30% para los hombres, es una diferencia de un 4% además de ser el nivel con más personas con ese nivel académico, continuando el orden el nivel académico de básica primaria comprendido entre los grados 1° y 5° con un 28% para hombres y un 26% donde se refleja diferencia debido a que según los encuestados son más mujeres; del nivel técnico de básica segundaria hay más hombres con estudios de básica secundaria con un 17% y sobre el nivel académico universitario o superior son malas mujeres con este nivel con un 13%. En conclusión podemos darnos cuenta Sobre el nivel académico los mueres con las que más estas con mejores niveles académicos que los hombres, además que la población es mayor que el de los hombres. ●
Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y determine, la escolaridad de los hombres y de las mujeres de forma individual.
Intervalo de Confianza para la población de mujeres
/ = 1,96 (̅ − ∗ √ , ̅− ∗ √ ) (6,94−1,96∗ √ 41,7592 , 6,94+1,96∗ √ 41,7592 ) 6,2063 , 7,67 Intervalo de Confianza para la población de hombres
/ = 1,96 (̅ − ∗ √ , ̅− ∗ √ ) (8,14−1,96∗ √ 42,7020 , 8,14+1,96∗ √ 42,7020 )
7,49 , 8,78 ●
Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los niveles de escolaridad para los hombres y mujeres.
/ = 1,96 = 159−14,72 + 202−14,70 = 22,172 − 1 ℎ ℎ = − 1 + + 159+202−2 ℎ − 2 ℎ − − ∗ 1ℎ + 1 , ℎ − + ∗ 1ℎ + 1 8,14−6,94−1,96∗ 22,172(2021 + 1591 ) , 8,14−6,94+1,96∗ 22,172(2021 + 1591 ) 0,22 , 2,178 Parte 2 Prueba de hipótesis para dos variables nominales
Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja de “muestra” y realizar lo siguiente: ●
●
●
Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo (P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias? Con un nivel de confianza del 95%, realice una estimación de los hombres que asisten a un establecimiento oficial. Con un nivel de confianza del 95%, realice una estimación de las mujeres que asisten a un establecimiento oficial.
Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?
●
Comparativo Hombres CLASES Frecuencia
Si No ●
Mujeres Proporcion
Clase
Frecuencia
Proporcion
0,27 0,73
Si No
13 41
0,24 0,76
12 33
Con un nivel de confianza del 95%, realice una estimación de los hombres que asisten a un establecimiento oficial.
a i c n e u c e r F
El intervalo de confianza será
●
==1,4596 = 0,73 7 3 = ± 1− = 0,73±1,96 0,731−0, 45 = 0,8597 = 0,6002 hombres y mujeres 0,60.0026002< ,0<.80,4978497
Con un nivel de confianza del 95%, realice una estimación de las mujeres que asisten a un establecimiento Mujeres oficial.
El intervalo de confianza será:
==1,5496 = 0,76 7 6 = ± 1− = 0,76±1,96 0,761−0, 54 == 0,0,86739460 0,60.4606460,< 0<.8739 0,8739
●
Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?
Prueba de hipótesis de dos proporciones
Se acepta Colombia
:: >≤ 3+540,76 = 0,74 = ++ = 450,745+54 − 1 1 = 1 − + = 0, 741−0,70,6−0,7473 1 + 1 = 0,3388 54 45 0,33 <<1,96
, la proporción de hombres que asisten al colegio oficial es mayor que la proporción de mujeres en
CONCLUSIONES
El anterior trabajo colaborativo nos permite entender der más acerca de la estadística y lo importante que es para análisis una población o un tema específico, la estadística hace que más fácil su comprensión y entendimiento ya que la estadística da a entender, organizar y tomar decisiones que estén de acuerdo con los análisis efectuados.