2
Matemática
Estadística
3
ÍNDICE
1. Población y muestra.............................................. 6 2. Estadística Descriptiva ......................................... 9 Ejercicios 2-1 ........................................................ 12 Hoja de respuestas 2-1 ........................................ 16 3. Amplitud de una variable................................... 21 4. Intervalos de clase............................................... 25 5. Gráficos. Histogramas, polígonos de frecuencia, tortas, barras......................................... 30 6. Medidas de centralización ( de posición o de tendencia central)..................................................... 39 7. Moda ..................................................................... 44 8. estadística. Ejercicios ......................................... 47 Hoja de respuestas ............................................... 50 9. Medidas de dispersión (o de desviación) ......... 53 10. Desviación Media.............................................. 56 11. Desviación estándar (s) .................................... 61 12. Varianza.............................................................. 64 13. Distribución normal - curva de Gauss.......... 69 Ejercicios 13-1...................................................... 75 Hoja de respuestas 13-1 ...................................... 78 14. Correlación......................................................... 80 14.1 ¿Cómo se calcula el coeficiente de correlación lineal? ............................................... 92 4
14.2 Ejercicios ...................................................... 98 15. Media, Moda y Mediana................................. 103
5
1. POBLACIÓN Y MUESTRA
Para hacer el estudio de los caracteres que se desea conocer se hacen observaciones. Si las observaciones se realizan sobre el total de un grupo, a ese grupo se lo denomina población o universo y cada observación se llama individuo. Por ejemplo: Si se efectúa un censo ganadero población
el conjunto de animales
individuo
cada animal
Si se efectúa un censo sobre viviendas población el total de viviendas individuo
cada vivienda
Si en una empresa se toman los salarios de cada empleado 6
población
el conjunto de salarios
individuo
cada salario
Muchas veces es muy difícil estudiar el número total (N) de los individuos de una población debido al costo económico, el tiempo que llevaría o por ser muy difícil de delimitar ese número total. Por ejemplo, si se desea saber la diferencia de presión sanguínea entre hombres y mujeres, sería imposible determinar la presión se todos los hombres y de todas las mujeres. El problema se resuelve recurriendo a las muestras. Se llama muestra al conjunto de n individuos (n < N) elegidos al azar entre los N de una población dada. Si en el ejemplo anterior se toma la presión a 200 personas elegidas al azar: Población
Total de personas existentes
Muestra
Los 200 personas escogidas
Individuo
Cada persona 7
Para que los estudios realizados sobre la población sean válidos, la muestra debe ser representativa de la población. Por ejemplo, si se quiere estudiar la incidencia del mal de Chagas en la Provincia del Chaco, y se toma una muestra de población perteneciente sólo a la ciudad de Resistencia, el estudio estadístico no es válido, ya que se está estudiando sólo individuos de la zona metropolitana, dejando de lado la zona rural. En este caso se dice que la muestra no es representativa de la población.
EJERCICIOS 1. Se quiere realizar un estudio para determinar la cantidad promedio de huevos que ponen los pingüinos hembras en el período reproductivo en Puerto Madryn. Determiná población y muestra del estudio. 2. Se quiere determinar la audiencia de cierto programa televisivo de televisión de aire. Determiná muestra y población.
8
2. ESTADÍSTICA DESCRIPTIVA
Actualmente es difícil leer un informe de cualquier actividad humana con repercusión pública que no esté acompañada por tablas ó gráficos estadísticos: el periodista los utiliza para enriquecer su comentario escrito; el empresario, para explicar su cuenta de resultados; el publicista, para transmitir un mensaje visualmente concreto; y todos, para facilitar la comprensión de una información generalmente densa y con datos de complicada presentación. Ante tal cúmulo de información y de datos, muchas veces el lector termina leyendo solamente el gráfico y la tabla adjunta. Por lo tanto, es imprescindible aprender a leer e interpretar este modo de comunicación y también aprender a confeccionarlos para que los demás la entiendan con claridad. La definición matemática de la estadística es:
9
Ciencia que utiliza conjuntos de datos numéricos para obtener a partir de ellos inferencias basadas en el cálculo de probabilidades.
El lenguaje de la estadística Vamos precisar algunos términos propios del lenguaje estadístico: Población: se denomina población al conjunto de todos los elementos que cumplen una determinada característica, que deseamos medir ó estudiar. Muestra: Se denomina muestra a cualquier subconjunto de la población. El número de elementos de la muestra se llama tamaño de la misma. Cuando el tamaño de la muestra coincide con la población, se llama censo. Individuo (objeto): Se considera individuo a cada uno de los elementos de la población.
10
Carácter estadístico: Cada una de las propiedades (aspectos) que pueden estudiarse en los individuos de una población recibe el nombre de carácter. Un carácter puede ser cuantitativo si se puede medir. Un carácter es cualitativo si no se puede medir, o sea se puede comparar. Variables estadísticas: Una variable estadística se llama discreta cuando sólo se pueden tomar determinados valores de ella. En cambio la variable se llama continua cuando puede tomar todos los valores de un intervalo Intervalos de clase: Se llama intervalos de clase a cada uno de los intervalos en que pueden agruparse los datos de una variable estadística
11
EJERCICIOS 2-1
EJERCICIO 1 Dados los siguientes datos de longitud de varillas: 52, 80, 65, 82, 77, 60, 72, 83, 63 78, 84, 75, 53, 73, 70, 86, 55, 88 85, 59, 76, 86, 73, 89, 91, 76, 92 66, 93, 84, 62, 79, 90, 73, 58, 71 a- Agrupá los datos en clases y establecé la frecuencia y frecuencia relativa b- Calculá la media, mediana y moda c- Graficá los datos en grafico de barras.
12
EJERCICIO 2 Se ha realizado en EE.UU. una estadística sobre la capacidad matemática de los alumnos de 14 años los resultados son los siguientes: Resultados
30-32
33-35
36-38
F (EE.UU.)
5
5
10
39-41 42-44 45-47 48-50 15
40
15
10
a- Halla los puntos medios de cada intervalo de clase. b- Graficá los polígonos de frecuencias. c- Calculá la desviación estándar y la varianza
EJERCICIO 3 La siguiente tabla muestra los pesos en Kg. de luchadores de Sumo KG.
140-144
145-149
150-154
155-159
160-164
165-169
Frecuencia
5
7
10
16
8
4
Frecuencia relativa
13
a- Completá la tabla dada b- Calculá la moda, media y mediana c- Graficá
EJERCICIO 4 Del campeonato local de fútbol se han elegido partidos, en la tabla se muestran el número de goles: Números de goles
1
2
3
Números de
8
8
x
partidos
a- Si la media de goles es de 2,04; hallá x b- Si la moda de goles es 3, determiná el menor valor que puede tener x. c- Si la mediana es de 2 goles, hallá el mayor valor positivo de x.
14
EJERCICIO 5 En una encuesta, se pregunta a 50 personas sobre el número se libros que se leen al año. Los resultados se muestran en la tabla: Nº de
0
1
2
3
4
5
6
7
8
5
5
6
9
11
7
4
2
1
libros Frecuencia Frecuencia relativa
a- Completá la tabla b- Calculá la media de los libros leídos por persona c- Calculá la varianza y desvío estándar. d- Realizá el grafico de tortas o circular.
15
HOJA DE RESPUESTAS 2-1
EJERCICIO 1 aLongitud de
Marca o
las varillas
intervalo
(en m)
de clase
50-59
54,5
60-69 70-79
Frecuencia
Frecuencia
Marca de
Relativa
clase x frecuencia
4
0,111
218
64,5
6
0,166
387
74,5
12
0,333
894
80-89
84,5
10
0,277
845
90-99
94,5
4
0,111
378
36
0,998
2722
Total
bLa media aritmética es 75,6 m La mediana se encuentra en el intervalo 70-79; es exactamente 76 m La moda es la longitud de varillas de 70-79
16
cGráfico de barras de longitud de varillas 15 10 5 0 50-59
60- 69
70- 79
80-89
90-99
EJERCICIO 2 aResultados
30-32
33-35
36-38
39-41
42-44
45-47
48-50
F (EE.UU.)
5
5
10
15
40
15
10
Punto medio
31
34
35
40
43
46
49
bPoligono de frecuencia (Capacidad de alumnos de matemática)
45 40 35 30 25 20 15 10 5 0 30-32 33-35 36-38 39-41 42-44 45-47 48-50
17
c- La varianza es 13,3 m y el desvío estándar es 3,6 m
EJERCICIO 3 aKG.
140-144
145-149
150-154
155-159
160-164
165-169
Frecuencia
5
7
10
16
8
4
Frecuencia
0,1
0,14
0,2
0,32
0,16
0,08
relativa
bLa moda es el intervalo 155-159 La media aritmética es 154,7 Kg. La mediana es 155,75 Kg. cGráfico de barras (Pesos de luchadores de Sumo) 20 15 10 5 0
140-144 145-149 150-154 155-159 160-164 165-169
18
EJERCICIO 4 a- X=9 b- El valor menor valor que puede tomar x es 9 c- El mayor valor positivo de x es 15
EJERCICIO 5 aNº de
0
1
2
3
4
5
6
7
8
Frecuencia
5
5
6
9
11
7
4
2
1
Frecuencia
0,1
0,1
0,12
0,18
0,22
0,14
0,08
0,04
0,02
libros
relativa
b- La media es 3,38 c- La varianza es 1,26 y el desvío estándar es 1,12
19
dGráfico de tortas (Nº de libros leídos)
1 2 3 4 5 6 7 8 9
20
3. AMPLITUD DE UNA VARIABLE
Amplitud: Es la diferencia entre el valor máximo y mínimo que puede tomar la variable Amplitud = xmáx - xmin ● Cuando la variable es continua
EJEMPLO 1 El cuadro muestra la cantidad de hijos que tienen ciertas mujeres.
21
Nº de hijos
fi
xi 0
2
1
5
2
7
3
4
4
1
5
1
Amplitud = xmáx - xmin =5–0 A=5 ● Cuando la variable es continua
EJEMPLO 2 El siguiente cuadro muestra las temperaturas registradas durante dos primaveras, en un observatorio.
22
Temperaturas
fi
15º
12
16,5º
5
17,2º
8
17,5º
7
18,2º
1
Amplitud = xmáx - xmin Amplitud = 18,2º - 15º Amplitud = 3,2º ● Cuando la variable viene dada en intervalos
EJEMPLO 3: En la tabla se muestran los salarios en pesos, de los empleados de la compañía “S&S”
23
Salarios ($)
Frecuencias
50 – 69,99
5
70 – 89,99
12
90 – 109,99
10
110 – 129,99
15
130 – 149,99
18
150 – 169,99
31
170 – 189,99
35
Amplitud = xmáx - xmin Amplitud = $189,99 - $50 Amplitud = $139, 99.-
24
4. INTERVALOS DE CLASE
Si tenemos un gran número de datos de una variable continua (cuando puede tomar cualquier valor real), es conveniente agruparlos en intervalos consecutivos, de manera que cada dato pertenezca a un solo intervalo.
EJEMPLO 1 Los siguientes datos corresponden a las alturas (en cm) de un grupo de 24 alumnos de cuarto grado: 125 130 132 140 128 132 128 132 139 133 142 130 138 133 142 136 145 124 126 147 138 134 128 132
25
Primer paso: ● Calculamos la amplitud A = xmax - xmin A= 147 –124 A= 23 Segundo paso: ● Determinamos el número de intervalos Como la muestra tiene 24 individuos, se determinarán 6 intervalos de amplitud 4 ya que 23 ≅4 6
Tercer paso: ● Determinamos los intervalos. El primer intervalo se toma a partir del valor mínimo. Para evitar que los extremos del intervalo coincidan con un valor de la variable se los define restando media unidad del último decimal. El primer intervalo se toma a partir del 26
124 – 0,5=123, 5 Valor mínimo Limite inferior de la clase El segundo intervalo se toma a partir de 123,5 + 4 = 127,5
Amplitud del intervalo (Calculado en el paso 2) Intervalo de clase
Frecuencia
123,5-127,5
3
127,5-131,5
5
131,5-135,5
7
135,5-139,5
4
139,5-143,5
3
143,5-147,5
2
Cantidad de alumnos que tienen una altura perteneciente al intervalo de cada clase
27
EJEMPLO 2 El puntaje de la evaluación de matemática de 32 estudiantes se registran en la siguiente tabla: 68 84 75 82 96 78 89 61 79 62 67 97 73 79 88 73 61 65 75 87 66 78 82 75 65 80 73 57 86 67 73 81 Primer paso: ● Calculamos la amplitud. A = xmax - xmin A = 97 – 57 A = 40 Segundo paso: ● Determinamos el número de intervalos 40 = 8 . Formamos 5 intervalos de ampli5
tud 8.
28
Tercer paso: ● Determinamos los intervalos. El primer intervalo se toma a partir del 57 – 0,5= 56,5 El segundo intervalo se toma a partir 56,5 + 8 = 64,5 Intervalos de clase
Frecuencias
56,5 – 64,5
4
64,5 – 72,5
6
72,5 – 79,5
11
79,5 –87,5
7
87,5 – 95,5
2
95,5 - 103,5
2
29
5. GRÁFICOS. HISTOGRAMAS, POLÍGONOS DE FRECUENCIA, TORTAS, BARRAS
HISTOGRAMAS Un histograma consiste en una serie de rectángulos que tienen: -Sus bases sobre un eje horizontal (eje x) con centros en los puntos medios de los intervalos de clase y la longitud a igual al tamaño de los intervalos de clase. -Superficies proporcionales a las frecuencias de clase. EJEMPLO: La siguiente tabla muestra la altura de ciertos árboles (en metros) y su frecuencia. Graficá en un histograma. 30
Altura 60-62
Cantidad de árboles 5
63-65
18
66-68
42
69-71
27
72-74
8
Total
100
Determinamos los puntos medios de los intervalos de clase. Limite superior + limite inferior = punto medio 2
Altura
Cantidad
de Punto medio
árboles
Tamaño de los
60-62
5
61
intervalos 62- 60= 2
63-65
18
64
65-63= 2
66-68
42
67
68-66= 2
69-71
27
70
71-69= 2
72-74
8
73
74-72= 2
Total
100
31
POLÍGONOS DE FRECUENCIAS Polígono de frecuencias: Es un gráfico de línea trazado sobre los puntos medios. Se obtiene uniendo los puntos medios de los lados opuestos a las bases de los rectángulos en el histograma; incluyendo el anterior al primero y el posterior al segundo.
32
EJEMPLO: La tabla muestra el tiempo (medido en horas) que tardan en fundirse 50 lámparas halógenas de larga duración. A continuación encontrarás el polígono de frecuencia correspondiente. Tiempo (en horas)
Lámparas
Puntos medios de los
500 -1750
2
intervalos 1125
1750 - 3000
7
2375
3000 - 4250
9
3625
4250 - 5500
12
4875
5500 - 6750
7
6125
6750 - 8000
6
7375
8000 - 9250
5
8625
9250 - 10500
2
9875
33
GRAFICO DE TORTA
Gráfico de torta: Los ángulos deben ser proporcionales a las respectivas frecuencias, por lo tanto:
αº 360º
=
f .absoluta total
A la cantidad total de la muestra le corresponden los 360º del círculo.
EJEMPLO: En la siguiente tabla se muestra la superficie de distintas zonas del mundo en millones de millas cuadradas.
34
Zonas
Superficies 11,7
África Asia
10,4
Europa
1,9
Norteamérica
9,4
Oceanía
3,3
Sudamérica
6,9
Centroamérica
7,9
El total de la superficie es 51,5 millones, entonces le corresponden los 360º del círculo. Para calcular el ángulo que le corresponde a cada sector haremos regla de tres simple: 51,5 millones
360º
11, 7 millones
x = 81º 47´ (África)
51,7 millones
360º
10,4 millones
x = 72º 25´ (Asia)
35
51,7 millones
360º
1,9 millones
x = 13º 13´ (Europa)
51, 7 millones
360º
9,4 millones
x = 65º 27´ (Norteamérica)
51,7 millones
360º
3,3 millones
x = 22º 58´ (Sudamérica)
51, 7 millones
360º
6,9 millones
x = 48º 2´ (Centroamérica)
36
GRAFICO DE BARRAS Gráfico de barras: Las anchuras de las barras son todas iguales, puede elegirse cualquier tamaño adecuado con tal de que las barras no se superpongan.
EJEMPLO: En la tabla se muestran las velocidades orbitales de los planetas del sistema solar. A continuación encontrarás el gráfico de barras correspondiente. Planeta
Velocidades (milla /seg) 29,7
Mercurio Venus
21,8
Tierra
18,5
Marte
15,0
Júpiter
8,1
Saturno
6,0
Urano
4,2
Neptuno
3,4
Plutón
3,0
37
Gráfico de barras
38
6. MEDIDAS DE CENTRALIZACIÓN ( DE POSICIÓN O DE TENDENCIA CENTRAL)
Son una serie de valores que tratan de representar o resumir una distribución de frecuencias dada. Además, se utilizan para comparar distintas distribuciones de frecuencias. Estas medidas son: ● la media aritmética (o promedio) ● la mediana ● la moda (o modo) Mediana: de una serie de datos ordenados (en forma creciente o decreciente) es el valor que tiene tantas observaciones anteriores como posteriores a él. ● La variable no viene dada en intervalos
39
EJEMPLO 1 Se tira un dado 50 veces. Cada número y la frecuencia con que han aparecido está indicado en la tabla. Calculá la mediana. Número del dado
Frecuencia
Frecuencia acumu-
1
11
11
2
9
20
3
5
25
4
10
35
5
12
47
6
3
50
Total
50
lada
La mediana corresponde a la observación cuya frecuencia acumulada contenga a Como
n . 2
n 50 = = 25 la frecuencia acumulada 25 2 2
contiene a 25. 40
Como la frecuencia acumulada es 25 le corresponde el número de dado 3. Entonces la mediana es 3. ● Cuando la variable está dada en forma de intervalos
EJEMPLO 2 La tabla muestra una distribución de frecuencias de los salarios en pesos de 65 empleados de la Compañía P & R. Salarios (en pesos)
Frecuencia acumulada
50 – 59,99
Nº de empleados 8
60 – 69,99
10
18
70 – 79,99
16
34
80 – 89,99
14
48
90 – 99,99
10
58
100 – 109,99
5
63
110 – 119, 99
2
65
Total
65
41
8
Como
n 65 = = 32,5 . 2 2
Como 32,5 está contenido en la frecuencia acumulada 34, la mediana está en el intervalo 70 – 79,99. Para obtener exactamente el valor utilizaremos n − F1 la siguiente fórmula: M = L1 + 2 f mediana
.c
donde L1= límite inferior del intervalo que contiene a la mediana n = número total de datos. F1= Frecuencia acumulada anterior al intervalo que contiene a la mediana. C = tamaño del intervalo que contiene a la mediana.
42
Reemplazando en la fórmula: n − F1 M = L1 + 2 f mediana
65 − 18 2 .c = 70 + .9,99 ⇒ M = $79,06 16
Gráficamente En un histograma Sueldos de em pleados 20
l
50 – 59,99
15
60 – 69,99
em pleados 10
70 – 79,99
5
80 – 89,99 90 – 99,99
0 1
100 – 109,99
sueldos
110 – 119, 99
m
La mediana es la abscisa correspondiente a la recta lm que divide al histograma en dos partes de igual área.
43
7. MODA
MEDIDAS DE CENTRALIZACIÓN (DE POSICIÓN O DE TENDENCIA CENTRAL) Son una serie de valores que tratan de representar o resumir una distribución de frecuencias dada. Además, se utilizan para comparar distintas distribuciones de frecuencias. Estas medidas son: •
la media aritmética (o promedio)
•
la mediana
•
la moda (o modo)
44
Moda El dato que se repite más veces, es decir, el de mayor frecuencia, es la moda. Tiene la ventaja de que es una medida que también es válida para datos no numéricos. Es muy común y se utiliza cotidianamente para describir la tendencia en el vestuario de cada año. La moda es el valor de la variable al que le corresponde la mayor frecuencia.
Ejemplo En la siguiente tabla, x i = 2 tiene la mayor frecuencia, f i = 7. xi
fi
0
2
1
5
2
7
3
4 45
La moda es 2
4
1
5
1
Σ
20
Cuando en el conjunto de observaciones hay una sola moda, se dice que la distribución es unimodal. Si hay dos variables con la misma frecuencia máxima la distribución se llama bimodal. Ejemplos 1. En la serie 5, 8, 5, 9, 6 la moda es 5 (f =2) La distribución es unimodal 2. En la serie 3, 6, 9, 4, 4, 8, 9, 4, 9, las modas son 4 y 9 (f = 3) La distribución es bimodal.
46
8. ESTADÍSTICA. EJERCICIOS
EJERCICIO 1 En un curso de estadística de 15 alumnos se registraron las siguientes notas: 2, 4, 8, 7, 9, 6, 6, 6, 5, 7, 8, 9, 6, 4, 2. Ordená los datos y hallá: abcd-
La media aritmética. La mediana. La moda. El rango.
EJERCICIO 2 En la primera semana del mes de enero se registraron, en la ciudad de Buenos Aires, las siguientes temperaturas: 25, 28, 27, 33, 31, 28, 29. Ordená los datos y hallá: a- La media aritmética. b- La mediana. 47
c- La moda. d- El rango
EJERCICIO 3 En el curso de estadística del problema 1) se tomaron las alturas de los alumnos y los datos fueron los siguientes: 1,79; 1,69; 1,72; 1,63; 1,67; 1,59; 1,69; 1,68; 1,78; 1,72; 1,65; 1,61; 1,70; 1,57; 1,72. Ordená los datos y hallá: abcd-
La media aritmética. La mediana. La moda. El rango.
EJERCICIO 4 El dueño de un negocio, con el fin de implementar un nuevo plan de márketing, estudia la cantidad de clientes que ingresan al local, en el término de una semana, y los datos fueron: 52, 20, 34, 83, 15, 21, 38, 42, 29, 18 Ordená los datos y hallá 48
a- La media aritmética. b- La mediana. c- La moda.
EJERCICIO 5 En la guardia de un hospital se tomaron las medias aritméticas mensuales de los ingresos a la guardia, en el año 2000. Los registros fueron los siguientes: 2400, 2056, 3245, 2890, 2113, 3560, 2456, 3654, 2432, 2012, 1967, 1056. Hallá: a- La media aritmética. b- La mediana. c- El rango.
49
HOJA DE RESPUESTAS
EJERCICIO 1 Los elementos ordenados quedan: 2, 2, 4, 4, 5, 6, 6, 6, 6, 7, 7, 8, 8, 9, 9 a- X = 5.933 b- Mediana = 6 c- Moda = 6 d- Rango = 7
EJERCICIO 2 Los elementos ordenados quedan: 25, 27, 28, 28, 29, 31, 33 a- X = 28, 71 b- Mediana = 28 c- Moda = 28 d- Rango = 8
50
EJERCICIO 3 Los elementos ordenados quedan: 1,57; 1,59; 1,61; 1,63; 1,65; 1,67, 1,68; 1,69; 1,69; 1,70; 1,72; 1,72; 1,72; 1,78; 1,81 a- X = 1,682 b- Mediana = 1,68 c- Moda = 1,72 d- Rango = 0,24
EJERCICIO 4 Los elementos ordenados quedan: 15, 18, 20, 21, 29, 34, 38, 42, 52, 83 a- 35,2 b- 29 c- 83
51
EJERCICIO 5 Los elementos ordenados son: 1056, 1967, 2012, 2056, 2113, 2400, 2432, 2456, 2890, 3245, 3560, 3654 a-
X = 2486,75
b- Mediana = 2416 c- Rango = 2598
52
9. MEDIDAS DE DISPERSIÓN (O DE DESVIACIÓN)
Las medidas de centralización (la moda, la media y la mediana) tratan de representar o resumir una distribución de frecuencias dada en un solo valor. Las medidas de dispersión tienen como objetivo estudiar lo “concentrada” que está la distribución en torno a la media. Podría suceder que dos distribuciones de frecuencias sean muy diferentes pero tener la misma media.
Me
53
Me
Las medidas de dispersión completan el análisis numérico de un conjunto de datos. Determinan la mayor o menor variación de los datos, y dan una idea de su dispersión respecto a las medidas de centralización. Las más importantes son: ● la desviación media Desviación media =
●
∑ x−x n
la desviación estándar o desvío típico s=
∑ (x
i
−x
)
2
n
54
fi
● la varianza s
2
∑ (x =
i
−x
)
n
55
2
fi
10. DESVIACIÓN MEDIA
Hemos estudiado varias medidas de centralización, por lo que podemos hablar de desviación con respecto a cualquiera de ellas, sin embargo, la más utilizada es con respecto a la media. La media es la medida de tendencia central más útil y exacta. Recordá que: La media aritmética o promedio es el cociente que se obtiene dividiendo la suma de los valores de la variable por el número de observaciones.
Desviación Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di .
56
La desviación no es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información. Si sumamos las desviaciones con respecto de la media podríamos obtener una estimación de la cantidad característica de desviación con respecto a la media. Entonces,dividiendo por n (número de observaciones), tendríamos una medida análoga a la medid aritmética, excepto que representaría la dispersión promedio de las calificaciones con respecto a la media. Pero, teniendo en cuenta las características de la media, encontramos una seria dificultad: la suma de las desviaciones de todos los valores obtenidos con respecto a la media, debe valer cero. Así, si definimos la desviación media como esta suma dividida por n, la desviación media tendría que ser cero.
57
Recordá que: La media es el punto en una distribución de medidas respecto del cual la suma de las desviaciones es igual a cero: Σ x − x = 0
(
)
Este inconveniente se soluciona sumando todas las desviaciones sin considerar el signo y dividiendo por n, es decir tomamos los valores absolutos de las desviaciones. Desviación media Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm. La fórmula que utilizaremos en una serie simple es:
dm =
Σx−x n
58
Referencias: Σ: sumatoria x : media aritmética
n: número de observaciones Si x1 , x 2 ,...x k se presentan con frecuencias, la fórmula que utilizaremos para datos agrupados en forma de distribución de frecuencias es:
dm =
(
Σ f x−x
)
n
Ejemplo ● Hallá la desviación media de los números 2, 3, 6, 8, 11.
59
Media aritmética = x =
2 + 3 + 6 + 8 + 11 =6 5
Desviación media = dm = dm = dm =
2 − 6 + 3 − 6 + 6 − 6 + 8 − 6 + 11 − 6 5 −4 + −3 + 0 + 2 + 5 5 4+3+0+ 2+5 5
dm = 2,8
60
11. DESVIACIÓN ESTÁNDAR (S)
La desviación estándar es la raíz cuadrada de la varianza.
La fórmula que nos permite hallarla es:
s=
(
Σ xi − x n
)
2
Para datos presentados en forma de distribución de frecuencia, la fórmula de la desviación estándar es:
s=
(
)
2
Σ xi − x . f n
Recordá que: Llamamos varianza a la media de los cuadrados de los desvíos (s2)
61
Observación: Dos distribuciones de datos pueden tener la misma media y ser muy diferentes. Ejemplo ● Tené en cuenta la siguiente tabla y hallá la desviación estándar x
x−x
(x − x )
9 8 7 7 7 5 5 5 5 4 4 3 3 2 1
4 3 2 2 2 0 0 0 0 -1 -1 -2 -2 -3 -4
16 9 4 4 4 0 0 0 0 1 1 4 4 9 16
62
2
● Con estos datos recopilamos la siguiente información:
(
Σ x = 75
(
Σ x−x
)
2
)
Σ x−x =0 = 72
n = 15
x=5
● Como sabemos, la desviación estándar se calcula con la siguiente fórmula:
s=
(
Σ xi − x n
)
2
● Entonces sólo resta reemplazar los datos obtenidos en la fórmula y hallar la desviación:
s=
72 15
= 4,80 = 2 ,19 ● De esta manera podemos concluir que la desviación estándar es igual a 2,19.
63
12. VARIANZA
Para evitar los valores negativos de los desvíos suelen tomarse los cuadrados de los desvíos. Llamamos varianza a la media de los cuadrados de los desvíos, y la denotaremos por s2
Cálculo de la Varianza en una serie simple En símbolos, la varianza queda expresada como la suma de los cuadrados de los desvíos dividida por el número de observaciones.
(
Σ xi − x s = n 2
64
)
2
Cálculo de la Varianza en una serie de frecuencias Para calcular la varianza se suman los productos de los cuadrados de los desvíos por la frecuencia, y se divide la suma por el número de observaciones.
(
)
2
Σ xi − x . f s = n 2
Cálculo de la Varianza en una distribución en intervalos de clase Se suman los productos de los desvíos de cada intervalo por la frecuencia del intervalo y se divide la suma por el número de observaciones.
(
)
2
Σ xm − x . f i s = n 2
65
En todos los casos: xi: es el i-ésimo dato : es la media aritmética para datos no agrupados n: es el número de datos
Σ: sumatoria Este dato estadístico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm la varianza vendrá dada en cm2. Pero al elevar al cuadrado las diferencias de los datos respecto de la media, hace que los valores más alejados de la media tengan mayor contribución. Como consecuencia, distingue mejor que la amplitud la variabilidad de dos conjuntos de datos.
66
EJEMPLO 1 ● Calculá la varianza para el siguiente conjunto de datos 5 9 12 7 15 3
SOLUCIÓN
● Aplicamos la definición (primera fórmula). ● Primero hay que calcular la media = (5+9+12+7+15+3)/6 = 51/6 = 8.5 ● Ahora procedemos al cálculo de la varianza:
S2= [(5-8.5)2+(9-8.5)2+(12-8.5)2+(7-8.5)2+(158.5)2+(3-8.5)2]/6 = 99.5/6 = 16.58
67
● Llegando entonces a que la varianza para este conjunto de datos es 16.58.
68
13. DISTRIBUCIÓN NORMAL CURVA DE GAUSS
El matemático Karl Friedrich Gauss, (17771855) estudiando los errores que se producen al medir reiteradas veces una misma magnitud, probó que éstos se distribuyen según una ecuación exponencial cuya grafica es:
Media La distribución normal es simétrica y el valor máximo de la función corresponde a la media.
69
Este gráfico se denomina campana de Gauss (debido a su forma acampanada) o distribución normal. La distribución de muchas variables parece seguir la curva normal. Por ejemplo, caracteres de individuos (personas, animales, plantas) de una misma especie (altura, peso). También hay variables discretas que tienen una distribución parecida, como el número de caras al lanzar un cierto número de monedas. Hay una gran cantidad de variables aleatorias continuas que se presentan en las situaciones más variadas y que, a pesar de ello, son de un mismo tipo. Todas ellas tienen en común la forma de su función de densidad. Para estas variables aleatorias, si la media es µ y la desviación típica es σ la función densidad es:
f ( x) =
1
σ 2π
e
1 x−µ − 2 σ
70
2
La gráfica de estas funciones tiene forma de campana con un eje de simetría. Las funciones de este tipo están completamente determinadas por su media µ, y su desviación típica, σ.
● La media µ indica la posición de la campana (parámetro de centralización) ● La desviación típica σ será el parámetro de dispersión. Cuanto menor sea, mayor cantidad de masa de probabilidad habrá concentrada alrededor de la media y cuanto mayor sea ``más aplastado" será.
Su gran importancia se debe al hecho de que el área debajo de cualquier campana de Gauss entre los valores x1 = µ + k1σ y x 2 = µ + k 2σ es la misma que el área bajo la N (0;1) entre z1 = k1 ∧ z 2 = k 2
71
EJEMPLO Un estudiante consigue un 72 % de aprobación en Historia y lo mismo en Inglés. La media para todos los alumnos es 65 %. La desviación estándar es del 3% para Inglés y 15% para Historia.
72
En inglés
Los mejores resultados
72 puntos
µ=65
En Historia
Los mejores resultados
µ=65
73
72 puntos
En Inglés, muy pocos superaron el 72 %, por lo tanto, se trata de un resultado muy bueno. En Historia, el 72 % lo superaron muchos. La media no es muy válida puesto que la dispersión de los resultados fue muy grande, como nos indica la desviación típica. Luego, ese 72 % no es muy bueno.
74
EJERCICIOS 13-1
EJERCICIO 1 Dada la variable aleatoria Z de distribución normal N(0,1) !
Calculá las siguientes probabilidades a- P(Z ≤ -1,3) b- P(Z ≥ 1) c- P(-0,5 ≤ Z ≤ 1,47)
EJERCICIO 2 !
En una variable aleatoria X con distribución normal N(8,4) calculá P(3 ≤ X ≤ 10)
EJERCICIO 3 Las notas de Historia de una clase se distribuyen según una distribución normal N(6,4;1,5) y el
75
profesor quiere poner sobresaliente a un 15% de la clase !
¿A partir de qué nota debe poner sobresaliente?
EJERCICIO 4 Las alturas de los empleados de una empresa de transportes se toman redondeando al centímetro más próximo. Se sabe que están distribuidos normalmente con la función N(172,5). Se toma una muestra de 1000 empleados al azar.
!
Calculá cuántos miden : a- No más de 180 cm. b- 175 cm o más. c- Entre 160 y 184 cm
76
EJERCICIO 5 El coeficiente intelectual (C.I.)de los alumnos de la universidad de Berdaguer sigue una distribución normal N(115,12).
!
Calculá la probabilidad de que un alumno tenga un C.I. superior a 138.
77
HOJA DE RESPUESTAS 13-1
EJERCICIO 1
a- 0,0968 b- 0,1587 c- 0,6207
EJERCICIO 2 0,5859
EJERCICIO 3
z − 6,4 P(Z ≤ z)=0,85 ⇒ z ' = ⇒ z = 7,96, por lo tanto la nota debe ser 8.1,5
EJERCICIO 4 a- 955 b- 308
78
c- 988
EJERCICIO 5 0,0281
79
14. CORRELACIÓN
DOS TIPOS DE RELACIONES A menudo, un investigador o nosotros mismos, nos vemos en la necesidad de saber si existe alguna relación entre dos variables que necesitamos medir. Por ejemplo: #
Cantidad de kilowatts consumidos y su costo.
#
Posición de un cuerpo lanzado hacia arriba y su velocidad.
#
Cantidad de cierta población de bacterias en un determinado momento.
#
Altura de las personas y su peso.
#
Altura de los padres y la de sus hijos
#
Calificación de un curso en física y en matemática.
Entre estas situaciones hay algunas entre las que podemos establecer una relación que llamaremos funcional. 80
Para que exista este tipo de relación debe haber una función que, conocida una de las variables, me permite calcular aproximadamente la otra, esto se cumple en los tres primeros ejemplos, cuando exista dicha relación diremos que las variables están correlacionadas o que hay correlación entre ellas. En cambio no existe una función que nos permita conocer la nota de física de un alumno conociendo la de matemática; o la altura de los hijos conociendo la de sus padres. Llamaremos a la relación existente entre estas variables relación estadística
DIAGRAMAS DE DISPERSIÓN Para estudiar la relación entre dos variables, se comienza por obtener un conjunto de datos.
81
Formamos con ellos pares ordenados (x , y ), la primera coordenada corresponde a una variable y la segunda a la otra, por ejemplo, las x corresponderán a las alturas de los padres y las y a las de sus hijos; o las x a la nota de matemática y la y a la de física; etc. Tendremos entonces un conjunto de datos (x 1 , y 1 ), (x 2 , y 2 ),..., (x n , y n ). que podemos representar en un par de ejes, formando lo que se conoce como diagrama de dispersión, en este caso se dice que los datos forman una nube de puntos.
82
EJEMPLOS 1. Relación entre población y vivienda por provincia (censo 1991) 1.200.000 1.000.000 800.000 600.000 400.000 200.000 0
En este ejemplo, cada punto representa una provincia, los valores de X indican la población y los de Y la cantidad de viviendas. Vemos que los puntos se alinean por lo que decimos que existe una correlación lineal. Además a mayores valores de una variable corresponden mayores de la otra, por lo que decimos que la correlación es directa. Por otra parte, como esta alineación es muy marcada decimos que se trata de una correlación fuerte.
83
2. Puntos obtenidos y partidos perdidos. Torneo de fútbol local 10 5 0 0
10
20
30
40
Punt o s
Para este ejemplo, cada punto representa un equipo de fútbol de primera división. Acá también notamos una correlación lineal, aunque más débil que en el ejemplo anterior. Como a mayores valores de x (puntos) corresponden menores de y (perdidos) decimos que la correlación es inversa.
84
3. Relación entre población y superficie de una provincia(censo 1991) 300.000 250.000 200.000 150.000 100.000 50.000 0
En este caso también cada punto representa una provincia argentina, pero acá no es clara la relación que existe entre las variables. Decimos que no hay correlación.
85
COVARIANZA Y COEFICIENTE DE CORRELACIÓN
Para estudiar con más detalle la correlación definiremos los siguientes parámetros estadísticos: Desvío típico n
σx =
∑x i =1
2 i
n n
σy =
∑y i =1
n
−x
2
−y
2
2 i
Donde xi e yi son cada uno de los datos de cada variable y x e y son las medias de dichos datos. Al punto ( x , y ) se lo conoce como centro medio o centro de gravedad de la muestra.
86
Covarianza n
σ xy =
∑ (x i =1
i
− x )( y i − y)
n
Notemos, a partir de la fórmula, que si la mayoría de los valores de x e y son, para cada par de datos, superiores los dos o inferiores los dos a las respectivas medias, esto implica que: 1.
El signo de la covarianza será positivo.
2.
La mayoría de los valores pequeños de x se corresponden con valores pequeños de y, cosa que también ocurre con los mayores.
Esto nos dice que si la correlación es directa la covarianza será positiva. De forma análoga se puede ver que a una correlación inversa se corresponde una covarianza negativa. Sin embargo, la covarianza es un indicador que se ve afectado por la escala considerada para 87
cada variable, o por algún dato demasiado alejado del centro de gravedad. Para corregir estas deficiencias se define el coeficiente de correlación lineal.
COEFICIENTE DE CORRELACIÓN LINEAL
ρ=
σ xy σ xσ y
Observaciones: #
ρ está siempre entre –1 y 1, es decir: -1≤ ρ ≤1
#
Si ρ es próximo a –1 se trata de una correlación inversa, más fuerte cuanto más próximo a –1 sea su valor.
#
Si ρ es próximo a 1 se trata de una correlación directa, más fuerte cuanto más próximo a 1 sea su valor.
88
#
Si ρ es muy próximo a cero no hay correlación lineal entre los datos.
CORRELACIÓN NO LINEAL El coeficiente ρ nos indica si hay o no correlación lineal entre las variables y que tan fuerte es. Sin
embargo,
fuertemente
las
variables
correlacionadas
pueden
estar
pero
dicha
correlación no ser lineal; un ρ próximo a cero indica que no hay (o es muy débil) la correlación lineal, pero nada nos dice de otro tipo de correlación.
89
El siguiente gráfico muestra la relación entre la inversión en publicidad de una empresa y sus ventas. Se observa que la publicidad hace aumentar las ventas, pero no indefinidamente ni de forma lineal. Las variables están fuertemente relacionadas pero la nube no se ajusta a una recta: se trata de un caso de correlación no lineal.
RECTA DE REGRESIÓN Si la nube de puntos del diagrama de dispersión adopta una forma muy definida (como es el caso del ejemplo 1 o del gráfico anterior) los puntos se pueden aproximar mediante alguna curva conocida que ajuste lo mejor posible los puntos de la nube. Dicha curva se conoce como línea de regresión y poder determinarla nos ofrece la posibilidad de estimar los valores de una variable conocidos los de la otra. Si entre las variables existe una fuerte correlación lineal, una recta se ajusta satisfactoriamente a 90
los puntos de la muestra. Esta recta se conoce como recta de regresión y su ecuación es :
y−y=
σ xy (x − x) σx
91
14.1 ¿CÓMO SE CALCULA EL COEFICIENTE DE CORRELACIÓN LINEAL?
Recordá que:
•
Es un valor que está siempre entre 1 y –1.
•
El coeficiente de correlación, r no varía con los cambios de escala y mide eficazmente el grado de correlación entre dos variables.
r= •
σx y σx . σ y
Si r es 1 (o próximo a 1), la dependencia es funcional (o casi funcional): los puntos están alineados (o casi alineados).
92
Cálculo de r
Ejemplo En un experimento sobre la distancia de frenado de un auto dependiendo de su velocidad, se obtuvieron los siguientes datos: Velocidad
70
50
45
120
85
65
32
18
19
43
35
34
(km/h) Distancia (m)
$ Representá los valores en un diagrama o nube de puntos y calculá el coeficiente de regresión entre la velocidad y la distancia.
Solución 1º Paso: Antes, debemos calcular previamente x, y, σ x , σ y , σ xy σx y
1 = n
n
n
1 ∑ (xi − x )( yi − y ) = ∑ xi yi − x .y
n
i =1
93
i =1
σx =
1 n
∑x
σy =
1 n
∑y
2 i
2 i
− x2
− y2
Si llamamos x a la velocidad e y a la distan-
cia. Entonces, obtenemos que: x = 72 ,5 y = 30 ,16
2º Paso: Reemplazando en las fórmulas los datos y los promedios, calculamos $ Desviación típica de x: σx =
σ
x
1 n
∑x
2 i
− x2
= 24 ,95
$ Desviación típica de y:
σy =
1 n
∑y
2 i
− y2
σ y = 8,93
$ La covarianza es:
94
σx y =
1 n
n
n
1 ∑ (xi − x )( yi − y ) = ∑ xi yi − x .y n
i =1
i =1
σ xy = 201,91
3º Paso: El coeficiente de correlación en este cada caso es:
r=
σxy σ x.σ y
201,91 24,95 ⋅ 8,93 201,91 r= 222,8 r = 0,91 r=
Representamos los datos en un diagrama de nubes.
Este gráfico obtiene este nombre pues
cuando existe una gran cantidad de datos, los mismos se agrupan formando una “nube” de puntos. Esta nube toma una forma que, a veces, la puede caracterizar relacionándola con una función 95
determinada, generando así el criterio intuitivo de correlación con una recta, parábola, exponencial, etc. Estas correlaciones son confirmadas o no por el cálculo de los coeficientes en cada caso.
50 45 40 35 30 25 20 15 10 5 0 0
20
40
60
80
100
120
140
Rectas de regresión Cuando existe correlación entre dos variables –cuanto más fuerte mejor- es útil trazar la recta que “mejor se ajuste” a los puntos de la nube. Esta recta llamada recta de regresión de y sobre x, tiene la siguiente ecuación:
96
y− y =
σx y σ 2x
(x − x )
Para el ejemplo anterior, la recta de regresión lineal viene dada por la siguiente ecuación: 202,91
(x − 72,5) (24,95)2 y − 30,16 = 0,32(x − 72,5) y − 30,16 =
y = 0,32 x − 23,2 + 30,16 y = 0,32 x + 6,96
Gráfico de la recta de regresión lineal.
50 45 40 35 30 25 20 15 10 5 0 0
20
40
60
80
97
100
120
140
14.2 EJERCICIOS
EJERCICIO 1 Las notas de los alumnos de 5º año en Matemática y Física se muestran en la tabla: Matemática
2
2
4
4
4
5
6
6
7
8
9
9
2
4
3
4
6
7
5
6
8
7
7
10
X Física Y
a- Calculá el coeficiente de correlación b- Graficá la nube de datos. c- Determiná y graficá la ecuación de la recta de regresión lineal
98
EJERCICIO 2 En el Parque Nacional Nahuel Huapi se talaron ejemplares de robles para determinar su edad (contando el número de anillos del tronco), y se ha medido su diámetro. Los datos que se obtuvieron son: Diámetro
10
15
16
21
30
25
30
35
4
8
12
18
22
26
30
32
(cm) Edad (años)
a- Hallá el coeficiente de correlación. b- Graficá la nube de datos. c- Hallá la recta de regresión. d- Determiná la edad correspondiente a 18 y 40 cm de diámetro.
99
EJERCICIO 3
En la tabla se muestran los datos de la longitud corporal y el peso de un bebé durante las primeras 24 semanas de vida.
Longitud
50
52
55
58
61
62
65
3,3
3,9
4,5
5,2
5,6
6,2
6,7
(cm) Peso (Kg.)
a- Representá la nube de puntos. b- Calculá el coeficiente de correlación lineal. c- Explicá el significado obtenido en el coeficiente. d- Hallá la recta de regresión lineal.
EJERCICIO 4 En el colegio de Mariana los alumnos han medido sus alturas y se han pesado para realizar un 100
trabajo de Ciencias Naturales. En la tabla, se encuentran los datos:
Peso
42
43
47
50
55
60
65
70
140
155
158
145
150
155
162
160
(Kg.) Altura (cm)
a- Representá la nube de puntos. b- Determiná el coeficiente de correlación c- Hallá y graficá la recta de regresión lineal.
EJERCICIO 5 El astrónomo Kepler investigó los movimientos de los planetas y descubrió tres leyes que llevan su nombre. En el siglo XVII, obtuvo datos para los planetas conocidos en la época que se volcaron a este cuadro:
101
Planeta
Distancia (106
Período (años)
Km.) Mercurio
58
0,24
Venus
108
0,62
Tierra
150
1
Marte
228
1,88
Júpiter
778
11,86
Saturno
1429
29,42
a- Elaborá una tabla de con dos columnas: En la primera (x) escribí los cuadrados de los períodos; y en la segunda, (y) los cubos de las distancias. b- Calculá el coeficiente de correlación entre los valores obtenidos en el punto a.
102
15. MEDIA, MODA Y MEDIANA
La Estadística se ocupa de tomar datos reales, analizarlos y presentarlos organizadamente para poder explicar ciertas cuestiones de la realidad. Entre los resultados que se obtienen de un estudio estadístico existen tres valores que dan información específica y que suelen ser muy utilizados:
Media, Moda y Mediana Media aritmética o promedio Cuando queremos saber la nota que figurará en el boletín luego de un trimestre calculamos el
promedio de las notas que hemos calificado durante ese período La media aritmética, o promedio de una serie de datos, se obtiene dividiendo la suma de los valores por la cantidad que de ellos hay. 103
EJEMPLO Un comerciante obtuvo las siguientes ventas: lunes, $ 750; martes, $ 600; miércoles, $ 720; jueves, $ 680; viernes, $ 840, y sábado $ 910. ¿Cuál fue la media de las ventas en la semana?
Media = 750 + 600 + 720 + 680 + 840 + 910 = 4500 = 750 6
6
Media = $ 750 diarios ! La media puede no coincidir con ninguno
de los valores registrados.
Moda Al dato que más veces se repite en una serie de mediciones, es decir, el de mayor frecuencia se lo denomina moda. Tiene la ventaja de ser una medida que vale también para datos no numéricos. 104
Por ejemplo, si evaluamos estadísticamente los colores de los autos que salen de una concesionaria podremos ver cual de ellos tiene mas frecuencia de venta, lo que establecerá lo que denominamos moda.
EJEMPLO El profesor de Matemática tomó en 7º B la misma evaluación que en 7º A. Las notas de 7º A fueron éstas: 2;2;2;3;3;3;3;5;7;7;8;8;8;8;8;8;9;9;10;10;10 y 10. Las notas de 7º B fueron éstas: 5;5;5;5;5;6;6;6;6;6;6;7;7;7;7;7;7;7;8;8;8 y 9. ¿Cuál es la moda en cada uno de los cursos? Realicemos las tablas correspondientes a cada curso:
105
A Notas
Frecuencia
2 3 5 7 8 9 10
3 4 1 2
6 2 4
Total
22
Moda A = 6
B Notas
Frecuencia
5 6 7 8 9
5 6
7
total
22
3 1
Moda B = 7
106
•
La moda siempre es uno de los valores registrados.
•
Cuando en el conjunto de observaciones hay una sola moda, se dice que la distribución es unimodal.
•
Si hay dos valores con la misma frecuencia máxima la distribución se llama bimodal
•
La moda no necesariamente coincide con la media aritmética.
MEDIANA En un estudio estadístico siempre se obtiene una lista de datos o resultados. En una lista con un número impar de datos, la mediana es el valor central, cuando el número de casos resulta par, la mediana se determina dividiendo a la mitad la suma de los dos datos centrales.
107
Dicho de otra manera, es el valor donde por encima de él se encuentra el 50% del total y por debajo el otro 50%. Ejemplo
De acuerdo con los sueldos que ganan mensualmente los 26 trabajadores de un taller, calcular la mediana. Ya que se trata de 26 trabajadores, se divide entre 2. La mediana se localiza contando entonces 13 frecuencias. . Sueldos
Frecuencias
$ 7.000
1
$ 6.750
2
$ 6.250
6
$ 5.000
8
$ 4.000
4
$ 3.500
3
$ 2.000
2
Total
26
Mediana = $ 5 000
108
HOJA DE RESPUESTAS
EJERCICIO 1 a- El coeficiente de correlación es r = 0, 84 b- La ecuación de la recta es y = 0, 78 x +1, 46 Su representación gráfica es:
12 10 8 6 4 2 0 0
1
2
3
4
5
109
6
7
8
9
10
EJERCICIO 2 a- El coeficiente de correlación es r = 0, 957 b- La ecuación de la recta de regresión lineal es y = 1, 13 x – 6,77 c- La edad correspondiente al roble de 18 cm de diámetro es 13 años aprox. La edad del roble de 40 cm de diámetro es 38 años aprox.
EJERCICIO 3 a-
La representación de la nube de puntos es: 8 7 6 peso
5 4 3 2 1 0 0
10
20
30
40 longitud
110
50
60
70
b- r = 0, 995 c- Como r > 0 la nube es ascendente y la correlación positiva. Por lo tanto es los puntos están alineados o casi alineados. d- La ecuación de la recta es y = 0, 22 x – 7, 772 e- Grafica de la ecuación lineal:
8 7 6 peso
5 4 3 2 1 0 0
10
20
30
40
50
60
70
longitud
EJERCICIO 4 a- El coeficiente de correlación es r = 0, 639
111
b- La recta de regresión lineal es y = 0, 47 x – 127, 7. Su grafica es:
165 160
altura
155 150 145 140 135 0
10
20
30
40
50
60
70
80
peso
EJERCICIO 5 a- La tabla es la siguiente: Cuadrados de los Periodo
Cubos de las distancias
0,3844
195112
0,3844
1259712
1
3375000
3,5344
11852352
112
140,6596
470910952
865,5364
2918076589
b- El coeficiente de correlación es r = 0, 99
113