FORMULARIO 1. ESTADÍSTICA UNIDIMENSIONAL 1.1. Terminología de un estudio estadístico Población: es Población: es el conjunto formado por todos los elementos del estudio estadístico. Muestra: Muestra: es la parte de la población que estudiamos y que nos sirve para deducir las características de la población. La muestra se toma cuando la población es muy grande y no puede realizarse un estudio de todos los individuos. Para que el estudio sea válido, la muestra ha de representar al conjunto de la población, tiene que ser una muestra representativa. Individuo: es Individuo: es cada uno de los elementos que qu e forman la población o la muestra. Tamaño de la población: es población: es el número de individuos que componen una población. Tamaño de la muestra: es muestra: es el número de individuos que componen una muestra. Variable estadística: estadística: es cualquier cualidad que estudiamos en los individuos de la muestra o población. 1.2. Tipos de variables estadísticas estadísticas Ejemplos Tipos de variables
Valor de la variable
Cualitativas o atributos
Cualidad Discretas
Número
Cuantitativas Continuas
Infinitos números
Variable
Valores
Color preferido Sexo Nº de libros leídos en un mes Número de páginas de un libro
Blanco, rojo, azul, … Hombre, mujer
Peso Altura
0, 1, 2, 3, … 210, 211, 22, 309, …
Entre 60 kg y 67 kg, …
Entre 1,50 y 1,80, …
1.3. Recuento de datos El recuento de datos según datos según sean: Datos aislados: Variables cualitativas. Variables cuantitativas discretas. Datos agrupados en intervalos: Variables cuantitativas continuas.
Se anota el número de veces que aparece cada dato. Se ordenan los valores en intervalos y se anota el número de veces que aparece cada dato.
2. VARIABLE CUANTITATIVA CONTINUA 2.1. Cálculo del número de intervalos 1) Hallamos la raíz cuadrada entera del número total de datos datos y, además, no debe ser inferior a 6 ni superior a 15. O bien, el número de intervalos que tomaremos será el redondeo hasta las unidades de N . 2) Utilizamos la fórmula empírica debida a Sturges: k = 1 + 3,3 log N Gema Isabel Marín Caballero
Página 1 de 6
2.2. Cálculo de la amplitud del intervalo 1) Conocido el número de intervalos, intervalos, hallamos el número de elementos que tenemos entre el dato inferior y el dato mayor, esto es, el rango de elementos. elementos. Después, dividimos el rango y obtenemos la amplitud del intervalo. de elementos entre el número de d e intervalos y Rango = dato mayor – dato menor Amplitud = rango / número de intervalos 2) Conocido el número de intervalos, intervalos, hallamos el número de elementos que tenemos entre el dato inferior y el dato mayor, esto es, el rango de elementos. elementos. Después, tomamos el primer múltiplo del número de intervalos que sea mayor o igual que el rango de elementos . Por último, dividimos el primer múltiplo del número de intervalos entre el número de intervalos y obtenemos la amplitud del intervalo. Rango = dato mayor – dato menor pm = Primer múltiplo del número de intervalos rango Amplitud = pm / número de intervalos
2.3. Cálculo de las marcas de clase Marcas de clase son los puntos medios de cada intervalo [ Li , Li 1 ) . xi
Li Li 1 2
Donde Li es el límite inferior del intervalo y Li 1 es el límite superior. Una vez que se calcula la primera marca de clase, clase, las siguientes se obtienen de sumar a la marca de clase anterior la amplitud de la clase. marca de clase anterior + amplitud de la clase O también la marca de clase se clase se podría calcular sumando al límite inferior de la clase la mitad de la amplitud de la clase. límite inferior de la clase + mitad de la amplitud de la clase
3. TABLA DE FRECUENCIAS Distribución de frecuencias x i
f i
F i
x1 Valor 1
f 1
F 1
x 2 Valor 2
f 2
F 2
x3 Valor 3
f 3
F 3
x 4 Valor 4
f 4
F 4
…
…
…
x n Valor n
f n
F n
Total
N
Gema Isabel Marín Caballero
f ri f 1 N f 2 N f 3 N f 4 N … f n N
1
Porcentaje f ri 100 (%)
F ri F r 1 F r 2 F r 3 F r 4
F 1 N F 2 N F 3 N F 4 N
…
F rn
f r 1 100 f r 2 100 f r 3 100 f r 4 100 …
F n N
f rn 100
100 %
Página 2 de 6
4. GRÁFICOS ESTADÍSTICOS Diagrama de barras. Histograma. Polígonos de frecuencias. Diagrama de sectores. Ángulo del sector circular: N
f i
360 x
N f i
360
x
; x
f i 360 N
Pictograma. Cartograma. Serie cronológica. Pirámide de población. Tipos de gráficas estadísticas Diagrama de barras Histograma Polígonos de frecuencias Diagrama de sectores Pictograma Cartograma Serie cronológica Pirámide de población
Tipos de variables Variables cualitativas. Variables cuantitativas discretas. Variables cuantitativas continuas. Variables cualitativas. Variables cuantitativas discretas y continuas. Variables cualitativas. Variables cuantitativas discretas y continuas. Variables cualitativas. Variables cuantitativas discretas y continuas. Variables cualitativas. Variables cuantitativas discretas y continuas. Variables cualitativas. Variables cuantitativas discretas y continuas. Variables cualitativas. Variables cuantitativas discretas y continuas.
5. PARÁMETROS ESTADÍSTICOS 5.1. Medidas de centralizac centralización ión Tipos de medidas de centralización Media aritmética Mediana Moda
Gema Isabel Marín Caballero
Tipos de variables Variables cuantitativas discretas y continuas. Variables cuantitativas discretas y continuas. Variables cualitativas. Variables cuantitativas discretas y continuas.
Página 3 de 6
Tipos
Cómo se calcula
Variables cuantitativas continuas
n
xi f i
Media aritmética
x
x i
i 1
marca de clase de cada intervalo.
N
Me xi [ Li , Li 1 )
clase mediana o
1) Ordenamos los datos de menor intervalo mediana. Valor aproximado Me = marca de clase a mayor. del intervalo. Si N es impar Me xc1 Si N es par Me Mediana
2
N
Valor exacto
2 Me Li c
N
F i 1
f i
Donde: 2 Li límite inferior. N 2) Buscamos la primera F i c amplitud de los intervalos. 2 F i 1 frecuencia absoluta acumulada de que es F i nº Me xi la clase anterior. f i frecuencia absoluta. Mo xi [ Li , Li 1 ) clase modal o intervalo modal. Valor aproximado marca de clase del intervalo. Valor exacto Buscamos la f i mayor Mo xi f f Donde: c
Moda
xc xc 1
Mo Li c
i
i 1
f i f i 1 f i f i 1
Donde: Li límite inferior. c amplitud de los intervalos.
5.2. Medidas de posición Tipos de medidas de posición Primer cuartil Q 1 1 Segundo cuartil Q 2 2 Tercer cuartil Q 3 3 Decil k (D k k) Percentil k (P k k)
Gema Isabel Marín Caballero
Tipos de variables Variables cuantitativas discretas y continuas. Variables cuantitativas discretas y continuas. Variables cuantitativas discretas y continuas. Variables cuantitativas discretas y continuas. Variables cuantitativas discretas y continuas.
Página 4 de 6
Tipos
Variables cuantitativas continuas
Cómo se calcula
Q1 xi [ Li , Li 1 ) Primer cuartil Q 1 1
Q1 : 25% N 0,25 N
1 4
N Q1 :
N
Buscamos la primera F i
4 F i nº Q1 xi
N 4
1
1 que es
Valor aproximado Q = marca de clase del intervalo. Valor exacto 1
1
N
Q1 Li c
4
F i 1
f i
Q2 xi [ Li , Li 1 )
Valor aproximado Q = Q2 : 50% N 0,50 N N Q2 : 2 marca de clase del 2 4 intervalo. Valor exacto N Buscamos la primera F i 2 que es
Segundo cuartil Q 2 2 = Me
2
N
1
4 F i nº Q2 xi
2
N
Q2 Li c
F i 1
4 f i
Q3 xi [ Li , Li 1 )
Valor aproximado Q = Q3 : 75% N 0,75 N N Q3 : 3 marca de clase del 4 4 intervalo. Valor exacto N Buscamos la primera F i 3 que es
Tercer cuartil Q 3 3
3
N
3
4 F i nº Q3 xi
3
N
Q3 Li c Recorrido intercuartílico R IQ IQ
4
F i 1
f i
R IQ Q3 Q1 Dk xi [ Li , Li 1 ) Dk : k % N
Decil k D k k
k 10
N Dk :
Buscamos la primera F i
N
100 F i nº P k xi
N 10
k
k que es
Valor aproximado Dk = marca de clase del intervalo. Valor exacto k Dk Li c
P k : k % N Percentil k P k k
Gema Isabel Marín Caballero
k 100
N P k :
Buscamos la primera F i
N
100 F i nº P k xi
N 100
k
k que es
N
F i 1
10 f i
P k xi [ Li , Li 1 )
Valor aproximado P k = marca de clase del intervalo. Valor exacto
Página 5 de 6
k P k Li c
N
F i 1
100 f i
5.3. Medidas de dispersión Tipos de medidas de dispersión
Tipos de variables Variables cuantitativas discretas y continuas. Variables cuantitativas discretas y continuas. Variables cuantitativas discretas y continuas. Variables cuantitativas discretas y continuas. Variables cuantitativas discretas y continuas.
Rango o recorrido Desviación media Varianza Desviación típica Coeficiente de variación
Tipos
Cómo se calcula
Variables cuantitativas continuas
Rango o recorrido
R xn x1
R Ln L1
n
Desviación media
xi x f i i 1
DM
N n
Varianza Desviación típica Coeficiente de variación
xi x
2
2
x i = marca de clase del intervalo. f i
i 1
N
CV
2
x
Para comparar la dispersión de dos poblaciones heterogéneas (con distinta media aritmética), se utiliza el coeficiente de variación, variación, pues indica la variación relativa . Cuanto menor es el coeficiente de variación, variación, mayor es el grado de representatividad de los valores centrales y la distribución es menos dispersa. Cuando dos distribuciones tienen la misma media aritmética, la diferencia entre ambas viene dada a través de la desviación típica, típica, que nos indica lo alejados que se encuentran los datos con respecto de la media. La varianza y la desviación típica típica de una distribución son siempre positivas o nulas. Es nula cuando todos los datos son iguales a la media. Cuanto menor es la varianza o la o la desviación típica, típica , mayor es el grado de representatividad de los valores centrales. Cuando la desviación típica toma típica toma valores mayores que uno, hay bastante dispersión. Si las medidas de dispersión son “pequeñas”, se puede concluir que los datos están agrupados alrededor de la media aritmética. Es decir, cuanto menores son las medidas de dispersión, más concentrados están los datos. Y si las medidas de dispersión son “grandes” , significa que los datos están bastante dispersos.
Gema Isabel Marín Caballero
Página 6 de 6