JOSÉ M. CASAS SÁNCHEZ Catedrático de Estadística Económica y Empresarial Universidad de Alcalá de Henares. Madrid Estadístico Facultativo del Estado.
JULIÁN SANTOS PEÑAS
INTRODUCCIÓN A LA ESTADISTICA PARA ADMINISTRACIÓN Y DIRECCIÓN DE EMPRESAS ;
Segunda edición
EDITORIAL CENTRO DE ESTUDIOS RAMÓN ARECES, S. A.
Primera edición: julio 1999 Segunda edición: julio 2002
A nuestras familias
Reservados todos los derechos. Ni la totalidad ni parte de este libro puede reproducirse o transmitirse por ningún procedimiento electrónico o mecánico, incluyendo fotocopia, grabación magnética, o cualquier almacenamiento de información y sistema de recuperación, sin permiso escrito de Editorial Centro de Estudios Ramón Areces, S. A.
© EDITORIAL CENTRO DE ESTUDIOS RAMON ARECES, S. A. Tomás Bretón, 21. 28045 Madrid. ISBN: 84-8004-522-1 Depósito legal: M. 31.204-2002 Compuesto e impreso por Fernández Ciudad, S. L. Catalina Suárez, 19. 28007 Madrid Impreso en España
1 Printed in Spain
¡,'·------------------------------------------------------------------------------------------------------------------------------------------------------------------------
_ _L.
;
lndice
PRÓLOGO ................................................................
11
CAPÍTULO l. EL MÉTODO ESTADÍSTICO EN LA INTERPRETACIÓN DE LOS HECHOS ECONÓMICOS . . . . . . . . . . . . . . . . . . . .
13
Las ramas de la Estadística y sus métodos científicos . . . . . . . . 1.2. La Estadística Descriptiva y el estudio de los hechos económicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3. El Cálculo de Probabílidades como herramienta matemática de Inferencia Estadística. La Estadística Moderna . . . . . . . . . . . 1.4. La Inferencia Estadística como método de estudio de los hechos económicos ...........................·......................
18
CAPÍTULO 2. DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES . . . . .. . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . .. . .
21
l. l.
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Conceptos fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Tareas a desarrollar en las grandes etapas de la investigación estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Construcción numérica y gráfica de las distribuciones de frecuencias unidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1. Distribuciones de frecuencias unidimensionales con los datos no agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2. Distribuciones de frecuencias unidimensionales con los · datos agrupados en intervalos de clases . . . . . . . . . . . . . . . 2.4.3. Representaciones gráficas para distribuciones de frecuencias de datos cualitativos .. .. . .. .. .. .. .. .. .. . .. .. ..
13 15 17
21 22 24 33 34 43 47
8
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
ÍNDICE
2.4.4.
Representaciones gráficas para distribuciones de frecuencias de datos cuantitativos. . ..........,............ . 2.5. Medidas de posición ........................................... . 2.5.1. La media aritmética .................................... . 2.5.2. La media geométrica .................................. .. 2.5.3. La media armónica .................................... . 2.5.4. La mediana ............................................. . 2.5.5. La moda ................................................ . 2.5.6. Otras medidas de posición no centrales: los cuantiles .. 2.6. Momentos .. ·'· ................................................... . 2.7. Medidas de dispersión ......................................... . 2.8. Medidas de asimetría y curtosis ............................... . 2.9. Medidas de concentración ..................................... . Ejercicios .............................................................. .
84 90 95 97 102 104 109
CAPÍTULO 3. DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES ..................................................... .
121
3.1. 3.2.
Introducción .................................................... . Tabulación de variables estadísticas bidimensionales: distribuciones bidimensionales de frecuencias ......................... . 3.2.1. Tablas de correlación .................................. . 3.2.2. Tablas de contingencia ................................. . 3.3. Dependencia funcional y dependencia estadística ............ . 3.4. Regresión y correlación lineal simple ......................... . 3.4.1. La regresión lineal simple ............................ .. 3.4.2. Correlación lineal simple .............................. . 3.5. Regresión y correlación lineal múltiple ....................... . 3.5.1. Ajuste de un plano por el método mínimo-cuadrático 3.5.2. Ajuste de un hiperplano mediante la utilización del álgebra matricial ........................................ . 3.6. Ajustes no lineales por mínimos cuadrados .................. . 3.7. Estudio de la asociación entre variables cualitativas ........ . Ejercicios .............................................................. . CAPÍTULO 4.
NÚMEROS ÍNDICES
4.1. Introducción .................................................... . 4.2. Clasificación de los números índices ......................... .. 4.3. Propiedades de los números índices .......................... . 4.4. Índices de precios .............................................. ..
50 61 62 70 73 77
121 122 122 135 138
145 145 151 160 160 171 179 184 188 201 201 202 203 204
9
4.4.1. Índices simples de precios .. . .. .. .. .. .. . .. .. .. . .. .. . .. .. 4.4.2. Índices complejos de precios sin ponderar . . . . . . . . . . . . 4.4.3. Índices complejos de precios ponderados . . . . . . . . . . . . . 4.5. Índices de cantidades o cuánticos .. .. .. . .. . .. .. .. .. .. .. .. .. .. .. 4.6. Propiedades que cumplen los índices complejos y ponderados de precios y cantidades .. .. .. .. .. .. .. .. . .. .. .. ... .. .. .. .. .. .. .. . 4.7. Índices en cadena .. .. .. .. .. . .. .. .. .. . .. .. .. .. . . .. .. . .. .. . . . .. . .. . 4.8. Cambio de base en una misma serie de números índices . . . . 4.9. Renovación y enlace de series de números índices con distintas bases . . . . . . . . . . .. . . . . . . . . . . ... . . . . . . . . . . . . . . . . . . . . . .. . . . . .. . . . . . . . . 4.10. Repercusión y participación en las variaciones de un índice . 4.11. índices de valor y deflactación de series económicas . . . . . . . . . 4.11.1. Índices de valor .. .. .. .. .. . .. .. .. .. .. . .. .. .. .. . .. .. . .. .. 4.11.2. Deflactación de series económicas .. . .. .. .. .. . .. . .. .. . 4.12. Índice de precios de consumo (IPC) .. . .. .. .. . .. .. .. .. .. . .. .. .. 4.12.1. Características principales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.12.2. Método de cálculo .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . .. 4.12.3. Enlace de series. Coeficientes de enlace . . . . . . . . . . . . . . 4.13. Índice de precios de consumo armonizado (IPCA) . . . . . . . . . . . 4.14. Otros índices o indicadores de coyuntura elaborados .. .. .. .. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
222 224 226 226 227 229 230 240 242 247 249 251
CAPÍTULO 5. ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES .............................................
261
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Concepto de serie temporal y definición de sus componentes. 5.3. Determinación de la tendencia .. .. .. .. .. . .. . .. .. .. .. .. .. .. .. .. .. . 5.4. Determinación de las variaciones estacionales . . . . . . . . . . . . . . . . . . 5.5. Determinación de las variaciones cíclicas . . . . . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
261 261 267 280 288 290
CAPÍTULO 6. FENÓMENOS ALEATORIOS Y SUCESOS . . . . . .
297
6.1. 6.2. 6.3. 6.4. 6.5. 6.6.
Introducción ...................................................... . Fenómenos aleatorios ........................................ ' .. . Espacio muestra! ................................................. . Sucesos ........................................................... . Operaciones con sucesos ........................................ . 6.5.1. Propiedades de las operaciones con sucesos .......... .. Sucesiones de sucesos ........................................... ..
205 206 208 212 216 217 218
297 298 299 303 305 313 315
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
10 ¡: 1· 1 1
6.7. 6.8.
Álgebra de sucesos ............................. · · · · · · · · · · · · ·. · .. · Métodos de enumeración o conteo ............ · · · '· · · ·. · · · · · · · · 6.8.1. Tablas de doble entrada ................ · · · · · · ·. · · · · · · · · 6.8.2. Principio de multiplicación ............ · · · · · · · · · · · · · · · · · 6.8.3. Diagramas de árbol ................. · · · ·: · · · · · · · · · · · · · · · 6.8.4. Combinaciones, variaciones y permutaciOnes ........ . Ejercicios ···································· ··························· PROBABILIDAD .................. · · · · · · · · · · · · · · · · · · ·
331
Introducción ......................................... · · .... · · · · · · Definición clásica de la probabilidad ....................... · · · Definición frecuentista de la probabilidad .................... . Interpretación subjetiva de la probabilidad .................. . Defmición axiomática de la probabilidad .................... . 7.5.1. Teoremas elementales o consecuencias de los axiomas. 7.6. Probabilidad condicionada .......................... · ..... · · · · · 7.6.1. Teorema de la probabilidad compuesta o producto .. 7.6.2. Teorema de la probabilidad total ..................... . 7.6.3. Teorema de. Bayes ............................... · · · · · · · · 7.7. Independencia de sucesos .............................. · · · · · · · · · Ejercicios ......................................... · · · · · · · · · · · · · · · · · · · · · ·
331 332 335 339 341 342 355 361 362 364 366 370
BIBLIOGRAFÍA ··························································
385
CAPÍTULO 7.
¡¡ 11
l)'
¡i 11
li
1
1
!l·
317 320 320 321 321 323 325
7.1. 7.2. 7.3. 7.4. 7.5.
Prólogo a la Segunda edición
El presente libro está planteado para que sirva de texto base para el estudio de un semestre de Introducción a la Estad{stica en la Licenciatura de Administración y Dirección de Empresas. Los capítulos 1 y 2 pretenden introducir al lector en el manejo de los datos numéricos, enseñarle a organizar los resultados obtenidos de las observaciones y a sintetizar la información con las diferentes medidas de posición, dispersión, forma y concentración. . En el capítulo 3 se proporcionan los instrumentos necesarios para el estudio de las variables estadísticas bidimensionales. Se introducen los conceptos de tablas de correlación, contingencia, distribuciones marginales y condicionadas, independencia estadística, regresión, correlación, etc. Dedicamos los capítulos 4 y 5 a dar algunos instrumentos que nos permitan hacer comparaciones y a estudiar la evolución de magnitudes económicas y sociales, introduciendo para ello los números índices y el estudio de las series temporales. También dedicamos dos capítulos al estudio de los fenómenos aleatorios y sucesos, así como a los conceptos más importantes sobre probabilidad. En esta segunda edición se ha introducido la nueva unidad monetaria, el Euro, se ha actualizado todo el capítulo de Números Índices, recogiendo la nueva metodología del Índice de Precios de Consumo y se ha suprimido la Aplicación Informática IPD para Análisis Estadísticos. Por último, deseamos agradecer a nuestros colaboradores, Mariano Ruiz Espejo y Ana Isabel Zamora Sanz sus ayudas en la redacción de algunos ejercicios prácticos y en la corrección de pruebas. LOS AUTORES
Madrid, julio de 2002
i
1
Capítulo 1 El método estadístico en la interpretación de los hechos económicos
i' i
li
J:
l. l.
Las ramas de la estadística y sus métodos científicos
La Estadística, en su acepción más general, puede considerarse como la ciencia que estudia las «regularidades» que se observan en una serie de fenómenos que pueden expresarse a través de la información numérica. Su propia evolución histórica favorece, como veremos, que la percibamos como un conjunto de cifras, gráficos, promedios, etc. En una segunda acepción la Estadística es un conjunto de métodos científicos que nos permiten interpretar la información numérica, elegir muestras representativas para hacer inferencias, contrastar hipótesis, estimar relaciones causa-efecto y hacer predicciones. La agrupación del conjunto de conocimientos que componen a la Estadística da origen a tres ramas claramente diferenciadas:
:.··. 1 =, 1
1:.
¡,.
• La Estadística Descriptiva que se estudiará en los próximos cinco capítulos. • El Cálculo de Probabilidades que se desarrolla en el capítulo siete y en el texto del mismo autor: Estadística I: Probabilidad y Distribuciones. • La Inferencia Estadística que se estudia en otra obra, también del mismo autor. La Estadística Descriptiva es la que tiene sus raíces históricas más profundas, ya que con una cierta ordenación y sistemática fue empleada por las sociedades humanas más primitivas. Su método científico es el deductivo ya que plantea un conjunto de datos ordenados y genéricos y va extrayendo conclusiones particulares de los mismos. Va de lo general a lo particular que es la esencia del método deductivo.
14
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
El Cálculo de Probabilidades también emplea el método deductivo ya que en esencia es un razonamiento puramente matemático. Arra:p.ca con la definición de probabilidad a través de una serie de axiomas de los que se van deduciendo un conjunto de teoremas. Este conjunto de conocimientos no constituye en sí una rama de la Estadística si no las herramientas matemáticas y modelizadoras en las que se apoyará la Inferencia Estadística para su formulación y desarrollo. El Cálculo de Probabilidades empezó a formalizarse a lo largo de las siglos XVI y XVII tratando de resolver problemas de juegos de azar y del mundo de la Astronomía. Por último, señalaremos que la Inferencia Estadística emplea el método inductivo basándose en el conjunto de instrumental matemático-deductivo que le proporciona el Cálculo de Probabilidades. Procede de las observaciones particulares de una muestra representativa y llega a la inducción de propiedades generales para el conjunto del que se extrae la mencionada muestra. La Inferencia Estadística es considerada como la Estadística moderna ya que se ha desarrollado a lo largo del siglo XX como unión y confluencia de la Descriptiva y el Cálculo de Probabilidades. Utilizando las anteriores reflexiones podemos concluir que la Estadística, en su conjunto, teniendo en cuenta todas sus ramas, emplea el método deductivo en unas determinadas etapas de su proceso de investigación y el inductivo en otras. De manera muy general podemos decir que las etapas de toda investigación estadística son las siguientes:
t.• Definición de los objetivos que se persiguen con la investigación Esta primera fase es fundamental, ya que se definen los parámetros poblacionales que se pretenden investigar. Por ejemplo, supongamos que deseamos conocer los hogares o familias que tienen más de un automóvil en la Comunidad de Madrid; la población a investigar son todos los hogares de la Comunidad y el parámetro poblacional será la proporción o porcentaje de los mismos que tienen más de un automóvil. 2.• Recogida de los datos estadísticos para llegar a conocer los parámetros poblacionales Existen fundamentalmente dos formas de obtener los datos estadísticos:
·'
:r:
i
1:¡
:¡
!l
i,:
l!· 1:
li
• Por la ejecución de una encuesta censal. En el ejemplo de los hogares de la Comunidad de Madrid consistiría en preguntar a todos ellos si p6seen más de un automóvil. La característica de interés se mide en todos y cada uno de los elementos de la población. Cuando el estudio estadístico que se ejecuta es de naturaleza censal no existe ningún problema de inferencia y el método empleado será íntegramente deductivo. Los estudios censales son excepcionales ya que tienen un elevado coste y un período largo de ejecución.
EL MÉTODO ESTADÍSTICO EN LA INTERPRETACIÓN DE LOS HECHOS...
15
• Por la ejecución de una encuesta muestral. Esta segunda alternativa es la que se utiliza en la investigación estadística ya que tiene las enormes ventajas de un coste económico reducido, un corto período de ejecución, en comparación con los censos, y la calidad de los datos observados puede controlarse mejor que en éstos al ser volúmenes más reducidos. La característica que se está investigando sólo se mide en un subconjunto de la población, muestra, y los resultados obtenidos se infieren al total poblacional. El método por tanto es inductivo ya que de lo particular de la muestra se generaliza al total de la población. Siendo esta la razón por la que la Inferencia Estadística adquiere toda su significación: definición de estimadores para los parámetros poblacionales, modelos de probabilidad que siguen, niveles de confianza en las estimaciones, errores de muestreo que estamos dispuestos a admitir, tamaños de muestras, etc. 3.• Descripción y estimación de los parámetros poblacionales Si se ha. utilizado la investigación censal nuestro estudio finaliza con la descripción de las características poblacionales a través de tablas de frecuencias y gráficos. Se empleará el método deductivo siguiendo el camino de lo general a lo particular. Si se ha utilizado la investigación muestral hay que considerar dos niveles de análisis: el de modelización probabilística del proceso a priori que es deductivo-inductivo (definición del modelo y proceso de inferencia) y el de descripción de los datos obtenidos o análisis a posteriori que es descriptivo o deductivo. Cuando se obtienen los datos de la muestra seleccionada por un procedimiento probabilístico, ya no tenemos estimadores que siguen una distribución o modelo de probabilidad, sino estimaciones o datos concretos que hay que describir o reducir de forma ordenada de lo general -conjunto de los datos muestrales- a lo particular. Luego la Estadística Descriptiva con su método deductivo interviene cuando tenemos un conjunto de datos a posteriori, bien provengan de una investigación censal, bien de una muestral. Cuando estemos en este último caso, las descripciones de las estimaciones deben venir acompañadas de sus niveles de confianza y de sus respectivos errores de muestreo.
1.2~
La estadística descriptiva y el estudio de los hechos economicos
La utilización de la Estadística en la interpretación de los hechos económicos, hay que contemplarla a través de la evolución histórica de las tres ramas que venimos considerando: la Estadística Descriptiva, el Cálculo de
16
11¡,
¡! 1'
¡:,,
1:
]"
11'
]''r~
!''
JI·!
!i
¡,·
11'i.:
.!il
.~
IJ:i
¡;¡¡
¡¡:.
( 1·; li l=¡
¡ii'
!· 1
.¡
!J'', \
!i 1'
1¡!~ 1
~ f ¡:!.:
f !.~
;¡·
"
:·¡·
·!:¡
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Probabilidades y la Inferencia Estadística. Empecemos por la primera. Es de todos conocido que los egipcios, chinos, griegos y romanos re¡¡.lizaron recuentos descriptivos de su población y riquezas. Tenemos referencias del historiador griego Herodoto (485-425 a. de J.C.) que en el año 3050 a. de J.C. Egipto elaboró un censo de población y riqueza con objeto de abordar la construcción de las pirámides. También en Egipto Ramsés II hizo un censo de tierras con objeto de establecer una nueva política de reparto de las mismas. Siguiendo el enfoque descriptivo, los griegos y romanos efectuaban recuentos periódicos de sus recursos económicos y humanos con claros fines tributarios y militares. En la Edad Media no se realizan operaciones estadísticas de descripción económica si se exceptúan los inventarios de posesiones de la Iglesia. Hay que esperar al nacimiento de las escuelas mercantilistas de los franceses, alemanes y anglosajones de los siglos XVI, XVII y XVIII. Las ideas mercantilistas de los franceses Colbert, Buffon y Condorcet influyen tanto en la escuela alemana formada por Seckendorff, Coring y Achenwall, como en la inglesa constituida por Graunt, Petty, Halley, Davenant y King, principalmente.· La preocupación fundamental de la escuela inglesa eran los datos demográficos. Gramit, a mitad del siglo XVII, se planteó la estimación de la población inglesa que estaba sometida a grandes fluctuaciones por causa de las epidemias. Obtuvo tasas de mortalidad y de natalidad partiendo de una muestra de la población. A finales del siglo XVII Petty efectúa estudios descriptivos sobre demografía, de rentas y tráficos mercantiles. En los siglos XVIII y XIX se produce un rápido crecimiento de datos estadísticos iniciándose la elaboración de los . primeros censos oficiales. En EE.UU. se elaboran censos de población cada diez años desde 1790; a lo largo del siglo XIX se crean Oficinas de Estadística en los principales Estados que se dedican a elaborar estadísticas de forma periódica sobre temas económicos. También, durante el siglo XX la producción de estadísticas descriptivas ha seguido una tendencia exponencial debido a la demanda de datos en los modelos de planificación y desarrollo económico. Vista la evolución histórica de la Estadística Descriptiva podemos conéluir con las siguientes reflexiones: • El origen de la palabra Estadística, en términos filológicos, es estadista que proviene a su vez del latín status. Es la ciencia que contabiliza las cosas del Estado desde los tiempos más remotos hasta nuestros días: recoge, describe y analiZa información de cualquier hecho o fenómeno. Si es del mundo económico estaremos ante una Estadística Descriptiva Económica. • Es una estadística económica que no contiene incertidumbre con lo que está ausente la probabilidad como medida de aquélla.
EL MÉTODO ESTADÍSTICO EN LA INTERPRETACIÓN DE LOS HECHOS...
17
• La Estadística Descriptiva o Deductiva la debe de dominar tanto el economista de empresa como el general, ya que le enseña cómo debe hacer un análisis primario y básico de un conjunto de datos que provienen de haber efectuado una investigación censal o muestral de un determinado fenómeno económico.
1.3.
El cálculo de probabilidades como herramienta matemática de inferencia estadística. La estadística moderna
Hemos apuntado anteriormente que ·la base científica de la Inferencia Estadística es el Cálculo de Probabilidades que es una rama de las matemáticas que se basa en el razonamiento deductivo. Veremos posteriormente que la Estadística Moderna del siglo XX es el resultado de la fusión de la Descriptiva y el Cálculo de Probabilidades con lo que es obligado efectuar un breve desarrollo histórico de éste. El origen del Cálculo de Probabilidades está relacionado con la resolución de problemas de juegos de azar. Las excavaciones arqueológicas han demostrado que las culturas primitivas practicaban juegos de azar cuyos resultados estaban ligados a la voluntad divina. Pero es a partir·del siglo XVII, con pequeños antecedentes de Cardano (1501-1576) y Galileo (1564-1642) cuando se empieza a formalizar esta rama de las matemáticas. Los Matemáticos Bias Pascal (1623-1662) y Pierre de Fermat (1601-1665) empiezan con su famosa correspondencia la formalización del Cálculo de Probabilidades sobre juegos de azar que les planteaba el conocido jugador Caballero de Meré. Christian Huygens recopiló los trabajos de Fermat y Pascal apareciendo en 1669 la primera sistematización del Cálculo de Probabilidades. Espoleados por la contrastación empírica de las teorías sobre astro~ nomía y física siguieron las aportaciones de Jacobo Bernoulli (1654-1705); Abraham de Moivre (1675-1750); Daniel Bernoulli (1700-1782); Pierre Simon Laplace (1749-1827); Karl Friedrich Gauss (1777-1855); Simeon Denis Poisson (1781-1840) y P. Chebychev como grandes impulsores de esta disciplina a lo largo de los siglos XVIII y XIX. Durante el siglo XX son autores clásicos del Cálculo de Probabilidades Markov, Liapounoff y Kolmogoroff de la escuela rusa; Borel; Lévy, Lebesgue y Fréchet de la francesa. Durante los siglos XVII, XVIII y XIX el Cálculo de Probabilidades se desarrolla desconectado de la Descripción estadística de los hechos económicos si exceptuamos pequeñas interrelaciones efectuadas fundamentalmente por Queteleta mediados del siglo XIX. Los matemáticos dedicados a los problemas de la física y la astronomía emplean un lenguaje diametralmente opuesto al utilizado por los estadísticos que describen los hechos económicos a través de
18
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
sus tablas, tasas de mortalidad y natalidad, números índices, etc. La unión de ambas tendencias se produce a comienzos del siglo XX ,consolidándose a lo largo del mismo por lo que conocemos como la Inferencia Estadística aplicada a la economía, cuyo estudio requiere un conocimiento previo del cuerpo fundamental del Cálculo de Probabilidades ya que nos proporcionará los instrumentos matemáticos necesarios para que, siguiendo la lógica inductiva, las conclusiones de una muestra las generalicemos a la población a la que pertenece.
1.4.
La inferencia estadística como método de estudio de los hechos económicos
La Inferencia Estadística también se empezó a desarrollar a lo largo del siglo XVIII resolviendo problemas de estimación y contraste en el mundo de la astronomía. Combina la observación de datos (Descriptiva) con la estimación de determinados parámetros de los modelos teóricos del Cálculo de Probabilidades. Dentro del desarrollo de la Inferencia hay que considerar tres corrientes metodológicas que surgen de las distintas interpretaciones del concepto de probabilidad. En primer lugar hay que considerar la «Inferencia Clásica>> que arranca con Laplace-Gauss con su problemática de las observaciones astronómicas y culmina con la estimación y contrastación de hipótesis de la Escuela Inglesa en el campo de las ciencias naturales --estudios fundamentalmente biológicos- formada por Karl Pearson (1857-1936), William S. Gosset (Student) (1876-1937), Ronald A. Fisher (1890-1962) y Jerzy Neyman (1894-1981). Esta corriente clásica de la Inferencia se apoya en el concepto frecuencialista de la probabilidad obtenido de la información descriptiva muestra! cuando el experimento aleatorio de la investigación se realiza en las mismas condiciones un número elevado de veces. Una segunda corriente es la denominada Inferencia Bayesiana. Sus bases iniciales las formuló el matemático inglés reverendo Thomas Bayes (17021761). La esencia del enfoque bayesiano está en su famoso teorema que combina todo tipo de información a priori sobre los distintbs estados de la naturaleza con la información muestral en sentido clásico para obtener o inferir el modelo de distribución a posteriori. A Bayes le siguen los modernos autores de la probabilidad subjetiva como son los estadísticos .Frank Ramsey, Bruno de Finetti y Leonard Savage cuyos enfoques son de gran utilidad en el mundo económico-empresarial. La tercera corriente, de enorme aplicación en el campo económico-empre- . sarial, es lo que se conoce como Teoría de la Decisión. Su formulación se debe al estadístico A. Wald (1902-1950) que aprovecha la inferencia bayesiana combinada con la noción de probabilidad subjetiva aportando el concepto de
EL MÉTODO ESTADÍSTICO EN LA INTERPRETACIÓN DE LOS HECHOS...
19
función de pérdida en el que se apoya el decisor para cuantificar sus expectativas y racionalizar el tratamiento de la incertidumbre económica. En 1912 Irving Fisher (1867-1947), economista americano conocido por su dedicación a la elaboración de números índices, inicia un movimiento para incorporar los métodos inferenciales conocidos en el mundo de las Ciencias Naturales al mundo de la economía. En 1930 funda con Charles F. Roos y Ragnar Frisch la Soci.edad de Econometría con el objetivo de que los economistas aceptasen que el cuerpo vigente de conocimientos estadísticos provenientes de los campos de la Física, Astronomía y Ciencias Naturales, podía ser aplicado a los datos económicos. A lo largo de las siguientes décadas se ha ido implantado paulatinamente el enfoque probabilístico en el estudio de los hechos económicos lo que permite confrontar los modelos teóricos con los datos estadísticos o estudiar el modelo que mejor se ajusta a los datos empíricos disponibles. No cabe duda que la aparición y difusión de los potentes ordenadores personales ha revolucionado la aplicación y difusión de los métodos estadísticos aplicados a la economía. Existen multitud de aplicaciones de fácil manejo que permiten dar un tratamiento descriptivo a uri conjunto de datos económicos en un tiempo récord. En una segunda fase pueden ejecutarse tratamientos multivariantes más complejos: regresión y correlación, análisis factoriales, análisis de conglomerados y análisis discriminantes.
1
1
Capítulo 2
i
): 1
Distribuciones de frecuencias. unidimensionales
1 ;·
!
1
1 j.
!t. '1; 1
V 1
J.
.i
¡,
il 1
1'1 ! !
¡
'
1
lj j
!1':
l
: !!
l
!, J.:· i!
1
~ :
¡ i,¡' 1
!
1 1
li .
¡:., ¡:¡ 1
¡:
1
i'
:;·
1~
~ ':
!
¡ j l
2.1.
Introducción
En este capítulo iniciamos lo que hemos denominado la Estadística Descriptiva o Deductiva que se ocupa de recopilar, organizar y analizar datos numéricos. El estudio lo iniciamos con la presentación de una serie de conceptos previos fundamentales que se emplearán constantemente en el desarrollo de esta disciplina: población, muestra, atributos, escalas de medición y variables estadísticas. En segundo lugar se aborda la explicación de las distintas tareas que componen las tres grandes etapas de toda investigación estadística: definición de objetivos, recogida de los datos y estimación y descripción de los parámetros poblacionales. El tercer aspecto que se estudia, centrándonos en la tarea descriptiva de la etapa denominada análisis descriptivo primario, es la elaboración de lo que se denomina distribución de frecuencias unidimensionales, tanto en su aspecto numérico como gráfico. En cuarta posición se analizan de forma global las distribuciones de frecuencias a través de sus medidas de posición: medias, mediana, moda y cuantiles. Otras medidas que se introducen, en quinto lugar, en el estudio de las distribuciones son los denominados momentos potenciales con relación al origen y a la media aritmética. En sexta posición se abordan las medidas de dispersión: recorrido, intervalos intercuartílicos, varianza, desviación típica, coeficiente de apertura, recorrido relativo, recorrido semi-intercuartílico y coeficiente de variación. Le siguen la exposición de lo que se conoce como «medidas de forma»: asimetría y curtosis. Dos distribuciones que tengan la misma media aritmética y la misma varianza pueden diferir en la forma de sus
22
23
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
representaciones gráficas, con lo que se llega a un estudio más profundo con la utilización de las medidas de forma. Por último se abordan las medidas de concentración o de desigualdad: Índice de Gini y Curva de Lorentz. Estas medidas se conciben para medir la equidad en la distribución de ciertas características de contenido económico: rentas personales o familiares, salarios, beneficios, etc.
Aunque los atributos no son susceptibles de ser medidos numéricamente, sus modalidades pueden relacionarse con lo que se denominan escalas nominales y ordinales. Las observaciones de las distintas modalidades decimos que están en una escala nominal cuando los números que le asignamos sólo se emplean para diferenciar las distintas categorías. Si al ejemplo de los colores· del semáforo le asignamos los dígitos 1, 2 y 3, sólo cabe la interpretación de que el 1 -=f. 2 -=f. 3 sin que se pueda afirmar que uno es superior a otro y sin que se puedan ordenar. La escala nominal es la forma de medición más débil y se utiliza sólo para clasificar las distintas modalidades de un atributo. No permiten ninguna relación de orden ni operaciones aritméticas de suma, resta, multiplicación y división. La medición de las características cualitativas o atributos también admite en ciertos casos lo que se conoce como escalas ordinales. Se podrá emplear la escala ordinal cuando las distintas modalidades admiten una determinada graduación u ordenación. En estudios de mercado y de opinión se emplean con mucha frecuencia las escalas ordinales. La imagen de un determinado político podrá calificarse de: muy mala, mala, regular, buena y muy buena. Si se le asignan los dígitos 1, 2, 3, 4 y 5 no quiere decir que la imagen buena sea el doble que la mala, sino que está en un orden superior. Este tipo de mediciones con escalas ordinales es superior al nominal ya que además de clasificar las distintas modalidades permiten ordenarlas, pero tampoco admite, como en las nominales, las operaciones aritméticas de suma, resta, multiplicación y división. Variables. Son las características poblacionales susceptibles de tomar valores numéricos a los que se les pueda aplicar lo- que se conocen como escalas de intervalos y de razón o proporción. Las primeras son aquellas que permiten una unidad de medida con lo que podemos cuantificar numéricamente la distancia existente entre dos observaciones cualesquiera. El orden de esta escala es superior a las nominales y ordinales ya que además de clasificar y ordenar las mediciones permite diferenciar con exactitud unas situaciones de otras. En el mundo económico-empresarial tenemos multitud de características en las que pueden aplicarse escalas de intervalos: salarios de una empresa, cualquier tipo de presupuesto, gastos, ventas, etc. Las escalas de proporción o razón, además de las cualidades de las de intervalo, se caracterizan por incorporar un punto de origen no arbitrario (un cero verdadero) como puede ocurrir, con los pesos y las edades de las personas, litros de gasolina en un depósito, etc. En conclusión podemos decir que las escalas de intervalo admiten unidades de medida y un origen (cero) arbitrarios y las de razón además de la unidad de medida tienen asignado un punto de origen no arbitrario ya que es un verdadero cero o cero absoluto. En estas escalas sí se permiten las operaciones aritméticas de la suma, resta, multiplicación Y división. Las variables estadísticas pueden clasificarse de distintas maneras. Tenien-
2.2.
Conceptos fundamentales
Vamos a exponer de forma sencilla una serie de definiciones que constantemente las estaremos empleando en estadística. Población. Se entiende por población, universo o colectivo cualquier conjunto de personas, objetos, animales, plantas, instituciones o entes en general que son portadores de una serie de características que nos interesa estudiar. Ejemplos de poblaciones: • Las personas que trabajan en la Administración Central. • Las lavadoras automáticas que se han producido en nuestro país durante 1994. • Los pinos existentes en la Comunidad de Madrid a 31 de diciembre de 1994. • Los autobuses de la E.M. T. a 30 de junio de 1995. Las poblaciones están compuestas de elementos o individuos por lo que deben de estar definidas con absoluta precisión de forma que siempre se pueda discernir si un elemento pertenece o no pertenece a la misma. Se clasifican en finitas o infinitas según que el número de elementos que la componen sea de una clase u otra. En el mundo económico y social estaremos casi siempre ante poblaciones finitas: habitantes de una región, empresas de un sector, demandantes potenciales o reales de un producto, etc. Muestra. Llamamos muestra a todo subconjm,1to representativo de la población de forma que las conclusiones sacadas en aquella se generalizan a ésta. Las poblaciones se pueden estudiar bien realizando una investigación exhaustiva de todos sus elementos y entonces diremos que estamos realizando un censo, o bien, investigando una parte o subconjunto de las mismas y entonces diremos que estamos realizando un estudio muestra). . • Atributo. Es toda característica poblacional no susceptible de ser medida numéricamente. La observación de un atnbuto da lugar a distintas modalidades. Son ejemplos de atributos: • El sexo de una población humana cuyas modalidades son: varón y mujer. • Los colores de un semáforo cuyas modalidades son: rojo, verde y amarillo. • La profesión de un conjunto de personas activas.
j
l
!
' 1
24
DISTRlliUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
do en cuenta el número de características que estudiamos en los elementos de una población las variables pueden ser unidimensionales, ·bidimensionales o pluridimensionales. Por ejemplo, si en el colectivo o población formado por las empresas del sector químico estudiamos sólo su volumen de producción estaremos ante una variable unidimensional. Si estudiamos al mismo tiempo la producción y el número de trabajadores de cada empresa será bidimensional (se observan dos características o variables cuantitativas en los elementos poblacionales). Las variables también pueden ser discretas o continuas según tomen un número finito o infinito numerable, o bien infinito no numerable de valores en un determinado intervalo de su campo de variación.
2.3.
Tareas a desarrollar en las grandes etapas de la investigación estadística
En el primer capítulo hemos considerado, de forma muy genérica, las tres · grandes etapas que pueden considerarse en toda operación 'estadística: definición de objetivos, recogida de datos y estimación y descripción de resultados finales. En el presente apartado vamos a comentar brevemente las distintas tareas contenidas en las grandes fases tal y como están relacionadas en el gráfico 2.1. En la definición de objetivos la primera tarea es identificar las características cualitativas o cuantitativas que se desean estudiar. Debe existir una necesidad de realizar la investigación estadística explicitando qué datos son los relevantes para la toma de decisiones. El gobierno de un país puede tener necesidad de investigar a través de una muestra representativa las siguientes características: -
-
Altas y bajas de empleados en distintos sectores económicos por tipología de contratos (fijos, eventuales, por obra, de .formación, a tiempo completo, a tiempo parcial, etc.). Evolución mensual de las ventas del comercio minorista. · Evolución del transporte de mercancías por carretera.
Una empresa puede tener la necesidad de conocer: -
El mercado actual de un determinado producto a través de su volumen , • de ventas (característica cuantitativa). La motivación fundamental por la que se compra un artículo de una determinada marca (característica cualitativa) que se consume en los hogares.
El éxito de toda investigación estadística se basa en la correcta selección de las características que se van a analizar de forma que se alcancen los objetivos que nos hemos propuesto.
j
'
l l j
¡ 1
11 i
i
j 1
i. 1
lJ
CD
Etapa: Definición de objetivos
Tareas:
• Identificación de características cualitativas o cuantitativas que se desean estudiar. • Definición de la población portadora de las características a investigar. • Identificar el marco o listado de unidades poblacionales especifi7 cando sus soportes (magnético, papel, documentos, etc.) y su accesibilidad.· • Decidir si la investigación va a ser censal o muestral determinando tamaño de la muestra y presupuesto necesario. • Especificar el ámbito del estudio y la forma de recoger los datos: entrevistas personales, por correo, por teléfono o mixtas.
l l
1 l
¡
I 1
1
@
Etapa: Recogida de los datos estadísticos
Tareas:
• • • • •
Diseño del cuestionario. Diseño muestral de acuerdo con el marco disponible. Diseño del material auxiliar de la encuesta. Recogida de los datos. Tratamiento de los datos.
1
1 l¡
l1 l
1 :l j
G)
Etapa: Estimación y descripción de los parámetros poblacionales especificados en los objetivos
Tareas:
• Análisis descriptivo primario. • Estimación de errores muestrales y no muestrales. • Análisis especiales multivariantes. GRÁFICO
2.1.
Etapas y tareas de toda investigaci6n estadística.
25
26
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
La segunda tarea consiste en delimitar con absoluta precisión, sin ningún tipo de ambigüedad, la población en la que podemos estudiar las características que nos interesan. En el caso de las altas y las bajas en el empleo serán las empresas que conforman los distintos sectores, en el segundo ejemplo será todo el conjunto de establecimientos minoristas (tiendas tradicionales, autoservicios, supermercados, hipermercados y grandes almacenes), en el tercer caso el censo de camiones y furgonetas de distintos tonelajes, en el cuarto caso las empresas que fabriquen el producto en cuestión y en el quinto ejemplo los compradores del producto. . La tercera tarea de la primera etapa es determinar el marco que contiene a los elementos de la población de nuestro estudio. En los ejemplos anteriores, y siguiendo el mismo orden establecido los marcos suelen ser: las bases de datos existentes en soportes magnéticos en el Ministerio del Trabajo (altas y bajas de la Seguridad Social); los censos de establecimientos minoristas elaborados por organismos públicos o empresas privadas; los ficheros del Ministerio de Transportes que contengan las licencias de transporte de mercancías vigentes; anuarios de fabricantes por productos y los censos de población elaborados periódicamente por el INE. Los marcos deben estar actualizados y depurados de unidades extrañas ya que de ellos se seleccionan de forma aleatoria las unidades muestrales cuando la investigación estadística no es exhaustiva. En la cuarta tarea se decidirá si la investigación estadística va a ser exhaustiva o, no dependiendo del tamaño de la población, las disponibilidades económicas, el plazo disponible, etc. Normalmente se acudirá a investigaciones muestrales (no exhaustivas) con lo que se establecerán los tamaños muestrales de acuerdo con los niveles de confianza que se deseen y los errorl::s muestrales que estemos dispuestos a admitir. Estas últimas cuestiones que se refieren a la fiabilidad de la investigación están relacionadas con los costes de la misma ya que a mayor nivel de precisión se requerirá una mayor muestra y por tanto, un mayor presupuesto. También tendremos que establecer el ámbito de la investigación: nivel municipal, comarcal, regional, nacional, etc., así como la forma más adecuada de recoger la información: entrevistas personales, por correo, por teléfono o mixtas. La primera tarea de la segunda etapa (recogida de los datos estadísticos) es el diseño del cuestionario. Para su elaboración se parte de todos los antecedentes que nos proporciona la primera etapa: características que mediremos, unidades que van a facilitar los datos: empresas, perso.nas, organismos, etc., y forma de recoger los datos: por correo, con agentes entrevistadores o por teléfono. Toda esta serie de antecedentes nos van determinando el formato del cuestionario y la naturaleza de sus contenidos. Elaborar un cuestionario que no tenga fallos es una tarea especializada que debe de desarrollar un grupo de expertos en las materias correspondientes. Aquí nos vamos a limitar a dar unas directrices para su buena confección:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
27
• Claridad en el lenguaje utilizado. El nivel cultural de los estrevistados es heterogéneo en la mayoría de los casos (se exceptúan las encuestas realizadas a colectivos del mismo nivel cultural: médicos, abogados, ingenieros, economistas, etc.) por lo que hay que emplear un lenguaje sencillo y directo evitando términos técnicos que sólo son comprensibles para los especialistas. • Precisión en las preguntas. Deben de ser concretas y cortas con objeto de obtener respuestas precisas. Un ejemplo de pregunta no concreta es ¿No piensa Vd. que fuma mucho? El ,término mucho es subjetivo y tiene distinto valor para distintas personas. La pregunta concreta sería ¿Cuán~ tos cigarrillos fuma Vd. diariamente? • No se debe influir en la respuesta. Deben evitarse juicios de valor a la hora de efectuar las preguntas que condicionan las respuestas. No sería correcto hacer preguntas del tipo ¿No piensa Vd. que nuestra empresa da un servicio posventa de gran eficacia? La pregunta correcta sería: ¿Qué opina Vd. de nuestro servicio posventa? • Deben evitarse las preguntas indiscretas que molestan al entrevistado. Hay que tener en cuenta que determinadas preguntas pueden molestar al entrevistado con lo que podemos conseguir que se niegue a contestar a la totalidad del cuestionario, o bien, que nos den respuestas falseadas. Está demostrado que no deben de pedirse directamente los ingresos de una persona ni la edad. Es mucho más eficaz pedirles que se sitúen dentro de una escala previamente establecida. La pregunta ¿Cuáles son sus ingresos anuales?, debe de sustituirse ppr: Indique, por favor, dentro de qué tramo de la siguiente escala se encuentran sus ingresos anuales: · menos de dos millones, entre dos y cuatro o más de cuatro. • Hay que cuidar el orden de las preguntas. Las preguntas más sencillas deben de ir al comienzo del cuestiona#o y las más complejas o delicadas al final. Con ello se consigue un mayor grado de respuesta y colaboración por parte del entrevistado ya que una vez que se ha avanzado en la cumplimentación es más difícil que se niegue a seguir contestando aunque las preguntas sean más comprometidas. Las anteriores recomendaciones generales no agotan toda la normativa existente de cómo deben confeccionarse las preguntas de un cuestionado. Se ponen a ~ítulo de ejemplo para dejar constancia de que es una tarea compleja que requiere verdaderos especialistas. Las preguntas de un cuestionado pueden clasificarse desde múltiples aspectos. Si atendemos, por ejemplo, a la libertad de elección de respuesta las preguntas pueden ser: • Abiertas: son aquellas cuya respuesta es totalmente libre para el entrevistado. Por ejemplo, a los cabezas de familia podría preguntárseles ¿Qué
28
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
usos les daría Vd. a los ordenadores personales en su hogar? Señale todos los que le parezcan.interesantes. En esta cuestión nos em;ontraremos una gama variada de respuestas: hacer un inventario de ·las existencias de productos alimenticios, hacer un presupuesto por partidas de gastos con un seguimiento semanal, hacer un listado de productos que se van agotando para responerlos cuando vamos a la compra, confeccionar un archivo con teléfonos y direcciones de nuestras amistades y proveedores, etc. En este caso el entrevistador anota literalmente las respuestas empleando las mismas palabras del entrevistado. • Cerradas: son aquéllas cuyas posibles respuestas están listadas. El entrevistado escoge una o varias respuestas de las que se le presentan. Si queremos cerrar la pregunta de los usos que se dan a los ordenadores personales en el hogar sería: ¿Qué usos daría Vd. a un PC en su hogar de todos los siguientes?: D Para escribir cartas, D Hacer un invetario de productos no perecederos, D Llevar la contabilidad del hogar, D Como pasatiempo con videojuegos. Otros aspectos que permiten clasificar las preguntas son: por el número de respuestas que permiten: dicotómicas (dos respuestas) o de respuesta múltiple; por la forma de realizarse: directas o indirectas, etc. Un ejemplo de pregunta dicotómica y directa sería: ¿Es Vd. fumador?: D Sí, D No. Como recomendación final en la elaboración de un buen cuestionario hay que hacer constar la absoluta necesidad de someterlo a una prueba piloto o pretest con objeto de aseguramos su buen funcionamiento antes de proceder a su edición. La segunda tarea que se relaciona en el gráfico 2.1, dentro de la segunda etapa, viene referida al diseño muestral en el supuesto de que la investigación estadística no tenga carácter de exhaustiva. El diseño de muestras probabilísticas, que son las que deben emplearse en toda toma de datos, requieren el dominio de la Teoría del Muestreo en Poblaciones Finitas que es una materia compleja a la que se dedican cursos completos para obtener un nivel de conocimientos adecuados. Los tipos de muestreo que se estudian son: a) Muestreo aleatorio simple (m.a.s.): Es la forma de muestreo más sencilla. Los elementos de la población objeto de estudio se numeran del 1 hasta N y se seleccionan n de forma aleatoria (empleando tablas de números aleatorios) que constituyen una muestra aleatoria sin reemplazamiento (un lnisnio número aleatorio sólo aparece una vez) representativa de todo el conjunto. El diseño también puede efectuarse con reemplazamiento (m.a.s.r.). b) Muestreo estratificado: Es un diseño que se emplea mucho en la práctica ya que permite mejorar la fiabilidad de las estimaciones respecto al m.a.s. para un mismo tamaño n de la muestra. También nos permite obtener esti-
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
29
maciones para cada estrato o subpoblación en los que hemos dividido la población objeto de estudio. La estratificación consiste en dividir la población en grupos que sean homogéneos internamente respecto a la característica que estemos estudiando y que existan grandes diferencias entre unos y otros estratos. Si, por ejemplo, se desea investigar la renta de los hogares de la Comunidad de Madrid se pueden agrupar en tres estratos o grupÓs: renta baja, media y alta. El total de la muestra que se emplee puede distribuirse de forma proporcional a la población de cada estrato o emplear otros criterios que pueden estudiarse en los manuales de Muestreo de Poblaciones Finitas. e) Muestreo por conglomerados: Los conglomerados son agrupaciones de elementos de la población de naturaleza heterogénea dentro de ellos respecto a la· característica que estemos estudiando. En el ejemplo de los hogares un conglomerado debe tener unidades de renta baja, media y alta de forma que si se efectúa un muestreo dentro del mismo se obtenga información de los distintos niveles que pueden alcanzar los ingresos de las unidades familiares. Se distinguen varios tipos de muestreo por conglomerados: de distintos tamaños, de tamaños iguales, sin submuestreo, con submuestreo, etc. d) Muestreo sistemático: Es una forma muy sencilla de selección de la muestra dada en una población numerada del 1 hasta N. El procedimiento consiste en las fases siguientes: se divide el tamaño de la población N por el de la muestra n; empleando una tabla de números aleatorios se elige uno que esté -comprendido dentro del cociente dado por el resultado anterior (si N = 100 y n = 5, N /n = 20, se elige de forma aleatoria un número entre 1 y 20) y por último se obtienen los (n - 1) elementos muestrales restantes sumando al que se ha elegido de forma aleatoria el resultado del cociente (si en el ejemplo el aleatorio ha sido 12, el segundo sería 12 + 20 = 32, el tercero sería 32 + 20 = 52, el cuarto 52 + 20 = 72 y el quinto elemento muestra! sería 72 + 20 = 92). Este procedimiento se denomina sistemático ya que lo único que tiene aleatorio es el arranque. El inconveniente de este diseño, igual que en el muestreo aleatorio simple, es que para utilizarlo es absolutamente necesario tener numerados del 1 al N todos lo elementos de la población. Esta numeración tiene que estar hecha al azar para evitar posibles sesgos sistemáticos a la hora de medir la característica de interés en nuestro estudio.
e) Muestreo polietápico o complejo: Es el que se aplica en la· práctica cuando se hacen estudios sociales. Los tipos de muestreo que hemos visto anteriormente no suelen aplicarse en estado puro cuando deseamos medir características de unidades de consumo (familias) o de producción (empresas) por razones de carencias de marco (inexistencia de soportes que contengan numerados todos los elementos de la población) o por razones de coste (el método de selección conlleva tal dispersión en la localización de las unidades
30
31
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
de la población que hacen inviable el estudio desde el punto de vista económico). Por estas tazones en la práctica hay que acudir al mu~:streo polietápico o complejo. Veamos esta problemática con un ejemplo. Supongamos que el Ministerio de Cultura desea entrevistar a la población española mayor de 18 años para conocer con qué periodicidad se visitan los museos. Se considera que a nivel nacional una muestra de 3.000 personas es suficiente. Para seleccionarlas por un procedimiento puro de m.a.s. podría acudir a la Dirección General de la Policía y solicitar que de forma aleatoria, utilizando los números del D.N.I., se seleccionaran las 3.000 personas con su nombre completo, dirección y demás datos personales. Estas personas estarían muy dispersas por todo el territorio: zonas rurales, pueblos pequeños, medianos, capitales de provincia, etc. Habría que entrevistar a una persona en un pueblo, a otra en una pedanía, a dos en una capital de provincia y así sucesivamente se tendría un período largo y dificultoso en recogida de información con costes de desplazamientos y dietas de los entrevistadores elevadísimos. También es probable que ni el Ministerio del Interior ni el Instituto Nacional de Estadística puedan por Ley utilizar esa información para facilitar la muestra al Ministerio de Cultura. Luego en este diseño de m.a.s. existen dos graves impedimentos: elevado coste y no disponibilidad de ficheros de población para seleccionar aleatoriamente la muestra. La única solución viable suele ser acudir a un muestreo polietápico ejecutando el siguiente diseño muestral complejo: en primer lugar se estratifican (muestreo estratificado) los núcleos de población por cruce de Comunidades Autónomas y tamaño de hábitat; en segundo lugar (primera etapa de selección) se eligen municipios con probabilidad proporcional a su tamaño (muestreo por conglomerados). En esta etapa los municipios grandes de las capitales de provincia suelen estar autorrepresentados eligiéndose de forma aleatoria sólo los medianos y pequeños. Los municipios grandes elegidos en la primera etapa se vuelven a estratificar (muestreo estratificado) en distritos de naturaleza homogénea respecto a características socio-económicas. Se eligen en una segunda etapa de selección una serie de estos distritos o manzanas de naturaleza equivalente a las secciones censales diseñados por el INE (muestreo por conglomerados). En estas manzanas, elegidas en la segunda etapa hay que hacer un listado de todas las viviendas que contienen y sobre el mismo elegir mediante m.a.s. las viviendas que correspondan. Una vez seleccionadas las viviendas, y también por un procedimiento de m.a.s. se selecciona las personas mayores de 18 años a entrevistar. Estos conglomerados últimos (manzanas de viviendas) que se han elegido suelen ser bastante homogéneos en cuanto a las características socio-económicas de las personas con lo que se aconseja realizar en cada uno un máximo de 10 entrevistas. En el esquema descrito anteriormente se observa que el muestreo que se
aplica realmente en los estudios socio-económicos es una mezcla de los distintos tipos de muestreo que se estudian con lo que los diseños reales son complejos y su puesta en práctica requiere el concurso de verdaderos especialistas en la materia. f) Muestreos no probabilfsticos: Los muestreos que se han comentado de forma abreviada anteriormente son todos probabilísticos. Todos tienen en común que los elementos de la población que entran a formar parte de la muestra se han obtenido por procedimientos de azar y todos tienen, a priori, antes de ser seleccionados, una determinada probabilidad de ser elegidos. Cuando en el proceso de selección existan unidades poblacionales que no tengan probabilidad conocida y utilizada en la selección para entrar a formar parte de la muestra, el muestreo no es probabilístico. Se pueden poner multitud de ejemplos de muestreos no probabilísticos: un investigador de un laboratorio toma una muestra de conejillos introduciendo su brazo en una jaula con lo que sólo eligirá los que estén a su alcance; el sociólogo de una empresa toma una muestra de empleados para saber su edad cogiendo, según su criterio personal, sólo las 50 primeras fichas de un montante de 500; a un entrevistador se le ordena que en una manzana de casas escoja al azar, según su criterio, a 20 personas para entrevistarlas con la única condición de que el 50 % sean hombres y el 50 % mujeres. Este último ejemplo es lo que se conoce por muestreo por cuotas que se emplea normalmente en los sondeos de opinión y estudios de mercado ya que no exige la elaboración de listados previos de los elementos que se van a seleccionar. No es probabilístico al no seleccionar unidades de acuerdo con probabilidades conocidas y preasignadas por el investigador. La principal ventaja de utilizar un muestreo no probabilístico por cuotas es que abarata mucho la recogida de información. Tiene el grave inconveniente, como todos los no probabilísticos, que carecen del rigor científico necesario para estimar los posibles errores muestrales que se comenten al estimar características poblacionales a través de subconjuntos muestrales ni se pueden establecer intervalos de confianza para las estimaciones. La tercera tarea que se resalta en la segunda etapa del gráfico 2.1 es elaborar el material auxiliar que sea necesario para que la recogida de información tenga los menores errores posibles ajenos al muestreo propiamente dicho: hojas de control del trabajo de campo que contienen listados de direcciones donde hay que hacer las entrevistas, partes de incidencias que puedan darse en el marco de la investigación, material de inspección, carnet de entrevistador, cartas de presentación, instrucciones generales para cumplimentar los cuestionarios, etc. Como cuarta tarea de la segunda etapa aparece la recogida de los datos propiamente dicha. Es la tarea esencial ya que la calidad de los datos depende
32
33
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
de su correcto desarrollo mediante el adecuado manejo de sus múltiples factores: entrenamiento del personal que interviene y modaliqad empleada en la recogida de los datos (entrevistas personales, por teléfono, por correo, etc.). El personal que interviene suele dividirse en: entrevistadores, jefes de grupo, inspectores, codificadores, depuradores, grabadores, etc., que están supervisados por una Dirección de trabajos de campo. En las entrevistas personales los agentes entrevistadores van provistos de los respectivos cuestionarios editados en papel. Otra variante que se utiliza actualmente son las entrevistas personales asistidas por ordenadores portátiles. La entrevista se desarrolla según la secuencia que indica el ordenador en su programa de ejecución que también incorpora controles de inconsistencias, con lo que se obtiene la información de manera instantánea completamente depurada y coherente enviándose por disquette o por módem a la central de procesamiento. Si se emplea este moderno procedimiento los entrevistadores tienen que estar entrenados en el manejó de estos costosos equipos, que requieren una inversión inicial considerable, que se ve compensada con el ahorro de grabación y validación necesarias en los cuestionarios tradicionales editados en papel. En la modalidad de entrevistas telefónicas asistidas por ordenador se emplea el mismo procedimiento metodológico indicado anteriormente con la enorme ventaja que los agentes entrevistadores no tienen que desplazarse con la consiguiente reducción de costes y tiempo invertido. La última tarea de la segunda etapa del proceso de investigación estadística es el adecuado tratamiento de los datos. En el caso de las entrevistas personales o telefónicas asistidas por ordenadores el tratamiento de la información (grabación y depuración de inconsistencias) se realiza de forma automática. Tras acceder al entrevistado el entrevistador conecta su ordenador y va ejecutando el programa de la entrevista de forma que automáticamente va detectando las inconsistencias que han sido programadas previamente. Si la encuesta se ejecuta por un procedimiento clásico (cuestionario editado en papel y agente entrevistador sin ordenador personal), el tratamiento de la información sigue el proceso siguiente: se agrupan los cuestionarios cumplimentados en la sede central del trabajo estadístico, se codifican las preguntas que lo exijan, se graban de forma masiva, los ficheros se someten a un programa de validación que saca los listados de inconsistencias, se corrigen y, por último, se almacenan los ficheros completamente depurados listos para someterlos al programa de tabulación. La tercera y última etapa denominada estimación y descripción de parámetros poblacionales se compone de tres tareas fundamentales: análisis descriptivo primario, estimación de errores y análisis especiales multivariantes. Una vez que los datos están depurados de todo tipo de inconsistencia se d~ben someter a un análisis descriptivo empleando los métodos de Estadística Descriptiva que se estudian en el presente capítulo y el siguiente. Para cada
una de las variables que se han medido conviene obtener su distribución de frecuencias, su representación gráfica, sus medidas de posición, de dispersión, de forma, etc. . Después de obtener estas primeras descripciones y medidas, cuando el estudio no es exhaustivo, hay que plantearse el grado de fiabilidad de las estimaciones a través del cálculo de los errores de muestreo a posteriori. A priori, en la primera etapa cuando se definen los objetivos de la investigación, se ha debido de definir el tamaño de la muestra que asegura unos errores máximos de muestreo para un determinado nivel de fiabilidad. Estas definiciones previas hay que contrastarlas con los cálculos de errores muestrales para los distintos ámbitos del estudio y las distintas variables observadas una vez que tenemos las primeras estimaciones. También hay que tener presente los errores ajenos al muestreo que hay que tratar de miriimizarlos ya que los sesgos que introducen en las estimaciones pueden llegar a invalidarlas: cuestionarios mal diseñados, grabación de datos deficiente (siempre hay que verificar con una doble grabación), validaciones inadecuadas y mala actuación de los agentes entrevistadores. Por último, una vez que se han hecho los estudios descriptivos y de fiabilidad correspondientes es cuando se pueden plantear los análisis especiales multivariantes de los datos: modelos de reducción de la dimensión (análisis factoriales, de componentes principales y correlaciones canónicas); modelos causales (regresiones de todo tipo y análisis de la varianza); modelos de agrupaciones y clasificaciones (análisis de grupos y discriminante) y modelos dinámicos o de series temporales (estocásticos y no estocásticos); etc. En estos análisis especiales es donde se puede plantear la modelización estadística en su máximo nivel: postulado del modelo, contraste de las hipótesis iniciales del modelo, es~mación de los parámetros del modelo, validación y resultados finales.
2.4.
. l ¡
L
Construcción numérica y gráfica de las distribuciones de frecuencias unidimensionales
Una vez que se han precisado los distintos conceptos básicos que se emplean en la elaboración de datos estadísticos, pasamos a analizar el proceso de elaboración de lo que se llama en la Estadística Descriptiva distribuciones de frecuencias unidimensionales. Son unidimensionales porque sólo observamos una característica (sus valores pueden representarse en el espacio de una dimensión) en los elementos de una población (investigación· censal) o de una muestra (encuesta muestra!). Existen dos tipos fundamentales de distribuciones de frecuencia: las de valores de la variable o datos no agrupados y las de datos agrupados en intervalos de clases.
34
2.4. l.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Distribuciones de frecuencias unidimensionales con los datos· no agrupados
Designemos con X la característica (puede ser una variable o un atributo) que deseamos observar en los elementos de una población o de una muestra. Realicemos el siguiente proceso: se observan los distintos valores o modalidades de la característica; si es una variable que admite ordenación se ordena de menor a mayor y como puede haber valores que se repitan se agrupan todos ellos. Si el valor o dato X; se repite n; veces a éste se le denomina frecuencia absoluta de dicho valor. Al proceso que hemos descrito se le denomina tabulación de datos y cuando se culmina se obtiene un conjunto formado por valores ordenados de menor a mayor (caso de variables que admitan este proceso) que tienen asociados el número de veces que han aparecido (n;) que llamamos distribución de frecuencias unidimensional de datos o valores no agrupados. Pueden darse dos tipos de distribuciones de frecuencias qe datos no agrupados: las que no tienen valores repetidos o de frecuencias unitarias y las que tienen valores repetidos y por tant<;>, alguna o algunas de sus frecuencias no son unitarias. Definición 2.1. Distribución de frecuencias unitarias. Llamamos distribución de frecuencias unidimensional unitaria de la característica X al conjunto de los r datos distintos y ordenados de menor a mayor (x 1, x 2 , •••,X;, ... , x,) de forma que ninguno está repetido. Este tipo de distribuciones surgen cuando la variable X toma pocos valores y ninguno se repite, con lo que las frecuencias absolutas n; son todas unitarias, ponderando en el análisis de la misma forma todos los valores X;. Se presentan en tablas que tienen la siguiente forma: TABLA 2.1.
Distribuciones de frecuencias unitarias.
35
Puede observarse en la tabla 2.1 que no se expresan las frecuencias absolutas ya que son todas unitarias.
Ejemplo 2.1 Supongamos que las rentas anuales de cinco familias, expresadas en miles de euros son: 200, 150, 300, 250 y 175. Con esta información construir la tabla de la distribución de frecuencias.
Solución: La tabulación es inmediata y simple ya que basta con ordenar la variable de menor a mayor: T A,BLA 2.2.
Distribución de frecuencias de la renta de las familias.
150 175 200
250 300
Definición 2.2. Distribución de frecuencias unidimensional con los datos no agrupados. Llamamos distribución de frecuencias unidimensional de la característica X al conjunto de los r datos distintos, ordenados de menor a mayor, acompañados de sus respectivas frecuencias absolutas: X 1, X 2 , ••• , X¡, ... ,
x,
Valores de la variable X¡
~2
x,
Este tipo de distribuciones se elaboran cuando la característica X toma pocos valores pero se repiten un gran número de veces con lo que las frecuencias ya no son unitarias. Cada valor X; está ponderado por el número de veces que ha aparecido, representado por su respectiva frecuencia absoluta n;. Los datos estadísticos se presentan en la Tabla 2.3:
36
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
TABLA
2.3.
Distribuciones de frecuencias unidimensional con los datos no agrupados.
Valores de la variable x1
Frecuencias absólutas n1
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
37
Vamos a continuación a establecer nuevos conceptos que aparecen en las distribuciones de frecuencias. Definición 2.3. Total de datos o frecuencia total.
x,
n,
Llamamos total de datos o frecuencia total, y la denotaremos por N a la suma de todas las frecuencias absolutas n;. O sea: T
N=
i= l
Ejemplo 2.2 En una comunidad de vecinos se ha preguntado a las 20 familias que la componen, el número de personas que trabajan en cada una. Las respuestas han sido recogidas en el siguiente cuadro: 1 o 2 3 2 o 1 2 1 o 1 1
4 1 1 1 1 o 1 2
5
Solución:
Existen pocos valores de la variable o característica número de personas que trabajan en la familia que la representamos por el símbolo matemático X. Estos posibles valores x 1 son: O, 1, 2, 3 y 4 que se repiten un cierto número de veces luego nos conviene calcular las frecuencias absolutas n;. Existen 4 familias en las que trabajan cero personas; trabaja 1 persona en 10 familias; 2 en 4 familias y por último, trabajan 3 y 4 personas en una sola familia respectivamente. La Tabla 2.4 nos da la distribución de frecuencias de esta situación. 2.4.
En el ejemplo 2.1, al ser las frecuencias unitarias la columna de las n; ni aparece con lo que el total de datos será el número de valores de la variable: N=S. En el ejemplo 2.2 N=
A partir de esta información construir la tabla de la distribución de frecuencias.
TABLA
In;
1 2
De la definición anterior se deduce que la suma de las frecuencias relativas, al ser tantos por uno, debe ser la unidad:
I
3 4
i= l
4 10 4 1
1
X;.
Llamamos frecuencia relativa del valor de la variable X; al cociente entre la frecuencia absoluta de dicho valor y el número total de datos N:
T
o
20
Definición 2.4. Frecuencia relativa de un determinado valor de la variable
Distribución de frecuencias unidimensional con los datos no agrupados del número de personas que trabajan en 20 familias. X¡
I n; = i=l
T
!;=
I
i=l
n.
1
N
N
~=-
T
I
i=l
1 n;=-·N= 1 N
Las frecuencias relativas se pueden expresar también en tantos por cien con la simple multiplicación 100. ¡; con lo que expresamos el porcentaje de veces que aparece el valor X; en el conjunto de todos los datos. En este supuesto la suma en vez de la unidad será 100.
38
CASAS-SÁNCHEZ, J. M. y SANTOS-PEl\IAS, J.
1 1
j=1
Luego la Ni contabiliza el número de observaciones que existen hasta llegar al valor X; bajo el supuesto, que es con el que venimos trabajando, de que los valores están ordenados de menor a mayor, o sea: x 1 < x 2 < ··· < x,
Según la definición 2.5 podemos escribir que:
l l .l
N~
=N
=N
- NJ
- N
=O
De estas expresiones se deduce que:
1.1
l ¡'
Las frecuencias relativas acumuladas tanto ascendentes como descendentes se definen de forma análoga sólo que se suman las Jj en vez de las ni
j
i
Fi = I
l
Jj
j=1
i 1
r
Ft = I Jj j=i+1
'J ·1
Nl = n 1 N1 = Nl + n2 Ni=
Nt =N- Ni
l
.!
N!= "L., n.1 '
39
.j
Frecuencia absoluta acumulada ascendente. , Llamamos frecuencia absoluta acumulada ascendente N[ de un determinado valor de la variable ordenado (de menor a mayor) X; al número de datos que son menores o iguales a él:
Definición 2.5.
i
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Verificándose que: Fl = f1 F1=Fl+fz
Ni_ 1 + n;
NJ=N Definición 2.6.
Frecuencia absoluta acumulada descendente.
Llamamos frecuencia absoluta acumulada descendente Nt de un determinado valor ordenado X; al número de datos que son mayores que él: r
N~= '
"L.,
j=i+1
n.1
.f
l 1 1j '
l
Ni=
N-
N~= N-
Nl N1
1
Por otro lado las descendentes se van obteniendo de la forma siguiente:
Fi = 1- Fl F~
= 1- F1
l ¡
Por tanto la Nt contabiliza los datos que quedan a partir de x; pará llegar al total de observaciones N. Con la definición 2.6 se establece lo siguiente:
FJ =
l
]
F~ =1-FT
'
F~
'
= 1 - FJ = 1 - 1 = O
De las expresiones anteriores también se deduce que:
FJ + Ft =
1
r ··~
40
.·~
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
1
Todos estos conceptos dan lugar a la siguiente tabla genérica que nos representa las diferentes distribuciones de frecuencia en su sen~ido más amplio: TABLA 2.5.
X¡
x2
X¡
n;
/¡=....!. N
n¡
n¡ =N
n2
n;
quinto. Las acumuladas, tanto ascendentes como descendentes si varían por propia definición:
Distribuciones de frecuencias con datos no agrupados. n.
X¡
~~
f1
n2 f2= N
n· j¡=....!. ' N
.
.
.
.
N!
FT
Fl
Nt1
NI1
pt1
pi1
m
NI2
pt
pi2
NT
Nf
NT
1
NJ=N
2
1
i 1
41
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
TABLA 2.6.
Distribuciones de frecuencias del ejemplo 2.1.
X¡
n;
/¡
NJ
NI
Ft1
F!1
150 175 200 250 300
1 1 1 1 1
1/5 1/5 1/5 1/5 1/5
1 2 3 4 5
4 3 2 1
1/5 2/5 3/5 4/5 1
4/5 3/5 2/5 1/5
1
o
o
N=5
pT1
P! =
Ejemplo 2.4
p+1
Con los datos del ejemplo 2.2 obtener las tablas de frecuencias absolutas, relativas, absolutas acumuladas ascendentes, absolutas acumuladas descendentes, relativas acumuladas ascendentes y relativas acumuladas descendentes. 1
Soluci6n:
N
Haciendo operaciones y teniendo en cuenta las defmiciones dadas tenemos: TABLA 2. 7.
De esta tabla genérica pueden obtenerse las tablas parciales que se deseen con sólo relacionar los valores de la variable x 1 con cualquiera de las frecuencias: tabla de frecuencias absolutas (columnas X¡ y n1); tabla de frecuencias relativas (columnas x 1 y fJ; tabla de frecuencias absolutas acumuladas ascendente (columnas x 1 y NJ) y así sucesivamente. Ejemplo 2.3
!~·
t:.
Con los datos del ejemplo 2.1 obtener las distintas tablas de frecuencias absolutas, relativas, absolutas acumuladas ascendentes, absolutas acumuladas descendentes, relativas acumuladas ascendentes y relativas acumuladas descendentes.
:~
~ .~:"
1 ,.
!
!
Soluci6n:
¡.;
X¡
n;
/¡
NJ
N!
Fl
F~1
o
4 10 4 1 1
4/20 10/20 4/20 1/20 1/20
4 14 18 19 20
16 6 2 1
4/20 14/20 18/20 19/20 1
16/20 6/20 2/20 1/20
1 2 3 4
1
o
N=20
Así, por ejemplo, para x 3 n3
=
2 se han obtenido:
4
! 3 =N= 20
1 1
Partiendo de los datos de la tabla 2.2 se van construyendo las distintas columnas. La primera de las frecuencias absolutas son todas la unidad ya que no se repite ningún valor. Las frecuencias relativas/; son todas iguales a un
Distribuciones de frecuencias absolutas, relativas, absolutas acumuladas as. cendentes, absolutas acumuladas descendentes, relativas acumuladas ascendentes y relativas acumuladas descendentes.
3
N1 = I
ni= n 1 + n2 + n3 = 4 + 10 + 4 = 18
j=l
N~
=N -
N1 = 20 -
18 = 2
o
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
42
3
F1 = ¡=1 .L Jj = F~ =
1-
4 10 4 20 + 20 + 20
F1 =
1-
18 20
=
=
En este ejemplo las frecuencias relativas también se han expresado en tantos por cien ya que muchas veces se suelen presentar de esta forma en vez del tanto por uno que venimos calculando.
18 20
2 20
y así sucesivamente, para los distintos valores de la variable X;. Todo lo dicho anteriormente está referido a observaciones de naturaleza cuantitativa. Si la variable es cualitativa, o sea, nos referimos a un atributo que toma distintas modalidades, no tiene ningún sentido el calcular frecuencias acumuladas. La tabla de frecuencias se construye de la forma siguiente: en la primera columna se describen las distintas modalidades, en la segunda se registran las frecuencias absolutas y en la tercera las relativas. TABLA 2.8.
43
Tabla de frecuencias de datos cualitativos.
Modalidades de la característica x
n;
¡;
M¡ M2
n¡ n2
n¡/N n 2/N
M;
n;
njN
M,
n,
n,/N
N
1
2.4.2.
Distribuciones de frecuencias unidimensionales con los datos agrupados en intervalos de clases
Este tipo de distribuciones se elabora cuando el número de valores que puede tomar la característica de interés es muy elevado con lo que es necesario agruparlos en intervalos de clases. Estos intervalos sólo tiene sentido en el caso de variables cuantitativas en las que se puede aplicar las escalas que llevan este nombre o las de razón. La agrupación de los valores de la característica que se esté analizando en intervalos de clases tiene el inconveniente de producir una pérdida de información, ya que si sabemos que un dato se encuentra dentro de un determinado intervalo, no podremos conocer su valor exacto sino sólo que se sitúa dentro de unos límites determinados. Esta pérdida de información se compensa con una mayor manejabilidad de la distribución. Los intervalos pueden construirse con amplitud -diferencia entre el límite superior e inferior- constante o variable. Antes de señalar cómo se elaboran los intervalos vamos a definir lo que se conoce como recorrido o rango de la variable X en estudio que lo designamos por R: R
Ejemplo 2.5
En 100 personas mayores de edad se ha observado que 50 son casados, 25 solteros, 15 viudos y lO divorciados. Con los datos anteriores construir la tabla de frecuencias de la variable cualitativa o atributo denominado estado civil.
=
x,- x 1
=
máx {x;}- rnín {x;} i
i
supuesto que los datos observados están ordenados de forma creciente como hacemos en las características cuantitativas. Una vez determinados los datos máximo y mínimo de una variable estadística (x, y x 1) podemos agrupar los datos en intervalos del modo siguiente:
TABLA 2.9. Distribución de frecuencias del estado civil. X
Casado Viudo Soltero Divorciado .
n;
¡;
¡; ~
50 15 25 10
50/100 15/100 25/100 10/100
50 15 25 10
N= 100
1
100
100
siendo L 0 = x 1 y Lk = x,. Así, la distribución agrupada de frecuencias está determinada por el conjunto de elementos (intervalos, frecuencias) como se indica en la tabla 2.10; siendo n; la frecuencia absoluta de datos contenidos en . el intervalo (L;_ 1 , LJ. Llamamos amplitud del intervalo (L 1_ 1 , L;] a la cantidad e;,
c1 =L;-L;_ 1
~-· ····~
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
44
Ejemplo 2.6
verificándose que k
Un comercio ha abierto sus puertas al público durante 25 días de un mes y ha obtenido las siguientes recaudaciones:
k
Le;= i=l
L (L;-L;_
1 )=Lk-L 0
=x,-x 1 =R
i= 1
16.500 7.325 17.085 20.210 15.800
Si la amplitud de todos los intervalos es constante, e igual a e e¡ = e, (i = 1, 2, ..., k) entonces
i=l
de donde la amplitud común de los intervalos resultaría ser: e=R/k A efectos operativos, llamamos inarca de clase del intervalo (L;_ 1 , LJ a su punto medio denotado x¡: X¡ =
Li-l + L¡ 2 = Li-1
10.050 13.800 19.000 7.280 5.000
22.540 25.000 15.075 24.500 17.700
10.000 14.600 13.760 23.090 21.600
12.320 18.300 11.900 21.200 13.050
Dado que la recaudación mínima, en los 25 días considerados, es de 5.000 y la máxima es de 25.000 podemos denotar por x 1 = 5.000 y x, = x 25 = 25.000. Los r = 25 datos observados pueden recogerse en una tabla de frecuencias, como hemos visto previamente, o bien, dado que el recorrido R = x 25 - x 1 = 25.000 - 5.000 = 20.000 y los datos no tienen frecuencia absoluta mayor que 1 en todos los casos, podemos agrupar estos datos de modo homogéneo en cada grupo. Una posibilidad es elegir como amplitud de cada clase, el valor común e = R/k =;= 20.000/5 = 4.000; si queremos agrupar los datos en k = 5 clases. Otras posibilidades son: si k = 4, e = 5.000 si k= 2, e= 10.000 si k= 10, e= 2.000, etc.
k
L e¡= k·e = R
e¡
+2
Si la amplitud común a las 5 clases es 4.000, los intervalos son: puesto que al ser e¡ la amplitud del intervalo,
Para i = 1, 2, 3, 4 y 5:
L¡ = L¡-1 +e¡
L 0 = x 1 = 5.000 L 1 = L 0 +e= 5.000 + 4.000 = 9.000
La tabla de frecuencias con los datos agrupados en intervalos de clases equivalente a la tabla 2.5 de valores sin agrupar será:
L 2 = L1 + e = 9.000 + 4.000 = 13.000
L3 =L2 +e=17.000 TABLA
2.10. Tabla de frecuencias con los datos agrupados en intervalos de clases.
Intervalos (L;_ 1, LJ
Marca de clase (x;)
n;
¡;
N!1
N"1
pi1
P"1
[L 0 , L1]
X¡
n¡
fl
N",1
(L 1 , L2]
x2
n2
!2
Ni1 Ni2
pi 1 pi2
p!1 p!2
N"2
L4
:¡¡
+ e = 21.000 L 5 = x 25 = L4 +e= 25.000, pues = L3
1
(Lk-l'
LJ
hc-1 h
pi. k-l pik
Pi-1
p!k
k= 5
Las marcas de clase son: X =
(Lk-2' Lk_¡]
45
Lo+ Ll
2
5.000 + 9.000 ----=7.000 2
9.000 + 13.000 - - - 2 - - = 11.000
46
x3 =
X5
=
Lz
+ L3 2
L4
=
resultado de esta operación ha sido recogido en la siguiente tabla agrupada de frecuencias:
15.000
Intervalos (en m 3)
Marca de clase (en m3)
Frecuencias absolutas
[0, 0,25] (0,25, 0,50] (0,50, 1]
0,125 0,375 0,75 1,5 3,5
1.235 187 50 18 10
+ Ls = 23000 2
(1, (2,
o
2] 5]
1.500
La tabla agrupada de frecuencias resultará: Intervalos
Marca de clase
[5.000, 9.000] (9.000, 13.000] (13.000, 17.000] (17.000, 21.000] (21.000, 25.000]
7.000 11.000 15.000 19.000 23.000
Frecuencias absolutas
De esta tabla, se observa que las amplitudes de los intervalos de volumen de madera es creciente, pasando de
3
c 1 = 0,25- O= 0,25, a c2 = 0,50 - 0,25 = 0,25, a c3 = 1 - 0,50 = 0,50, a c4 = 2 - 1 = 1, hasta c5 = 5 - 2 = 3 metros cúbicos
4
7 5 6
La frecuencia absoluta 3 del intervalo [5.000, 9.000] es debido a los 3 datos: 7.350 ; 7.280 ; 5.000 La amplitud de los intervalos puede no ser común, y podríamos tener intervalos de diferente amplitud. Es sencillo advertir que agrupando datos se pierde información de la variable estadística, aunque se gana en facilidad de uso. La tabla completa de las distintas frecuencias será la siguiente: TABLA 2.11.
47
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Tabla de frecuencias con los datos agrupados en intervalos de clases.
(L,_ 1, LJ
X¡
n,
¡;
Nt1
M
pt
[5.000, 9.000] (9.000, 13.000] (13.000, 17.000] (17.000, 21.000] (21.000, 25.000]
7.000 11.000 15.000 19.000 23.000
3 4 7 5 6
3/25 4/25 7/25 5/25 6/25
3 7 14 19 25
22 18 11 6
3/25 7/25 14/25 19/25 1
N=25
1
1
o
1
F" 1
22/25 18/25 11/25 6/25
También se aprecia que la mercancía es tanto más frecuente cuanto menor sea su volumen. La tabla completa de los distintos tipos de frecuencias queda de la forma siguiente: TABLA 2.12.
Tabla de frecuencias con los datos agrupados en intervalos de clases.
(L;-n LJ
X;
n;
¡;
NJ
Ni
[0, 0,25] (0,25, 0,50] (0,50, 1] (1, 2] (2, 5]
0,125 0,375 0,75 1,5 3,5
1.235 187 50 18 10
1.235/1.500 187/1.500 50/1.500 18/1.500 10/1.500
1.235 1.422 1.472 1.490 1.500
265 78 28 10
o
.
FJ
Ff
'
1.235/1.500 265/1.500 1.422/1.500 78/1.500 1.472/1.500 28/1.500 1.490/1.500 10/1.500 1 o
1.500
o
Ejemplo 2.7 Una sociedad del sector maderero ha adquirido troncos de cierta variedad forestal para su posterior transformación. Al recibirlos, ha decidido clasificarlos según tramos de metros cúbicos de volumen de madera por unidad. El
2.4.3.
Representaciones gráficas para distribuciones de frecuencias de datos cualitativos
En la Estadística Descriptiva las representaciones gráficas tienen la ventaja de que el impacto visual nos proporciona de forma instantánea una visión global del reparto de los datos observados, pero nunca deben sustituir al
48
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
estudio analítico que es el que nos proporciona las conclusiones definitivas del fenómeno objeto de estudio. Los distintos tipos de gráficos ~on simplemente una forma complementaria, nunca sustitutiva, de describir la realidad que nos interesa. Las figuras más empleadas para los datos cualitativos son el diagrama de rectángulos, diagrama de sectores o de pastel, pictogramas y cartogramas. Las dos primeras se dibujan bajo el principio de proporcionalidad entre las áreas de los rectángulos o sectores y las frecuencias absolutas n; de cada modalidad del atributo. Los pictogramas consisten en reflejar las frecuencias de cada modalidad a través de dibujos artísticos cuyo tamaño también guarda proporcionalidad con las frecuencias absolutas. Por último los cartogramas son una representación por medio de un mapa que se utiliza cuando las modalidades están contenidas en áreas geográficas. Si la distribución de frecuencias es unitaria (pocas modalidades y no se repite ninguna) su representación gráfica carece de interés ya que los rectángulos, los sectores o las figuras de los pictogramas tendrían todas el mismo tamaño, al tener todos la unidad por frecuencia absoluta, oon lo que no se puede realizar ningún análisis diferenciador de la importancia relativa de cada modalidad ya que todos tienen el mismo peso o importancia. Ahora bien, si los datos son los del ejemplo 2.5, con frecuencias no unitarias, podemos construir los siguientes gráficos: -
Diagrama de rectángulos, en donde todos los rectángulos tienen la misma base y sus áreas son proporcionales a las frecuencias absolutas n;. Gráfico 2.2.
Digrama de sectores, en donde el área de cada sector es proporcional a la frecuencia de cada modalidad, casados: 50, solteros: 25, viudos: 15 y diverciados: 10. Gráfico 2.3.
GRÁFICO
-
n¡
49
2.3.
Diagrama de sectores o de pastel para la característica cualitativa estado civil del ejemplo 2.5.
Pictograma, en donde el tamaño de las figuras es proporcional a las frecuencias de cada modalidad. Gráfica 2.4.
50 40 30
20 10 CASADO GRÁFICO
VillDO
SOLTERO DNORCIADO
M¡
CASADOS
SOLTEROS
VllJDOS
DNORCIADOS
2.2. Diagrama de rectángulos para la característica cualitativa estado civil del ejemplo 2.5.
GRÁFICO
2.4. Pictograma para la característica cualitativa estado civil del ejemplo 2.5.
50
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
2.4.4.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Representaciones gráficas para distribuciones de frecuencias · de datos cuantitativos
frecuencias absolutas del 1 (mínima) hasta el 10 (máxima). Para x 1 = O se levanta una barra de altura 4, para x 2 = 1 de 10, para x 3 = 2 de 4, para x 4 = 3 de 1 y para x 5 = 4 de l. El resultado de este proceso de construcción es el gráfico 2.6.
Vamos a estudiar en primer lugar las representaciones gráficas de las distribuciones de frecuencias no agrupadas. Es evidente que no tiene ningún sentido el efectuar una representación gráfica de la tabla 2.1 ya que al ser las frecuencias absolutas todas la unidad no nos aportaría ninguna información diferenciadora respecto a los distintos valores de la variable. En cambio en la tabla 2.3 se representa mediante lo que se conoce como diagrama de barras. La figura se construye utilizando un sistema de ejes cartesianos de forma que en el eje de abscisas se toman los distintos valores de la variable y en el eje de ordenadas las frecuencias absolutas. Sobre cada valor de la variable cuantitativa X¡ (ordenados previamente de menor a mayor) se levanta una barra cuya altura sea su frecuencia absoluta n¡. Luego la gráfica del diagrama de barras de la tabla 2.3 tendrá la forma del gráfico 2.5. Análogamente se puede construir el diagrama de barras para las frecuencias relativas, y se puede emplear en la misma figura una doble escala en el eje de ordenadas ya que de unas a otras se pasa dividiendo por el total de observaciones, siendo así ambas escalas proporcionales.
f¡
n¡
0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05
10
9 8 7 6 5 4 3 2
o f¡
n¡
GRÁFICO
n¡
nsT
-------------·
o
X¡
GRÁFICO 2.5.
X3 -------------· Xr
51
X
Diagrama de barras.
Ejemplo 2.8 Construir el diagrama de barras de la tabla 2.4 del ejemplo 2.2. Solución:
En el eje de abscisas del sistema cartesiano se anotan los cinco valores de la variable: O, 1, 2, 3 y 4. En el de ordenadas se pone la escala de las
2.6.
2
3
4
X
Diagrama de barras de la tabla 2.4 del ejemplo 2.2. (La escala de las frecuencias relativas, J;, se obtiene dividiendo las absolutas n; por el total de observaciones que en este caso son N = 20 ).
Con el gráfico 2.6 podemos comprobar con gran rapidez y de un solo vistazo que en la mayoría de las familias observadas (50%) sólo trabaja una persona. Esta es la gran ventaja de las representaciones gráficas: obtener conclusiones con el impacto visual de la figura. Como en las variables cuantitativas sí tienen sentido las columnas de las frecuencias acumuladas, vamos a ver sus representaciones gráficas a través de las figuras denominadas diagramas acumulativos de frecuencias. Ahora se trata de representar las columnas NI, N[, Fi y F[ de la tabla 2.5. Las funciones que las representan tienen forma de escalera ascendente o descendente, según se trate de Ni o Fi o bien de N[ o Ff. Se sube o se baja un peldaño al pasar de cada valor de la variable al siguiente. La altura de cada peldaño viene determinada por el valor de la frecuencia correspondiente (absoluta o relativa) y como siempre en el eje de abscisas están los valores de la variable y en el de ordenadas las frecuencias acumuladas que corresponden a cada valor. En el gráfico 2.7 se representa el diagrama acumulativo ascendente correspondiente a las columnas Ni y Fi de la tabla 2.5. Para cada valor de la variable X¡ se determina el punto (x¡, ND y desde el mismo se traza una línea paralela al eje
52
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
de abscisas de trazo continuo hasta la vertical del siguiente punto (x;+ 1 , N[+ 1 ). Este trazo continuo viene por la izquierda coincidiendo con el,eje de abscisas, teóricamente desde menos infinito, ya que a la izquierda de x 1 (mínimo valor de la variable) no se puede acumular ninguna frecuencia y no existen los peldaños de escalera. Justo en x 1 tenemos n1 = Nl y la altura del peldaño coincide con su valor; de x 1 a x 2 , sin incluir x 2 , no se acumula ninguna frecuencia con lo que la función se mantiene en trazo grueso paralela al eje de abscisas hasta llegar a x 2 • En este punto, al existir la frecuencia absoluta n2 que se acumula a Nl dando como resultado N1, hay un nuevo salto de peldaño coincidiendo con el valor x 2 • Así sucesivamente hasta el último valor x, en el que la escalera tiene su último peldaño de altura n,. A partir de (x,, N!) la función se convierte en una paralela al eje de abscisas, teóricamente hasta más infinito, ya que cualquier punto x del eje de abscisas con un valor igual o mayor que x,, la N! = N y la F! = 1, y no se vuelve a acumular ninguna frecuencia con lo que los peldaños de la escalera desaparecen. Ft1
Nt
Ft r
~
t
Fr-1 F! Ft
FT '
o
4
1
14 18 19 20
4/20 = 0,20 14/20 = 0,70 18/20 = 0,90 19/20 = 0,95 20/20 = 1
2 3 4
Los datos anteriores se llevan en forma de escala al eje de ordenadas y los valores de la variable al eje de abscisas del sistema cartesiano. La curva, como se indica en él gráfico 2.8 viene por la izquierda desde menos infinito hasta que encuentra el primer valor x 1 =O en el que hay un salto de peldaño n1 "" Nl = 4; sigue paralela al eje de abscisas a esa altura de 4 ya que no acumula ninguna frecuencia hasta que llega a x 2 = 1 donde se acumula n2 = 10 (nuevo salto de peldaño) y pasa otra vez a ser paralela a la altura total N1 = n1 + n2 = 4 + 10 = 14. Así sucesivamente hasta x 5 = 4 donde se da el último salto de peldaño de altura n5 = 1 convirtiéndose en una paralela hasta más infinito a la altura total N1 = N = 20 para la escala de NT o la unidad para F[. '
t
Nr-1
:
Nz Nt
Nl
•• 1 1 1 1 1
:t
o GRÁFICO 2.7.
----------------------------------.-------..
NT '
X;
53
------------~
1
1
1 1 1
1 1 1
1
1
1 1 1
1 1 1
1 1 1
[
1
:
-----~
X¡
1
1 1 1
1 1 1 1
1 0,95 0,90
20 19 18
0,70
14
-------------------------------,..----..... ---------------------- r-------_, --------------...-------j
1 1 1
1 1
Xz ---------- Xr-1
Xr
X
Diagrama acumulativo de frecuencias ascendente. (La escala de las frecuencias relativas acumuladas ascendentes se obtiene de las N[ dividiéndolas por el total de datos N).
Ejemplo 2.9
0,20
4-1---i
Construir el diagrama acumulativo de frecuencias ascendente, utiliz~ndo los datos de la tabla 2.7.
o
Solución:
De la tabla 2.7 hay que representar los datos de las columnas N[ y F[ que son los siguientes:
GRAFrco 2.8.
2
3
4
X
«Diagrama acumulativo de frecuencias relativas acumuladas ascendentes». (La escala de las frecuencias relativas acumuladas ascendentes FT se ' obtiene dividiendo la Ni por el total de datos N= 20).
54
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
El diagrama acumulativo de frecuencias del gráfico 2.8 nos indica que, del total de familias observadas, las que tienen dos personas o menos trabajando, son 18 que son el 90% del total (dato dado por Ff expresado en porcentajes, o sea, 100 x FJ) y las que tienen tres o menos son el 95 % de las familias. La representación de las columnas N[ y F[ de la tabla 2.5 daría como resultado el diagrama acumulativo descendente con la forma que se expresa en el gráfico 2.9. La función descendente viene teóricamente desde menos infinito a la altura del total de datos N = N~ para la escala de las frecuencias absolutas y de la unidad para las relativas. Cuando llega a la vertical de x 1 baja un peldaño justo hasta la definición de Ni =N- Nl con lo que queda cancelado el punto (x 1 , Ni}. A partir de este punto la función descendente es paralela hasta encontrarse con la vertical de x 2 en la que vuelve a bajar un nuevo peldaño hasta N~ = N - N1. El proceso se repite sucesivamente hasta encontrarnos con la última vertical del máximo valor x, en la que baja el último peldaño, pasando al valor cero hasta más infmito, ya que N; = N - N~ = N - N = O, como ya sabemos.
55
Solución: De la tabla 2.7 hay que representar los datos de las columnas N[ y F[ que junto con los valores de la variable son los siguientes: X¡
o 1 2 3 4
M '
Ft
16 6 2 1
16/20 = 6/20 = 2/20 = 1/20 = 0/20 =
'
o
0,80 0,30 0,10 0,05
o
En el gráfico 2.10 la función acumulada descendente viene siendo paralela al eje de abscisas, teóricamente desde menos infinito, ya que para cualquier punto x del eje de abscisas, inferior al primer valor de la variable x 1 = O, los superiores al mismo acumulan todas las observaciones o datos que ascienden a 20. Justo al llegar a la vertical de x 1 =O, que coincide con el eje de ordenadas, los valores superiores al mismo acumulan 16 datos u observaciones obteniéndose la
N
Ni = N - Nl = 20 -
1 1 1
4 = 16
1 1
-----~
siendo 4 la magnitud del peldaño descendente en la mencionada vertical. La función se mantiene paralela hasta que encuentra la vertical de x 2 = 1 donde vuelve a descender el montante de 14 observaciones con lo que
:
: : -----t------+------: : : : l
1 1 1 1
1 1 1
}
F,_¡
1 1 1 1
}i
N,_¡
Ft o GRÁFICO
2.9.
N~
1 1 1 1
:
:
1 1
1 1
:
1
-----l------+-------------.:..· --..., 1 1
X¡
X2 ---------- Xr-!
X
((Diagrama acumulativo de frecuencias 4escendente.» ,
Ejemplo 2.10 Construir el diagrama acumulativo de frecuencias descendentes utilizando los datos de las columnas N[ y F[ de la tabla 2.7.
=N -
N1 =
20 - 14 = 6;
o sea, los datos superiores a x 2 = 1 ascienden a 6 manteniéndose esta situación hasta x 3 = 2 que pasan a ser 2; x 4 = 3 que son 1 y para valores superiores a x 5 = 4 no existe ninguna observación con lo que la función coincide con el eje de abscisas hasta más infinito. La interpretación de este diagrama acumulativo de frecuencias descendentes es fácil empleando la escala de F[: el 80 % (Fi x 100) de las familias observadas tienen alguna persona trabajando, el 30% tiene más de una persona trabajando, ellO% tiene más de dos personas trabajando, el 5% más de tres y no hay ninguna familia que tenga más de cuatro personas trabajando. Está claro que la información que suministran los gráficos 2.8 y 2.10 es complementaria ya que como sabemos N[+ N[= N.
56
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Luego si el 80% de las familias observadas tienen alguna persona trabajando, un 20 % no tienen ninguna, si un 30 % tienen más de una, un 7.0 % tiene una o ninguna y así sucesivamente; basta con observar las escalas F[ multiplicadas por 100, o sea, expresadas en porcentajes.
57
n¡/c¡
n3/c3 n2/c2 nJ!ck
0,80
16 +----.
n¡lc¡
o
Lo
L¡
L?.
GRÁFICO
0,30
6
~
Lk-1
Lk
Extremos de intervalos
2.11. H ístograma de frecuencias.
r-------·~---. 1 1 1 1
Ejemplo 2.11
1
0,10
0,05
21 -------+------! 1 -------T-------¡--------r------,
o GRÁFICO
2
3
4
X
2.10. «Diagrama acumulativo de frecuencias descendente».
Por último, vamos a estudiar las representaciones gráficas de las distribuciones de frecuencias agrupadas en intervalos de clases. Las tablas del tipo 2.10 se representan a través de los llamados histogramas de frecuencias que tienen la forma expresada en el gráfico 2.11. Como los valores de la variable están ahora agrupados en intervalos se levanta un rectángulo cuya base es la amplitud de aquéllos. En cada intervalo (L;_ 1 , L;] de los definidos en la tabla 2.10 se levanta desde el eje de abscisas un rectángulo que, con dicha base (L;_ 1 , L;), llegue a la altura njc; sobre el eje de ordenadas. De este modo el área del rectángulo es proporcional o coincide con n;:
Área(i) =base· altura=
n. e;·....!.= n; C;
(i = 1, 2, ... , k)
Si todos los intervalos tienen la misma amplitud, las alturas de los rectángulos serán las correspondientes frecuencias. A las alturas de cada rectángulo n)c; se le denomina densidad de frecuencia del intervalo i-ésimo.
Elaborar el histograma de frecuencias de los datos de la tabla 2.11.
Soluci6n: Para elaborar el histograma sólo nos interesan los datos de las columnas (L;- 1 , L;] y n; de la tabla 2.11 que son los siguientes: (L;- 1 , L;]
[ 5.000, ( 9.000, (13.000, (17.000, (21.000,
9.000] 13.000] 17.000] 21.000] 25.000]
n;
3 4 7 5 6
Lo primero que hay que observar es si la amplitud de los intervalos es · constante o es variable. En este caso es constante e = 4.000; luego las alturas de los rectángulos del gráfico 2.12 son directamente las frecuencias llevadas a la escala de ordenadas.
TABLA
f¡
59
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
58
2.13. Cálculo de densidades de frecuencias h,.
n¡
(L;-¡,
LJ
n;
C¡
h=!!! l
C¡
0,28 0,24 0,20 0,16 0,12
7 6 5 4 +-------------------· 3 +--------
o GRÁFICO 2.12.
- [ 40, 100] (100, 200] (200, 500] (500, 1.000]
5.000
9.000
10 20 15 5
60 100 300 500
0,17 0,20 0,05 0,01
h¡
13.000 17.000 21.000 25.000
X
Histograma de frecuencias de los datos de la tabla 2.1 l. (La escala de las frecuencias relativas se obtiene dividiendo las absolutas n, por el total de observaciones N = 25 ).
Ejemplo 2.12 Los ingresos anuales de 50 familias expresados en miles de euros, y agrupados en intervalos de clases son los siguientes:
1.000 GRÁFICO 2.13.
(L;_ 1 , L;]
[ 40, 100] (100, 200] (200, 500] (500, 1.000]
10 20 15
5
Elaborar su histograma de frecuencias. Solucíón:
Se observa que la amplitud de los intervalos es «variable»; luego hay que calcular las alturas de los rectángulos h; = njc; como se indica en la tabla 2.13 con objeto de construir el gráfico 2.13.
X
Histograma de frecuencias cuando la amplitud de los intervalos es variable.
En la construcción de los histogramas han intervenido las frecuencias absolutas o relativas, pero sin acumular. Como estamos tratando variables cuantitativas hay que representar gráficamente las frecuencias acumuladas (Ny F;) que en el caso de distribuciones agrupadas reciben el nombre de polígono~ acumulativos de ~recuencias. Vam?s a representar sólo las columnas NJ y FJ ~e la tabla genénca 2.10. En el eJe de abscisas se expresan los limites de los Intervalos y en el de las ordenadas la NJ y FJ tal y como se representa en el gráfico 2.14. Puede observarse que el poügono acumulativo se obtiene uniendo mediante rectas cada par consecutivo de los siguientes valores:
60
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
61
.-_y
f
t
Nk
t
>·siguientes mediante segmentos: (5.000, 0), (9.000, 3), (13.000, 7), (17.000, 14), · .· (21.000, 19) Y (25.000, 25). A partir del último punto la función es paralela al ·. eje de abscisas. Si se emplea la escala de FJ el polígono es idéntico sólo que en ordenadas se reduce el tamaño 25 veces que son el total de observaciones para las que se han dividido las Ni para obtener las FJ. Luego basta con poner la escala de F[ en el eje de ordenadas aliado de NJ como se indica en el gráfico 2.15.
----------
t :t
Fk-!
Nk-:-1
Ft
N2
Ft
N¡
2.5.
t
o
~
L¡
--------- Lk-!
L¡
Lk
GRAFICO 2.14. Polígono acumulativo de frecuencias ascenqentes.
Cuando disponemos de una distribución de frecuencias asociada a cierta variable estadística, ésta puede ser resumida o reducida por unas medidas que dan una idea global de cómo es la distribución sin tener que recordar todos los datos con sus frecuencias absolutas o relativas. Entre estas niedidas se encuentran las de posición que sitúan la distribución entorno a dichos parámetros, dando una idea de en qué valores se distribuye la variable estadística.
El polígono acumulativo descendente puede también represent~se a. tr~vés de los datos de las columnas Nf y F[ uniendo los puntos consecutivos sigUientes mediante segmentos:
Ejemplo 2.13 Construir el polígono acumulativo de frecuencias ascendentes y descendentes con los datos de la tabla 2.11.
Medidas de posición
t
N¡
25
----------------------------------------------..,----___,....
0,76
19
--------------------------------------
0,56
14
0,28
7
0,12
3
Soluci6n:
t•
De la tabla 2.11 obtenemos los datos de las columnas NJ, FJ, N[ Y Ff que son los siguientes: (L;-¡, LJ
[ 5.000, ( 9.000, (13.000, (17.000, (21.000,
9.000] 13.000] 17.000] 21.000] 25.000]
NT ' 3 7
14 19 25
F+
FT '
3/25 = 0,12 7/25 = 0,28 14/25 = 0,56 19/25 = 0,76 25/25 = 1
'
22 18 11 6
o
. 22/25 = 0,8~ 18/25 = 0,72 11/25 = 0,44 6/25 = 0,24
o
El gráfico 2.15 se construye uniendo, para la escala de NJ, los puntos
o
5.000 GRAFICO 2.15.
9.000 13.000 17.000 21.000 25.000
L¡
Polígono acumulativo de frecuencias.
La mayoría de las medidas de posición son números que se obtienen por operaciones aritméticas una vez que se han ordenado los valores de la variable. Sólo tienen sentido en el caso de «datos cuantitativos» si exceptuamos lo que
62
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
llamaremos «moda» que sí puede obtenerse y tiene pleno sentido en el estudio , de características cualitativas o atributos. En el estudio de las medidas de posición trabajaremos con distribuciones de frecuencias de tipo unitario, de datos no agrupados (valores observados junto con sus frecuencias absolutas) y con datos agrupados en intervalos de clases (considerando las marcas de clase y sus frecuencias absolutas). Estudiaremos la media aritmética, la media geométrica, la media armónica, la mediana, la moda y los cuantiles.
2.5. l.
Ejemplo 2.14
Obtener la media aritmética de la distribución de tipo unitario referidas a las rentas anuales de cinco familias expresadas en miles de euros, contenida en la tabla 2.2. Los datos de dicha tabla son: X¡
150 175 200 250 300
La media aritmética
El concepto de media aritmética de una distribución de frecuencias es uno de los más importantes en la descripción de datos al ser el más usado cuando representamos al conjunto de la distribución por una sola medida de posición central. Se debe utilizar, ya que lo exige su propia definición,. cuando los datos observados son de naturaleza aditiva (rentas, salarios, beneficios, pesos, estaturas, puntos, etc.) de tal forma que una suma representa el total de los recursos repartidos entre todos los elementos de la distribución. Definición 2.7.
Media aritmética.
_
x1
Solución:
- 150 x=
_
x 1n 1
5
1.075
=--=
5
215
La media aritmética de las rentas anuales es de 215.000 euros y nos representa al conjunto de los cinco valores de la distribución.
+ x 2 + .. · + x, _ 1 N
--
N
~ L. X¡
Obtener la media aritmética de la distribución de frecuencias no agrupada del número de personas que trabajan en 20 familias contenida en la tabla 2.4 cuyos datos son: X¡
[2.1]
o
i=1
1 2 3 4
Para las distribuciones no unitarias tanto agrupadas como no agrupadas: x=
+ 175 + 200 + 250 + 300
Ejemplo 2.15
Llamamos media aritmética a la suma de todos los valores de la distribución dividida por el número total de observaciones. Para las distribuciones de tipo unitario será:
X=
63
+ x 2 n 2 + ... + x,n, N
1 N
r
I
x¡n;
[~.2]
i=1
4 10 4 1
1
Solución:
x
En las no agrupadas los X; son los valores de la variable estadística directamente observados y en las agrupadas en intervalos de clase son lo que hemos denominado marcas de clase.
n;
1
= N
4
I
i=O
. X;n;
1 (O· 4 + 1·10 + 2 · 4 20
=-
+ 3 · 1 + 4. 1) =
1 20
5 ~1 4
- . 25 = -
Por término medio trabaja aproximadamente una persona por familia ya que al ser una variable cuantitativa de naturaleza discreta (no admite decimales) la solución se expresa en números enteros de forma aproximada.
64
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Ejemplo 2.16
I
Obtener la media aritmética de la distribución de frecuencias agrupada de las recaudaciones diarias de un comercio expresadas en la tabla 2.11. De dicha tabla las columnas que necesitamos son la de las marcas de clase X; y la de las frecuencias absolutas que son: X¡
n;
7.000 11.000 15.000 19.000 23.000
3 4 7 5 6
X¡W¡
.X = .:___;=-=1'------
[2.3]
r
I
W¡
i= 1
Puede observarse en la expresión [2.3] que los w¡ hacen la misma función que las n; de la fórmula [2.2], ya que como sabemos r
N=
In; i= 1
Estos coeficientes de ponderación son valores positivos que representan el número de veces que un valor de la variable es más representativo o más importante que otro en el que su correspondiente w¡ sea la unidad.
Solución:
Ejemplo 2.17
1 .X=
65
25
(7.000 · 3 + 11.000 · 4
.
+ 15.000 · 7 + 19.000 · 5 + 23.000 · 6) =
1.000
= ""'25 (21 + 44 + 105 + 95 + 138) = 40.403 = 16.120
El examen final de una asignatura puntúa el doble que los exámenes parciales. Un alumno ha obtenido las siguientes calificaciones: primer parcial no liberatorio 5 puntos sobre 10; el segundo 9 y el examen final 6. Obtener su nota media a final de curso. Solución:
Hay que resaltar que la media aritmética viene expresada en las mismas unidades de medida que los datos originales observados. En el caso de las distribuciones agrupadas en intervalos de clases la media la obtenemos utilizando las marcas de clases, ya que los valores observados son desconocidos, con lo que difiere de la que podría obtenerse si se utilizaran los valores no agrupados. En este caso se trabaja bajo la hipótesis de que los valores observados se distribuyen dentro de cada intervalo de forma uniforme con lo que su punto medio (marca de clase) es representativo de todo el conjunto. La expresión [2.1] se conoce con el nombre de media aritmética simple ya que al ser las frecuencias unitarias todos los valores de la variable tienen la misma importancia o peso a la hora de calcular .X. Por el contrario, la expresión [2.2] recibe el nombre de media aritmética ponderada ya que cada X; aparece ponderado o multiplicado por su respectiva frecuencia absoluta n; que al ser distinta de la unidad da distinta importancia o relevancia a cada X¡. Existen otras formas de ponderar que son distintas a las frecuencias absolutas n¡. Estas situaciones aparecen cuando en distribuciones de tipo unitario, en las correspondientes expresiones del tipo [2.1] se introducen unos «coeficientes de ponderación» denominados w; que son distintos de n; con lo que la media aritmética ponderada sería:
Al tener distinta importancia o peso las distintas calificaciones la media que nos piden como calificación final es una media aritmética ponderada: Calificaciones
Coeficientes de ponderación
X¡
W¡
5 9
1 1
6
2 .X=
5. 1 + 9 . 1 + 6. 2 4
26
=
4
=
6,5
Obsérvese que los w¡ establecidos sólo indican la importancia de cada valor de la variable y sólo son números reales positivos. Al mismo resultado llegamos si los w¡ son w¡ = 2, 2, 4, ya que:
.x =
5 . 2 + 9 . 2 + 6 . 4 52 = 8 8
=
6,s
66
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
La única condición que exige el problema es que w3 (peso del examen final) sea el doble que w1 y w2 (pesos de los exámenes parciales}.
y= 20 [(- 2)· 4 + ( -1)·10 +o. 4 + 1·1 + 2·1] = - ( -15) = - -
x¡-
4
t
Si a la variable estadística X; la sometemos al mismo tiempo a un cambio de origen Ot y a un cambio de escala e mediante la transformación: Y;
1
x=y+O = -~+2=
Propiedades de la media aritmética I.
-
ot
= -e- (siendo Ot y
e constantes)
[2.4]
Demostración:
De la expresión [2.4] se deduce que
ey¡ + ot
Sustituyendo X; en la fórmula de la media aritmética. para el caso de distribuciones no unitarias (sin agrupar o agrupadas) ya que la demostración es idéntica en las unitarias: r
1
x =N
r
¿ i=l
1
x;n; =-
N
r
¿
~
(ey¡ +
ot)n; = e
.L.
1 '--'=-=- -
i=l
N
L.,
+
ot i=Nl
n,.
=
ey +
ot
Esta propiedad nos manifiesta que la media aritmética es sensible a los cambios de origen o de escala. Si e= 1 entonces x=y+ ot y diremos que se ha realizado un cambio de origen. Esta operación se realiza para facilitar los cálculos y se toma como Origen de trabajo Ot el valor central de la distribución en el caso de ser impares o uno de los centrales si son pares. Así en la distribución del ejemplo 2.15 se tomaría como origen de trabajo Ot = 2 transformando X; en Y; de la forma siguiente: X¡
o 1 2 3 4
Y;=
X¡-
-2 -1 o 1 2
2
4
-
X¡
Y;- 1.000
n;
7.000 11.000 15.000 19.000 23.000
7 11 15 19 23
3 4 7 5 6
1
y= 25 (7. 3 + 11· 4 + 15.7 + 19.5 + 23. 6) =
x = ey =
1.000 ·16,12 = 16.120
. Si en la distribución anterior hacemos al mismo tiempo un cambio de ongen Y escala, que es lo que nos dice la expresión [2.5] de la propiedad r tendremos que, por ejemplo, si ot = 15.000, e= 4.000: '
n;
4 10 4 1 1
20
1 403 = 25 (21 + 44 + 105 + 95 + 138) = 25 = 16,12
r
~
y,.n,.
3
3 - + 8 =2 4 4
X¡
[2.5]
=
1
Si Ot = O la exp~esión [2.5] se transforma en x = ey y diremos que se ha efectuado un cambiO de escala en la variable X. Esta operación se suele efectuar también para facilitar los cálculos cuando los valores observados 0 las mar~as de cla~e (e~ ~as distribuciones agrupadas) son muy elevados y tienen un máx1mo comund1v1sor. En los datos del ejemplo 2.16 el cambio de escala podría ser e = 1.000 quedando
entonces resulta que
x¡
67
X¡
x ¡ - ot y¡=--e-
n;
7.000 11.000 15.000 19.000 23.000
-2 -1 o 1 2
3 4 7 5 6
1
y = 25 [(- 2). 3 + (- 1) . 4 + o. 7 + 1 . 5 + 2 . 6] = 2
25
CASAS-SÁNCHEZ, J. M. y SANTOS-PEl~AS, J.
68
Dividiendo por dos y desarrollando el paréntesis:
de donde .X =
7
ey + Ot = 4.000 · 25 + 15.000 = 16.120
' N
LX¡=
Ne
i= 1
11.
69
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
La suma de las desviaciones .de los valores o datos a su media aritmética es cero: r
¿
(x; - x)n; =
o
e=.x \
La segunda derivada es: d2S(C) de2 = 2
[2.6]
i=l
N
L (-1)( -1) =
2N
>o
i=l
Demostraci6n:
con lo que se cumple la condición suficiente de mínimo.
En efecto: r
¿
r
r
(x; - x)n¡ =
¿
"L., n.' = .XN - .XN =• O
IV.
i=l
i=l
i=l
ya que como 1
.X=N
r
r
r
L
.XN =
x;n;
L
x¡n;
y
i=l
i=l
L
Si el total de datos u observaciones se estratifica en L grupos distintos, la media aritmética del total es una medía aritmética de las distintas medías de los estratos ponderadas por el número de observaciones que tienen los mismos:
n;=N
i=l
[2.8] 111.
La suma de los cuadrados de las desviaciones de los valores observados unitarios respecto a una constante arbitraria e es mínima cuando esa constante e coincide con la media aritmética .X: N
S(C) =
L (x;- C)2
[2.7]
Demostraci6n: Las observaciones las dividimos en L estratos quedando:
i=l
mínimo cuando
e=
.X.
La medía total o global será
Demostraci6n: Como sabemos para obtener el mínimo de la expresión S(C) se halla su primera derivada y se iguala a cero. La condición suficiente es que la s¿gunda derivada sea positiva. En efecto:
dS(e) de
d
(
LN i=
.X= (xu
+ X12 + .. · + X1N) + ... + (xLl + xL2 + ... + xLNJ = N1+N2+ .. ·+NL
Nt
(x; - e)2 )
1
N
= 2 de
.
L _(x¡- C)( -1) =O i=1
L
i=l
NL
xli
+ .. · +
L
i=l
XL;
.X1N1 + ... + .XLNL N1+N2+ .. ·+NL
70
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
ya que como sabemos
71
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Definición 2.8. N1
I x- 1
=
X¡¡
i= 1 ---¡:¡---, etc.
1
con lo que N1
I
x 1;
=
Llamamos media geométrica de una distribución de frecuencias y la denotaremos por G a la raíz N-ésima del producto de los N valores observados: Para las distribuciones unitarias:
x1 N 1, etc.
G=r:}x 1 ·x2 • ... ·x,=
i=l
Ventajas e inconvenientes de la media aritmética
-
Es calculable en las variables de naturaleza cuantitativa. Para su cálculo se utilizan todos los valores de la distrib"ución. Está perfectamente definida de forma objetiva y es única para cada distribución de frecuencias. Tiene un claro significado ya que al ser el centro de gravedad de toda la distribución nos representa a todo el conjunto de valores observados.
G = r:}x"11 ·x"22 • ••· • x"• r =
1 logG Demostración:
2.5.2.
Ejemplo 2.18
En muchas ocasiones los valores de la distribución no son de naturaleza propiamente aditiva como ocurre en los casos de los números índices o porcentajes que representan la evolución de una característica con respecto al valor que tiene en un período o situación que llamamos base. Cuando se desea obtener promedios de magnitudes tales como tipos d~ interés, tas.as, porcentajes, números índices, etc., la media aritmética pierde la propiedad de tener un claro significado ya que la suma de dichas magnitudes no representa un total de recursos como en las magnitudes de naturaleza aditiva. En estos casos debe de emplearse la media geométrica como la medida de posición central más representativa cuando la variable presenta variaciones acumulativas.
[2.9]
[2.10]
Como propiedad fundamental de la media geométrica damos la siguiente: «El logaritmo de la media geométrica es igual a la media aritmética de los logaritmos de los valores de la variable.»
Entre los inconvenientes hay que señalar que es una medida de posición muy sensible a los valores extremos de la distribución con lo que puede llegar a ser poco representativa del conjunto si la dispersión de los datos es muy elevada. A pesar de este inconveniente, por sus múltiples ventajas, es la medida de posición central más utilizada.
La media geométrica
X¡
Para las distribuciones no unitarias (agrupadas o no)
Las ventajas que podemos señalar de la media aritmética como más relevantes son: -
N~
V¡~11
r
I
=-
N
n;logx¡
[2.11]
i=l
c.q.d.
Los tipos de interés que ofrece una entidad bancaria durante tres años consecutivos para depósitos a plazo son: 4,5, 5 y 5,5 por 100. Hallar el tipo medio anual que ofrece el banco. Solución:
Los tipos de interés actúan sobre un capital inicial C 0 que lo convierten al cabo de tres años en otro final C1 por un proceso «acumulativo». Luego el promedio más representativo para este caso es la «media geométrica». En el primer año obtenemos un capital C 1 tal que: C1
=
C0 (1
+ 0,045)
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
72
Ventajas e inconvenientes de la media geométrica
En el segundo año: C2 = C 1(1
+ 0,05)
Entre las ventajas de las media geométrica podemos señalar: -
En el tercer y último año: C 3 = Cz(1
+ 0,055) =
C 0 (1
+ 0,045)(1 + 0,05)(1 + 0,055)
-
El tipo medio de interés i será aquél que verifique: C 0 (1
+ i)3 = C0 (1 + 0,045)(1 + 0,05)(1 + 0,055)
Es más representativa que la media aritmética cuando la variable evoluciona de forma acumulativa con efectos multiplicativos. Está definida de forma objetiva y es única, si existe. Tiene en cuenta en su cálculo todos los valores de la distribución. Los valores extremos tienen menor influencia que en la media aritmética por estar definida a través de productos en vez de sumas.
Los inconvenientes que hay que resaltar son:
osea (1
-
+ i) = .U<1 + o,o45)(1 + o,o5)(1 + o,o55) = 1,049992
Puede observarse que (1 + i) es la media geométrica de los valores (1 + 0,05) y (1 + 0,055) siendo las cantidades (0,045, 0,05 y 0,055) las que operan internamente de forma «multiplicativa» en C 0 para transformarlo en C 3 • El promedio de estas cantidades de 0,049992 con lo que la tasa media del tipo de interés que hace el mismo efecto que las tres tasas anuales, expresada en porcentajes es
(1
73
+ 0,045),
Su cálculo es más complicado que en la media aritmética. No puede calcularse si algún X; es cero ya que se anula al definirse como productos. Tampoco puede determinarse con valores negativos ya que daría lugar a que apareciesen números de naturaleza imaginaria con lo que el problema no quedaría resuelto, salvo que el radicando sea negativo y el índice de la raíz sea impar. Así en la distribución del ejemplo 2.15 no es que no exista la media geométrica sino que no es un buen promedio al ser x 1 = O con lo que daría:
i = 4,9992 por 100 En cambio sí puede obtenerse la media geométrica en la distribución del ejemplo 2.16:
Si se calcula la media aritmética:
i=
4,5
+ 5 + 5,5 3
2
=5
G = ,Y7.000 3 -11.0004 ·15.000 7 ·19.000 5 • 23.000 6 = 15.132
vemos que no coinciden siendo ésta menos representativa del fenómeno ya que no tiene en cuenta el efecto multiplicativo de las tasas de interés. El ejemplo 2.18 también puede resolverse aplicando la expresión [2.11] en el caso de frecuencias de tipo unitario: log G = -1 3
L3
log
1 X;=-
i=l
1
=
[ log(1
+ 0,45) + log(1 + 0,05) + log(1 + 0,055)
3
Si comparamos la media aritmética del ejemlo 2.16 con la geométrica: la G < x. Igual ocurre en el ejemplo 2.18 en el qu~ .X = 5 y G = 4,9992. Demostraremos más adelante que para datos no negativos
x = 16.120 y G = 15.132 vemos que
J
=
2.5.3. 00686032 3
.
3 [0,1613680 + 0,0211892 + 0,0232524] = '
y su antilogaritmo: Antilog (0,022867)
=
1,054064
= 0,022867
La media armónica
Existen situaciones en las que no es adecuado el empleo de la media aritmética ni de la media geométrica ya que los datos observados no son de naturaleza aditiva ni multiplicativa. Esto ocurre en los casos en los que se desea promediar velocidades, rendimientos, productividades, etc., en los que hay que combinar una serie de conceptos tales como: «entidades de produc-
74
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
ción» (recorridos, fincas, empresas, secciones, etc.), «recursos producidos» por cada entidad (n 1 ,
n 2,
... ,
n,),
~~total
de recursos»
(N= ;t 'n} «ritmo de 1
producción» de cada entidad (x 1 , x 2 , ... , x,) que se expresa en producto obtenido por unidad de producción y unidades de producción de cada entidad que se obtienen dividiendo la producción de cada entidad por su ritmo de producción
(n
1
,
nz, ..., n,)· El problema que tenemos que resolver es obtener un
x1 x2
x, promedio de los ritmos de producción (x 1 , x 2 , ... , x,) que multiplicando por las unidades de producción nos dé el total de recursos producidos. A este producto H se le denomina media armónica: [2.12]
-
despreciable frente a ellos la información de otros valores de x; que sean mayores. No es posible calcularla cuando existen valores iguales a cero.
Relación entre las medias armónica, geométrica y aritmética
Vamos a demostrar que para una misma distribución de frecuencias con todos sus datos positivos ocurre que:
Consideremos el caso más sencillo de una distribución con dos valores de la variable con frecuencias unitarias y que con dichos valores pueden calcularse los tres promedios:
Despejando H en la expresión [2.12] tenemos:
2
2 H= 1
Definición 2.9.
75
1
-+xl
Dada una distribución de ritmos de producción x 1 , x 2 , ... , x, y las producciones de r entidades: n1 , n2 , ... , n" llamamos media armónica de aquéllos a: H
N
N
= - - - - - - = -,-n1 n2 .. ·+n, "L. n; -+-+ xl
Xz
x,
G=
F'0z
- xl + Xz x= 2
[2.13]
i=l X;
Xz
Vamos a demostrar en primer lugar que H
~
G, o sea:
V en tajas e inconvenientes de la media armónica
Entre las ventajas de la media armónica hay que destacar las siguientes: -
Está definida de forma objetiva y es única. Su cálculo es sencillo. Intervienen todos los valores de la distribución. Es más representativa que las otras medias en los casos de obtener promedios en velocidades, rendimientos y productividades.
Como inconvenientes hay que citar: -
No debe de usarse para valores de la variable muy pequeños (cercanos a cero) ya que sus inversos pueden aumentar muchísimo haciendo
Elevando al cuadrado los miembros de la anterior desigualdad y operando:
4x 1 x 2 ~ xi
+ x~ + 2x 1 x 2
O~ xi
+ x~- 2x 1 x 2
O~ (xl- Xzf
Con lo que queda demostrado que H
~
G. Por otro lado G ~
x ya que:
76
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
77
Ejemplo 2.20
Con lo que
Por tanto, queda demostrado que H ~ G ~ .X. Esta demostración puede generalizarse para cualquier número de valores de la variable. La media armónica del ejemplo 2.16 será:
Cuatro fincas han producido 100, 120, 150 y 200 quintales métricos de trigo con unos rendimientos de 10, 15, 12 y 18 quintales métricos de trigo por hectárea. Calcular el rendimiento medio. Solución:
H =
25 _3_ _ _4_ _ _7_ _ _5_ _ _ 6_ = 14.022
--+--+--+--+-7.000
11.000
15.000
19.000
23.000
Vemos que se cumple que
En este ejemplo los ritmos de producción son los rendimientos obtenidos por hectárea y los recursos producidos son los montantes de quintales métricos de trigo obtenidos en cada una de las fincas que son las entidades de producción. La distribución de frecuencias será: X;
ya que
10 12 15 18
14.022 < 15.132 < 16.120 Ejemplo 2.19
100 150 120 200
Un automóvil realiza los siguientes recorridos 200, 300 y 400 km a las velocidades medias de 50, 60 y 80 km por hora. Calcule la velocidad media para el recorrido total. Solución:
En este ejemplo los ritmos de producción o valores de la variable son las velocidades medias del vehículo en cada recorrido (entidades de producción) (x 1 = 50, x 2 = 60 y x 3 = 80). Los recursos producidos son las distancias que se han recorrido (n 1 = 200, n 2 = 300 y n3 = 400) con lo que la distribución de frecuencias será: X;
n;
50 60 80
200 300 400
H = 200
900 300
400
50
60
80
-+-·-+-
=
64 kmjhora
2.5.4.
La mediana
Las anteriores medias que hemos estudiado (aritmética, geométrica y armónica) son medidas de posición central que representan al conjunto de valores observados de la distribución equilibrando los más elevados, los intermedios y los pequeños ya que en su cómputo intervienen todos ellos. El problema que tienen estas medias es que son sensibles a los valores extremos muy altos o muy bajos y cuando existe mucha dispersión son poco representativas del conjunto de observaciones. Con objeto de superar esta dificultad vamos a definir otra medida de posición central en cuyo cálculo no intervienen todos los valores de la variable X;. En vez de equilibrar valores de la variable para determinar el centro de gravedad de la distribución equilibra las frecuencias observadas a ambos lados de su valor.
78
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Definición 2.10.
Mediana
Dada una distribución de frecuencias con los valores ordenados de menor a mayor, llamamos mediana y la representamos por M e al valor de la variable que deja a su izquierda el mismo número de frecuencias que a su derecha. Determinación de la mediana en las distribuciones de tipo unitario Pueden ocurrir dos casos:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
79
a) S~ N~ sup~ra a N/2 la median~ es el X; que corresponde a ese NJ. . ~) St N; es _Igual a N/2 la medtana es la media aritmética de x. y el st_gwente X;+ 1· St.este r~sultado no fuese admisible porque la distribuci,ón es discreta Y no admite dectmales; la medi\lna sería los dos valores conjuntamente.
Ejemplo 2.21 . Obtener la ~ediana de la distribución de frecuencias no agrupada del eJ_emplo ~-2 refendo al número de personas que trabajan en 20 familias. La dtstnbuctón es:
a) Que el número de valores de la variable sea impar: la mediana es el valor central. Por ejemplo, si la distribución unitaria es X;: 1, 3, 9, 13, 14 la mediana es M. = 9 ya que es el valor que deja a su izquierda los mismos datos u observaciones que a su derecha; o sea, dos datos. 1
b) Que el número de valores de la variable sea par: la mediana es la media aritmética de los dos valores centrales. Por ejemplo, si la distribución unitaria es x;: 2, 3, 4, 5, 7, 8 la mediana es
1 1
L.___, 1 1 1 1
4+5 M.=--=4,5 2 ya que es un punto del campo de variación de la variable que deja tres observaciones por debajo de él (2, 3 y 4) y otras tres· por encima (5, 7 y 8). Si la variable que se está estudiando es de naturaleza discreta (por ejemplo, número de personas) y no admite decimales, la M.= 4,5 no sería admisible con lo que las medianas serían conjuntamente los dos valores centrales (4 y 5) ya que valores menores o iguales a 4 hay tres y valores iguales o superiores a 5 también hay tres.
... ,'1•
r---·:·· 1 1 1
1 1
1 1
1 1 1
o GRAFICO 2.16.
Determinación de la mediana en distribuciones no unitarias y con los valores no agrupados en intervalos de clase. Si la distribución de frecuencias no es unitaria hay que acudir al concepto de frecuencias acumuladas para determinar la mediana. Si de la correspondiente distribución se representan en el mismo sistema de ejes cartesianos los diagramas acumulativos ascendentes y descendentes, la abscisa del punto donde se encuentran corresponde con la mediana ya que por encima del mismo hay un 50% de observaciones y por debajo otro 50% como indica el gráfico 2.16. El procedimiento de determinación numérica es el siguiente: se calcula N/2 y se construye la columna de las NJ. A continuación se observa cuál es la primera NJ que supera o iguala a N/2 distinguiéndose dos casos:
X¡
X
De~erminaci6n gráfica de la mediana a través de los diagramas acumulativos ascendente y descendente. X;
o 1 2 3 4
n;
Ni
4 10 4 1 1
4 14 18 19 20
'
Solución: Observando en la columna N[ que el primero que supera a
N/2
=
10 es
N1 =
14.
80
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Luego la mediana es su correspondiente valor de la variable que es M.= l. Este resultado nos indica que las familias con un ocupado, al tener, una frecuencia acumulada de 14 incluyen a las observaciones que ocupan los lugares décimo y décimo-primero que cumplen la definición de mediana para este ejemplo con un total de 20 observaciones.
a)
81
Que N/ supera a N/2 el intervalo mediano será (L;_ 1, LJ que corres-
pon~e a ese NJ > N /2. Puede observarse en el gráfico 2.17 que el valor de la abscisa que se corresponde con M. tiene una ordenada de N/2. Para obtener el v~lor d~ la mediana al límite inferior del intervalo mediano hay que añadir la d1stancm d que es un trozo de la amplitud del intervalo e;. Luego:
Ejemplo 2.22 Los salarios mensuales de 100 empleados de unos grandes almacenes son los siguientes: Salarios (x;) 1.000 ·1.250 2.000 3.000
N. 0 empleados (n;)
NT
50 30 15 5
50 80 95 100
euros euros euros euros
Pa~a determinar la distanciad se adopta la hipótesis de que los valores de la _vanable X; que pertenecen al intervalo mediano se distribuyen de forma umforme a lo largo del mismo. Luego podemos establecer una relación directamente proporcional entre la frecuencia absoluta del intervalo mediano (n;),
'
N
N¡
N
,____...
Solución: Observando NI vemos que el primero que iguala a N/2 =50 es Nl =50. Luego estamos en el caso en el que la mediana será
''
'
' ''
''
'
''
N/2 N¡_¡
1.000 +1.250 -- = 1. 125
2
euros
Puede observarse que un salario mensual de 1.125 euros tiene por debajo de él al 50% de los salarios de los trabajadores y por encima al otro 50%.
o GRAFICO 2.17.
Determinación de la mediana en distribuciones con los datos agrupados en intervalos de clase. En este caso no tenemos valores observados de la variable al estar incluidas en intervalos de clase. Luego la mediana la obtendremos siguiendo el ~étodo de observar la columna de frecuencias acumuladas hasta encontrar un valor de Ni que supere o iguale a N /2. Gráficamente si de una distribución agrupada representamos sus polígonos acumulativos ascendentes y descendentes, d~nde se cortan ambas funciones su correspondiente abscisa nos daría la mediana como se indica en el gráfico 2.17. Observando la columna de NI nos podemos encontrar con los casos:
Lo----- L¡
X
Determinación gráfica de la mediana a través de la representación de los polígonos ascendentes y descendentes de una distribución de frecuencias agrupada en intervalos de clase.
su amplitud (e;), la longitud desconocida (d) y la frecuencia que le corresponde (N/2- N/_ 1): C¡
d
n;
N/2- N/_ 1 '
de donde
N/2- NT•-1 d -·C· n. '
'
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
82 Sustituyendo:
M.=Li-1 +
N/2- NI-1 ·C;
n;
b) Que NI es igual a N/2. En este ca~o se t oma por convenio como mediana el límite superior del intervalo mediano.
N. 0 de empleados (Li-1• L;)
N. 0 de comercios
[ O, 1] ( 1, 2] ( 2, 4] ( 4, 6] ( 6, 10] (10, 15]
20 30 20 15 10 5
83
N!
'
20 50 70
85 95
100
Calcular la mediana.
Ejemplo 2.23 Los ingresos anuales de las 50 familias del ejemplo 2.12 expresados en miles de euros y agrupadas en intervalos de clases son:
N!
'
[40,
lOO]
(100, 200] (200, 500] (500, 1.000]
Solución:
El primer NJ que iguala o supera a N/2 = 50 (en este caso iguala) es 50 con lo que el intervalo mediano es (1, 2] y la mediana es su límite superior M.= 2.
N1 =
10 30
10 20 15
45
5
50
Ventajas e inconvenientes de la mediana. Como ventajas de la mediana cabe destacar:
Calcular la mediana. Solución:
Observando la columna NI vemos que el primer Ni q~e iguala o su?era - 25 es Niz = 30 con lo que el mtervalo mediano (en es t e caso su Pera) a N/2 es (100, 200]. Por tanto:
-
25- 10 M = 100 + ·lOO= 175 e 20 La conclusión que obtenemos es que el ingreso de 175.000 euros deja por debajo al 50% de las familias y por encima al otro 50%.
Ejemplo 2.24 Cien pequeños comercios se agrupan segón su nómero de empleados, en la siguiente distribución:
Es la medida más representativa en el caso de variables que sólo admiten la escala ordinal. Es una medida de posición central sencilla de calcular. Tiene una fácil interpretación al ser un valor de la variable en el caso de las distribuciones de frecuencias unitarias o las no unitarias no agrupadas. En el caso de las agrupadas está dentro del campo de variación del intervalo mediano. En la mediana sólo influyen los valores centrales de la distribución y es insensible a los valores extremos. La M. puede calcularse en distribuciones en las que los valores extremos son desconocidos siempre y cuando tengamos información sobre sus frecuencias (casos de intervalos iniciales y finales de naturaleza abierta).
El ónico inconveniente que se le puede señalar a la mediana es que en su determinación no intervienen todos los valores de la variable. Este inconveniente se transforma en ventaja cuando son desconocidos los valores extremos o existe una enorme dispersión entre los mismos que invalidan las. medias como medidas de posición central al no ser representativas del conjunto de la distribución por la enorme influencia que ejercen los mencionados valores extremos en su cálculo.
84
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
2.5.5.
1·
'
La moda
1
r
1' 1
¡,
,, 1
i' i i
,.
1
85
Ejemplo 2.26
Igual que la mediana es una medida de posición central que está fundamentada en las frecuencias de la distribución y no en el conjunto de los valores de la variable como ocurre con las distintas medias. La moda siempre estará definida en relación a valores de la variable asociados a sus distintas frecuencias con lo que no tiene sentido hablar de moda en las distribuciones de frecuencias de tipo unitario. Definición 2.11.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Las puntuaciones de 100 alumnos en un examen fueron recogidas en la siguiente distribución de frecuencias:
2 6
7 9
Moda absoluta
Dada una distribución no unitaria llamamos moda absoluta, que representaremos por M 0 , al valor de la variable (o los valores) con mayor frecuencia absoluta. En el caso de existir dos, tres o más valores con la mayor frecuencia absoluta, la distribución se dirá que es bimodal, trimodal o multimodal.
''
15 40 40 5
Determinar su moda. Solución:
Observando la columna n, vemos que es una distribución bimodal o con dos modas absolutas ya que la máxima frecuencia, 40, se repite en dos valores de la variable con lo que sus modas absolutas son M 0 = 6 puntos, o bien, M 0 = 7 puntos.
Determinación de la moda en distribuciones no unitarias y no agrupadas Definición 2.12.
En este caso la determinación de la moda es inmediata ya que basta con observar la columna n, de frecuencias absolutas. Ejemplo 2.25
En la distribución de frecuencias del ejemplo 2.2 referido al número de personas que trabajan en 20 familias obtener la moda. Los datos de la distribución (tabla 2.4) son los siguientes: X¡
n;
o
4 10 4 1 1
1 2 3 4
Moda relativa
Dada una distribución no unitaria llamamos moda relativa a aquel valor de la variable (o los valores) cuya frecuencia absoluta no es superada por las de sus valores contiguos. Ejemplo 2.27
Las puntuaciones de 120 alumnos en un examen fueron recogidas en la siguiente distribución de frecuencias:
1 3
4 5
Solución:
Observando la columna de frecuencias absolutas la mayor corresponde a n2 = 10, siendo la moda absoluta su correspondiente valor de la variable M 0 =l.
20 30 20 40
7
7
9
3
Obtener las posibles modas de la distribución.
86
87
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
n;
Solución: '
Observando la columna n; la moda absoluta es M 0 = 5. También existe una moda relativa M 0 = 3 ya que su frecuencia asociada n2 = 30 no es superada por sus valores contiguos que tienen unas frecuencias absolutas de 20 observaciones.
Determinación de la moda en distribuciones agrupadas en intervalos Al estar los valores de la variable agrupados en intervalos sólo obtendremos una aproximación al valor de la moda como ocurría con las medias (se utilizaban las marcas de clase al no disponer de los valores realmente observados) y la mediana (se utilizó la hipótesis de la proporcionalidad directa entre frecuencias absolutas y amplitudes del intervalo mediano). Para determinar la moda pueden emplearse distintas hipótesis pero las más utilizadas son las siguientes: -
-
La moda se encuentra en el intervalo que tiene mayor frecuencia absoluta dividida por su amplitud (es decir, mayor densidad de frecuencia) que recibe el nombre de intervalo modal. La moda estará más cerca de aquel intervalo contiguo que tenga mayor frecuencia absoluta. Luego dentro del intervalo modal la moda se encuentra en un punto para e! cual las distancias a los extremos inferior y superior del intervalo son inversamente proporcionales a las frecuencias absolutas de los intervalos adyacentes a dichos extremos.
Teniendo en cuenta las hipótesis anteriores vamos a considerar dos casos: a) Que los intervalos tengan todos una amplitud constante c. Para determinar la moda se observa la columna n; de frecuencias absolutas concretando que la mayor de todas nos determina el intervalo modal. Supongamos que es como se indica en el gráfico 2.18 el intervalo (L;_ 1, LJ con una frecuencia absoluta n;. Los intervalos contiguos al modal tienen unas frecuencias absolutas de »; _ 1 el anterior y n; + 1 el posterior. Luego la moda será: M 0 =L;_ 1 +d
o GRÁFICO
X
2.18.
Determinaci6n de la moda a través del histograma de frecuencias.
Teniendo en cuenta las propiedades de las proporciones de suma de antecedentes y consecuentes queda:
d
e-d
1
1
n;-1
e
1
1
n;-1
n;+1
--+--
ni+1
Tomando el primer y último miembro de estas igualdades y despejando nuestra incógnita que es la distanciad queda: 1
1
n;-1
»;-1
d = --:........::'---e= 1 -1 + -
ni+1
n;-1 · »;+1
+ »;-1
»;-1
e=
n;-1
+ ni+1
e=
»;+1 n;-1
+ ni+1
e
(siendoO~d~c)
La hipótesis que hemos establecido de proporcionalidad inversa de las distancias d y (e - á) a las frecuencias n; _ 1 y n; + 1 nos permite escribir: d e- d -1-=-1-
Sustituyendo d por su valor en función de las frecuencias de los intervalos adyacentes al modal y de su amplitud constante e queda la expresión de la moda: M =L. o
•-1
+
ni+
n;-1
1
+ »;+1
e
88
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
89
Ejemplo 2.28
Ejemplo 2.29
Los salarios anuales de 200 ejecutivos de un país expresados en miles de euros se recogen en la siguiente distribución de frecuencias:
Las recaudaciones mensuales expresadas en miles de euros de 100 establecimientos comerciales se reflejan en la siguiente distribución de frecuencias:
Salarios anuales (Li-l
Recaudaciones
N. 0 de ejecutivos
-LJ
ni
[75-125] (125-175] (175-225] (225-275]
(Li-l
25 100 50 25
Solución:
N. o de comercios
Densidad de frecuencias
ni
n. h.=_. 1 ci
50 40 7 3
0,40 0,80 0,14 0,03
-LJ
[75-200] (200-250] (250-300] (300-400] Solución:
Podemos observar que la amplitud de los intervalos es una constante e = 50. Observando la columna ni vemos que la mayor es n 2 = 100. con lo que el intervalo modal es (125-175]. Por tanto el valor de la moda es: M 0 = 125 +
50 ~ ·50= 158,33 miles de euros 25 +50
Puede observarse que utilizando la columna ni el intervalo modal sería [75-200]. Pero esta conclusión es errónea ya que la amplitud de los intervalos es variable y las frecuencias absolutas directamente no son válidas. Hay que obtener la columna hi de densidades de frecuencias siendo la mayor h 2 = 0,80 con lo que el intervalo modal será (200-250] y la moda: M 0 = 200 +
Conclusión: el salario que más se repite en los 200 ejecutivos es de 158.333 euros. b) Que los intervalos sean de amplitud variable ci. En este caso nos encontramos con el mismo problema que cuando se construían histogramas con intervalos de amplitud variable que había que calcular previamente las densidades de frecuencias:
Ventajas e inconvenientes de la moda
-
El intervalo modal será el que tenga una «mayor densidad de frecuencias». Una vez determinado el correspondiente (Li_ 1, LJ basta con sustituir las frecuencias absolutas de los intervalos adyacentes por sus cor~espondiente~ densidades de frecuencias con lo que la expresión de la moda en este caso será:
i-1
Conclusión: la recaudación que más se repite en los establecimientos comerciales es de 213.000 euros.
La moda tiene una serie de ventajas tales como:
n.
h.=_. 1 ci
Mo=Li-l+h
0,14 . ·50= 213 mtles de euros 0,40 + 0,14
+
h
·ci i+l
-
Es la única medida de posición central que puede obtenerse en las variables de tipo cualitativo que sólo admiten la escala nominal ya siempre podemos determinar la modalidad que más se repite en el estudio de un determinado atributo. Es de sencillo cálculo. Es de fácil interpretación ya que nos da directamente el valor de la variable que más se repite.
Como inconveniente hay que señalar que en su determinación no intervienen todos los valores de la distribución (caso de las medias) ni todas las frecuencias (caso de la mediana) centrándose sólo en la mayor frecuencia absoluta de un determinado valor de la variable.
90
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
2.5.6.
Otras medidas de posición no centrales: los cuantiles
Hasta ahora hemos estudiado las medidas de posición central ya que de una forma u otra se ha buscado un valor representativo de todo el conjunto de la distribución. Las medidas que denominamos cuantiles son valores de la variable que dividen a la distribución en partes proporcionales, o sea, en intervalos que contienen el mismo número de observaciones. Es evidente que la medida de posición central que hemos llamado mediana es un cuantil ya que es un valor de la variable que la divide en dos partes iguales a la distribución.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
91
valor de la variable y si lo iguala es la media aritmética de ese valor y el siguiente igual que ocurría cuando se obtenía la mediana. En el caso de los tres cuartiles (Q 1 , Q2 y Q3) la expresión rN q
será
1N
2N
4
4
que como coincide con la M. simplificando es
N/2
y
3N para Q3 . 4
Definición 2.13. Cuantiles Llamamos cuantiles a aquellos valores de la variable que dividen a la distribución en intervalos que tienen un número de frecuencias absolutas proporcional a una constante comprendida entre O y 1. Los más conocidos son: -
Los cuartiles (Q¡) que son tres valores que dividen a la distribución en cuatro partes iguales. Los deciles (D;) que son nueve valores que dividen a la distribución en diez partes iguales. Los percentiles (P ¡) que son noventa y nueve valores que dividen a la distribución en cien partes iguales.
En el caso de los nueve deciles las expresiones de las frecuencias acumuladas ascendentes que nos lo determinan serán: 1 Para D 1 la frecuencia absoluta acumulada N 10 2 Para D2 la frecuencia absoluta acumulada N 10
9 Para D9 la frecuencia absoluta acumulada N 10 Cálculo de cuantiles en distribuciones no agrupadas en intervalos de clase Como la mediana es un caso particular de cuantil, ya que divide a la distribución en dos partes iguales, las reglas de cálculo que se vieron para rN obtener M. son válidas para obtener los distintos cuantiles: se calcula q siendo r el cuantil correspondiente, q el número de intervalos con iguales frecuencias en que se divide la distribución y N el número tqtal de datos,u observaciones; seguidamente se construye la NJ (los valores de la variable siempre están ordenados de menor a mayor) y se observa cuál de los NJ supera rN o iguala a - . Recordemos que en el caso de la mediana r = 1 y q = 2 con q rN lo que la expresión es N/2. Si NJ supera a - el cuantil es el correspondiente q
Para los percentiles:
Para P 1 la frecuencia absoluta acumulada
Para P 2 la frecuencia absoluta acumulada
Para P 99 la frecuencia absoluta acumulada
1N
100 2N
100
99
N
100
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
92
93
Puede observarse que Q 2 coincide con la mediana ya que
Ejemplo 2.30
120 N/2=-=60 2
'
En la distribución del ejemplo 2.27 de las puntuaciones ~e 120 alumnos determinar los tres cuartiles, el séptimo decil y el 99.o percentil. X¡
n;
NT
1 3 4
20 30 20 40 7 3
20 50 70 110 117 120
5
7 9
y observando en N/ es N1 = 70 el que cumple la condición de ser la primera igual o mayor que N /2 con lo que su correspondiente valor de la variable o mediana es M. = 4. La frecuencia absoluta acumulada ascendente que nos determina el séptimo decil será:
'
7N 7 ·120 840 10=10=10= 84
Solución: Las frecuencias absolutas acumuladas ascendentes que nos d~terminan los
tres cuartiles son: 1N
=
2N
4
99N 99 ·120 100 =---¡()() = 118,8
240 = 60 para Q2
=
4 3N
4
Observando la columna Nf es el último valor N~ condición con lo que:
360
=
4
=
120 el que cumple la
90 para Q3
N/ los tres cuartiles son:
= 3 , Q2
=
4
y
Q3
=5
ya que son los tres valores de la variable x 1 que. se corresponden con N i2 = 50
=
4
Luego observando en la columnas Q1
La frecuencia absoluta acumulada ascendente que nos determina el 99. 0 percentil será:
120 = 30 para Ql
4
Observando en la columna N[ es Nl = 110 el que cumple la condicioin con lo que el séptimo decil es el valor de la variable correspondiente:
,
Ni3 = 70 y
Nl = 110
que son las frecuencias absolutas acumuladas que ~umplen las condiciones de ser las primeras mayores o iguales que las respectivas 1N 4
2N 4
3N
y
--¡-·
Cálculo de cuantiles en distribuciones agrupadas en intervalos Este problema se resuelve de forma idéntica que en el caso de la mediana. Luego la fórmula de determinación es la misma sólo que en vez de una frecuencia absoluta acumulada ascendente de N /2 será en términos genéricos la de los cuantiles hasta rN. Por tanto, para determinar el cuantil de orden r q
y número de intervalos iguales q, o sea
crfq'
será:
rN
-q - NJ_l
C,¡q = L 1_ 1 +-=----·e; n;
94
CASAS-SÁNCHEZ, J. M. y SANTOS-PEl'ílAS, J.
Todo el procedimiento de determinación estudiado en la mediana es aplicable al cien por cien al caso de los cuantiles. Ejemplo 2.31
En la distribución de frecuencias del ejemplo 2.29 referida a las ventas mensuales de 100 establecimientos comerciales. Calcular: a) El nivel de venta que no es superado por el 25% de los esta~lecimientos. b) El nivel de venta mínimo que recaudan el15% de los comercios que más venden. Solución:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
b) El nivel de ventas mínimo que nos piden nos lo proporciona el percentil 85 ya que es el valor que nos deja a su derecha, por encima de él, un 15 % de los comercios con las mayores ventas. La frecuencia absoluta acumulada ascendente que lo determina es: 85N
Observando en la columna Ni vemos que N~ = 90 nos determina el intervalo donde se encuentra el percentil 85 que es (200-250]. Aplicando la fórmula de determinación:
Pas = L;-1 n;
Ni
[75-200] (200-250] (250-300] (300-400]
50 40 7 3
50 90' 97 100
4
=
100
4
=
+
85N --N 100 i-l n;
e;= 200
+
85 - 50 40
·50= 243,75 miles de pesetas.
l
a) El nivel de ventas que nos piden corresponde al va~or de_l primer cuartil; luego la frecuencia absoluta acumulada que nos determma el mtervalo donde se encuentra es:
1N
85·100
1oo =100= 85
En la distribución del ejemplo 2.29 hay que obtener la columna de las frecuencias absolutas acumuladas ascendentes quedando: (L;_ 1 - LJ
25
Conclusión: el nivel de ventas mínimo que corresponde al 15% de los comercios que más venden es de 243.750 euros.
2.6.
Momentos
Los momentos son medidas obtenidas a partir de todos los datos de una variable estadística y sus frecuencias absolutas. Estas medidas caracterizan a las distribuciones de frecuencias de tal forma que si los momentos coinciden en dos distribuciones diremos que son iguales, siendo más semejantes cuanto mayor sea el número de momentos que coinciden. Se define el momento de orden h respecto al origen de una variable estadística a la expresión:
Observando en la columna Ni cumple la condición de igualarla o sup~rarla por primera vez el primer valor Nl = 50 con lo que el intervalo es el pnmero [75-200]: 1N _ r 4 N;-1
25-0 . Ql = L;_ 1 +----c.= 75 + --·125 = 137,5 mtles de euros. n; ' 50 Puede observarse que al aplicar la fórmula de determinación, al ser el primer intervalo de la distribución donde se encuentra el primer cuartil, el Ni =O ya que antes del primero no existe ninguna frecuencia acumulada. L~-r~spuesta al problema planteado es que son 137.500 euros el nivel de ventas que no es superado por el 25 % de los establecimientos comerciales.
¡'
~~~ ..
95
Algunos ejemplos son: si h = 1, a 1 = x que como sabemos es la media aritmética; si h =O, a 0 = 1; ah es la media aritmética de los valores observados elevados a la potencia h. El momento de orden h respecto a la media aritmética o central de una variable estadística es:
siendo
x la media aritmética de la variable estadística.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
96
Los cambios de escala y origen en el cálculo de los momentos respecto a la media
Ejemplos: si h = 1,
m
1
1 N
1
r
¿
=-
97
(x; - x)n;
= N
i=l
1
r
.L 1=1
x.n. 1 1 - - .X N
L
n; = .X - .X = O;
i=l
Los momentos respecto a la media se ven afectados por los cambios de escala pero no por los cambios de origen. Si se realiza la transformación siguiente:
si h = 2, se denota m 2 = s2 y se llama «varianza» que es la medida de dispersión absoluta que se estudiará más adelante.
x¡- 0 1
y¡=--c-
resulta que Relaciones entre los momentos Todo momento respecto a la media puede expresarse en función de los momentos respecto al origen de órdenes menores o igual al orden del primero. Para ello usamos el binomio de Newton:
(x; - x)h
Demostración:
'Lh (-1Y·(h)h'' . x;- 1x1
=
1
j=O
Así:
1L
mh = N
=
r
i= 1
L h
j=O
1L LhL (-1)1(h). h-·-·]
(x; - x)hn; = N
r
X;
i= 1
1 -
N
1,
r
)
x n; =
1
·=o
·(h)x·( 1.L x?- n;
(-1)1 . 1
1 1
=
·G) -·
h (-1Y . .~
ah_i,Xl.
.X= 0 1 + Cy.
rO
1=1
También cualquier momento respecto al origen,
ah,
se puede expresar en
función de mh- i y .X. Un caso particular de especial relevancia es m 2 :
2 ·(2)
En la demostración anterior se ha tenido en cuenta que los cambios de escala Y. origen sí ~fectan ambos a los momentos respecto al origen ya que como se VIo en la pnmera propiedad de la media aritmética, que es un momento de orden uno respecto al origen,
(2) (2) - (2)-2
m2= i~O (-1Y j a2-}J= O a2o
1 a¡x+ 2 x, =
Los momentos se utilizan constantemente en la Estadística Descriptiva en el cálculo de medidas de dispersión, de asimetría y de apuntamiento o curtosis como se verá en los próximos epígrafes.
2. 7.
Medidas de dispersión '
es decir, la varianza coincide con el momento de orden 2 respecto al origen menos la media aritmética elevada al cuadrado.
Las medidas de dispersión tratan de medir lo más o menos esparcida que se encuentra la variable estadística entorno a una medida de posición o de tendencia central, indicándonos lo representativa que es la medida de posición. ~ mayor dispersión, menor representatividad de la medida de posición, y viceversa.
98
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Algunas medidas de dispersión absolutas (dependen de las unidades de medida de la variable) o relativas (están definidas por cociente y no.dependen de las unidades de medida de la variable) vamos a definirlas a continuación. Las medidas de dispersión absolutas sólo tienen sentido cuando vienen acompañadas de un promedio. Las relativas permiten comparar la dispersión de distintas distribuciones. a)
b)
a)
La varianza siempre es positiva:
Para probarlo:
V i = 1, 2, ... , r: oo > (x, -
= x,- x 1 = máx{x,}- mín{x,} para 1 ~
i ~
r
xfn, ~ O
por lo que dividiendo entre N, y sumando en todos los valores de la variable tenemos:
Intervalos intercuantflicos: • Intervalo intercuartílico, I
=
Q3
• Intervalo semiintercuartílico, (Q 3
Q1 -
-
Qt>f2.
• Intervalo intercuartílico relativo, (Q 3 • Intervalo 10- 90 por 100, D 9
-
D 1.
• Intervalo 7 - 93 por 100, P 93
-
P7•
-
2
La. varianza S = O cuando x, - x = O V i = 1, ..., r , o sea los valores de la variable coinciden con la media aritmética.
Q 1 )/Me.
b) La desviación cuadrática media de una variable estadística respecto de ~na con~tante k, se hace mínima en k = x en cuyo caso la desviación cuadrática medta respecto a x es la varianza s2 • Veámoslo: sea
etc. e)
Propiedades de la varianza, s2
Recorrido, rango o intervalo de variación: R
99
Medidas de dispersión respecto a la media aritmética: • Desviación absoluta media respecto a la media, da . • Vananza, s2
1 ¿~ =N
(x,- x-)2 n, = m2 = a 2
-
=
1 r N ,~ Jx, -
1
xJn,.
1 r f'(k) =N ,~ 2(x, - k)( -1)n,
1
x-2 .
<=1
• Desviación típica, s =
2
¡;;;;_ = J a
2 -
f"(k)
x• 2
• Coeficiente de variación de Pearson, sjx, que es la medida de dispersión relativa que más se utiliza para comparar la dispersión de distintas distribuciones. Las unidades en que se miden las medidas de dispersión son las mismas de los datos (por ejemplo: da, s, R, I, etc.), o en unidades al cuadrado (por ejemplo: s 2 ) o son magnitudes escalares independientes de las. unidades d& medida (por ejemplo: intervalo intercuartílico relativo, sjx, etc.). A efectos de comparar las dispersiones de dos o más variables estadísticas en las mismas o distintas unidades, se realiza habitualmente a través del coeficiente de variación de Pearson, sjx, como hemos indicado anteriormente. Existen otras muchas medidas de dispersión, pero las más usadas utilizan la varianza, por lo que la vamos a estudiar algo más.
r
=O
k =
=>
x
1
= N ¡~ n, = 2 > O, luego x es mínimo.
Queda comprobado que: f(x)
=
s2 •
e) Método abreviado de cálculo de s2 : Como en el método abreviado de cálculo de la media aritmética vimos que: x¡ =
ahora
ey¡ + ot = x = c.v + 0
, 1
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
100
útil cuando o, es un valor 0 dato central de la variable estad~stica X y ,c. es la distancia 0 separación entre dos datos consecutivos de la vanabl~estadtsttca X. Como la s2 es un momento de segundo orden respe~to a la me~ta, volvemos a comprobar que a éstos no les afecta el cambio de ongen pero Sl el de escala.
d) Cálculo de la varianza a través de los momentos respecto al origen: Como ya se demostró en el apartado de los momentos:
s2 m2 Jo (-1){~}2- ii (~}2 -G)alx + G)x2 =
=
=
=
-2 -2
a2 - 2x + x
=
=
-2
El coeficiente de variación de Pearson es: S
i
=
j79i8o 5/4
:::!:
0,7949842
En la variable estadística presentada en la distribución agrupada de frecuencias del ejemplo 2.16, a2 =
1 25
(7.000 2 • 3 + 11.000 2 • 4 + 15.0002 • 7 + 19.000 2 • 5 + 23.000 2 • 6) =
1
a2 - x 1
101
=
s2 = a2- x2
1
Relación muy importante desde el punto de vista práctico.
25 10 6 (49. 3 + 121· 4 + 225.7 + 361· 5 + 529. 6) =
= 4. 104 . (147
+ 484 + 1.575 + 1.805 + 3.174) = 40.000. (7.185) = 287.400.000;
Sabemos, por el mismo ejemplo 2.16 que la media aritmética es:
x=
Ejemplo 2.32 La varianza de la variable estadística presentada en el ejemplo 2.15 se puede obtener así:
16.120;
por todo ello, la varianza resulta ser: s2
x2 =
= a2 -
287.400.000- 16.1202 =
= 287.400.000- 259.854.400 = 27.545.600
La desviación típica es:
donde
S
y por el mismo ejemplo 2.15 la media aritmética es:
=
p
x=-· 4' luego
2S
-
51 20
(~)2 =51 4
La desviación típica será:
20
- 25 = 204 ~ 125 = 79 16 80 80
5.248,3902
y el coeficiente de variación de Pearson: S
5
:::!:
::- :::!:
0,3255825.
X
Como se ha comentado, la desviación típica, como medida de dispersión absoluta, expresada en las mismas unidades que la variable estadística, tiene significado si se compara con el valor de la media aritmética. En este caso supone aproximadamente 1/3 de la media con lo que podemos concluir que ésta es bastante representativa de todo el conjunto de datos, ya que se puede considerar que la dispersión es baja. El coeficiente de variación de Pearson por su definición por cociente nos indica lo que representa la dispersión (s) en razón al promedio (x). Cuanto más se aproxime a la unidad mayor dispersión existirá en los datos observados y peor será la representatividad del promedio.
102
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
A partir de la unidad el promedio no representa bien como medida de tendencia central al conjunto de datos y debe descartarse.
2.8.
103
La curtosis o apuntamiento surge al comparar la forma de una variable
Medidas de asimetría y curtosis
n¡
Una distribución es simétrica si y sólo si el diagrama de barras que la representa es simétrico respecto de la recta x = x, siendo x la media aritmética. Es fácil comprobar además que si una distribución es simétrica, el momento m3 = O, pero no al revés, es decir, de que m3 = O no se deduce que la distribución es simétrica. Se han propuesto distintas medidas de asimetría para variables estadísticas; entre ellas destacamos el «coeficiente de asimetría de Fisher»:
o
X
Si g 1 > O, la distribución es asimétrica positiva o a la derecha: estadística con respecto a la distribución llamada normal Se mi"de f d , . un amentalmen te por e1 coefiICJente de curtosis de Fisher:
n¡
q2
Si .>O, tiene más apuntamiento que la distribución normal, y se llamará 1ep~ocurtic~. (El grado de apuntamiento de la normal es tres como se indica en a antenor expresión de Fisher.)
o
X
Si g 1 = O, la distribución puede ser simétrica o no; si ésta es simétrica se dará siempre g 1 = O. Si g 1
O y b constantes, transforma distribuciones simétricas en otras simétricas (y asimétricas en asimétricas).
Si g2 =O, la distribució~ t~ene un apuntamiento similar a la distribución normal, y se llamará mesocurtlca. Si g2 < ti:ne menos apuntamiento que la distribución normal y se 11 amará platicurtica. '
?, ,
Ejemplo 2.33
Sea la variable estadística asimétrica siguiente:
o 5/9
1
2 3
104
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J. DISTRIBUCIONES DE
Veamos que su coeficiente de asimetría es cero, por ser m3 = O. En efecto:
FRECUENCIAS UNIDIMENSIONALES
105
Denotando P;
NT
= ~
·100
u.
y
q¡ = ~·100
(i = 1, 2, ... , r)
u,
donde p
'
= 100 y q
_ , d' ' - 100' e1 m Ice de concentración de Gini es r-1
¿
1 -
G-
1 1
=-·-·0=0 3
6 9
r-1
L
•
1=1
Este ejemplo comprueba que si el coeficiente de asimetría de Fisher g 1 =O, la variable no necesariamente es simétrica. Aunque la simetría implica m3 = O, y por tanto, g 1 =O. Luego una condición necesaria, aunque no suficiente, para que una variable estadística sea simétrica, es que su coeficiente de asimetría de Fisher g 1 sea igual a cero. Simetría implica g 1 = O pero g 1 = O no implica simetría.
2. 9.
(p¡- q¡)
_i=_1_.,......_ _
Medidas de concentración
P;
Para obtener el índice de Gini e . que por un proceso sucesivo de cál s lcon;emente construir la tabla 2.14 ya nos definen dicho índice. La col cu o o tenemos las columnas q¡ Y P; que ' . umna X;n; nos da el reparto del total de recursos L x n entre 1 d. . . i= 1 ; ; os Istmtos elementos de la distribución dados por las frecuencias absolutas n;. Las columnas Ni . 1 de recursos (u¡) y de ind' 'd Y u; nos dan la evolución acumulada lVI uos que se los reparten (Ni) p , . nos representa dicha evolución d ; · or último, q1 y p. expresa a en porcentajes. ' TABLA 2.14.
En esta sección trataremos el índice de concentración de Gini y la curva de Lorentz, como instrumentos válidos para analizar la mayor o menor concentración en una distribución de rentas de los individuos que las reciben.
X¡
n;
X¡
x¡n¡
n¡
x 1n 1
Elaboración del índice de Gini.
N! '
Nt1
I
U¡= j
=
U¡
i xjnj
= -·100 u,
q¡
=-·100
índice de concentración de Gini x2
xini,
x2n2
Nf2
u2
=
X¡n¡
+ x2n2
n;
xini
(i = 1, 2, ... , r)
N! '
U¡=
I
= -·100
xjnj
j= 1
U¡
q¡
= -·100 u,
j=1
a la renta total percibida por los rentas
NJ
primeros rentistas, supuesto el orden de
x,
n,
N
x1
~
x2
~ .. · ~ X; ~ .. · ~
x,.
__3:!}__
N
ur
=
I
i=l
I
i=1
xin¡
Nt
xjnj
Pt
u2
q2
u,
X¡
I,
u1 =
n2
Pt = ; ·100
U¡
X¡n¡
u,
Consideremos la variable estadística X {(x 1, n1): i = 1, 2, ... , r}, donde X; es la renta de los n1 individuos, que ordenados en sentido creciente de rentas, ocupan los lugares N/_ 1 + 1 hasta N/. Llamamos
N!
U¡
q¡
1
100
p2
= -...!·100 N
Ni =~·100 N
N!
P· = --..!.·100 ' N
100
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PE:Ñ"AS, J.
106
Si la concentración de renta es mínima, es decir, si la renta está repartida por igual entre los N individuos, X¡= x =cte., lo que implica: U¡= xN[, y esto implica a su vez q¡ = p¡, por lo que la renta está equidistribuida, e
Si la concentración de renta es máxima, es decir, sólo el último individuo percibe toda la renta:
107
concentración máxima de la renta corresponde a la curva que partiendo de (0, O~ llega a (100, O) mediante un segmento, y de (100, O) llega a (100, 100) medmnte otro segmento. Conviene añadir que el índice de Gini es aproximadamente el área sombreada (entre la diagonal y la curva de Lorentz) dividida por el área del triángulo de vértices (0, 0), (100, O) y (100, 100). Ejemplo 2.34 En .una emp~esa existen cuatro categorías profesionales y cada una tiene . unos mveles de mgresos mensuales diferentes. La distribución de frecuencias que expr~sa los niveles de ingresos y el número de personas en cada categoría es la s1gmente:
por lo que
El índice de concentración de Gini puede tomar gradualmente valores de O a 1, según pase de la equidistribución hasta el caso opuesto ~e concentración máxima de la renta en un solo individuo.
(niveles de ingresos expresados en euros)
n,{ N. 0 de personas)
1.000 2.000 3.000 4.000
25 10 4 1
X¡
Curva de Lorentz Es la gráfica 2.19 de los puntos (p¡, qJ, i = 1, 2, ... , r en el plano cartesiano. La curva parte de (0, O) y llega a (100, 100). El caso de equidistribución de la renta corresponde a la diagonal que une (0, O) con (100, 100), y el caso de
Obtener el índice de Gini y la curva de Lorentz. Solución:
q¡% ) 0 - + - - - - - - - - - - - - - " " A ! (100, 100)
Vamos a construir las columnas que se necesitan para resolver el problema:
NT
P· = ---'- · 100
NT N
U¡
q¡=~·100
25 35 39 40
62,5 87,5 97,5 100,00
25.000 45.000 57.000 61.000
40,98 73,77 93,44 100,00
'
'
u. u,
El índice de Gini será: (lOO, O)
(0, 0) GRÁFICO 2.19.
Curva de Lorentz.
·p¡%
1 = (62,5 - 40,98) G
+ (87,5 - 73,77) + (97,5 - 93,44)0 159 62,5 + 87,5 + 97,5 - •
·T,.,.., ,-~¡.
108
CASAS-SÁNCHEZ, J. M. y SANTOS-PEJ\IAS, J.
Ejercicios
que al tomar un valor próximo a cero se puede concluir que existe una buena · equidistribución en los ingresos. La curva de Lorentz será:
l. Para asistir a un partido de fútbol hay dos tipos de entradas: adultos a 40 euros y niños a 5 euros. Sabiendo que el precio medio resultó de 12 euros. ¿Cuál fue la proporción de asistentes adultos? Soluci6n:
La variable estadística está compuesta por dos datos: x 1 = 40 euros y x 2 = 5 euros., con frecuencias relativas respectivamente de: f 1 y ! 2 = 1 - f 1 • La media aritmética es:
o
62,5
87,5 97,5 Pi
es decir: 12
=
40!1
+ 5(1- ft)
=
35!1
+ 5.
Luego:
es la proporción de asistentes adultos. (Por tanto f 2 = 1 - f 1 = 0,8 fue la proporción de niños espectadores entre el total.)
2.
Una empresa tiene cuatro áreas de producción. Cada área produce un número distinto de bienes o servicios, que llamamos productos. Los ingresos totales y el rendimiento por producto de cada área son:
Área 1
2 3 4
Ingresos totales (euros.)
Rendimiento/producto (euros.jprod ucto)
100.000 720.000 500.000 360.000
500 1.000 25.000 90.000
110
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Calcular el rendimiento medio por producto para el total de áreas de la empresa.
Solución:
. . de producción . ( i't Los ntmos med10s
Solución:
d e calI'da d (-r2
El rendimiento medio por producto será: siendo n; el número de productos del área i( = 1, 2, 3, ó 4) y
=
número productos) y de control . tiempo t 1
= número .
productos) son: tiempo t 2
n.
4
x = L X; .r:r,
'111
X;
i= 1
el número de ptas. por producto del área i. donde: y
=
100.000 500
n2
=
720.000 1.000
n3
=
500.000 = 20 productos, 25.000
n4
=
360.000 90.000
n1
=
200 productos,
x1
y
=
500 euros/producto
r2 =!!.. = =
=
720 productos,
4 productos,
x2
y
x3
y
y
x4
=
=
=
1.000 euros/producto
25.000 euros./producto
=
L n; =
200
+ 720 + 20 + 4 =
;=1
944 productos en total de todas las áreas.
t2
=.E_=..!!._) r2 60
r=
número transformaciones en total - _p_+_p_ tiempo en realizarlas 2
2
1
1
30
60
=
_2_p_
= __ 2_
120
= 2 + 1 = - 3- = 40 transformaciones/hora.
-+- - 60
Que es la media armónica de los ritmos medios de producción y control de calidad.
Luego
1
4
x =- L
1 X;n; = -
N ;= 1 1 = 1.680.000 944
3.
(=>
El ritmo medio de tranformación es:
90.000 euros./producto
4
N
60
t2
944
~
(100.000
+ 720.000 + 500.000 + 360.000) =
1.779,66 euros/producto para el total de áreas
de la empresa.
Un sistema industrial realiza dos tipos de transformaciones: «producción» y «control de calidad». El ritmo o velocidad media de producción es de. 30 bienes/hora. El ritmo o velocidad media de control de calidad de la producción es de 60 productos/hora. Calcular la velocidad o ritmo medio de ambas transformaciones, supuesto que el control de calidad afecta a toda la producción.
4. En cierta comunidad se han censado los establecimientos hoteleros según el número de empleados, y los datos se han presentado en una tabla agrupada de frecuencias: N. o de empleados
N. 0 de hoteles
Oa5
125 60 13 2
5 a 15 15 a 50 50 a 200
200
112
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Se pide: El número de hoteles con más de 5 empleados de esa comunidad. El número de hoteles con más de 5, y menos o igual de 15 empleados. e) Representar gráficamente la variable número de empleados. d) Calcular la mediana del número de empleados y explicar en qué hipótesis nos basamos para realizar dicho cálculo. a) b)
113
l~ego l~ mediana, M. se. encuentra en el primer intervalo (0, 5], y bajo la hipóhtests de que .en éste mtervalo la distribución del «número de empleados por otel», es umforme: M e = O+
100-
o
125
· 5 = 4 empleados
Solución: a) El número de hoteles con más de 5 empleados es el total de hoteles (200) menos el número de hoteles con 5 o menos de 5 empleados (125):
5~ Una empresa distribuidora de bienes de consumo conoce el número de clientes que demandan estos bienes, según su cantidad distribuida
Es decir: 200 - 125 = 75 hoteles tienen más de 5 empleados Nos piden la frecuencia absoluta del intervalo (5, 15] de «número de empleados». En la tabla agrupada de frecuencias, se asigna a éste intervalo la frecuencia absoluta 60 hoteles.
Distribución
Clientes
0-1.000 1.000-2.000 2.000-4.000 4.000-6.000 6.000-8.000
8 15 45 30 2
b)
e)
Mediante el histograma de frecuencias:
N. 0 de hoteles Amplitud lnt. 0
100
1;5 = 25
Calcular: El porcentaje de clientes que demandan más de 1.000 bienes de consumo, y 6.000 o menos. b) El número de bienes más demandado. a)
Solución:
a) 13/35
2/150
De 1.000 a 2.000 hay 15 clientes De 2.000 a 4.000 hay 45 clientes De 4.000 a 6.000 hay 30 clientes De 1.000 a 6.000 hay 90 clientes
200
50
N. 0 de empleados
d) La frecuencia total es N = 200. Luego debemos calcular la posición de N/2 = 200/2 = 100. Pero 100 verifica:
0:::;100
'
. Como. en total hay 100 clientes, 90 clientes representan el 90 % de los clientes. ~~ en total hubiera N clientes, se obtendría por una regla de tres el porcentaje: 9 0 - N} 9.000 x - - 100 x=N%
La moda, bajo el supuesto contemplado en la teoría, se calcula así:
b)
M = 2.000 + o
0,015 · 2.000 0,015 + 0,015
=
. 3.000 btenes.
Ahora: H
~
~
G
6.
Dada la siguiente distribución que refleja la variable estadística «productividad» en cierto sector económico: Intervalos
Frecuencias
0-10 10-30 30-50
32
115
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
114
2x 1 x 2 + X1
Xz
~
~
~
~
...,¡ x 1 x 2
2...,¡ x 1 x 2
+ 2x 1 x 2 + x~
~
4x 1 x 2 ~ xi
~
xi - 2x 1 x 2 + x~
=
(x 1
x1 + x 2
~
~
x 2) 2
-
~
;;:,
O cierto.
También: 1 Fx0z ~ 2(X¡ + X2)
8
10
~
. X¡Xz
~
~
1 2 . 4(x 1 + 2x 1 x 2 +
2
x 2)
Calcular la media, mediana y moda. Solución:
Media:
a=
1 50
(5 · 32 + 20 · 8 + 40 · 10) =
720
5o =
14,4
25- o 125 - ~ 7' 8125 M ediana·• M e =O+ - -32· 1 0 =16 Moda:
7.
8/20 , , M o = O+ + ·10 = 10; se puede calcular segun se ve en teona, 0 8120 pues de existir, la moqa se situaría en el intervalo 0-10, pero no existe frecuencia no nula para ningún intervalo inferior.
8.
Los pesos en gramos de cierto producto agrícola, han sido anotados, así como la frecuencia de presentación en un cierto lote del producto. Pesos: Frecuencia:
70
74
4
9
78 16
82 30
86 44
90 36
94 20
98 12
102 6
Calcular la media y la desviación típica de los pesos, con y sin cambio de variable. Solución:
Demostrar que si los datos x 1 y x 2 son positivos, entonces H~G~x,
siendo H, G y .X, las medias armónica, geométrica y aritmética respectivamente, para dichos datos.
Media:
x=
1 (70·4 + 74·9 + 78·16 + 82· 30 + 86-44 + 90· 36 + 94·20 + 177
+ 98. 12 + 102. 6)
Solución
=
1 177 (280 + 666 + 1.248 + 2.460 + 3. 784 +
+ 3.240 + 1.880 + 1.176 + 612)
=
1 -15346 177
~
86 700565 '
Con cambio de origen y escala:
G=JY;
Sea 0 1 = 86
y
C=4
X
=4y + 86
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
116
117
y= _1_((-4)·4 + (-3)·9 + (-2)·16 + (-1)· 30 + 0-44 + 1· 36.+ 2-20 + 177 1 + 3 12 + 4. 6) = - -(- 16 - 27 - 32 - 30 + 36 + 40 + 36 + 24) . 177
Entonces: = S
1 31 :::= 0,1751412 177
=
C · Sy
=
4sy
~
7,0739156
La variación en millonésimas, entre las dos formas de calcular la desviación típica de la variable x, se debe a la correspondiente aproximación de decimales.
= -·
Entonces .X= 4y + 86 = 4.
31 + 86 :::= 86,700565 177
9.
En un determinado país se sabe que la renta media es de 2.000.000 de ·u.m.jaño y su varianza es 90.000 (u.m.) 2 en ese año. Cinco años despúes, la renta media se elevó a 2.600.000 u.m.jaño, y su varianza resultó ser 125.000 (u.m.) 2 • Determinar:
Desviación típica: s=
J?' = J az -
a) ¿En qué año, inicial ó 5 años después, hubo mayor dispersión absoluta? b) ¿En qué año hubo mayor dispersión relativa?
1339364 - (15346)2 :::= 7,0739122 177 177
2
a =
donde a2
=-1-(702·4+ 742·9 + 782·16 + 822 ·30+ 86 2 -44 + 902 ·36 + 94 177
+ 982 ·12 + 1022. 6)
=
1~7(19.600 + 49.284 + 97.344 +
+ 291.600 + 176.720 + 115.248 + 62.424) =
2
·20+
Solución: a)· La dispersión absoluta se mide por la varianza:
201.720 + 325.424 +
364 7567 0282 177 :::= '
1.3 39 ·
90.000 = s~ <
si = 125.000 (hubo mayor dispersión absoluta 5 años después).
b) La dispersión relativa se mide usualmente por el coeficiente de variación de Pearson:
Con cambio de origen y escala: Sea 0 1 = 86
+ 22·20 + 32·12 + 42·6)
Y
C=4
= 1~7(64 +
+ 96)
=
X=
4y
+ 86
81 + 64 + 30 + 36 + 80 + 108 +
1 -559 :::= 3,1581921 177
J9o:OOo xo
s0 s 1 .)125.000 _ _ = > _x = . _ ~ 0,00013598207 2 600 000 2 000 000 1 (hubo mayor dispersión relativa el año inicial)
o,ooo15
=
Aunque la dispersión absoluta ha aumentado tras los cinco años, y por ello cabría suponer que las desigualdades en la renta han aumentado, con la dispersión relativa se constata una disminución en las desigualdades económicas de la renta percibidas, por lo que podríamos concluir que se ha avanzado en la disminución relativa de las «desigualdades sociales» o «no redistribución de la renta», en cuanto a la renta percibida en relación a las medias de la renta de cada año, según la información del enunciado del problema.
118
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
10.
Una variable estadística, que mide el saldo de una cuenta corriente a fin de año, presenta los siguientes datos en tres años consecutivQS:
pues
10.000 euros 80.000 euros - 10.000 euros
(i = 1, 2, o 3)
denotando por
Obtener la media geométrica y comentar el resultado.
X;i
la factura j-ésima cobrada en el albarán tipo i; i
Solución: g
= .V1o-1o 3 . 80·10 3 ·( -10)·10 3 = 1o 3
V-8.ooo =
= 1, 2 o 3
y
j = 1, 2, ... , N¡.
-2o.1o 3 =
= -20.000 euros< mín{10.000; 80.000; -10.000} Para estos datos, la media geométrica es una mala medida de posición pues se sitúa muy a la izquierda de, o inferior a, cualquiera de los tres datos disponibles y no entre ellos, como sería deseable en una medida de posición.
11.
Los datos de una variable estadística recogen las tarifas, de una compañía de transportes y distribución, cobradas en ijn período temporal, y son recogidas en tres tipos de albaranes según la cuantía económica de la mercancía. Los tres tipos de albaranes contienen todas las facturas cobradas a los clientes y cada factura, según su cuantía se recoge en un solo tipo de albarán. Si el número de facturas, en ese período, han sido de N 1 = 700, N 2 = 500 y N 3 = 25, para cada tipo de albarán, y en media aritmética el ingreso ha sido de x1 = 3.500 euros; x2 = 15.000 euros y x3 = 225.000 euros para cada tipo de albarán. Se pide: hallar el ingreso medio por factura del total de cobros.
12. Una empresa vende dos ~roductos X e Y. En su entorno, la distribución de ventas de est.os productos ttene las siguientes frecuencias (número de empresas con tal mvel de ventas): Ventas del producto X
Frecuencia
Ventas del producto Y
Frecuencia
0-40 40-100 100-300
25 54 21
0-100 100-500 500-2.000
52 63 85
100
200
Si la_ empresa vende 72 productos X, y 700 productos Y, ¿en qué producto X ó Y ttene mayor penetración relativa entre las empresas del mercado en su entorno?
Solución:
Llamando N= N 1
+ N 2 + N 3 = 700 + 500 + 25 = 1.225,
Solución:
al total de facturas o albaranes, la media aritmética pedida es: 72 = 40 3
1
X = N ;~ N; X¡ = 1.
1
1
=
1.225 (2.450.000
= 1.
1
225
(700 · 3.500
+ 100px - 25. 54
60
=>
Px =
+ 500 · 15.000 + 25. 2~5.000) = 700 = 500
+ 7.500.000 + 5.625.000) =
1 15.575.000 ~ 12.714,286 euros 225
119
=>
1 [ 25 100
+ 200Py- 115.
1 Py = 20 [115 0
85
+ (7oo-
+ (72 - 40)
1.500
54] = 0,538 60
=>
500)~J =o 6316 1.500 '
120
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Capítulo 3
De este modo hemos calculado Px y Pr que son las proporciones de empresas del entorno que venden menos del producto X, e Y; pues 72 ~s un cuantil Q de la variable estadística «Ventas de X», y 700 es otro cuanttl QPr Px de la variable «Ventas de Y». . En X la empresa supera en ventas al 53,8 % de las em~esas competidoras. En el producto Y, la empresa supera en ventas al 63,16% de las empresas de la competencia. Luego tiene mayor penetración en el sector del producto Y, que en el sector de vendedores del producto X.
Distribuciones de frecuencias bidimensionales
3.1.
Introducción
A lo largo del Capítulo 2 hemos estudiado con detenimiento el comportamiento de una sola característica o variable estadística que hemos medido u observado en un conjunto de elementos o individuos que formaban una población estadística o una muestra representativa de la misma. Pero podemos estudiar para cada elemento de la población dos o más características de tipo cualitativo (que como sabemos vienen dadas en escalas nominales u ordinales) o cuantitativo (medidas en escalas de intervalo o de razón). Como sabemos estas variables o características pueden ser de naturaleza continua (toma infinitos valores no numerables) o discreta (toma un número finito o infinito numerable de valores). Lo habitual es que se estudien al mismo tiempo varias características de los elementos de una población estadística. Consideremos, por ejemplo, que nuestro objetivo es estudiar las causas que originan los distintos niveles de los gastos de los individuos varones mayores de 18 años de la Comunidad de Madrid. Además de la mencionada variable, que normalmente se medirá en una muestra representativa de la población estadística (individuos varones mayores de 18 años en la provincia de Madrid), nos interesará medir otras características que pensamos que están relacionadas con ella: ingresos del individuo (variable cuantitativa continua), estado civil (variable cualitativa), número de habitantes del municipio donde vive (variable cuantitativa discreta), forma de locomoción que emplea con más frecuencia (variable cualitativa), aficiones que tiene (variable cualitativa), edad (variable cuantitativa continua o discreta si se expresa en años enteros).
122
Todas estas características influirán en distinto grado en los niveles de gastos y nos podrán explicar su comportamiento. En general, a mayores ingresos existirá un mayor gasto, los tramos de edad más bajos gastarán más ya que tendrán más movilidad y mayores aficiones lúdicas que comportan un mayor dispendio. Como es lógico podrá estudiarse separadamente cada característica construyendo su distribución unidimensional y calculando sus medidas de posición y dispersión, como se ha indicado en el Capítulo 2; pero lo normal e~ presentar conjunt~mente más de una carac~erística con el o?je~ivo de estudiar sus posibles relaciOnes y responder a cuestiOnes como las sigUientes: ¿en qué medida el nivel de ingresos determina el nivel de gastos?, ¿existe relación entre el nivel de gastos y la edad?, ¿y el estado civil?, ¿y el tamaño del municipio?, etc. En los apartados que siguen se estudiarán cuestiones tales como las distintas tabulaciones de las variables estadísticas bidimensionales y los nuevos conceptos que generan (distribuciones de frecuencias marginales y condicionadas), el concepto de independencia estadística, y la regresión y correlación entre variables;
TABLA 3.1.
~
Tabla de correlación
Yt
Yz
yj
Ys
ni.
Xz
nll nz¡
n¡z nzz
nli nzi
nls nz.
nL nz.
X¡
n;¡
n;z
nii
nis
n.
x,
n,¡
n,z
nrj
n..
n,.
n.i
n.l
n.z
n.i
n.•
N
X¡
r
Así N
=
Tabulación de variables estadísticas bidimensionales: distribuciones bidimensionales de frecuencias
n;i es la frecuencia absoluta total o número de unidades
i=l j=l
r
en la población. También: n.i
=
¿
s
¿
n;i y n;. =
contingencia.
3.2.1.
nii
j=l
Con lo que se construyen la última fila y la última columna de la tabla de correlación que se denominan frecuencias marginales. Considerando estas expresiones es evidente que: r
s
r
s
"L. n.l. = "L... n .J. = "L. · "L. nl).. = N i=l
Vamos a considerar dos tipos de tabulaciones: para variables cuantitativas y para variables cualitativas. En el primer caso el resultado de la tabulación recibe el nombre de tabla de correlación y en el segundo tabla de
..
s
¿ ¿
i=l
3.2.
123
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PENAS, J.
j=l
i=l j=l
Las tablas de correlación del tipo de la 3.1 se construyen cuando el número de observaciones es elevado y existe también un elevado número de pares de valores (x;, yi) en los que i = j ó i ,¡. j. También puede darse el caso que sea conveniente, para hacer la distribución más manejable, agrupar los valores de las variables en intervalos de clases con lo que los respectivos (x¡, yi) serían las correspondientes marcas de clase.
Tablas de correlación Ejemplo 3.1
Partimos de una población estadística en la que se estudian simultáneamente dos variables o características cuantitativas que nos definen una variable estadística bidimensional. Llamando X e Y a las variables consideradas, podemos construir la llamada tabla de correlación. Los datos en que se presenta la variable X, los denotamos X¡ (i = 1, 2, ... , r). Los datos en que se presenta la variable Y, los denotamos yi U= 1, 2, ... , s). Sea n;i la frecuencia absoluta con que se presenta el par simultáneo (x;, yi). La distribución conjunta o bidimensional será la de la tabla 3.1.
Se ha efectuado una encuesta a 100 familias preguntándoles sus ingresos anuales (X) y el número de miembros (Y) que los aportan. Los ingresos se han expresado en ·miles de euros y se han agrupado en cuatro intervalos de clases con lo que X¡ son las respectivas marcas de clases. Los resultados de la tabulación han sido los de la tabla 3.2 En la tabla 3.2 se observa que de las 100 familias sólo hay, por ejemplo, 15 en las que el dinero lo aparta una sola persona y sus ingresos están comprendidos entre 10.000 y 15.000 euros; 30 en las que los ingresos los aportan
TABLA
Tabla de correlación de los ingresos familiares y el número de miembros que los aportan
3.2.
~
3
2
1
S
-
12,5 17,5 25,0 40,0
10-15 15-20 20-30 30-50
n.i
15 10 12 1
2 20 30 2
1 2 4 1
18 32 46 4
38
54
8
100.
dos personas y están comprendidos entre 20.000 y 30.000 euros y así sucesivamente se interpretan las frecuencias absolutas conjuntas n;j.· Las marginales.n;. y n.i nos señalan el número de veces que se repiten los valores de X; e Yi por separado sin que se establezca entre ellas ninguna relación conjunta. Así de las 100 familias 38 tienen un sólo miembro que ingresa dinero, 54 dos miembros y 8 tres. Al observar los niveles de ingresos representados por X¡ vemos que 18 están en el primero, 32 en el segundo, 46 en el tercero y sólo 4 familias pertenecen al cuarto nivel de mayores ingresos. También se puede construir la tabla de correlación de frecuencias relativas sin más que dividir toda frecuencia absoluta por el número total de observaciones N:
Es inmediato comprobar que la suma de todas las frecuencias relativas es la unidad: r
r
S
S
1
n..
r
i=t i=t
N
N
S
I I hi=" I I _y_="_ I I i=t i=t
N i=t
n;j=-=1
N
i=t
Las frecuencias relativas marginales serán: S
h. =
s
r
fj
s
= I I hi = 1 i=1j=1
Ejemplo 3.2
X
L;
r
n;.
S
L¡_ 1
También se verifica que:
I h. = j=l I i=1
)
125
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
124
n;.
N =
"L. n lJ.. S S i= 1 " n;i " - N = .L.... N = .L.... hi J=l
J=l
r
r
r
_ n.i _
"L. nZJ.. i= 1
_
"
n;i _ "
fi - N - - N - .L.... N - .L.... ¡.=1
¡_:::::
1
hi
~ partir de la Tabla 3.2 obtener la tabla de correlación de frecuencias relatlvas.
Solución:
Dividiendo. to~as las frecuencias absolutas por el total de observaciones la tabla será la stgutente: TABLA
~
3.3.
Tabla de correlación de frecuencias relativas 1
2
3
h.
12,5 17,5 25,0 40,0
0,15 0,10 0,12 0,01
0,02 0,20 0,30 0,02
0,01 0,02 0,04 0,01
0,18 0,32 0,46 0,04
fj
0,38
0,54
0,08
1
?uanto exis~en pocas observaciones y las frecuencias son unitarias no tiene sentldo con~trmr una tabla de correlación ya que muchas de las celdillas de las frec~encms absolutas serían cero. En este caso, la distribución bidimensional es stmplemente dos columnas que se expresan de la forma siguiente: X¡
Y;
X¡
Xz
Yt Yz
X¡
Y;
x,
Yr
Así, por ejemplo, el valor de la producción (yJ expresado en millones de euros Y ~1 número de trabajadores (xJ de cinco empresas del sector de la · construcctón se tabulará de la forma siguiente:
126
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Y;
X¡
1.500 2.500 5.000 10.000 15.000
350 500 800 1.500 1.700
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
. Expresadas en forma de columnas las distribuciones marginales de frecuenCias de la Tabla 3.1 serían: ·
Aunque las frecuencias conjuntas no sean unitarias, si el número de pares de valores de la variable bidimensional es reducido, tampoco es necesario construir una tabla de correlación ya que es suficiente una tabulación a tres columnas de la forma siguiente: X¡
Y;
xl Xz
Y1 Yz
X¡
Y;
x,
Yr
127
X¡
n;.
xl Xz X¡
Yi
n•J.
nz.
Y1 Yz
n.l n.z
n;.
~j
n.
Ys
n .•
n~.
x,
n,_
;J
. J:?e est~s distribuciones marginales, como en esencia son distribuciones u_mdrmenswnales ya que expresan el estudio de cada variable con independenCia de la otra, pue~en obtenerse todas las medidas de posición, dispersión, etc. que ~e han :studiado en el Capítulo 2 de las variables unidimensionales (medias margmales, varianzas marginales, etc.).
n,
Ejemplo 3.3
N
Así, por ejemplo, la siguiente tabla es una tabulación de 500 empresas en las que se ha estudiado su nivel de producción en tres intervalos expresados en millones de euros, y su número de trabajadores: Producción (y;) [100-200] (200-400] (400-1.000]
Solución:
a)
N. 0 de trabajadores (x;) [20-50] (50-80] (80-200]
De la tabla de correlación 3.2 obtener las distribuciones de frecuencias marginales, la moda de Y y la media aritmética de X.
Distribuciones marginales de frecuencias:
300 150 50
12,5 17,5 25,0 40,0
• Distribuciones marginales de frecuencias Definición 3.1.
Distribuciones marginales de frecuencias.
Dada una distribución bidimensional de las variables (X, Y), llamamos distribuciones marginales de dichas variables a los conjuntos: {(x;, n;.):
i = 1, 2, ... , r}, distribución marginal de X
{(yi, n):
j = 1, 2, ... , s}, distribución marginal de Y
Luego las marginales de una distribución bidimensional es el estudio unidimensional de cada componente con independencia del otro.
n.
X¡
'· 18 32 46 4
b)
Moda de Y: M.= 2.
e)
Media aritmética de X:
yj
n. ·}
1
38
2
54
3
8
1 r X=-¿ x.n. =
N
1
i= 1
''·
= 100 [12,5 · 18 + 17,5 · 32 + 25,0 · 46 + 40,0 · 4] = 20.950 euros
128
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
Dada una tabla de correlación bidimensional siempre se pueden obtener sus dos distribuciones marginales con la simple suma por filas y columnas de sus frecuencias conjuntas. Pero la inversa no es siempre cierta; o sea, dadas las distribuciones marginales no siempre puede elaborarse de modo único la distribución conjunta (X, Y) = {(x¡, yi; n¡i): i = 1, 2, ... , r; j = 1, 2, ... , s}. Veámoslo con un ejemplo:
Si
6}
n1. = n 2. =
9 n3. = 15
n .1 =
6}
X
Análogamente se define la variable estadística Y condicionada a que denotándola
= X¡,
(Y 1 X
= X¡)
= {(yi, n;) : j = 1, 2, ... , s} para cualquier i
La frecuencia total de (Y 1X =
xJ es
~
b) Y!
Y2
Y3
n¡.
xl x2 x3
o
6 6 3
o
2 4
1 8
6 9 15
n. .J
6
15
9
30
~
... , r
S
n;. =
L
n;i .
Las frecuencias relativas condicionadas de las variables (X 1Y= yi) e (YI X= xJ serán respectivamente:
n. 3 = 9
son las frecuencias marginales de la variable estadística bidimensional (X, Y)= {(x¡, yi; n¡i): i,j = 1, 2, 3}, ésta no está determinada; para ello. podem?s proponer dos posibles variables bidimensionales distintas con las mismas distribuciones marginales:
a)
= 1, 2,
j=l
n. 2 = 15
y
129
Y1
Y2
Y3
n. '·
X¡
o 3 3
6 3 6
o
x2 x3
3 6
6 9 15
n..J
6
15
9
30
n ..
Jj¡; = n:J l.
Puede observarse que pueden definirse tantas distribuciones de frecuencias condicionadas como valores tienen las variables X e Y ya que cada una queda determinada por la f.tla o la columna del correspondiente valor que condiciona. Las distribuciones condicionadas también son unidimensionales y por tanto pueden obtenerse todas las medidas de posición y dispersión de las mismas.
Ejemplo 3.4 Esto comprueba que dadas las distribuciones marginales, no siempre se puede reconstruir la variable estadística bidimensional conjunta de modo único.
• Distribuciones condicionadas de frecuencias
De la tabla de correlación 3.2 obtener: a) La distribución de Y condicionada a que X = 175. b) Obtener la moda, media aritmética, la desviación típica, y el coeficiente de variación de dicha distribución. Soluci6n:
Definición 3.2. Distribuciones condicionadas de frecuencias. Dada una variable estadística bidimensional (X, Y), llamamos variable X condicionada a que Y= yi, y denotaremos (XI Y= y) a la variable estadística que toma los valores X¡ con frecuencia absoluta n¡J:
a) El valor que condiciona X = 175 nos define la segunda fila de frecuencias absolutas conjuntas nii que son las que formarán la distribución junto con los valores de la variable Y. Luego la distribución pedida es una unidimensional formada por las siguientes columnas:
Y= YiiX (X 1 Y= y} = {(x¡, nii) : i = 1, 2, ... , r} para cualquier j = 1, 2, ... , s. r
La frecuencia total de (X 1Y= Y} es n.i =
L nii. i= 1
=
1 2
3
x 2 = 175 10 20 2
130
CASAS,SÁNCHEZ, J. M. y SANTOS,PEÑAS, J.
b) La distribución obtenida anteriormente se manipula como una unidi, mensional para obtener las distintas medidas de posici~n y dispersi9n:
M 0 (Y
JX =
175)
=
2
Lo que nos indica que lo más frecuente son dos miembros por familia los que aportan ingresos dentro del segundo intervalo 15-20.
-
Yrrx~ 175 =
1 (1·10 32
+ 2·20 + 3·2) =
56 32
=
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
131
todos los pares de valores (x;, Y) con sus frecuencias absolutas n; .. Podemos distinguir dos tipos principales de momentos: con relación al origen o con respecto a las medias. a)
Momentos respecto al origen
Llamamos momento de orden h, k respecto al origen de la distribución conjunta (X, Y) al valor:
1,75 (h, kEN)
Son ~ 2 miembros por familia los que aportan ingresos dentro del intervalo comprendido entre 15.000 y 20.000 euros. Recordemos que cuando la variable es de tipo discreto, como en este caso (Y son individuos) no tienen sentido los decimales dando el resultado por exceso o defecto en números enteros.
s2
rrx~l?s
Algunos casos de este tipo de momentos con relieve son: r
alo =
"LJ
X;
n. N'·
(media marginal de Y)
= _.!._ [(1 - 1' 75)2 . 10 + (2 - 1,75)2 . 20 + (3 - 1,75)2 . 2] = 32 r
=
_.!._ [5,625 + 1,25 + 3.125] 32
=
(media marginal de X)
í~l
¿
0,3125
i~l
2 n;. x.-
'N
Srrx~175 ~ 0,56
•
ao2 =
n.
L yJN·J j~
y
1
(momento producto)
El coeficiente de variación de Pearson será: b)
Srrx~175 ~ 0,56 ~ 0,32 Yrrx~l?s 1,75 Este coeficiente nos indica, expresado en tantos por 100, que la desviación típica supone un 32 % de la media aritmética con lo que podemos admitirla como promedio que nos representa al conjunto de la distribución. Hasta un 50 % de participación de la dispersión en el promedio se considera como aceptable la representatividad. Algunos autores son más estrictos y no aceptan promedios en los que el coeficiente de variación sea superior al 10%.
• Momentos en las distribuciones bidimensionales Igual que en las unidimensionales los momentos son medidas que reducen los datos de una variable estadística, que en este caso será bidimensional, permitiendo tener una idea general de la distribución sin tener que enumerar
Momentos respecto a las medias
El momento de orden h, k respecto a las medias de la variable estadística bidimensional (X, Y) es: (h, kEN)
Como ;jemplo, ~ 10 = m01 =O. El momento m 20 es la varianza de x, S2 (X), y m02 =S (Y). Es duecto comprobar que m 20 = a20 - ai 0 y m02 = a02 - a~ • 1 El momento m 11 recibe el nombre de covarianza de las variables X e Y, y le denotamos Cov (X, Y) 6 Sxy·
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
132 Ejemplo 3.5
. a02
Disponemos de la siguiente tabla de correlación que recoge la ~ariabl~ estadística bidimensional (X, Y) donde X es el número de transferencras reczbidas por una sucursal bancaria al día, e Y el número de transferencias enviadas desde la misma sucursal el mismo día. Los datos se han anotado durante un total de 18 días hábiles.
~ 2 3 4
1
2
3
1 2 1
4 4 2
1 2 1
=
ao2 -
2
ao1
= 40 -
22
40 = 80 =9 18
= 40 -
9
36
4 9
9
• Independencia estadística Dos variables estadísticas X e Y son independientes entre sí cuando la variación de una de ellas no influye en la distribución de la otra condicionada por el valor que tome la primera. Por el contrario existirá dependencia cuando los valores de una condicionan la distribución de los valores de la otra. Acudiendo a la defmicíón que se dio de frecuencia relativa condicionada tenemos que:
6 8 4
n;¡
n..
¡;/} =
18
4
10
4
mo2
- 1( 2 2 2 1 · 4 + 2 ·10 + 3 · 4) 18
133
¡;. ¡
N
..21. = -
n_1
= ..Y. n.1 1
N
Obtener algunos momentos de relieve.
¡;} = ¡;/} -/¡
La expresión [3.1] nos indica que la frecuencia relativa conjunta de (X = X¡, Y= y) es el producto de la frecuencia relativa de X; condicionada por Y= yi, por la frecuencia relativa marginal Ji cuando existe independencia estadística; o sea que el valor y1 que condiciona influye en la distribución de la variable X;- Si existe independencia estadística es evidente que las frecuencias relativas de X condicionadas por los distintos valores de yi, serían todos iguales entre sí e iguales a la frecuencia relativa marginal de X ya que dichos valores Yi no influyen para nada en la distribución de la variable X;. O sea, se cumplirá que:
Soluci6n: 1 18
1 18
26 9
a 10 = -(2·6 + 3·8 + 4·4) =-·52=-
1 18
1 18
a 01 =-(1·4+2·10+3·4)=-·36=2
a 11
1 = -(2 ·1·1 +
18
2 · 2 · 4 + 2 · 3 ·1 + 3 ·1· 2 + 3 · 2 · 4 + 3 · 3 · 2 + 4 ·1· 1 +
1 +4·2·2 + 4·3·1) = 18(24 + 48 + 32)
104
=
¡;/1 =
52
18 = 9
¡;/2 = ¡;/3 =
nu n. 1
a
20
=
80
m2o
=
a2o - aio
=
=
(26)2
9- 9
=
1 -(24 + 72 + 64) 18 720 - 676 81
=
44 81
=
1~
... =
¡;/} =
... =
¡;¡. = ¡;_
[3.2]
O lo que es lo mismo:
n¡ 2 n. 2
n;. n..
- = - = ... = - =
1 -(22. 6 + 32.8 + 42. 4) 18
[3.1]
w
-18 = -9
nil + n; 2 + ... + n;. n;. =-=¡; n. 1 + n. 2 + ... + n.. N '·
[3.3]
Sustituyendo en la expresión [3.1] la frecuencia relativa condicionada ¡;11 por la marginal¡;_ de la expresión [3.2], ya que estamos bajo la hipótesis de independencia estadística, tenemos que:
¡;ii =Jir .f.j
b' o len
n;i = n; . . n.J N
N N
Definición 3.3.
necesariamente X e Y son independientes, como ocurre en el ejemplo presentado en el que m11 = O y las variables X e Y son dependientes.
Independencia estadística.
Dadas las variables estadísticas X e Y, la condición necesaria y suficiente para que sean independientes es:
y V j = 1, 2, ..., s)
Una propiedad de interés es que si X e Y son independientes, entonces la covarianza entre ellas es nula. Veamos para ello que T
S
n..
T
S
ni. n..
135
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
134
T
ni.
S
n.j
x,.-" y,.-=atoaol a11 - " "xy ''-" "x.y.-·__.1=" - ;~1 i~t i i N - i~t i~t ' 1 N N ;~1 N i~l N ' pero como m11 = a 11 - a 10 a 01 = a 10 a 01 - a 10 a 01 =O, que es lo que queríamos probar. Sin embargo, que Cov (X, Y) = O no implica que X e Y sean independientes. Esto puede comprobarse con un contraejemplo en que X e Y sean dependientes (o no independientes) y además m11 = O.
Ejemplo 3.6 En la tabla de correlación presentada en el Ejemplo 3.5, las variables X e Y son dependientes, pues por ejemplo:
3.2.2.
Tablas de contingencia
En los estudios socioeconómicos se analizan en muchas ocasiones variables de tipo cualitativo que sólo admiten escalas nominales y como mucho ordinales (sexo, nacionalidad, profesiones, niveles de estudios, imagen de políticos, etc.). Como ya se comentó en los análisis unidimensionales, en las variables cualitativas no tiene sentido la obtención de promedios si se exceptúa la moda en las de escala nominal y la mediana en las de escala ordinal. Luego en este tipo de análisis no tiene ninguna lógica la definición de momentos respecto al origen o respecto a la media. Lo que sí se puede es obtener sus respectivas tablas de frecuencias que en el caso de las bidimensionales se las denomina tablas de contingencia. Es una tabla de doble entrada como la 3.4 en la que en la primera columna y primera fila se expresan las modalidades de ·los atributos M y M'; en las celdillas centrales están las frecuencias absolutas conjuntas nii. La última columna y la última fila nos definen lo mismo que en las tablas de correlación las frecuencias marginales del atributo M y el M' con las que pueden construirse las dos distribuciones marginales o unidimensionales representadas por los conjuntos {(M;; n;.) para i = 1, 2, ..., r} y {(Mj; n.) para j = 1, 2, ... , s}. También pueden definirse las correspondientes distribuciones condicionadas de frecuencias dadas por los conjuntos {(M/M'
=
Mj); nij para i = 1, 2, ..., r},
{(M'/M
= M;);
TABLA
La independencia estadística entre x e y, exige que para todo i y todo j = 1, 2 y 3, se verifique:
3.4.
n;j
para j
y
= 1, 2, ... , s}.
Tabla de contingencia
= 1, 2 y 3,
como esto no se da para algún par (i, j), concretamente para i = 2 y j = 1, concluimos que X e Y son dependientes. Además, vimos en el Ejemplo 3.5 que m11 = Cov(X, Y) = O, por lo que éste es un contraejemplo de que «m 11 = O equivale a que X e Y son independientes». Efectivamente, hemos demostrado que si X e Y son independientes, esto implica que m11 = Cov(X, Y) = O. Pero no ocurre lo recíproco: si m11 = O no
M'1
M'2
M~
..
n.
J
M, n.J
n,.
n.l
n.z
n.j
n.s
N
136
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J. DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
Como a las variables cualitativas no se las puede someter a las operaciones de sumas, restas y divisiones, al venir expresadas en escalas nomiqales u ordinales, no tiene sentido el hablar de medias marginales o condicionadas o de varianzas o desviaciones típicas. Lo que sí cabe es establecer el concepto de independencia estadística entre variables cualitativas ya que como vimos en las tablas de correlación de las variables cuantitativas, en su definición sólo intervienen determinadas propiedades de las frecuencias relativas tanto conjuntas como marginales. Luego la condición necesaria y suficiente para que los atributos M y M' sean independientes es que la frecuencia relativa conjunta sea igual al producto de las frecuencias relativas marginales:
nii =ni .. n.i
N
N N
137
b) Distribuciones marginales M
M'
Casados Solteros
40
Con accidente Sin accidente
60
20 80
La moda del atributo estado civil es solteros y de los accidentes es sin accidente. e) La distribución de los accidentes (M') condicionada a ~ue sean solteros será:
V i,j
M'/M =Solteros Con accidente Sin accidente
La deducción de la anterior expresión es idéntica a la efectuada para las tablas de correlación de variables cuantitativas.
15 45
60
La moda es sin accidente. Ejemplo 3.7
d) Independencia estadística. Se construye una tabla de frecuencias relativas
Se han observado 100 conductores de turismo de los cuales 40 están casados y 60 solteros. De los primeros 5 han sufrido algún tipo de accidente en el último afio y de los segundos han sido 15. Obtener: a) La tabla de contingencia. b) Las distribuciones marginales y sus respectivas modas. e) La distribución de los accidentes condicionada a que sean solteros con su respectiva moda. d) Comprobar si los dos atributos son independientes.
>( Casados Solteros
Con accidente
n,.
Sin accidente
N
0,05 0,15
0,35 0,45
0,40
0,20
0,80
1
0,60
n.
....:l.
Soluci6n:
N
a) Tabla de contingencia Como en la primera comprobación
~
nu
Con •ocldente
Sin accidente
n'.l.
Casados Solteros
5 15
35 45
60
n.j
20
80
100
40
N
n.l nl. =/= N · N,
ya que 0.05 =/= 0.20 · 0.40,
se puede decir que los dos atributos M y M' no son independientes estadísticamente hablando. También se pueden elaborar tablas de contingencia combinando características cualitativas con cuantitativas: sexo con edad, hábitat donde viven las· familias (rural o urbano) con niveles de renta, etc.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
138
En las distribuciones bidimensionales también pueden establecerse representaciones gráficas. Como las marginales y condicionad~s son unidim~nsio nales todos los gráficos estudiados en el capítulo 2 son aphc~bles a las nusmas. En las conjuntas se acudirá a las tres dimensiones. En un eJe ~e represen~a la variable X en el otro la Y y en el tercero la frecuencia conJunta nu. SI los valores de la variable no están agrupados la figura será un diagrama de barras en tres dimensiones. Si están agrupados (sólo para variables de tipo cuantitativo que admitan las escalas de intervalo o razón) serán histogra~as tridimensionales que nos generan estereogramas formados por una sene de paralelepípedos cuyos respectivos volúmenes son proporcionales a las n;i'
3.3.
Dependencia funcional y dependencia estadística
Es frecuente encontrarse cuando se estudian conjuntamente dos características 0 variables que exista una relación de dependencia entre las mismas. ~sta dependencia tiene dos naturalezas: dependencia funci~nal que es cuando ~xiste una relación matemática exacta entre las dos vanables y dependencia estadística que se caracteriza por una relación aproximada e~tr: lo.s dos fenómenos. La dependencia funcional se puede representar segun mdica el gráfico 3.1 en el que los pares de valores observados de una _variable ~idimensional (x;, y;) pertenecen exactamente a la función matemática que hga a las ~os variables que en este caso es una recta. Podría representar un fenómeno físico y
Ys Y4 Y3 Y2
YI XI GRÁFICO
X2
X3
X4
X5
3.1. Dependenciafuncional exacta de tipo lineal.
X
139
que es el espacio {y;) que recorre un vehículo que va a una velocidad constante (b) en distintos períodos de tiempo (xJ A cada valor X; le corresponde un sólo valor Y; dado por la función matemática que liga a las variables. La dependencia estadística, expresada en términos aproximados, ocupa en la teoría del conocimiento económico un lugar preponderante a la hora de constrastar determinadas hipótesis de dependencia funcional formuladas por la teoría económica. Luego debe haber un planteamiento teórico previo al estudio estadístico para no llegar a conclusiones que no tengan sentido. Puede darse el caso, por ejemplo, que exista dependencia estadística, por puro azar, entre la evolución del número de accidentes de automóviles y la producción de queso manchego. De ello no podemos sacar la conclusión de que una variable determina a la otra ya que no tiene ningún sentido. Sí parece lógico formular que el nivel de gasto de los hogares está dependiendo .de su renta disponible. Pero esta dependencia no es de tipo matemático-funcional sino estadística. Si se observan un conjunto de países de valores de renta disponible y niveles de gastos nos encontraremos que para un mismo nivel de renta pueden darse distintos niveles de gastos ya que existen otra serie de características, además de la renta, que influyen en el gasto aunque sea de forma menos relevante. Este tipo de fenómenos se representan en un sistema de ejes, a través de una nube de puntos como se indica en el Gráfico 3.2. Por ejemplo, la figura a) representa una dependencia lineal positiva (al crecer la renta disponible X también crece el consumo familiar Y). Puede observarse que en la dependencia estadística los pares de valores observados (x;, Y;) ya no están alineados como se indica en el Gráfico 3.1 con la dependencia funcional. También nos indica la nube de puntos que la relación entre x e y es de distinta naturaleza: lineal positiva representada por la figura a); lineal negativa expresada en la figura b); curvilínea según la forma de la figura e); sin ninguna relación como se indica en la figura d); etc. Existen tres motivos fundamentales por los que una variable que vamos a llamar dependiente o endógena está influida por otra que actúa como independiente o exógena: la casualidad o el azar ha hecho que ambas variables estén relacionadas estadísticamente (por ejemplo, como se ha señalado, el mimero de accidentes de automóvil y la producción de queso manchego); una tercera variable está determinando a las que estamos estudiando (por ejemplo el consumo de caviar y la compra de yates de recreo están determinadas por la renta disponible de las personas) y, por último, puede existir una relación causa-efecto como el ejemplo de que los niveles de consumo están determinados fundamentalmente por la renta disponible. En los estudios estadísticos de los fenómenos socioeconómicos sólo nos deben preocupar las relaciones de causa-efecto que son las que tienen una base teórica. Las nubes de puntos de la forma del Gráfico 3.2 nos señalan el tipo de ligazón existente entre Jas dos variables. La regresión es una parte de la
140
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
y
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
141
formando la siguiente línea quebrada de puntos
y X X
X X X X X X X
XX X X X
X X
que es la línea de regresión tal y como se indica en el Gráfico 3.3. Hemos
X X X X
X X
pas~do de la nube de puntos en la que a cada valor xi le pueden corresponder
X
Xx X
X
xx
X X X
X X X
X
(a)
vanos valores de Yi (por ejemplo a un mismo nivel de renta pueden corresponderle varios niveles de consumo ya que éste no depende sólo de aquélla) a una línea de regresión en la que a cada xi le corresponde un sólo valor d~ la ordenada que es la media aritmética de Y condicionada a dicho valor.
(b)
y y
X X
X
X X X
!
X
Ys
X
X
l/c
' P r(x,. Ylxr)
X
X
X
X
X Xx
X
X
X
XX
X
X X X X X X
: P2(x2, Ylx2)
¡
X
Y2
X
lic , P¡(x¡, Y{x¡)
Y1
X
X
(e) GRÁFICO
'
y
(d)
3.2. La dependencia estadística expresada por las nubes de puntos de las observaciones. GRÁFICO
Estadística Descriptiva que nos enseña a determinar la línea hacia la que tiende la nube puntos. Luego la Teoóa de la Regresión nos permite pasar de la dependencia estadística representada en una nube de puntos a la dependencia funcional dada por una línea de regresión. Existen dos formas de obtener la línea de regresión: a través del empleo de las distribuciones de frecuencias condicionadas o a través de los ajustes mínimo-cuadráticos. Veámos como se construirla por el primer método la línea de regresión de Y sobre X cuando Y es la variable dependiente o efecto, y la X es la independiente o causa. Para ello, si hay r observaciones consideramos toda~ distribuciones condicionadas: Yfx 1 , Yfx 2 ,
••• ,
Y/x,.
En estas distribuciones, al ser unidimensionales se obtienen las correspondientes medias aritméticas:
' '' ' ''
' '' '''
*
*
X¡
x2 ·························
r
t t Xr
X
3.3. Lfnea de regresión de Y/X obtenida por el método de las medias aritméticas condicionadas.
Por idéntico procedimiento puede obtenerse la línea de regresión de X sobre Y actuando en este caso la X como dependiente y la Y como independiente. Las distribuciones de frecuencias condicionadas serian: X/y1, Xfy2, ... , Xfy.
Las medias aritméticas serian: X/y 1, X/y 2, ..., Xfy.
con lo que se generan los puntos de la línea:
143
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
142
b) Línea de regresión de X/Y: y
YS
1 (X/Y= 1) = ¡(2 ·1
P;(Xfys, Ys)
--------------------M----------------------
--------M--------------------
+ 3 · 2 + 4 ·1) = 3
1 (X /Y = 2) = O(2 · 4 1 Y2
---------)(----------M------------
(X/Y= 3)
-- ----------------)(----- ---------------
1 -(2 ·1 4
=
Pi(Xfy2,yú y¡
+ 3 · 4 + 4 · 2) = 2,8
+ 3 · 2 + 4 ·1) = 3
-------- -)(- ------ ------------ ------------------------M--------------------
X¡ GRÁFICO 3.3'.
X2
Los puntos serán: P 1(3, 1), P~(2.8, 2) y P~(3, 3). El Gráfico 3.4 contiene las dos líneas. Otra forma más utilizada en la obtención de las líneas de regresión Y/X y X/Y es el denominado ajuste mínimo-cuadrático. Esta segunda versión es menos pura que la de las medias condicionadas pero es mucho más manejable ya que se obtiene una función estimada en el ajuste y no una línea de puntos 1
Pí(Xly¡, y¡) ··-·----····· ------··---
Xr
X
Unea de regresión de X/Y obtenida por el método de las medias aritméticas condicionadas.
Ejemplo 3.8
y
De la tabla de correlación del Ejemplo 3.5 obtener las líneas de regresión de Y/X y X/Y por el método de las medias aritméticas condicionadas.
3
P'
• 3 1
. . 1
1
Pí,'
Soluci6n: a)
2
Línea de regresión de Y/X:
~
•
\
\
1 (Y/X = 2) = -(1 · 1 + 2 · 4 6
+ 3 · 1) = 2
1 (Y/X= 3) = -(1· 2 + 2 · 4 8
+ 3 · 2) = 2
(Y/X
+ 3 ·1) = 2
=
4)
=
1 -(1· 1 + 2 · 2 4
Los puntos de la línea son: P 1(2, 2), P z(3, 2) y P 3 (4, 2) que es una paralela al eje de abscisas. El que las medias aritméticas condicionadas sean todas iguales y su unión dé una paralela no implica independencia estadística entre las variables como se comprobó en el Ejemplo 3.6. La inversa si es cierta, si existe independencia las condicionadas son todas iguales e iguales a las marginales como se señala en la Expresión 3.2.
X
2 GRÁFICO 3.4.
3
4
Uneas de regresión del ejemplo 3.8.
como ocurre con las medias aritméticas condicionadas, ya que en la realidad siempre tendremos una serie de observaciones discretas que nos proporcionará una línea de puntos más o menos próximos, pero no una curva continua como nos proporciona el ajuste mínimo-cuadrático. Dada una distribución de frecuencias bidimensional expresada por el conjunto {(x;, y¡); n;¡} el ajuste mínimo-cuadrático consiste en desarrollar el proceso siguiente:
144 -
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
Representar la nube de puntos dada por los valores observados (x;, Yi) y elegir la función del tipo Yti = f{x;, a1 a2 , .•• , an) que más se aproxime a dicha nube. El número de parámetros {a 1, a2 , ...) tiene que ser inferior al número de observaciones para que el ajuste tenga grados de libertad que es la diferencia entre el número de observaciones y el número de parámetros. En el Gráfico 3.5 lo que mejor puede ajustarse a la nube de puntos es una parábola de tercer grado de tipo y = ax 3 + bx 2 + ex + d.
-
forman la nube). Aplicando la condición necesaria de mínimo que es que se anulen las derivadas parciales de [3.4] respecto a los parámetros desconocidos (a 1, a2 , a 3 , ... ) de la función Yti tendremos un sistema llamado de ecuaciones normales que nos resuelve el problema pasando de la dependencia estadística a la funcional. Al estúdiar la regresión lineal simple en el próximo apartado veremos algún caso práctico del ajuste mínimo-cuadrático.
3.4.
Para cada X; se define un error o residuo que es la diferencia entre la variable dependiente observada yi y el valor teórico Yti = axf + bxf + ex; + d
dado por la función: ei = Yi- Yti· Estos residuos son unos positivos (el representado en el Gráfico 3.5) y otros negativos (cuando las observaciones estén por debajo de la función) y para que no se anule su suma se eleva al cuadrado: [3.4]
S= L(yi- Ytl
Regresión y correlación lineal simple
3.4. l.
a) La función a estimar es lineal es decir una recta. b) Existe una sola variable explicativa o exógena y por ello recibe el nombre de simple. e) En la exposición vamos a referirnos a una tabla de correlación de frecuencias unitarias del siguiente tipo:
X;
Y;
xl Xz
Y1 Yz
Yi
X;
Y;
Yti
XN
YN
o
X¡
GRÁFICO
-
La regresión lineal simple
En la mayoría de los fenómenos de naturaleza económicosocialla nube"de puntos nos indica que la relación entre las variables es de naturaleza lineal. La regresión lineal simple nos permitirá pasar de la dependencia estadística a la funcional con las siguientes características:
y )(
3.5.
145
)(
X
Ajuste mínimo-cuadrático.
El método del ajuste mínimo cuadrático consiste en que la expresión 3.4 de los errores o residuos cuadráticos sea un mínimo (que la función ajustada pase lo más próxima posible a todos los puntos que
d) Se empleará el ajuste mínimo-cuadrático para estimar la ecuación de la recta: y= a+ bx de modo que llamamos: Yti =a+ b X;
Siguiendo el proceso de todo ajuste mínimo-cuadrático se realizarán las siguientes operaciones: -
Representar la nube de puntos dada por los pares de observaciones yJ como se indica en el Gráfico 3.6.
(x;,
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
146
147
Si en la expresión [3.6] dividimos por N podemos expresarlo en función de los momentos respecto al origen:
y y= a+ bx Yi
(3.7) Yti
Resolviendo el sistema correspondiente a la expresión [3.7] obtendremos su solución:
o 3.6.
GRÁFICO
-
Sustituyendo en la segunda ecuación
X
X¡
Ajuste lineal mfnimo-cuadrático.
Ajustar la recta y = a + bx de forma que la suma de todos los errores e1 elevados al cuadrado, sea mínima: N
S= L
N
e¡ =
N
L (y¡ - Ytif
L (y¡ - a - bx;) 2 ~mínima [3.5] i=l
i=1
i=1
=
Para minimizar la expresión [3.5] se tiene en cuenta la condición necesaria de todo mínimo que es que se anulen las derivadas respecto a las incógnitas que son los coeficientes de regresión lineal a y b:
as
-
aa
as
-
ab
Luego las estimaciones mínimo cuadráticas de los coeficientes de regresión lineal simple se resuelven por el siguiente sistema:
N
=
[3.8]
2 L [y¡ - a - bxJ ( -1) = O i=1
-
Sxy
s;
-
a=a01 -ba 10 =Y--·X
N
= 2 L [Y; - a - bxJ (- XJ = O i=1
Si sustituimos a y b en la recta y
=
a + bx queda:
que nos permite llegar al siguiente sistema de ecuaciones normales mínimo cuadráticas: N
L Y; =
N
N a
+b
L
X;
i=1
i=1
[3.6] N
N
[3.9]
N
LX; Y;= aL X¡+ b L x'f i=1
i=1
i=1
que es la recta de regresión mínimo cuadrática de Y sobre X.
148
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
La recta de regresión mínimo cuadrática de X sobre Y, por analogía resulta ser:
obtener las medias aritméticas marginales (X, Y), la covarianza y la varianza de la variable independiente:
[3.10] Ambas rectas pasan porel punto del plano xy (a 10, a 01 ), y sus pendientes
.
mu
mu
.
149
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
..
son repecbvamente y - . Como m20 y m 02 son vananzas positivas (salvo m2o mo2 casos triviales), ambas pendientes tienen el signo común de la covarianza m11 ; de aquí, ambas rectas son crecientes, o ambas son decrecientes. Si las variables estadísticas X e Y son independientes, entonces m11 = O por lo que las rectas de regresión serán y
respectivamente, es decir, paralelas a los ejes coordenados X e Y. El coeficiente de regresión lineal simple b es la pendiente angular de la recta de regresión, o sea, es la derivada de y con respecto a x y tiene un significado muy concreto: nos determina en cuánto varía la variable dependiente o endógena cuando la independiente o exógena varía en una unidad. Si la recta que se ajusta es una función de consumo en relación con la renta, el coeficiente b sería lo que se conoce en teoría económica como la propensión marginal a consumir. El significado del a, que es la ordenada en el origen de la recta, a veces puede tener sentido económico y a veces no. El Ejemplo 3.9 es un caso de ajuste lineal simple por el método de los mínimos cuadrados cuando la distribución bidimensional es de naturaleza unitaria y el Ejemplo 3.10 es una tabla de correlación donde las frecuencias ya no son unitarias.
Y¡
X¡
X¡ y¡
X~
2 3 3 4 4 5 6 5 7 9
2 3 4 5 6 7 8 8 9 10
4 9 12 20 24 35 48 40 63 90
4 9 16 25 36 49 64 64 81 100
10
10
L Yi i= 1
= 48
10
LX¡=
62
1 10 62 X= a¡o = 10 i~l x¡= 10 = 6,2
10
L X¡y¡ i=l
i=l
= 345
y=
aol
=
Yi =
xf = 448
48 10 = 4,8
X¡Y¡
345 a 11 = ;;__::_N__ = 10 = 34.5
m11 = Sxy = a 11
-
a 10 a 01 = 34.5- 4,8·6,2 = 34.5-29.76 = 4,74
448 1 10 a2o = 10 ¡~ xf = 10 = 44,8
1
m20 =
s; =
b
m11
a20 - aio = 44,8 - 38,44 = 6,36
Sxy
=- =
m2o
a= a 01
-
-s2x = b a 10
4.74 6 36 ~ 0.745 ·
~
4,8 - 0,745 · 6,2
~
4,8 - 4,621 = 0,179
Solución:
Para estimar a y b empleamos la formulación de la expresión 3.8; luego los cálculos conviene establecerlos de la forma siguiente ya que tenemos que
1 10 10 i~l
L i=l
10
L i=l
Ejemplo 3.9 En 10 familias se han observado sus ingresos (xJ y sus gastos (y¡) anuales expresados en millones de pesetas dando lugar a las siguientes cantidades (x¡: 2, 3, 4, 5, 6, 7, 8, 8, 9, 10) e (y¡: 2, 3, 3, 4, 4, 5, 6, 5, 7, 9). Obtener la recta regresión del gasto en función de los ingresos e interpretar los valores estimados de los coeficientes de regresión.
•
1
y=O.l79+0.745x
1
150
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
El significado de b = 0,745 es que cuando los ingresos aumentan en una unidad el gasto aumenta en 0,745 unidades. El significado del término independiente es que cuando el ingreso es cero existe un consumo autónomo de 179.000 pesetas aunque esta interpretación carece de sentido económico ya que sin ingresos no puede existir gasto sino existe un endeudamiento paralelo. Ejemplo 3.10 Obtener las rectas de regresión mínimo cuadráticas asociadas a la siguiente tabla de correlación:
o
3
6
1 2
1 4
5 4
2 1
8 9
5
9
3
17
Empleando la notación de los momentos respecto al origen y respecto a la media tenemos: 26
alo
= 17(1·8 + 2·9) = 17
a01
=
a 11
1
=
-(1· 0·1 17
mu = au-
a
20
45 17
+ 6 · 3) = -
+ 1· 3 · 5 + 1· 6 · 2 + 2· 0·4 + 2· 3 · 4 +
aloaol
=
63 26 45 1071- 1170 17- 17.17 = 289
1 a02 = - (0 2 • 5 17
= 02
_ ao2
2 a 10
2 aol
44 (26) 2 748 - 676 72 = 17 - 17 = 289 = 289
= 189 _ (45) 2 17
17
=
3.213- 2.025 = 1.188 289 289
Con estos cálculos, las rectas de regresión de Y sobre X, y de X sobre Y son respectivamente:
17
+ 32 · 9 + 6 2 · 3) =
63 2· 6 ·1) = 17
-99 289
81
+ 108 17
189 17
=-
26 17
=-
99 ( 45) 1.188 y- 17
Correlación lineal simple
A través de la regresión hemos estudiado la forma funcional de la relación entre dos variables pero no se ha tratado el grado o la intensidad de esa relación. Corresponde a la teoría de la correlación el estudiar el grado de asociación existente entre las dos variables; es decir, el medir la intensidad de la dependencia entre las mismas. Una vez que se ha realizado cualquier tipo de ajuste nos interesa conocer en qué media la variable endógena o dependiente queda determinada por el modelo matemático que se ha estimado al pasar de la dependencia estadística a la funcional. Si nos fijamos en el Gráfico 3.6, sea cual sea la función que pretendemos ajustar a la nube de puntos (recta, parábola, exponencial, etc.) el valor observado de la variable endógena Y; es igual al valor teórico o estimado por la función y,; más el correspondiente residuo o error; o sea: [3.11]
La variable dependiente observada Y; tiene una determinada variabilidad Los valores o dispersión que como sabemos se mide por su varianza estimados por el modelo ajustado Yti constituyen una serie que se obtiene, una vez estimado el modelo, para los distintos valores de la variable exógena o explicativa que se van introduciendo en el mismo, con una determinada variabilidad dada por su varianza que la vamos a denominar varianza de la variable endógena Y; explicada por Ia regresión. El tercer elemento de la expresión [3.11] es el residuo que también tiene su correspondiente variabilidad que la vamos a medir a través de lo que vamos a llamar varianza residual o varianza de los errores o residuos s;Y.
s;.
s;
1 44 =-(1 2 ·8+2 2 ·9)=-
17
m
3.4.2.
Solución:
1 -(0 · 5 + 3 · 9 17
=a
20 -
X-
)'(
1
m 20
151
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
152
~i en .la e~presión [3.14] a cada valor de las tres variables se le resta su media antméhca Y se divide por el total de observaciones N, recordando que
• Relación entre la varianza de la variable dependiente, la varianza explicada por la regresión y la varianza residual
N
e= O, ya que L
la media de los residuos es cero, Vamos a demostrar que estas tres varianzas se relacionan de la forma siguiente: [3.12] Si en la expresión [3.11] elevamos al cuadrado ambos miembros y sumamos para N pares de observaciones de frecuencias unitarias tendremos: N
N
N
L yf = L Y~+ L ef
L
Yti e; en el caso de
i= 1
ajustar una recta a la nube de puntos: N
N
L ytiei = L (a+ bxJe; =aL e;+ b L e;X; i=1
i=1
1 N 1 N N ;~ Yti= N ;~ (a+bx;)=a+bX=
1
1
.L, e; =
i=1
1 N N i~1 (y¡ - Y?
i=1
Y
1 N :E (yti - Yf
Y,
s;,
i=1
e; = Y; - Yti = Y; - a - b X;
N
1
N
N
i=1
.L, X; =
Na- b
i=1
queda:
O
i=1
para que se cumpla la primera ecuación normal de la expresión [3.6]. N
.L, e;x; i= 1
N
N
N
N
N
i=1
i=1
i=1
i=1
i=1
.L, e;X; = .L, (y¡- a- bx;)x; = .L, X;Y;- a .L, X;- b .L, xf ,=O para que se cumpla la segunda ecuación normal mínimo-cuadrática de la expresión. Luego la expresión [3.13] queda reducida a N
N
N
i=1
i=1
i=1
.L yf = .L Yii + .L ef
Ytif
Sustituyendo Yti por lo que vale a través de la expresión [3.9],
sumando para los N valores: N
:E e~
ry
s;Y = N i~1 e~ = N i~1 (y¡ -
N
1
+N
~as variar:zas y s;y pueden obtenerse una vez que se ha realizado para obtener las series de y11. y e.' = (y i - ytih\ el aJuste mímmo cuadrático d Y. po er .operar con ellas. No obstante existen otras formas de obtenerlas sm necestdad de efectuar el ajuste en función de las varianzas y covarianza deXef:
1
Veamos qué vale
=
sz = sz + sz
O ya que:
L e; = L Y; -
Y
al tener en cuenta que la recta de regresión pasa por (X, Y); tendremos:
N
El
que la media de
Yti coincide con la media de Y;, o sea:
N
N
oy
con lo que demostramos que:
i=1
Vamos a ver seguidamente qué vale la expresión
N
e¡ =
i=1
[3.13]
+ 2 L Ytiei
i= 1
i=1
i=1
N
153
[3.14]
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑ"AS, J.
154 Luego:
(3.15)
La varianza explicada se obtiene despejándola de la expresión [3.12]
155
o residuos e¡ la s;y = o con lo que s; = s;, las varianzas de la variable dependiente o endógena Y; se deberán única y exclusivamente a las variaciones de la variable independiente o exógena X¡, existiendo únicamente una dependencia funcional o exacta. Como esta situación no suele ocurrir en los fenómenos económicos y sociales, vamos a definir lo que se conoce como coeficiente de determinación. Se denomina coeficiente de determinación a la participación de la varianza explicada por la regresión en la varianza marginal de la variable dependiente observada:
[3.16] [3.17] Ejemplo 3.11 Utilizando las varianzas y covarianza del Ejemplo 3.10 obtener la varianza explicada por la regresión y la varianza residual comentando sus resultados. Solución:
Del ejemplo 3.10 la m11 = mo2
=
99 72 ~ -0.343, la m20 = ~ 0.249 y la 289 289
1.188 289 ~ 4.1 S 2 =m ry
mi
02
- -1 m20
s2 = s2 - s2 Yt
Y
ry
~
~
0,117 4111--' 0,249
4' 111 - 3' 642 =
~
4111-0469 ' '
=
3 642 '
s;
o469 '
Si se observa el valor de s;Y se llega a la conclusión de que es muy elevado en relación con la varianza total de Y; representada por con lo que la varianza explicada por la regresión es muy reducida y la línea de regresión no es representativa del conjunto de valores observados de Y;·
s;
• Coeficientes de determinación y de correlación lineal simple Se observa en la expresión [3.12] que la varianza de la endógena observada o sea s;, se obtiene como suma de la varianza explicada por la regresión S 2 y la varianza no explicada o varianza residual s;Y. Si no existiesen errores
y¡,
Y,.
Al estar definido por cociente entre varianzas es un parámetro independiente de las unidades de medida y permite comparar resultados entre distintas asociaciones entre variables, cosa que no ocurre con las varianzas explicadas o residuales, como indicadores de grados de asociación, al venir influidas por las .unidades de medida de las variables. El significado del coeficiente de determinación es que nos proporciona el porcentaje de causas comunes que tienen las dos variables relacionadas para explicar su variabilidad o evolución si se expresa en tantos por 100. Si lo expresamos en tantos por uno, como indica la formulación [3.17], sin multiplicar por 100 su resultado, su significado es que nos indica el tanto por uno de varianza de Y; explicado por la variable independiente X; a través de la función ajustada Yti· Como las varianzas que definen a R 2 son siempre positivas llegamos a la 2 conclusión que R 2 ~• O. Por otra parte las varianzas que intervienen S y2 y S ry como mucho serán Iguales a la total marginal cuando exista una retación exacta o funcional entre las variables (SYt2 = SY2 ) y las causas comunes son el 100 por 100 (s;Y = O) o cuando las causas comunes son nulas (S; = S2 ) y el R 2 = O. Conclusión: el campo de variación del coeficiente de deter~lina~ión es O;:( R 2 ;:( l. Cuando las causas comunes a x e y llegan al 0,75 expresadas en tantos por uno, o el 75% en tantos por cien, el modelo ajustado suele aceptarse. Si el porcentaje es inferior se llega a la conclusión de que la relación elegida (en este caso lineal) no es buena, debiéndose ensayar con otras funciones. El coeficiente de determinación de la expresión [3.17] es una formulación genérica y sirve para cualquier tipo de regresión ya sea lineal o no lineal. Vamos a determinar seguidamente otra formulación para el caso de la regresión lineal simple. Si en la expresión [3.17] se sustituye la varianza residual
156
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
157
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
por lo que vale en función de la covarianza y las varianzas marginales según se vio en la expresión [3.15] tendremos:
y
y
[3.18]
Resumiendo, en la regresión lineal simple el coeficiente de determinación puede obtenerse con las siguientes formulaciones equivalentes:
[3.19]
X
X
a) R = l. "Dependencia exacta o funcional positiva".
b) R = -l. "Dependencia exacta o funcional negativa".
y
y
Xti =X
X XX
X
X
xx
X
Si en la segunda formulación equivalente despejamos la varianza residual:
X
XX
X
X
X
[3.20] X
n
X
=~=+ ~ S ·S - ....¡u·u X
V
Yti =y
~xxx
X
X
X
X
X X
)C
X X X
X
e) R =O. "Con independencia entre las variables".
s
y
Yti =y
X
X X
Vamos a definir el coeficiente de correlación lineal simple como la raíz cuadrada del de determinación:
R=+ -
V
d) R = O. "Con independencia lineal pero con dependencia exponencial. Las variables son dependientes".
[3.21]
y
y
El coeficiente de correlación se usa para determinar el grado de dependencia lineal de la variable endógena ante los valores de la exógena. Esta dependencia puede ser directa o positiva, o indirecta o negativa, según sea el signo de la covarianza Sxy· Si la covarianza es positiva la correlación también lo es y su coeficiente tomará valores entre cero y uno: O ~ R ~ l. Si R = 1 implica que la s;Y =O y los valores teóricos o estimados Yti coinciden con los observados Y; exitiendo una dependencia exacta o funcional. Si R = O implica que s;Y = no existiendo ninguna dependencia o asociación entre las variables de tipo lineal, aunque sí puede haberla de otra naturaleza (parabólica, exponencial, etc.), convirtiéndose las rectas de regresión en dos paralelás a los ejes de coordenadas a las alturas Yti = Y y xti = X ya que Sxy = O con lo que en las expresiones [3.9] y [3.10] los valores estimados de las rectas coinciden con las medias aritméticas marginales.
y
x/y
ylx =x/y ylx =x/y
s;
X
X
e) O< R < l. "Dependencia no exacta f) -1 < R < O. "Dependencia no exacta positiva". negativa". GRAFICO 3.7. Rectas de regresión para distintos valores del coeficiente de correlación R.
158
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
Si la covarianza es negativa la correlación también lo es y su coeficiente tomará valores entre menos uno y cero: - 1 :::::; R :::::; O. Si R = - 1 la correlación es perfecta existiendo una dependencia funcional pero negativa. Las rectas de regresión coincidirían en una sola que sería decreciente al tener una pendiente negativa. Concluyendo diremos que el campo de variación total del coeficiente de correlación es: - 1 :::::; R :::::; l. Cuando varía de - 1 a cero estamos en una correlación negativa y la dependencia será mayor cuanto más se aproxime a - l. Si la variación está entre cero y + 1 la correlación es positiva y el grado de asociación o dependencia será mayor cuanto más se aproxime a más uno. A partir de ±0.75 diremos que la dependencia es fuerte o aceptable. Si el valor es inferior se rechaza el modelo estimado para hacer predicciones ya que son poco fiables. El Gráfico 3. 7 recoge las distintas posibilidades de representación según el valor de R. Las figuras e) y f) son las que se dan en los casos reales.
ejemplo 3.10, es delll,45% (porcentaje de causas comunes entre las variables X e Y en dichos ajustes lineales: de X sobre Y, y de Y sobre X) no siendo suficiente la forma funcional estimada para representar la dependencia entre las dos variables {el número debe ser un 75 %). En cuanto a la correlación, medida por R = - 0.3385, es negativa y por ello una de las variables tiende a aumentar cuando la otra variable disminuye, y viceversa: una tiende a disminuir cuando la otra tiende a aumentar. En el ejemplo 3.11 se obtuvo la varianza residual para el mismo supuesto y vimos que era muy elevada con lo que el ajuste no podía ser bueno. Los bajos valores de los coeficientes de correlación y determinación nos confirman este hecho. Ejemplo 3.13
• Predicción
Obtener los coeficientes de determinación y correlación del ajuste lineal efectuado con los datos del Ejercicio 3.9.
Uno de los objetivos que persigue la regresión y correlación es hacer predicciones de la variable dependiente o endógena en función de los que toma la independiente o exógena. Las predicciones se efectúan utilizando la recta ·estimada Ya = a + b X¡. Obtenemos valores de Yti' que son promedios de los observados, mediante valores dados de X; y la actuación de los coeficientes de regresión a y b estimados. La predicción será más fiable cuanto mayores sean los coeficientes de determinación o de correlación ya que menor será la varianza de los residuos que es la que nos indica la cuantía de la separación entre lo observado y lo estimado. Hay que tener presente que la fiabilidad de las predicciones disminuye a medida que los valores dé la variable exógena X; se alejan de su recorrido.
Solución:
Empleando la expresión R 2 = b · b', ya se obtuvo el coeficiente b = 0.745. Para obtener b' se efectúa la regresión X/Y. Esta regresión tiende sentido estadístico pero carece de sentido económico en la relación causa {gasto) y efecto {ingresos) ya que los niveles de gasto no determinan los niveles de ingresos sino todo lo contrario. Para calcular 11 b, = m , sólo nos fa1ta ca1cu1ar moz
El a 01
=
m02 = a02
-
2 • a 01
4,8 según el Ejercicio 3.9.
Ejemplo 3.12
1 N 1 ;~ yf = 270 = 27. 10 10
Aprovechando los momentos respecto a la media del ejemplo 3.10 obtener los coeficientes de correlación y determinación lineal.
aoz =
Solución:
m02 = 27 - 23,04 = 3,96
R=
~1
~ fo:z
=
-~
J72. J1.i8s
~
-0,3385,
, b' =
m 474 = -'- = 119 m02 3,96 '
_____!.!
.
R 2 = b·b' = 0,745·1,19 = 0,89
R 2 ~ 0,11458,
Según estos datos la fiabilidad o confianza del ajuste lineal, presentado en el
159
1
R=
J0,89 = 0,94
160
161
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
Conclusión: El nivel del ingresos determina el 89 % del nivel del gasto siendo la correlación positiva y de nivel elevado con lo que el modelo e,'ltimado es fiable para hacer predicciones.
Vamos a ajustar por el método mínimo-cuadrático la ecuación de un plano a esta nube de puntos: [3.22]
Ejemplo 3.14 El sistema de ecuaciones normales surge de minimizar la expresión: Con la información que nos proporcionan los Ejercicios 3.9 y 3.13 predecir el nivel de gasto para unos ingresos de 12 y 15 millones de pesetas comentando la fiabilidad de dichas predicciones.
Solución: Para X;= 12; Yti = 0,181 Para X;= 15; y1; = 0,181
+ 0,745 ·12 = 9,121 millones de pesetas + 0,745 ·15 = 11,356 millones de pesetas
Ambas predicciones son fiables ya que el coeficiente de correlación es R = 0,94; pero la primera es más fiable que la segunda ya que el valor X¡ = 12 está más cerca de X= 6,2 que el valor segundo de X;= 15, al alejarse del recorrido de X en la nube de puntos.
Regresión y correlación lineal múltiple
3.5.
[3.23]
i=l
Derivando la Expresión 3.23 respecto del término independiente b0 tenemos la primera ecuación normal:
Las predicciones se realizan con la recta estimada: -
N
L (y¡- bo- b1X1;- b2X2;f
S=
Aunque este capítulo está dedicado fundamentalmente a las distribuciones bidimensionales, vamos a realizar una introducción al análisis multidimensional explicando el sentido de nuevos conceptos como son los coeficientes de determinación y correlación parcial y el problema de la multicolinealidad.
N
L Y; =
N b0
i=l
N
N
i=l
i=1
+ b 1 L X 1; + b2 L X2;
[3.24]
Dividiendo por N: [3.25] La expresión [3.25] nos indica que el plano pasa por el punto tridimensional (X 1 , X 2 , Y) llamado centro de gravedad de la distribución. También nos sirve para obtener el término independiente de la función, conocidos los coeficientes de regresión parcial de Y/X 1 que es el b 1 y el de Y/X 2 que es b2 y las medias marginales de las tres características en estudio (X 1 , X 2 , Y): [3.26]
3.5. l.
Ajuste de un plano por el método mínimo-cuadrático
Para que didácticamente se comprendan mejor los conceptos vamos a empezar por el estudio de la regresión y correlación de la función de un plano generalizando seguidamente al caso del hiperplano. Se parte de la nube de puntos tridimensionales en la que se recogen las observaciones de frecuencias' unitarias de tres características estudiadas en una población (por ejemplo: ' gastos familiares y¡, ingresos familiares X¡¡ y número de miembros de la familia x 2 ;). Si el número de observaciones tridimensionales es N, la nube de puntos la formarán las siguientes ternas: (y1, Xu, X21),
{yz, X12• Xzz),
(y3, X13, X23),
..., (yN, X1N• X2N).
Para determinar los coeficientes de regresión parcial b1 y b2 se vuelve a derivar en la expresión [3.23]. Para hacer más manejable el sistema vamos a tomar como variables las desviaciones a sus correspondientes medidas aritméticas llamando y¡= Y;- Y, X~¡= X¡¡y X~¡= x2i- Xz. Luego si restamos ordenadamente la expresión [3.25] de la [3.22] tendremos la fórmula del plano que pasa por el nuevo origen (X 1 , X 2 , Y):
xl
con lo que la expresión que hay que minimizar para obtener b 1 y b2 será: N
S=
L i=1
(y¡ - b 1 x'u - b 2 x~;f
162
163
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
Derivando parcialmente respecto a las incógnitas b 1 y b2 e igualando a cero tendremos el siguiente sistema de ecuaciones normales que junt? con la expresión [3.26] resuelven nuestro problema:
Las expresiones [3.26], [3.30] y [3.31] resuelven nuestro problema de estimación del plano de regresión. El significado de los coeficientes de regresión b 1 y b2 se obtiene observando que con las derivadas parciales de y1¡ son respecto a X 1 y X 2 . Luego b1 mide la variación de la variable endógena y 1¡ al variar X 1 en una unidad permaneciendo constante la otra variable exógena X 2 • El b2 mide la variación de y1¡ cuando X 2 varía en una unidad permaneciendo constante la x 1 •
N
I
N
y;x'li
= h1
I
í:l
í:1
N
N
N
x'{;
+ b2
I
x'ux;;
í:1
[3.27]
I y; X~;= b I 1
i:1
í:1
N
x~;x;;
+ b2
I
x'i.¡
• El problema de la multicolinealidad en el ajuste de un plano
i:1
El sistema de la expresión [3.27] lo podemos expresar en función de las respectivas covarianzas y varianzas marginales dividiendo por N todos sus elementos:
(3.28)
Este problema surge sólo en la regresión múltiple cuando las variables explicativas, exógenas o independientes tienen entre sí una fuerte relación de dependencia. Si esta dependencia entre X 1 y X 2 fuese exacta, es decir Rf 2 = 1, entonces: ya que si: R 12 = 1 R1z
Empleando la Regla de Cramer se despejan las incógnitas del sistema [3.28]:
[3.29]
Por analogía la expresión para calcular el otro coeficiente de regresión parcial será:
[3.31]
Ryl
=
-Rvz
_Sv R, 1 -Ry 2 ·R 12 _Sv Ry 1 -Ry 1 ·Ry2 _Sy Ry 1 -Rv 1 ·1 O --· --· =1- Rf 2 S1 1- Ri 2 S1 1- 1 O
= - 1: 1
[3.30]
=
b --· 1 · S1
b
La expresión [3.29] se puede poner en función de los coeficientes de correlación lineal simple si dividimos numerador y den01ninador por Sv Si S~:
-·1
Rv 1 = Rv 2
y entonces para R 12 = 1 resulta que:
y para R 12 y análogamente de la b2 •
=
=
= Sy. Ry 1 + Ry 1( -1) = ~
s1
1- 1
o
De manera análoga se tiene que
Como se ha visto si existe multicolinealidad perfecta es imposible calcular los coeficientes de regresión parcial con lo que nos llevaría a cambiar la estructura del modelo eliminando una de esas variables. Pero si la multicolinealidad no es perfecta pero elevada, por ejemplo un +0.8 < IRd < + 1, aunque sí pueden obtenerse Jos b 1 y b2 , ya que ya no se da la indeterminación matemática, la fiabilidad de Jos coeficientes de regresión parcial se ve mermada ya que las variaciones de Yti ante variaciones unitarias de xlí y x 2 ; están mezcladas con lo que obliga a cambiar el diseño del modelo matemático que liga a las tres variables.
164
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
• Coeficientes de determinación y correlación múltiple en el ajuste de un plano
nulos como se demostró e:n la correlación simple al deducir la expresión [3.12], o sea N
.L
El significado de estos coeficientes es el mismo que se ha dado en la correlación simple. Se sigue cumpliendo que la varianza marginal de la variable dependiente o endógena es igual a la varianza explicada por la regresión s;,. 12 (se denota con los subíndices 1 y 2 al existir dos variables explicativas) más la varianza residual s;Y. 12. El coeficiente de determinación múltiple será la participación de la varianza explicada por la regresión en la varianza de los valores observados de Y; o varianza marginal de Y;· Por tanto, partiendo de la igualdad
i= 1
s;
s; = s;,-12
N
e¡x'li = O
y
L e¡X~; =O i=l
o para que se cumplan las ecuaciones normales de la regresión, es decir las expresiones [3.28]. Sustituyendo lo que vale la varianza residual en el ajuste de un plano dado por [3.33] en [3.32] tenemos:
+ s;y·l2
el coeficiente de determinación múltiple será: R2 = s;,-12 = s;- s;y·l2 = _ s;y·l2 1 y·l2 8 y2 8 y2 8 y2
[3.34] [3.32] La expresión [3.34] puede utilizarse para obtener R;. 12 sólo exclusivamente en el caso de la regresión lineal múltiple de un plano. La varianza residual la obtenemos de la expresión [3.33] y conocida ésta puede obtenerse la varianza explicada por la regresión s;,12 por diferencia con las;:
Por las mismas causas que se expusieron en la correlación simple su campo de variación sigue siendo el mismo: O ~ 12 ~ l. Este coeficiente se puede obtener bien por su definición genérica dada en [3.32], que como sabemos es válida para cualquier tipo de ajuste sea lineal o no, bien haciendo una transformación para el ajuste del plano. La definición de varianza residual en la regresión de un plano con las variables expresadas en desviaciones a sus medías aritméticas (se hace un cambio de origen de forma que el plano pasa por el nuevo origen dado por X 1, X 2, Y2 ) es: 1 N 1 N
R;.
s;y·l2 =N
L e?= N L
i=l
i=l
165
e¡(y;- b¡x'li-
s2yr·12- s2y- s2ry·l2
[3.35]
El coeficiente de correlación es la raiz cuadrada del de determinación. En la correlación múltiple no tiene ningún sentido el estudio de la dependencia positiva o negativa y por tanto el signo de su coeficiente ya que la pendiente del plano puede ser positiva repecto a x 1 y negativa respecto a x 2 o viceversa:
b2X~;)\=
[3.36]
• Coeficientes de determinación y correlación parcial en el ajuste de un plano
[3.33] En la anterior demostración se ha tenido en cuenta la definición del error e¡ como diferencia entre la endógena observada y la estimada por el plano e¡= (y;- b 1x'li- b 2 x~¡) y el sumatorio de los errores por las exógenas son
\
Al existir más de una variable explicativa puede estudiarse la evolución conjunta o causas comunes entre la variable dependiente Yti y la primera independiente xli permaneciendo constante la otra explicativa X 2¡. Luego sólo se estudia la influencia de x 1¡ en Yti· Vimos en la correlación lineal simple que el coeficiente de determiación se podía obtener como producto de los coeficientes angulares de la recta yjx de la x/y. Por analogía el coeficiente de
166
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
determinación parcial ducto de
d~
Ytifxli permaneciendo constante la x 2 ; será el pro-
b1
ay,¡
=~ uXli
por
b'
1
[3.37] Sustituyendo el valor b 1 dado por la expresión [3.30] y por analogía cuando la xli actúa de dependiente la y,¡ de independiente será donde pone en la expresión [3.30] el subíndice uno poner y y donde pone y poner uno:
b'
=
Sl. R,t - R,2 R12 1- 2
S,
R:
b b' _ (R,t - R,2 · R12f y1.2- 1 t - (1- Ri2)(1 - R:2) _
El coeficiente de determinación parcial de x 2 ; será:
Estos ejemplos son a título didáctico ya que en los casos prácticos reales se manejan cientos de observaciones ya que una muestra representativa tiene muchas más observaciones de las características. Se pide: a) Estimar el plano de regresión de los gastos en función de los ingresos y el número de habitantes de las ciudades donde viven, comentando el problema de la multicolinealidad. b) Descomponer la varianza marginal de los gastos observados en varianza explicada por la regresión del plano y en varianza no explicada. e) Obtener los coeficientes de determinación y correlación múltiples. d) Obtener los coeficientes de determinación y correlación parcial.
Solución:
Sustituyendo en 3.3 tendremos:
R2
[3.38]
a) Para estimar el plano y= b0 + b1 x 1 + b2 x 2 emplearemos las expresiones [3.26], [3.30] y [3.31]. Luego dispondremos los datos para obtener las medias marginales, las varianzas y covarianzas que requieren dichas expresiones:
y,Jx 2 ; permaneciendo constante
(R,2 - R,t . R¡z)2 R 2 - b b' - -'--'-=-~-<-=---==-;y2.1 - 2 . 2 - (1 - Ri2)(1 - R;t)
Y;
[3.39]
Los coeficientes de correlación parcial son como siempre la raíz cuadrada de los de determinación: [3.40]
1 2 3 2 4 12
xli
x2i
xi¡
yf
xi¡
1
1
1
1
1
1
4 4 5
1 2 3 4
4 9 4 16
9 16 16 25
1 4 9 16
6 12
17
11
34
67
31
Medias marginales: Estos coeficientes variarán lo mismo que en la correlación simple entre -1 sentido al signo de la dependencia parcial.
+ 1 dando
Ejemplo 3.15 Se han observado en cinco individuos varones mayores de 18 años sus niveles de gastos totales anuales, sus niveles de ingresos y el número de habitantes que tienen las ciudades donde viven. Los gastos e ingresos vienen expresados en millones de pesetas y los habitantes de las ciudades también en millones. Los valores observados de las tres variables son los siguientes: Y; (gastos): 1, 2, 3, 2, 4; X¡¡ (ingresos): 1, 3, 4, 4, 5; x 2 ; (habitantes): 1, 1, 2, 3, 4.
Y;Xli
3
[3.41]
y
167
_ 1 y=5
N
12
L Yi = -5
= 2,4
i=l
La expresión [3.26] es:
El valor de b 1 se calcula con la expresión [3.30]:
Y;X2;
XliX2i
20
1 2 6 6 16
12 20
47
31
44
8
1 3
8
168
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
luego hay que calcular las varianzas marginales s; y Si, S~ así como los coeficientes de correlación lineal simple: Ry 1, Ry 2 y R 12 (para calcuJar otros coeficientes hay que obtener las covarianzas): Varianzas marginales:
1 S2 = Y N
34 Y2 = - - (2 4f = 6 8 - 5 76 = 1 04 5 , , ' '
N
L y~ -
i= t
'
1 N S2 = - L x 2 . 1 N i=l ¡,
~ L.,
1 2s2--
1
2 x2i-
N i=l
67 - (3 4f = 13 4 - 11 56 = 1 84 5 ' ' , ,
-
X2 = -
-
31 -2 - 1,36 x2--(2,2) 2 -- 6,2- 4' 845
Hay que resaltar que estos coeficientes de correlación lineal simple sólo se calculan a efectos de emplearlos en las expresiones [3.30] y [3.31] que nos determinan los coeficientes de regresión parcial b1 y b2 • Al existir una fuerte correlación o multicolinealidad en sentido amplio entre xli y x 2 ;, al ser R 12 = 0,83, los RY 1 y RY 2 no nos pueden indicar el grado de dependencia entre la variable endógena y cada una de las exógenas por separado. Para ello x 1i y x 2 ; tendrían que estar incorrelacionadas cosa que no suele ocurrir en la evolución de características socioeconómicas. Lo que hay que perseguir es que la correlación sea la menor posible entre las variables explicativas con objeto de que b 1 y b 2 representen con la mayor nitidez posible las variaciones de Yri ante variaciones unitarias de las variables explicativas. Empleando las expresiones [3.30], [3.31] y [3.26], los coeficientes de regresión parcial son: Sy RY 1 b1 = - ·
Desviaciones típicas: Sy
= Jl,04 =
S1
S1
1,02
= V fl84 J.,O"t =
136 ·'
s2 =
fi,36 =
169
1,17.
Ry 2 • R 12 1,02 0,89 - 0,77 · 0,83 =-· =061 1-Ri 2 1,36 1-0,69 ' -
b = Sy. Ry2 - Ry 1 • R 12 = 1,02. 0,77 - 0,89 · 0,83 = O 084 2 S 1-Ri 2 1,17 1-0,69 ' 2
Covarianzas:
b0 = 2,4 - 0,61· 3,4 - 0,084 · 2,2 = 0,215
1 N -Sy! = Yhi - YX 1 = 9,4 - 8,16 = 1,24 N i=l
L
1 N Sy2 =N i=t
L Y;X
1 N S12 = N i=l
--
2;-
YX 2 = 6,2- 5,28 = 0,92 -
-
L X 1;X2;- X 1X 2 = 8,8- 7,48 = 1,32
Coeficientes de correlación lineal simple:
Ry! =
=
RY 2
S1
1,24
1,24
- = 0,89 sy. S1 = 1,o2. 1,36 = -1,39
_Y_
~= 0,92 = 0,92 = o 77 Sy. S2 1,02 · 1,17 1,19 '
s12 R¡2=-s S 1.
2
1,32 = 1,32 = o 83 1,36. 1,17 1,59 '
El coeficiente b1 es la derivada parcial de Yti respecto de xli y significa que al variar x 1; en una unidad, permaneciendo constante x 2 ;, la Yri varía en 0,61 unidades. El b 2 de la variación de Yti cuando la x 2 ; varía en una unidad permaneciendo constantes los ingresos x 1 ;. Como se observa una elevada multicolinealidad entre las variables explicativas estos coeficientes son inestables con lo que su significado como propensiones marginales al gasto en relación con los ingresos o con el número de habitantes no tienen excesiva pureza. Sería conveniente modificar el diseño del modelo eliminando de la regresión la variable número de habitantes, que como se observa, al tener un coeficiente de regresión parcial muy pequeño, no es relevante en la determinación del gasto. Derterminar la varianza explicada y la varianza residual. Se parte de la igualdad s; = s;,. 12 + s;y. 12. La varianza marginal observada de la variable dependiente Y; ya la hemos obtenido s; = 1,04. Luego si obtenemos la residual está resuelto el problema. Empleando la expresión [3.33]; b)
s;y. 12
=
s; - b1syl - b 2 Sy 2 = 1,04 - o,84 = 0.2
s;.. 12 = s; -
s;y .12 = 1,04 -
0,2 = o,84
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
170
3.5.2.
e) Coeficientes de determinación y correlación múltiples. • Coeficiente de determinación múltiple
2
- s;,.12- 0,84Ry· 12 - s2 - 1 04 - 0,81 y
'
• Coeficiente de correlación múltiple Ry. 12 = ~ = 0,90
Como el coeficiente de determinación es relativamente elevado podemos conducir que el grado de fiabilidad del modelo como instrumento de predicción es aceptable. Lo mismo ocurre con la dependencia global del gasto en relación con los ingresos y el número de habitantes que se eleva, a un 90 % si el coeficiente de correlación múltiple lo expresamos en porcentajes. Coeficientes de determinación y correlación parcial. Recurriendo a las expresiones [3.38] y [3.39] tenemos:
á)
2
RY 1 · 2 2
Ry 2 · 1
= (Ry 1 - RY 2 • R 12) 2 = (0,89- 0,77 · 0,8W =O 50 (1 - Ri 2)(1 - R;2 ) (1 - 0,69)(1 - 0,59) ' =
(Ry 2 - RY 1 • R 12) 2 (1 - Ri 2)(1 - R;1 )
=
2
0,77 - 0,89 · 0,77) (1 - 0,69)(1 - 0,79)
=
O 10 '
Como sabemos el coeficiente de determinación parcial R;~. 2 estudia las causas comunes que tienen las variables Yti y xu (niveles de gastos e ingresos) permaneciendo constantes las que tengan Yti y x 2;, o sea una vez que se ha efectuado la regresión de Yti sobre x 2;. Una vez que hemos efectuado la regresión de los gastos sobre el número de habitantes quedará una determinada varianza residual o no explicada s;Y. 2 que debe reducirse con la introducción en el modelo de la variable x 1 ;; pues bien el que R;1 . 2 = 0,50 significa que al incorporar xu la s;Y. 2 queda explicada en un 50% demostrándonos que es una variable con un fuerte sentido explicativo dentro del modelo. Por el contrario la incorporación de x 2 ; al modelo, una vez efectuada la regresión con x ;, sólo reduce la varianza no explicada s;y·l en un 10%. Los'coeficientes • 1 de correlación parciales tienen signo positivo ya que todas las covariaciones son positivas y serán: Ry 1 . 2 = ~ = 0,70 Ry 2 . 1
=
~
=
0,32
171
Ajuste de un hiperplano mediante la utilización del álgebra matricial
La regresión lineal múltiple se estudia empleando el álgebra matricial por lo ~ue recomendamos al lector que se ponga al día de los conocimientos bástcos. en esta materia: operaciones con matrices, reglas de trasposición, det~rmmantes, matriz inversa, rangos, etc. En este epígrafe sólo daremos unas ~oc10nes, g~nerales en una primera aproximación al problema de la regresión lmeal mu~ttple desde un punto de vista descriptivo ya que en los cursos de I~troducctón a la Econometría se estudia esta teoría en profundidad introduciéndose en el modelo probabilístico. Vamos a considerar la ecuación de un hiperplano con una variable endógena o dependiente (y) y k variables exógenas o explicativas (x 1, x 2 , ••• , xk): · [3.42] . Por otro lado sabemos que el valor i-ésimo de la endógena observada es tgual al valor estimado o teórico del modelo ytl. más el error o residuo e.l" Y;= Yti+ e;= b0 + b¡X 1; + h 2X2; + ·· · + bkxki +e;
[3.43]
Al tener en cuenta todas las observaciones muestrales de las variables o sea para i = 1, 2, 3, ..., N, la expresión [3.4] se transforma en el siguie~te sistema de ecuaciones: Yt = ho + b¡Xu + h2x21 + · ·· + bkxk 1 + Y2 = ho + h1x12 + b2x22 + ··· + bkxk2 +
e1 e2
[3.44]
YN = bo + h 1 X1N + b 2x 2N + ··· + bkxkN +eN
El sistema [3.44] se puede expresar matricialmente:
es decir
[~J[i
0
xk2 xkl][bb¡ ]
..
•
X2N
y= xb +e
•
xkN
[e
1
e2 ]
.. + .. o
•
bk
ek
[3.45]
Como xb es la endógena estimada la expresión [3.45] también toma la forma matricial: [3.46] Y= Yt +e
172
DISTRIBUCIONES DE FRECUENCIAS
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
En las expresiones [3.45] y [3.46] existen los siguientes elementos matriciales: • El vector columna de las observaciones de la endógena y de dimensiones (N x 1) ya que tiene N filas y una columna:
BIDIM~NSIONALES
173
• El vector columna de la variable endógena estimada por el modelo o hiperplano de orden (N x 1) ya que es el resultado del producto xb cuyos órdenes son [N x (k+ 1)] y [(k+ 1) x 1], resultando xb de orden (N
X
1):
Yt
Ytl] [ Ytz
= .
YtN
• El vector columna de los (k+ 1) coeficientes de regresión parcial b de orden [(k+ 1) x 1] ya que tiene k+ 1 filas y una columna:
Estos cinco elementos matriciales intervienen en todo . el proceso de la regresión en sus variadas operaciones y transformaciones como se verá a continuación. Nuestro problema consiste, como siempre, en estimar el vector de los coeficientes de regresión parcial b empleando el método de los mínimos cuadrados. Hay que minimizar la suma de los cuadrados de los errores de las distintas observaciones: N
S=
L
N
ef =
i= 1
• El vector columna de los errores o residuos e de orden (N x 1) ya que tiene N filas y una columna:
L (y¡- Yr;)
N
2
=
i= 1
L
(y¡- bo-
b¡X¡;- · · · -
bkxkl
[3.47]
i=l
Derivando parcialmente la expresión [3.47] respecto a las incógnitas que son los coeficientes tenemos:
• La matriz de las observaciones de las k variables explicativas x de orden [N x (k + 1)] ya que tiene N filas y (k+ 1) columnas. La primera columna es de unos ya que sería el factor del coeficiente constante de la exógena ficticia que afecta al término independiente del hiperplano:
X~ [i
Xu X¡z
Xz¡ Xzz
Simplificando y operando tendremos el siguiente sistema de ecuaciones normales mínimo cuadráticas: N
L xlN
XzN
i= 1
N
Y; = Nbo
+ bl
L i= 1
N
X¡;
+ bz
L
i= 1
N
Xz;
+ ... + bk
L
i= 1
xki
N
N
L
xliyi
=
L
bo
i=l
N
X¡;+ b¡
i=1
L
N
xL
N
L
b2
+
X¡;X2; + ... +
bk
i=l
i=l
L
X¡¡Xk;
i=l
'
····························································································· N
L
N
i=l
Xk;Y; = bo
L
i=l
N
Xk;
+ b¡
L
N
X¡;Xk; +
i=l
b2
L
i=l
+ ··· +
bk
L
i=l
X12
X1N
Y2
Xu
x12
X1N
x21
X22
X2N
Y3
X21
X22
X2N
xkl
X12
X22
xk2
xkl
xkN
xk2
xkl
YN
xki
¿
[(k
+ 1) X
N], (N
X
~/ [(k+ 1)
X
1)
1)]
[(k
X
N
i= 1
xkN
~/ + 1)
X
(k
+ 1)]
--..
1
[(k+ 1)
X
X
1]
A la expresión [3.48] también se puede llegar operando directamente con elementos matriciales. La suma de los errores elevados al cuadrado puede ponerse, según el álgebra matricial, como producto del traspuesto del vector de los errores por dicho vector: N
L
ef = e' e = [y - xb ]' [y - xb] = [y' - b' x'] [y - xb] = y'xb - b'x'y + b'x'xb
= y'y -
2y'xb
+ b'x'xb
[3.49]
En la demostración anterior se ha tenido en cuenta que y'xb = b'x'y ya que los escalares, como son los anteriores términos, son iguales a sus traspuestos. Derivando la expresión matricial [3.49] respecto al vector de las incógnitas b e igualando a cero, como condición necesaria de mínimo, tendr~mos el sistema de ecuaciones normales mínimo cuadráticas: ae'e = -2x'y ab
i= 1
XliYi [3.51]
N
xki
¿
i=l
N
¿
xkixli
N
x¡;
¿
bk
i= 1
Xk;Y;
i=l
+ 1)
X
(k
+ 1)]
([k+ 1)
X
1]
(k+ 1)
X
1]
En la expresión [3.51] se observa que la matriz x'x es cuadrada de orden [(k+ 1) x (k+ 1)] y dividiendo por N sus elementos obtenemos los momentos de primer o segundo orden respecto al origen de las variables explicativas. El producto x'y origina un vector columna que dividiendo por N nos proporciona los momentos de primer orden de las endógenas respecto al origen y los de segundo orden entre ésta y las explicativas. Como x'x es una matriz cuadrada podemos obtener su determinante lx'xl y si es distinto de cero implica que es una matriz no singular y puede obtenerse su inversa [x'xF 1 . Premultiplicando la expresión [3.50] por dicha inversa y teniendo en cuenta que el producto de la inversa por la matriz dada es la unitaria, tenemos que:
[ b = [x'xF 1 x'y
j
[3.52]
La expresión [3.52] nos proporciona las estimaciones de los elementos del vector columna b que son los coeficientes de regresión parcial del hiperplano [3.42]. La interpretación de estos coeficientes es la misma que se ha dado en el ajuste de un plano. • El problema de la multicolinealidad en el ajuste de un hiperplano
+ 2x'xb =O
o sea x'xb = x'y
i= 1
¿
b¡
[x'xF 1 [x'x] b = [x'xF 1 x'y
i= 1
= y'y -
N
X¡¡Xki
1)
[3.48]
x'y = x'xb
Y;
i=l
bk
[N· (k+ 1)], [(k+ 1)
N]
¿
bo
N
¿
xi;
i= 1
[(k [(k+ 1)
N
xki
bl
xkN
xk2
i=l
¿
X2N
i=l
N
N
X21
¿
X¡¡
i= 1
¿
Xu
X1N
¿
N
bo
Y1
N
N
x¡;
Este sistema podemos expresarlo de forma matricial:
Xu
Si el sistema de ecuaciones normales [3.50] lo ponemos de forma semidesarrollada, obteniendo los productos x'x y x'y, se verá el significado de sus elementos:
N
X2hi
175
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
174
[3.50]
Para que se pueda aplicar la expresión [3.52] no puede existir ninguna relación lineal exacta entre cualquier subconjunto de variables exógenas o
176
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
explicativas. Si esto ocurre sabemos por el álgebra matricial que la matriz [x'x] sería singular, o sea que tendría determinante nulo, \x'x\ = Q, lo que imposibilitaría el cálculo de la matriz inversa [x' x] - 1 y como consecuencia es imposible obtener el vector columna de los coeficientes de regresión parcial.
Como es una matriz simétrica coincide con su traspuesta: Adj [x'x] = {Adj [x'x]}'. Como sabemos, la inversa es:
Ejemplo 3.16
Obtener los coeficientes de regresión parcial del plano del Ejemplo 3.15 utilizando la expresión [3.52].
[x'x]
_
1
=
{Adj [x'x]}' lx'xl
=
Solución:
b
~
[!l
I
5
I
xi;
5
X2;
I1
11
=
5 17 17 67 11 44
11 44 31
I1
17
xlixu
67
44
95
95
95
11
33 95
46 95
X2;X1;
;~
12
I1
XuY;
47
X2;Y;
31
I1
5
I
X~¡
11
44
31
;~
= 10.385 + 8.228 + 8.228 - 8.107 - 8.959 - 9.680 =
= 26.841 - 26.746 = 95
En segundo lugar obtenemos la matriz de adjuntos (menores complementarios con su signo): Adj [x'x] =
Y;
i~1
5
= 5·67·31 + 17·44·11 + 17·44·11-11·67·11-
- 17. 17. 31 - 5. 44.44
33
;~
Vamos a calcular la [x'xr 1• En primer lugar se obtiene el determinante de la matriz por la regla de Sarrus:
Jx'x\
34
5
x'y=
;~
i~
5
5 17
X2;
i~1
5
I1
xli
i~1
43
;~
I
X1;
5
i=1
I1
5
i~1
I
11 95
5
N
=
43 95
Veamos el valor de x'y que según el sistema [3.51] es:
5
.[x'x]
141 95
95
¡x.r'xy
177
141 -43 [ 11
-43 34 -33
11]
-33 46
b = [x'xr 1 x'y
=
141 95
43 95
11 95
12
0,13
43 95
34 95
33 95
47
0,62
11 95
33 95
46 95
31
0,074
Las diferencias de estos coeficientes de regresión parcial y los obtenidos en el ejemplo 3.15 son debidas a los errores de redondeo ya que son coeficientes muy pequefl.os con gran sensibilidad en su cálculo. • Forma matricial del coeficiente de determinación múltiple en el ajuste de un hiperplano
La bondad del ajuste la obtenemos con el cálculo del coeficiente de determinación múltiple que sigue siendo la participación de la varianza explicada
178
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
por la regresión sobre la varianza total de la endógena observada. Estas varianzas se pueden obtener también empleando el cálculo matricial con los elementos del modelo. Como sabemos los valores observados del vector columna y son iguales a los estimados por el modelo Yt más el vector columna de las desviaciones o errores e: y = Yt
Ejemplo 3.17 Con los datos del Ejemplo 3.16 obtener la bondad del ajuste del plano. Solución:
Para obtener el coeficiente de determinación múltiple empleamos la expresión [3.53]:
+ e = xb + e
Operando niatricialmente con estos elementos se demuestra igual que en la regresión lineal simple que la varianza total de la endógena es igual a la varianza estimada por la regresión s;,.J23···k más la varianza residual s;y·!23···k' o sea:
s;
s 2 - s2 yy1 ·123···k
b'Xy
~ (0,13
~ 32,994 ~ 33
b'x'y - NY2 ~ 33 - 28,8 = 4,2 5
y' y=
y·123···k
0,62 0,074)(:;)
NY2 = 5. (2,4) 2 = 5. 5,76 = 28,8
+ s2ry·l23···k
El coeficiente de determinación múltiple será: R2
179
=s;,.123···k s2 y
I
yf
=
34
i=l
y'y- NVZ
= 34- 28,8 = 5,2
La varianza explicada por la regresión en su forma matricial será:
s;,.123···k
1 =N
N
.I
1 (Yti- Yf =N _
•=1
1
[N.I Y~- -] Nf"Z
2
Ry·12
'
=
•=1
1
i""72
-
1
-
= N [y;yt - N r] = N [(xb)' (xb) - NY2 ] = N [b'x'xb - NY2 ] = 1
1
1
-
N
i""72
N
La varianza total de la variable endógena será:
2= -1;., N
L., i=1
2
1 (yi- Y) = N
[NI
-]
i=1
1 _ yf- NY2 =-[y' y- NY2 J N .
Luego la expresión matricial del coeficiente de determinación múltiple en la regresión de un hiperplano con término independiente b 0 es:
R;.
b'x'y- NY2 123 ···k
= -,....:....-N-,==-72 yy- r
3.6.
Ajustes no lineales por mínimos cuadrados
En los epígrafes anteriores se ha estudiado en profundidad la regresión lineal ya que es la adecuada para explicar la mayoría de los fenómenos de naturaleza socioeconómica. No obstante existen otras ocasiones en las que la nube de puntos de los datos observados no se ajustan a funciones de naturaleza lineal. Así, por ejemplo, en el Gráfico 3.8 figura a) representa una nube de puntos a Jos que se ajusta un polinomio de segundo grado, a la b) una función exponencial, a la e) un polinomio de tercer grado y a la d) una hipérbola equilátera. El planteamiento de estos ajustes por el método de los mínimos cuadrados es análogo al estudiado en los casos lineales.
= - [b'x'x(x'x)- x'y - NVZ] = - [b'x'y - N r]
sy
4,2
~52= 0,81
• Ajuste de una parábola o polinomio de segundo grado El modelo que se pretende ajustar es:
[3.53]
[3.54]
180
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
y
y
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
Operando da lugar al siguiente sistema de ecuaciones normales:
)(
N
)(
)( )(
)( )(
:¿
)(
)(
N
:¿
)(
i= 1 N
X
X
(a)
y
X;+ az L
i= 1 N
Y; X¡= ao
:¿
N
X;+ a 1
X~1
i= 1
:¿
i= 1
i= 1
N
N
N
x? + a2 LX~ i=l N
i=l
i=l
i=l
Resolviendo el sistema obtendríamos los coeficientes de la parábola que sustituidos en la expresión [3.54] da lugar al modelo ajustado. En este ajuste el número de observaciones tiene que ser mayor que tres que es el número de coeficientes a estimar. El ajuste puede generalizarse a polinomios de grado r en general, para r + 1 < N, ya que habría r + 1 incógnitas o coeficientes.
y
)(
• Ajuste de una hipérbola equilátera
)(
X
X
(d)
(e)
N
:¿
L Y; xf = a0 L xf + a 1 L x~ + a2 L x'f i=l
(b)
GRÁFICO
N
Y;= Na 0 + a 1
i=l
)(
)( )(
181
3.8. Los ajustes no lineales.
La ecuación de una hipérbola equilátera es la siguiente: 1 y= ao +al-
[3.55]
X
Para obtener los coeficientes se minimiza la expresión: N
S=
L [y¡- (a
0
Como sabemos la endógena observada será igual a la estimada más el error:
+ a1 x; + a2 xf)JZ
i=l
obteniendo el sistema de ecuaciones normales del modo siguiente:
as -=0 aao
as aa2
-=0
Efectuando el siguiente cambio de variable: 1 x
z=-
nos quedaría la ecuación de una recta de Y sobre Z cuyo ajuste ya hemos estudiado: ·
182
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
183
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
• Ajuste potencial
Se ajustaría por mínimos cuadrados el modelo lineal simple de U sobre X,
La ecuación de una función potencial es:
u= a+ bx [3.56]
La expresión [3.56] tiene la peculiaridad respecto a los que hemos estudiado hasta ahora de que no es lineal en los parámetros. Cuando las funciones son lineales en los parámetros, como por ejemplo la hipérbola equilátera, basta con hacer una transformación en la variable para aplicar el método de los mínimos cuadrados. Si la función que se desea estimar no es lineal en los parámetros, hay que transformarla en lineal previamente. En el caso que nos · ocupa basta con tomar logaritmos:
+ a 1 logx
logy = loga 0
Una vez estimados a y b se obtienen los verdaderos parámetros deshaciendo el cambio: a 0 = antilog a y a 1 = antilog b. En los casos del ajuste de una hipérbola equilátera, potencial y exponencial vistos, el método de Gauss o de mínimos cuadrados se aplica previa transformación de las variables. Ejemplo 3.18
Disponemos de los datos siguientes del consumo X y precio Y de un producto: 2
3
3
2
Si hacemos el siguiente cambio: logy =u logx
=
z
loga 0 =a
aplicamos el método mínimo cuadrático al modelo lineal simple de U sobre Z:
u= a+ bz
Ajustar a estos datos: Una hiperbóla equilátera del precio sobre el consumo. b) Una función potencial. e) Una función exponencial. a)
Solución:
Construimos la siguiente tabla
Una vez estimados a y b se sustituyen en la expresión [3.56] donde a0 = antilog a, y a 1 = b. X¡
Y;
1 z.=-
5 3 2
1 1/2 1/3
• Ajuste exponencial
La ecuación de la función exponencial es:
Se transforma en lineal tomando logaritmos logy
=
loga0
a)
+ xloga 1
y= a0
z; = log
X¡
U¡= log Y;
0,6931471 1,0986123
1,6094379 1,0986123 0,6931471
o
1
1
x
X
+ a 1 - = a0 + a 1 z = 0,6538 + 4,3846-
donde
Haciendo el cambio de variable logy =u loga 0 =a loga 1
1 2 3
1 2 3
xi
l
=
b
11
a 0 =YmZ - = 0,6538 }
mzo
a 1 = mu = 4' 3846 mzo
m 11 es la covarianza entre Y
mzo
es la varianza de Z
y Z
184
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
185
Como vimos la independencia estadística se dará entre los dos atributos si y sólo si: donde u = log y = log a0
nij = n; .. n.j
+ b ·log x = log a0 + bz'
N
N N
V i,j
[3.57]
siendo -
m~l-
m~1
loga 0 =U- -,-Z' = 1,8538
y b = -,- = -1,2057,
m2o
donde m'11 es la covarianza de U y Z', y e)
m2o
m~ 0
la varianza de Z'.
Si la expresión [3.57] no se cumple se dirá que entre los mencionados atributos existe un determinado grado de asociación o dependencia estadística. Existe asociación por ejemplo entre el nivel educativo y los puestos de responsabilidad ocupados en las empresas. Si de la expresión [3.57] despejamos la frecuencia absoluta conjunta y la denotamos por n;j tendremos:
y = a0 · ai = 1,2429 · 0,6325x
[3.58]
donde u = log y = log a0
= 0,2174418
+ x log a 1 = ( U-
1 - -m~ X- ) m2o
+ x -m~ 1 = m2o
- 0,4581453 X,
Este valor n;j es la frecuencia teórica que existiría si los dos atributos fuesen independientes. Vamos a llamar nij a la frecuencia absoluta conjunta observada. La diferencia al cuadrado entre estas dos frecuencias es un indicador del grado de asociación entre los dos atributos. Un primer coeficiente de asociación o contingencia es el llamado cuadrado de contingencia:
siendo m'{ 1 la covarianza de U y X. [3.59]
3.7.
Estudio de la asociación entre variables cualitativas
En el estudio que hemos realizado de la regresión y correlación se ha tratado sólo el caso de variables cuantitativas (ingresos, gastos, precios, salarios, etc.) a las que se les puede someter a todo tipo de cálculos numéricos (sumas, restas, divisiones, etc.). Vimos en el Apartado 3.2.2 que con variables de tipo cualitativo pueden construirse las denominadas tablas de contingencia y a través de las mismas se podía estudiar la independencvia estadística entre distintos atributos. Si dos atributos son dependientes estadísticamente podemos construir una serie de coeficientes que nos midan el grado de asociación o dependencia entre los mismos. Partimos de la tabla de contingencia 3.4 en la que existen r modalidades del atributo M y s del M'. El total de observaciones será: r
N=
s
L L n;j i= 1 j= 1
Este coeficiente tiene un campo de variación variable desde cero --cuando existe independencia y n;j = n;¡- hasta determinados valores, todos positivos, que dependerán de las magnitudes de las frecuencias absolutas que lo componen. Este inconveniente de límites variables se elimina con el empleo del coeficiente de contingencia debido a K. Pearson que se define como:
~
C=.vJi"+?
[3.60]
Su campo de variación es de cero a uno. El valor cero se dará en el caso de independencia al coincidir las frecuencias teóricas con las observadas: n;j = nij. A medida que se va aproximando a la unidad el grado de asociación entre los dos atributos es mayor. Sólo alcanzará la unidad en el supuesto límite de que el cuadrado de contingencia es muy grande ya que el límite de C cuando x2 tiende a infinito es uno.
186
CASAS-SÁNCHEZ, J. M. y SANTOS-PE:f.lAS, J.
DISTRIBUCIONES mi FRECUENCIAS BIDIMENSIONALES
Ejemplo 3.19
En segundo lugar se obtienen los elementos de la
A partir de la tabla del Ejemplo 3. 7 determinar el grado de asociación entre los atributos estado civil y accidentes automovilísticos.
(n~ 1 '
n 11
f
nu
Solución:
(n~ 2
-
nd 2
' n12
La tabla de contingencia es:
x2 :
=
(8- 5)2 8
=
(32 - 35f 32 = 0,281
=
187
1,125
Accidentes Con accidente
Sin accidente
5 15
35 45
40
20
80
100
n.
'·
Estado civil Casados Solteros
60
(n;,- n;/
TABLA.
n~í
En primer lugar construimos la tabla de frecuencias teóricas n;i: '
-
n11 -
n'
n ·n
40·20
l. .1----¡::¡-loO --
= nl. · n. 2 =
12
N
8
40 · 80 = 32 lOO
M'1
M'2
1,125 0,750
0,281 0,188
El cuadrado de contingencia será:
n ·n 60·20 n'21 = - 2- · - - 1· = - - = 12 N lOO
2
2
x2 = ¿ ¿ i= 1 i= 1
(n' - n ij
,
f
ij
= 2,344
n;i
A no ser cero este coeficiente nos indica que existe asociación o dependencia entre el estado civil y los accidentes. Para ver el grado en la escala de cero a uno obtenemos el coeficiente de contingencia de Pearson: TABLA.
M!J
M;
M¡ Mz
n;,
M'1
Mí
8 12
32 48
e=
rx.z--
V~=
2,344 loo+ 2,344
~
= v0,0229 = 0,1513
Como el coeficiente e está muy próximo a cero, se llega a la conclusión de que la asociación entre los dos fenómenos es muy baja.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
Ejercicios
mo2 -
68.294 - - 103 2 6
2 ao1 = -
ao2 -
=
189
773,3
1 aoz = 6(120 2 + 85 2 + 90 2 + 63 2 + 1102 + 1502 ) = 1
l. Un jefe de un establecimiento comercial quiere saber si el aumento en el número de clientes potenciales que entran en sus almacenes, supone un aumento en sus ventas. Para ello observa las variables estadísticas X (número de clientes potenciales) e Y (importe de las ventas), durante los seis días de una semana; los datos son:
= 6(14.400 + 7.225 + 8.100 + 3.969 + 12.100 + 22.500) = =
b) mu
=
L
M
X
J
V
S
X y
87 120
63 85
70 90
55 63
90 110
105 150
a) Las medias aritméticas y varianzas marginales de X e Y. b) La covarianza de X e Y. e) Coeficiente de correlación entre X e Y. á) La dependencia o independencia estadística entre X e Y. e) Las rectas de regresión lineal de X sobre Y, y de Y sobre X.
e) R
=
3
=
78,3
a1 1
= 6 (87 · 120 + 63 · 85 + 70 · 90 + 55· 63 + 90 · 110 + 105. 150) =
a20
-
a 210
2 38.588 - - (470) 6 6
= -
= ~(87 2 + 6
~
=
=
1 6(10.440 + 5.355 + 6.300 + 3.465 + 9.900 + 15.750) =
=
1 6 51.210
1
-
~¡¡;;;;
=
=
8.535 466,6
fo52.fi73J
~
466,6 ~ 09766723 17,182932·27,808871- '
R i= O =>
Y sobre X:
x e y son variables dependientes.
- 466,6 x- 78 3 =---(y- 103) ' 773,3 y- 103
=
466,6 , (x- 78,3) 295 2
2. Calcular la varianza residual de Y sobre X, y de X sobre Y, así como el coeficiente de determinación para los datos del problema anterior. =
1 = 6(7.569 + 3.969 + 4.900 + 3.025 + 8.100 + 11.025) =
= 6 38.588 = 6431,3
m1 1
a 10
295,2
63 2 + 70 2 + 55 2 + 90 2 + 105 2)
=
e) X sobre Y:
- 1 1 o Y= (120 + 85 + 90 + 63 + 110 + 150) = 6618 = 1 3 = a 01 6 m20 = a 20
a 10a 01 = 8.535 - 78,3 · 103 = 466,6
-
Existe un grado de correlación entre clientes potenciales y ventas del 97,6 %. á)
Soluci6n: a)
11382,3
a 11
Se pide:
235
=
1
Día
1 1 X= (87 + 63 + 70 +55+ 90 + 105) = 6470 6
1 6 68.294
Soluci6n: 2
R = 0,9538887
s;Y =
m02 (1 - R
s;x = m
20 (1
- R
=> 2 2
95,39% de concasualidad.
)
~ 35,659342 varianza residual de Y sobre X
)
~ 13,61308 varianza residual de X sobre Y
190
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
3.
Si hxy y byx son las pendientes de las rectas de regresión de X sobre Y, y de Y sobre X, demostrar que el coeficiente de determinación, R 2 = h-xy b,x·
de la que conocemos a 01
=
191
19; por otro lado,
Solución:
bxy
=
::~} m
_ R2 -
11 b =yx mzo
_ mu mu _ - - . - - byxbxy mzomoz mzo moz mil
siendo 2 la pendiente de la recta de regresión de X sobre Y, de donde la pendiente de la recta de regresión de Y sobre X, mll 9 = 09/2 = 045 = mzo ' ' 20
debido a la propiedad conmutativa del producto de números reales.
4.
Justifíquese si debe aceptarse o rechazarse que de unos datos relativos a cierta variable bidimensional se ha obtenido que m11 = 40, m20 = 16 y m02 = 25.
Luego sólo queda determinar a 10, pero la recta de regresión dada es
x - a 10
= 2{y -
a 01 )
= 2{y -
19),
y coincide con Solución:
X=
De ser ciertos estos momentos, podremos calcular el coeficiente de correlación:
de donde: -18
R=
m 11
~¡;;;;;
=
40
Ji6J25
40 40 =-=-=2>1 4· 5 20 '
=
a 10
A partir de un conjunto de datos sobre una variable estadística bidimensional, se ha calculado la recta de regresión de X sobre Y, obteniéndose los siguientes resultados: x = 2y - 18 ; R 2 = 0,9
; a 01 = 19
Obtener por deducción lógica la recta de regresión de Y sobre X.
-
2 · 19 = a 10
-
=
38
a 10
=
-18
+ 38 = 20
por lo que la recta pedida, sustituyendo será:
que contradice que el coeficiente de correlación debe estar comprendido entre - 1 y 1: - 1 ~ R ~ l. Debe rechazarse, por ser imposibles los datos.
5.
2y- 18
9 9 y- 19 = -(x- 20) = - x - 9 20 20 '
o bien:
9
x Y= 20
+ 10
'
o equivalentemente:
[!
=
0,45x
+ 10
Solución:
La recta buscada es:
6. Entre los empleados de cierta empresa se dispone de la información de sus salarios brutos al año, que se han clasificado en dos intervalos: de 1 a 3 y de 3 a 7 millones de pesetas. Por otro lado se han encuestado a los asalariados sobre el número de vehículos a motor (incluyendo automóviles, moto-
192
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
193
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
cicletas, camionetas y similares) adquiridos en los últimos 5 años. Los resultados han sido: Vehículos, Y
o
1
2
3
2
3
o 2
6 3
2
9
Salario, X 1-3 3-7
o
o
1 1
2
3
2
Obtener:
1
a 11 =9 (2 ·O· 2
+ 2 · 1 · 3 + 2 · 2 · 1 + 2 · 3 ·O + O· 5 ·O + 1 · 5 ·O +
b)
= 99 (y-~) e)
1
moz
X _
3 = 99 92
=
(y _13) 9
11 99 18 92
1.089 1.656
-.-=--~O
'
6576087
Coeficiente de correlación:
1
9
+
a 20 = -(2 2 ·6
9
=>
9
(y _13) 9
+ 5·3) = -(12 + 15) = 3 1· 3
m20 = a 20 - ai 0 = 1
3 = 11/9
X _
Coeficiente de determinación:
R2 =
9
9
92/81
Soluci6n:
a 0 1 = -(O· 2
9
=>
92
9
50
Aprovechando los cálculos ya efectuados,
a) La recta de regresión de Y sobre X. b) La recta de regresión de X sobre Y. e) El coeficiente de correlación y el de determinación. d) Si son ambas variables independientes o no. e) La varianza residual de Y sobre X.
1 a 10 = -(2·6
1
+ 2. 5. 1 + 3. 5. 2) =- (6 + 4 + 10 + 30) = -
1
+ 2 · 2 + 3 · 2) = -(O + 3 + 4 + 6) = 9
11 - 32
= 11
13
-
9
d)
R# O
e)
S2
- 9= 2
=
9
29
=
(13)
9- 9
ry 2
=
261 - 169 92 81 = 81
=
{1089 )·JR2 = + yt:656 ~ 0,8109307
Variables estadísticas dependientes. El salario de los empleados influye en el número de vehículos a motor adquiridos en los últimos 5 años.
1
+ 52 ·3) = -(24 + 75) = 11
= aoz - a~l
R = sig(m 11
m 02 (1 - R 2)
92 ( 1 - 1.089) - ~ O 3881 1.656 '
= -
La variabilidad de Y no explicada por la recta de regresión de Y sobre X, es del 38,8 %.
194
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
7.
De una variable estadística bidimensional (P, V) = (precio, ventas en tm.) de cierto producto de consumo en diferentes días, se han ajustado las siguientes rectas de regresión:
100
100
i= 1
í=1
L c'f =
L C¡ = 100.000
150.000.000
100
L h¡ C¡ = 50.030.000
4P+
V=2} 25P + 16V= 9
í=1
Hallar: Calcular el coeficiente de correlación. a) b) e)
Solución: Las rectas serán: 1
1
P=--V+4 2
25 9 V=--P+16 16
y
(1)
La recta de regresión de e sobre H. El coeficiente de determinación. La varianza explicada por la recta obtenida de
Solución:
o bien:
V= -4P
+2
16 9 P=--V+25 25
y
R=-
J( -~)(-~!)=-~E
190.300 e - 1.000 = 1. . (h - 31 O) 903 900
(2)
Si fueran ciertas la rectas de P sobre V y de V sobre P de (1), entonces:
Donde. a 01 =
[-1, 1]
R = -
5
S=
-
100
=
100,
L h; =
i= 1
moz
= a 02
¿ ht = 200.000.000
i= 1
310 2
afo
azo
=
200.000.000 100
m11 = a 11
-
a 10 a 01
a 11
=
50.030.000 = 500.300 100
-
100
31.000
= 2.000.000 -
-
0,625.
8. De las estadísticas de una variable bidimensional (H, C) = (horas de trayecto, consumo de combustible en litros) de cierta flota mercante, se han obtenido estos valores:
31.000
a 10 = 10() = 310 horas
a20
=
J(-4)(~! 6)= -~~ [-1, 1],
donde - 8/5 no puede ser nunca un coeficiente de correlación. Luego:
N
100.000
----¡o¡=¡ = 1.000 litros
m20
Mientras que si las rectas de V sobre P y de P sobre V fueran respectivamente las recogidas en (2), se deduciría: R=-
e sobre H.
aoz =
a~ 1
=
= 1.903.900
. 2.000.000 (horas) 2
= 500.300 -
310 · 1.000
= 1.500.000 - 1.000 2 = 500.000
150.000.000 = 1.500.000 100
= 190.300
195
196
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
La explicación puede deberse a que los buques de gran tamafio y consumo de combustible hagan muy frecuentemente trayectos breves, mientras que los de menor tamaño y consumo hagan también los trayectos largos en horas. e)
s;c = m
02
~
nij:
(1 - R 2 ) ~ 480.978,996 es la variabilidad de e no explicada por e sobre H.
S
e
V
n.
V H
80 48
52 52
20 12
152 112
n•J.
128
104
32
264 =N
la recta de
Por todo ello, la varianza explicada por la recta de _
2 Src-
m 02 -
_
m 02
R2 -
mi 1 _ m
-
20
9.
197
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
e sobre H, es:
(190.300j2 . 2 1. . ~ 19.021,004 (litros) 903 900
'·
Solución:
De la distribución de una variable bidimensional se sabe que:
y S
e
V
19.456 264
15.808 264
4.864
14.336 264
11.648 264
3.584
n;/ X
Obtener las rectas de regresión de Y sobre X, y de X sobre Y. V
264
Solución: H
Y sobre X: y- a
m
01
11 =(x - a ) = m2o 10
08·J2·J8 y- 4= ' (x - 3) 2
R~
¡;;;;;; (x -
m2o
= 1,6 (x -
3)
*
y
a10)
*
= 1,6x -
264
donde para ver si son X e Y independientes se debe verificar:
i = 1,2 ; j = 1, 2, 3.
0,8
Por ejemplo:
X sobre Y: m 11
x- a 10 =-(y- a 01 )
*
mo2
*
X
.
3,2
x- 3 = - {y- 4) = 0,4{y- 4)
n~ 1 =
80
*
X e Y son variables dependientes.
8
= 0,4y + 1,4
El cuadrado de la contingencia es: 2
10.
19.456
264 =1= n 11 =
Estudiar si las siguientes variables, X= sexo, e Y= estado civil, son o no independientes. En el caso de haber dependencia obtener el «cuadrado de la contingencia».
3
x2 = ¿ ¿ i= 1 j= 1
(n' _ n ij
,
ij
)2
~ o,5390749
+ 1,0366826 + o,1347687 + o,7316017 +
nij
+ 1,4069264 + 0,1829004 =
4,0319547
198
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
11. Ajustar una parábola a los datos relativos al precio P y demanda D de cierto artículo si se han observado ambas variables conjuntamene en 4 días ' consecutivos:
199
2
-9=b· ( 351---¡37 ) +e ( 3.403-37·--¡351)
)
351·37 351 2 - 163 = b ( 3.403 - - - ) + e ( 33.603 - - - ) 4 4 Día i
1
2
3
4
10 6
7 9
11 5
9 8
-9 = -35 b - -625 e ) 4 4 625 11.211 -163 = b +-- e
4
Solución: Debemos ajustar la función D =a+ bP sistema de ecuaciones normales 4
¿
D¡ = 4a
i=l
i=l
4
4
D; P; = a
i=l
¿ i=l
4
" D. P~ = ¡_.,,
i=l
+ b ¿ Pf +e i=l
4
pt
i=l
4
=
4
i=l
+ 625e } + 11.21le
{- 625e -
+ 11.211e
36)
+ 392.385) - 22.500
de donde:
a "L.-t P~ + b L..a. " P~ + e ¿_., " P~ i=l
625 35
=-
- 22.820 = e(- 390.625
4
¿
625b
1
- 625
4
P;
35b
=
b = - (- 625e - 36) 35
+ b ¿ P; + e ¿ Pf
i=l
¿
4
- 36 -652 =
4
+ eP 2 , para ello resolvemos el
4
=
e
-22.820 + 22.500 = -320 = 1.760 1.760
-o 18 '
i=t
y
que resulta ser:
b
28 = 4a + 37b + 351e} 250 = 37a + 351b + 3.403e 2.294 = 351a + 3.403b + 33.603e
~ b(- ~:: = 7
a= 7-
3
2.294 = 351 7 -
35
:5)0 = 37(7-
-¡-b ---¡-e
~b-
!
3 1 e)
+ 3.403b + 33.603e
1 (-625e- 36) 35
=-
37
351
4
4
a= 7- - b - - e
e:,;
e:,;
7- 20,518165
2,21818
+ 15,954545 =
2,43638
La parábola de regresión de D sobre Pes aproximadamente:
+ 351b + 3.403e )
1
D = 2,43638 + 2,218l8P- 0,181818P 2
1
12. Con los datos del problema anterior, calcular la varianza residual de D sobre P y el coeficiente de determinación R 2 •
200
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Solución:
Capítulo 4
Números índices 1 ~ ¡ 0,362157
=
0,09054,
donde:
Df = a + bP 1 + ePi
~
6,7273
+ 1,2336 · 10 - 0,1269 · 102 ~ 6,369
D~ =
a + bP 2 + cP~ ~ 6,7273 + 1,2336 · 7 - 0,1269 · 72 ~ 9,1444
D~ ~
4,942
D! ~ 7,5508
4. 1.
Introducción
El coeficiente de determinación se calcula así:
s;D
R = 1-- ~ mo2 2
o,09054 1 - - - = 0,963784, 2,5
donde mo2
=
1 a02 = ¡(6 2
a 01
=
1 ¡(6
2 = 206 - 72 aoz - aol 4
+
92
1
=
206 - 196 4
10 4 206
+ 52 + 82 ) = ¡(36 + 81 + 25 + 64) = 4
+ 9 + 5 + 8) =
28
4
=
7
Por tanto existe una concausalidad parabólica del 96,38 % entre las variables estadísticas P y D.
A lo largo de los capítulos 2 y 3 se ha estudiado la descripción de variables aisladas tanto cuantitativas como cualitativas así como las relaciones entre distintas variables a través de la regresión y la correlación. Las distribuciones de frecuencias tanto unidimensionales como multidimensionales están referidas a un sólo período temporal, o sea no se ha tenido en cuenta la variable tiempo en el estudio de las variables económico-sociales. En el presente capítulo y el que le sigue vamos a tratar de la descripción de fenómenos económicos a lo largo del tiempo a través de la construcción de lo que se denominan números índices y el tratamiento clásico o descriptivo de las series temporales. Existen un gran número de fenómenos económicos cuyo significado y estudio alcanza distintos niveles de complejidad. Ejemplos de estos fenómenos son lo que se conoce como coyuntura económica, nivel de inflación, nivel de desarrollo, etc. Los números índices que estudiaremos en el presente capítulo constituyen el instrumental analítico más adecuado para estudiar la evolución de una serie de magnitudes económicas que nos den respuesta a cuestiones tales como si la coyuntura económica es positiva o negativa, si el nivel de inflación es adecuado o no o si nuestro ritmo de crecimiento económico permite o no permite crear empleo neto positivo. Un número índice puede definirse como una medida estadística que nos proporciona la variación relativa de una magnitud simple o compleja a lo largo del tiempo o del espacio. Lo más corriente es que se estudie la evolución de la magnitud a lo largo del tiempo con lo que hay que establecer lo que se conoce como período inicial o base sobre el que se va comparando la evolución de la magnitud o variable estadística. El procedimiento de comparación es muy sencillo. Supongamos, por ejemplo, que queremos estudiar la evolución
202
203
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
NÚMEROS ÍNDICES
de la producción de automóviles, siendo X. el valor de la misma en el período base (un año determinado) y xt los automóviles fabricados en otro período t distinto del base que se denomina período de comparación. El índice de evolución de o a t expresado en tantos por cien será:
- Números índices complejos sin ponderar que surgen cuando se estudia la evolución de una magnitud que tiene más de un componente y a todos se les asigna la misma importancia o peso relativo. Así, por el ejemplo, la magnitud compuesta puede ser el precio de un conjunto de productos lácteos (queso, leche y mantequilla) estableciéndose la hipótesis, por otro lado nada realista, que los tres componentes tengan la misma importancia o peso en el consumo de los hogares. Como en la realidad los componentes de una magnitud compleja tienen pesos distintos, estos índices tienen poca utilidad en el mundo económico-empresarial. Su elaboración no plantea ninguna dificultad. Supongamos que la magnitud compleja que nos interesa tiene N componentes (1, 2, ... , i, ... ,N). En primer lugar se elaborarían los índices simples de cada componente 111, 121 , ••• , 1;1, ••• , 1N1; siendo el índice complejo sin ponderar la media aritmética simple todos ellos:
11 = o
X
___! X
x.
100
[4.1]
La expresión [4.1] toma el valor 100 en el período base ya que X 1 =X. y en los demás períodos fluctuará de acuerdo con la evolución X 1• El hecho de que 1~ < 100 implica que X 1 100, X 1 > x., indicando que la evolución ha sido positiva en el recorrido del período base o al período de comparación t. La elaboración de números índices tienen sentido en las variables de naturaleza cuantitativa. La expresión [4.1] está definida por cociente con lo que el índice es independiente de las unidades de medida en que venga expresada la variable con lo que se pueden efectuar agregaciones de distintos índices construyéndose indicadores de evolución general de fenómenos económicos.
4.2.
lt
Los números índices se clasifican atendiendo a la naturaleza de las magnitudes que miden (simples o complejas) y a la importancia relativa de cada componente dentro del conjunto en el caso de las complejas. Luego según esto tendremos: - Números índices simples que surgen cuando se estudia la evolución a lo largo del tiempo de una magnitud que tiene un sólo componente (no admite desagregación). Sería el caso, por ejemplo, de estudiar la evolución del precio del queso manchego puro de oveja, de una determinada marca en los últimos diez años. Luego dada una magnitud simple X; su número índice simple será en el período t el siguiente:
x.
"
X;.
X
100
N
1t =
l;tWi
i=l N
= -
N
L -Xit N
X
X;.
i=l
¿
4.3.
N ¿ -x.'1 X i=l
100
100·W. '
X;.
N
W;
i= 1
Siendo:
Los números índices simples se emplean con gran difusión en el mundo de la empresa a la hora de estudiar las producciones y ventas de los distintos artículos que fabrican y lanzan al mercado.
lit
i=l
¿
[4.2]
1;1 =Número índice en el período t de la magnitud i. X; 1 = Valor de la magnitud en el período t. X;o = Valor de la magnitud en el período base.
N
1
N
L
[4.3]
- Números índices complejos ponderados surgen cuando a los componentes de la magnitud compleja que se está estudiando se le asigna a cada uno un determinado coeficiente de ponderación W;. Este tipo de números índices son los que realmente se emplean en el análisis de la evolución de los fenómenos complejos de naturaleza económica: índice de precios de consumo (IPC), índice de producción industrial (IPI), etc. Su formulación general es inmediata ya que basta con introducir en la expresión [4.3] los coeficientes de ponderación de los N componentes (W1 , W2 , ... , W¡, ... , WN):
Clasificación de los números índices
l. =-'1
1 = -
¿
W;
i=l
Propiedades de los números índices
1."
1
1
[4.4]
Existencia: Todo número índice debe existir y se puede calcular para cualquier valor de la variable, tomando un valor real y distinto de cero. 2.• Identidad: Si se hacen coincidir los períodos base y de comparación el índice vale la unidad si se expresa en tantos por uno o cien si es en tantos por 100: 1¡1 =
x.
_____!!_ X
X;.
x.
100 = ~ X;.
X
100 = 100
'!1'''' ' :~¡
1
1
204
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
3." Inversión: El producto de dos índices en los que se han invertido los períodos base y de comparación es igual a la unidad:
i
205
NÚMEROS íNDICES
4.4. 1. Índices simples de precios Se designa la magnitud precio del único componente del índice simple i por p1• Luego la expresión del índice simple de un precio para el período t será:
4."
[4.5]
Cicular: Es una genralización de la de inversión. Si generalizamos a tres períodos t', t, o, tendremos: Siendo: l
it' ¡it ¡io io ' it1 it =
1
=>
¡it' ¡it _ 1 _ ¡it io ' it' - ¡io io it
s.• Proporcionalidad: Si la magnitud varía en proporción 1 + K, y ftjado el período de comparación, el número índice también varía en la misma proporción. Sea x;, = Xit + KX 11 = (1 + K) X¡,
X
T =-'1 = ,, X;.
(1
+ K)X- 1 X;.
X. X. '=-''+K·-'1 =/. +KJ. =(l+K)J. X;. : X;o ,, ,, ,,
Estas propiedades, que se cumplen en general para los números índices simples, no suelen cumplirse todas en el caso de los índices complejos o de varias componentes. En los apartados siguientes nos ocuparemos de la elaboración de índices concretos: índices de precios, de cantidades, de valor, etc., que son los que más se utilizan en el campo económico.
4.2.
,
lndices de precios
La magnitud que vamos a considerar en este caso concreto es el precio, los números índices de precios se clasiftcarán también en:
Números índices de precios
Simples' (se estudia el precio de un sólo producto o servicio) Complejos (se refiere a un precio con varios componentes) {
P 1, =Número índice simple de precios del componente i en el período t. p 1, =Precio del componente i en período t. Pio
= Precio del componente i en el período base.
Ejemplo 4.1 Los precios expresados en pesetas corrientes del litro de leche entera de una determinada marca, en el período 1995-2000, han sido: 75, 77, 85, 89, 97 y 105. Obtener la serie de números índices simples de la magnitud precio del litro de leche tomando como período base 1990. Solución:
p.11 = Pit
Años
X
lOO
Pio
75
100 =lOO
1995
-X
1996
-
X
100 = 102,6
1997
-X
100 = 113 3 ,
75
77 75
85 75 89
Sin ponderar
Sauerbeek { Bradstreet-Dutot
1998
-
1999
-
Ponderados
Laspeyres Paasche Edgeworth { Fisher
2000
75
100
X
100 = 129,3
97 75
105 -
75
= 118,6
X
X
100 = 140,0
'1
206
CASAS-SÁNCHEZ, J. M. y SANTOS-PEJ'lAS, J.
Solución:
Si se observa la serie de los números índices simples vemos la evolución de la magnitud a lo largo del período observándose que de 199,5 a 1996 el precio ha crecido un 2,6 por 100 de 1995 a 1998 un 18,6 por 100 y en todo el período un 40 por 100. Como se ha comentado anteriormente los índices, al estar definidos por cociente no dependen de las unidades de medida.
4.4.2.
En primer lugar se obtienen los índices simples de los tres componentes: Índices simples
11
Índices complejos de precios sin ponderar
P1, = P!t
P 2 ,=Pzr x 100
--X
1
Pzo
p
p = s N
L: i=l
1
P.11 = N
N
L:
.
p,,
X
85
3t
= p 3, P3o
X
100
2.100 2.100 900 -X
900
100
2.300 -2.100
X
100 = 104,7
X
100 = 109,5
X
100 = 133,3
1.200
100 = 100
900
1
P,=-·
N
-1 L3 -Pw
1997
97 X
100 = 114,1
-~X
100 = 1143 '
-
85
2.400 2.100 1.400 900
X
100 = 155,6
3
[4.6]
i= 1
Pw
N
L i=l
p., __.!..X
P;o
100
1
X
100 =-. 300 = 100 3
i=l Pio
Ejemplo 4.2
Los precios de la leche, el queso y la mantequilla, de una determinada marca, que ha pagado una familia en el período 1997-1999 han sido los siguientes:
1. Leche (ptas./litro) 2. Queso (ptas.fkg) 3. Mantequilla (ptas.fkg)
85
100= 100
Años
1998
Artículos
89
100 = 100
1999
.En segundo lugar se aplica la expresión 4.6 para las tres componentes siendo la serie de los índices de Sauerbeck:
En primer lugar si tenemos N componentes del precio se obtienen los índices simples, Pw para cada una, siendo el índice de Sauerbeck la media aritmética no ponderada de los mismos: N
85 -X
1998
1
Índice media aritmética de índices simples·o de Sauerbeck
1
1997
100
X
P10
En este caso la magnitud precio es compleja ya que intervienen en su definición varios componentes. Nos podemos plantear la evolución de los precios de los productos lácteos a través de tres componentes: leche, queso y mantequilla. El índice complejo se puede definir empleando dos criterios: el de la media aritmética simple o de Sauerbeck o el de la media agregativa simple o de Bradstreet-Dutot. a)
207
NÚMEROS ÍNDICES
1997
1998
1999
85 2.100 900
89 2.300 1.200
97 2.400' 1.400
Tomando como período base 1997 obtener la'serie de los números índices · complejos sin ponderar de Sauerbeck del precio de los productos lácteos consumidos en la familia.
1999
1
3
- L
P;, -X
3
i=l
Pw
1
3
P;,
- L3
•=1
Pw
X
1 100 = -· 347 5 = 115 8 3 ' ' 1 100 =-. 384 o= 128 o 3 ' '
Observando esta serie de índices complejos sin ponderar vemos que el precio de los productos lácteos ha aumentado un 28 por 100 en el período 1997-1999. b)
Índice media agregativa simple o de Bradstreet-Dutot
El concepto de media agregativa se emplea sólo en la elaboración de números índices. En el índice de Sauerbeck se obtiene una media aritmética de índices de precios simples relativos ya que los índices simples son cocientes de precios de los períodos de comparación con el base. La media agregativa
208
209
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
NúMEROS ÍNDICES
se define como el cociente entre la media aritmética simple de los N precios en el momento t de comparación y la misma media en el período b,ase o:
económicos esto no ocurre. Lo que se gastan las familias en leche es mucho mayor que lo que se gastan en queso o mantequilla, por ejemplo. Otro grave inconveniente que tiene el índice de la media agregativa es que al sumar precios absolutos, no relativos, depende de las unidades de medida de la variable. Así si el precio de la mantequilla en vez de expresarse en kilos se refiere a 250 gramos, evidentemente el sumatorio varía y el índice agregativo también. Estos problemas se eliminan con la construcción de índices complejos y ponderados que vamos a ver seguidamente.
1 p BD
=
N
1 N
N
.I
•=N l
i~l
N
.I
Pit X
Pit
=~ N
100
;~1
Pio
X
100
[4.7]
Pio
Ejemplo 4.3
a)
Obtener el índice de Bradstreet-Dutot para los datos del ejemplo 4.2 tomando como periodo base 1997.
La distinta tipología de índices de precios complejos y ponderados surge en relación con los coeficientes de ponderación que se utilizan para cada componente. Estos coeficientes asignan a cada elemento la importancia relativa que tiene dentro del conjunto. Los índices de precios que pueden elaborarse son muy variados si tenemos en cuenta el circuito de las transacciones económicas: precios de salida de fábrica, al por mayor, al consumidor, etc. Las ponderaciones que se utilicen estarán basadas en el valor de las transacciones en la fase comercial que se considere. Si son precios al por mayor, será el valor de las transacciones entre mayoristas y minoristas; si son precios al consumidor serán los valores de los intercambios entre el comercio minorista y los consumidores. El índice de precios de Laspeyres utiliza como coeficientes de ponderación el valor de las transacciones en el periodo base. En economía entendemos por valor el producto del precio por la cantidad: Vio = Pio · qio· Luego si en la expresión 4.6 que es el complejo sin ponderar introducimos estos coeficientes de ponderación W; = Pio · q¡0 para cada componente tendremos:
Solución: En primer lugar obtenemos el numerador y denominador de la expresión [ 4. 7] sumando simplemente las columnas del ejemplo 4.2: Año
3
I
P;, p BD =~X 100 3
L
P;o
i=l
4.4.3.
3.085
1997
--X
100 = 100
1998
3.589 3.08S
X
100 = 116,3
1999
3.897 _ 3 085
X
100 = 126,3
3.085
Índices complejos de precios ponderadós
Este tipo de índices son los más representativos del fenómeno que se pretende estudiar y por tanto son los que se utilizan realmente. Los índices complejos sin ponderar tienen el grave inconveniente que a todos los componentes se les da el mismo peso cuando en los casos reales de los fenómenos
Índice de precios de Laspeyres
El índice de precios de Laspeyres tiene la ventaja de que las ponderaciones Pio q¡0 del periodo base se mantienen fijas para todos los períodos considerados; pero por contra aparece el inconveniente de que su representatividad disminuye a medida que nos alejamos de dicho período. b) Índice de precios de Paasche Este índice surge cuando en una media de índices simples se introduce como coeficientes de ponderación la expresión W; = P;o q¡1; o sea las cantidades
210
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
del período de comparación q;, se valoran con precios del período base P;o:
~
L.,
p =
i=1
P
P;r
-
~ Pit
W¡
Pio
L., X
N
100 =
L W¡ i=1
Pioqit
-
i=1 N
~
Pio
L., X
100 =
L Pio q¡, i=1
100
Índice de precios de Fisher
[4.9]
[4.12]
Pio q¡,
En la expresión [4.9] puede observarse que las ponderaciones ya no son fijas sino variables. El índice de Paasche tiene la ventaja de que los pesos relativos de los distintos componentes se actualizan en cada período, con el agravante de complejidad y costes de tener que contabilizar precios y cantidades en cada período, mientras que en la expresión [ 4.8] sólo se actualizan periódicamente los precios P;r· e)
d)
Este índice se define como la media geométrica de los índices de Laspeyres y Paasche:
Pitqit
.:...i=,..,;l:...__ _ X N
L i=1
211
NÚMEROS íNDICES
Ejemplo 4.4
Además de los precios de la leche, el queso y la mantequilla, para el período 1997-1999 del Ejemplo 4.2, tenemos las cantidades que ha consumido la familia en dicho período concentrándose la información estadística en la siguiente tabla:
Índice de precios de Edgeworth 1997
En este índice se utiliza como coeficientes de ponderación la suma de los utilizados en los casos de Laspeyres y Paasche: l. 2. 3.
Luego su expresión será: ~ P;,
L.,
p = E
-
i=1
~ Pit
W¡
Pio
L., X
N
100 =
-
i=l
L W¡
+ Pio q¡,) X
N
L
i=1
(pio qio
Pio (pio qio
+ Pio q¡,)
p¡,(qio
+ q¡,)
.:...i=:-:'1:...__ _ _ _ X N
P;o(qio
100
[4.10]
+ q¡,)
i= 1
La expresión [4.10] también puede adquirir la forma siguiente que es más práctica para su cálculo: N
2: p = E
N
p¡,q¡o
+
i= 1 N
L
i=1
2:
p¡,q¡,
i= 1 N
Pio qio
+
Leche Queso Mantequilla
Precio (ptas.)
Cantidad
Precio (ptas.)
Cantidad
Precio (ptas.)
Cantidad
85 2.100 900
600 litros 30 kg 15 kg
89 2.300 1.200
650 litros 40 kg. 18 kg
97 2.400 1.400
700 litros 45 kg 20 kg
Solución:
N
L
1999
Utilizando los datos del anterior cuadro obtener los índices de precios de Laspeyres, Paasche, Edgeworth y Fisher de 1999 tomando como período base 1997.
100 =
i=1
L
1998
Artículos
L
i=l
X
Pio q¡,
100
[4.11]
En primer lugar vamos a obtener una tabla de cálculos donde se incluyan los valores de los numeradores y denominadores de las expresiones [4.8], [4.9] y [4.11].
Artículos
Pi97 • qi97
Pi99 • qi91
Pi99 • qi99
Pi97 • %99
l. Leche 2. Queso 3. Mantequilla
51.000 63.000 13.500
58.200 72.000 21.000
67.900 108.000 28.000
59.500 94.500 18.000
Sumas
127.500
151.200
203.900
172.000
212
CASAS-SÁNCHEZ, J. M. y SANTOS-PE:f.l'AS, J. 3
L PL
1
• Índice cuántico de Laspeyres X
100
=
151.200 127.500
X
100
=
203.900 172.000
Pi99. qi9?
= ¡;
L i=
X
100
=
118,6
X
100
=
118,5
Los coeficientes de ponderación que se introducen en la fórmula de la media aritmética de índices cuánticos simples son W¡ = qio • Pio• siendo q¡0 las unidades producidas o consumidas del componente i en el período base y Pio puede ser el precio final de venta si nos referimos a cantidades vendidas o consumidas o puede ser el valor añadido por unidad producida si nos referimos a un índice de cantidades producidas. Hay que tener en cuenta que el valor añadido por unidad es equivalente a un precio que nos da la verdadera importancia relativa del componente. La formulación será:
Pi9? ·qi9?
1
3
L Pp
1
Pi99. qi99
= ¡;
L
Pi97. qi99
i=1 3
p
213
NÚMEROS íNDICES
3
L
Pi99 • qi9?
=i=1 3 E
+ i=1 L
Pi99 • qi99
3
L Pi9? • qi9? + i=1 L i=
X
100
=
151.200+203.900 127.500 + 172.000
X
100
=
Pi9? . qi99
1
355.100 . 299 500
X
100 = 118,6
PF = J118,6
X
118,5 = 118,5
=
4.5.
Índices de cantidades o cuánticos
Para cualquier magnitud, y por supuesto para las cantidades, siempre se podrán elaborar números índices simples (se analiza un sólo componente), complejos sin ponderar (utilizando cualquier tipo de media sin ponderar en los índices simples relativos o utilizando el concepto de media agregativa). Luego en los índices complejos sin ponderar ·siempre se podrán construir índices de Sauerbeck y de Bradstreet-Dutot cuando exista homogeneidad entre los componentes incluidos en el índice. Para no ser repetitivos al tratar las cantidades vamos a formular sólo los índices complejos ponderados de Laspeyres, Paasche, Edgeworth y Fisher. En economía existe una gran variedad de cantidades, pero las más relevantes son los volúmenes producidos por las empresas de una serie de artículos que son demandados bien por las propias empresas (bienes intermedios o de producción) o por las familias (bienes de consumo fmal). Los índices cuánticos, complejos y ponderados miden la evolución de estas magnitudes a lo largo del tiempo estableciéndose los adecuados coeficientes de ponderación.
Esta expresión de Laspeyres es la que más se utiliza, ya que nos da la evolución de la cantidad en términos reales o constantes al utilizar los precios del período base. • Índice cuántico de Paasche En este caso los coeficientes de ponderación, con el mismo sentido económico del índice de Laspeyres, de precio fmal o valor añadido por unidad, según sean cantidades consumidas o producidas, serán W; = q¡0 • P;r· La formulación será la siguiente: q
N
"L..,
Qp
=
____!!_ •
i=1 /io
N
w,.
"L.., X
100
=
q.
N
lt -·q;oPir
i=1N qio
L W¡ i= 1
L i=
1
qioPit
"L..,
X
100
qitPir
= .:..,¡:,.,.::1'--- X
100
[4.14]
L i=
1
En la expresión [4.14] de Paasche puede observarse que se utilizan los precios de cada período de comparación, al variar t. • Índice cuántico de Edgeworth En este caso, igual que ocurría en el índice de precios, el coeficiente de ponderación es la suma de los utilizados por Laspeyres y Paasche: W¡ = q¡0 • Pio + q¡0 Pir· Su desarrollo será:
214
215
NúMEROS ÍNDICES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J. 3
I
QL=
qit Pio
i= 1 3
¿
X
100 =
155.450 . 127 500
X
100 = 122,00
X
100
=
171.450 . 140 400
X
100 = 122,12
+
L
qioPio
i= 1 N
L
N
q¡,(p¡o
i= 1
X
N
L
L
+ P;,)
qio (pio
100 =
+
3
L
=~1~_ _---!.::i=~1:..___ X
....:i
N
L
+ Pit)
i=1
N
qitPio
i=1
N
qio Pio
+
I
100
[4.15]
Qp=
L
3
L
Como sabemos será la media geométrica de los índices cuánticos de Laspeyres y Paasche:
QE =
Solución:
QF = jQL • Qp
X
L i= 1
100
155.450
+ 171.450
= 127.500 + 140.400
X
100
=
100- 122,02
= j122
X
122,12
= 122,06
1997
En una industria auxiliar del automóvil se fabrican tres componentes. La estadística de las unidades producidas en los años 1998 y 1999 y de los valores afiadidos (v.a.) por unidad expresados en pesetas son los siguientes:
1998
Artículos PiO
q¡o
P;,
q¡,
85 2.100 900
600 30 15
89 2.300 1.200
650 40 18
Con estos datos obtenemos los numeradores y denominadores de las Expresiones [4.13], [4.14] y [4.15]. Artículos
q;o· Pto
q,.·P;o
q,o· Pi<
q;,·Ptt
Leche Queso Mantequilla
51.000 63.000 13.500
55.250 84.000 16.200
53.400 69.000 18.000
57.850 92.000 21.600
127.500
155.450
140.400
171.450
Sumas
X
+
i~l
Ejemplo 4.6
Los datos que hay que manejar de la mencionada tabla son:
1. 2. 3.
qioPio
326.900 . 267 900
Ejemplo 4.5
De la tabla de precios y cantidades del Ejemplo 4.4 obtener los índices cuánticos Qv Qp, QE y QF de 1998 tomando como período base 1997.
3
qitPio
i;1
L i= 1
[4.16]
Leche Queso Mantequilla
qioPit
i= 1
• Índice cuántico de Fisher
l. 2. 3.
3
I
i=1
qit Pit
i= 1
1999
1998
Componentes 1 2 3
q¡o
v.a.junidad = P1o
q¡,
v.a.junidad = p,.,
5.000 8.000 6.000
20 10 30
6.000 10.000 10.000
25 12 35
Obtener los índices de producción de Laspeyres y Paasche de 1999 con base 1998 = 100. Solución:
Seguidamente obtenemos los numeradores y denominadores de QL y Qp:
216
NÚMEROS ÍNDICES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑ"AS, J.
Componentes
q¡o ·Pro
q¡o· p¡,
q¡,·p¡o
q¡,·p¡,
1 2 3
100.000 80.000 180.000
125.000 96.000 210.000
120.000 100.000 300.000
150.000 120.000 350.000
Sumas
360.000
431.000
520.000
620.000
3
L
QL = í~l
L
X
100 =
520.000 0.000 36
X
100 =
620.000 l.OOO 43
qitPio qioPio
X
100 = 144,4
X
100 = 143,9
í=l 3
L
Qp
q;,Pit
= i =3 1
L
qioPit
í=l
4.6.
Propiedades que cumplen los índices complejos y ponderados de precios y cantidades
Al estudiar de una forma genérica los números índices se comentó que deberían de cumplir una serie de propiedades ideales: existencia, identidad, inversión, circular y de proporcionalidad. Así como los índices simples las cumplen en su gran mayoría, los complejos y ponderados no cumplen algunas de ellas. En el cuadro siguiente se resume el cumplimiento de las propiedades indicadas en el apartado 4.2 para los diferentes índices.
Existencia Identidad Sanerbeek Bradstreet-Dutot Laspeyres Paasche Edgeworth Fisher
Sí Sí Sí Sí Sí Sí
Sí Sí Sí Sí Sí Sí
Inversión
Circular
Proporcionalidad
No Sí No No Sí Sí
No Sí No No No No
Sí Sí Sí Sí* Sí* Sí*
217
La propiedad de proporcionalidad en los índices de Paasche, Edgeworth y Fisher se verifica pero con cierta limitación en el campo económico, pues al variar los precios en una cierta proporción k difícilmente las cantidades permanecerán constantes. Luego para que se verifique esta propiedad en estos tres índices será necesario que las cantidades no varíen frente a los cambios de precios. En resumen, el índice de Bradstreet-Dutot es el que cumple todas las propiedades pero su utilización es muy limitada por tratarse de un índice no ponderado. El índice más utilizado será el de Laspeyres, pues de los ponderados es el único que cumple la propiedad de proporcionalidad. El índice de Laspeyres, tanto de precios como cuántico, es el más utilizado en los indicadores generales de precios y producción que elaboran todos los países. Su diseño y posterior cálculo exige una rigurosa selección de sus componentes para que sea representativo del fenómeno que se pretende estudiar a través de su estructura de coeficientes de ponderación que como sabemos se refieren al período base. Ahora bien, la actividad económica está sujeta a cambios continuos con lo que a medida que en la serie de números índices nos alejamos del período base, la estructura de los coeficientes de ponderación es cada vez menos representativa con lo que hay que fijar un nuevo período base y establecer con las investigaciones adecuadas una nueva estructura de ponderaciones. En los enlaces de series de números índices que tienen distinta base nos apoyamos en la propiedad de inversión que como se ha indicado anteriormente no la cumple el índice de Laspeyres; pero se actúa en la práctica como si se cumpliera ante la necesidad de efectuar dichos empalmes.
4.7.
,
lndices en cadena
Los índices estudiados anteriormente y, en concreto, el de Laspeyies y el de Paasche, frecuentemente los más utilizados para hacer un estudio a corto plazo, pero si el estudio es a largo plazo estos índices no son los más adecuados, pues las ponderaciones quedan desfasadas con el paso del tiempo y no corresponden a la situación actual y la base se aleja perdiendo actualidad y en consecuencia calidad. Para evitar esto se introducen los índices en cadena, que se obtienen a partir de una generalización de enlaces o emplames de índices para los cuales la base de cada índice es siempre el período de comparación del índice precedente, es decir: 1~ = 1~ ·Ii · ··· · ~~-t
219
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
NÚMEROS íNDICES
lo cual nos permite obtener una serie de índices referidos todos ellos a la misma base.
ponderación en el caso de los índices complejos, sino simplemente apoyarse en las propiedades de inversión y circular que nos permiten obtener el coeficiente técnico que transforma la serie dada en la nueva con un período base distinto. Supongamos que la serie dada con período base o se quiere transformar en una nueva con un período base t' que esté más cercano en el tiempo al período actual de comparación. Está claro que en la serie dada existiría un número índice J~ que corresponde al nuevo período base que se ha elegido t'. Pues bien, este J~ es el elemento fijo que nos sirve de enlace técnico en la transformación de una serie en otra. Al considerar los tres períodos (t', t, o), la propiedad circular nos dice:
218
J~
J; = J;
J!. Ji
,
= J! ·Ji· J~
:.
Ejemplo 4.7
Los precios de un determinado artículo han sido 20, 22, 26, 28 y 32 euros para el período 1998-2002, respectivamente. Obtener la serie de índices referidos al año base 1998 y el índice Jigg~ para esos precios. Solución:
[4.17] De la expresión [ 4.17] nos interesa despejar la nueva serie de índices con el nuevo período base t', J~, o sea:
Aplicando la definición de índice en cadena mediante la generalización de valores tenemos: J1999 1998
22
Q
(
1
= ,.-= J' J~
[4.18]
Q
La expresión [4.18] surge de la propiedad de inversión que dice J~ · J~ = 1 (el producto de dos índices en los que se han invertido los períodos de comparación y base es igual a la unidad). Despejando J~, en la expresión [4.18]:
=== 105 5o/¡ 20 ' o
2000- 1999 2000J1998- J1998.J1999-
J' J'
22 26o 20.22-130 Vo
[4.19] 2001 J1998 -
1999 J1998.
2000 J1999.
22 26 28o 20. 22. 26 - 140 Vo
2001 J2000 -
2002- 1999 2000 2001 2002 J1998- J1998 .J1999 · J2ooo·J2001-
La expresión [4.19], al ser un cociente de índices expresados en tantos por 100, nos da resultados en tantos por uno. J~ es el término general de la serie dada de números índices y varía desde = 100 hasta J~. Es decir, si tenemos la serie J~ de números índices referidos al perído base O y queremos efectuar un cambio de base del período o al nuevo período base t', tendríamos la serie J:,:
J:
22 26 28 32o · · · 8- 160 Yo 20 22 26 2
Al mismo resultado se llegan mediante J2002 1998
32 20
= -
=
160 o/¡o
Período
o
4.8. Cambio de base en una misma de números índices
seri~
Si se tiene una serie de números índices cuyo período base es cero: J~,
1
J!,
J;, ..., J~, ..., J:, puede interesarnos cambiar la base o si está muy alejada en el tiempo del período t de comparación. Este cambio del período base no implica efectuar un profundo estudio para determinar nuevos coeficientes de
t'
Índice J~ ¡o o ¡l
Índice [~,
o
[~,
Jio
[:,
¡t'
¡:: =
I'o
[:,
o
1:,
100
220
CASAS-SÁNCHEZ, J. M. y SANTOS-PE:&AS, J.
NúMEROS ÍNDICES
en donde: Jt'i
-
I~
¡t'
¡t ¡t =~X 5 I~ '
i=
O 1 '
' ...,
, t ' ..., t
el término J~ es fijo ya que es el valor que toma la serie dada justo en t', que es el nuevo período base. Se denomina coeficiente de transformación o coeficiente de enlace técnico de la serie dada en base O a la nueva serie en base t', al cociente: [4.20] luego para pasar una serie en base O a un nuevo período base t', bastará multiplicar cada uno de los elementos de la serie original, por el coeficiente de transformación a la nueva base t', es decir, por J~..
100
I~
100 x 100 = 85 5 117 '
I!
108
12 I~
112 117
X
100 = 95 7 '
I! =
-·- X
100 = 97 4 '
14
115
1°
~ =-
1°5 =
o
221
J 51 = - = X 100 = 92 3 I~ 117 ' ]2 5
= ~= -
]3 5
= -
I~
114 117
J45 = ~ = X 100 = 98 3 I~ 117 ' I~ 117 1 55 = - = - X 100 = 1000 I~ 117 '
Ejemplo 4.8
I~
119 117
J65 = - = -
I~
Dada la siguiente serie de números índices con período base o, efectuar un cambio de base al período 5.
17
X
123 117
J75 = ~ = - X
I~
Período (t)
Indices (n)
o
100 108
1 2 3
114
115
5
117
6 7
119 123
Solución: El problema se puede resolver de dos maneras: a) Aplicando la expresión [4.19] expresada en tantos por 100:
100
=
105 1 '
b) Aplicando a la serie dada el coeficiente de transformación que en este caso será, según la expresión [ 4.20]: ]
0
5
I~ lOO = - = =
I~
112
4
100 = 101 7 '
I~ =
100 108
X
112 114
X
115 117 119 123
X
X
X
X X X
117
r.
X
0,855 0,855
O 855
'
0,855 = =
85,5 92,3
0,855 0,855
=
0,855 0,855 0,855 0,855
= 98,3
=
=
= =
95,8 97,5 100,0 101,7 105,2
222
223
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
NÚMEROS íNDICES
Hay que resaltar que, en los cambios de base de una serie de números índices, el coeficiente de transformación se aplica a todos y cada uno de los componentes de la serie.
El concepto o definición de este coeficiente de enlace es el mismo que hemos dado en los cambios de base dentro de una misma serie, aplicándose ahora sólo a los elementos de la serie que tenga la base más antigua, ya que nos interesa hacer el estudio de la evolución con la base más moderna que es la más representativa. Si la serie con base más antigua es 1~, 1~, 1;, ..., 1~, ... , 1~ y 1~ coincide con el período base de la serie más moderna, el coeficiente de enlace será:
4. 9.
Renovación y enlace de series de números índices con distintas bases
1~
• Renovación de componentes y de coeficientes de ponderación en los números índices complejos En el mundo de la economia los números índices representan fenómenos complejos: la evolución general de los precios del conjunto de bienes y servicios que adquieren las familias o unidades de consumo final, la evolución del Producto Interior Bruto de un país, el comportamiento de un mercado de valores mobiliarios (índices bursátiles), etc. Por tanto, el proceso de elaboración de un número índice complejo y ponderado implica la adopción de una serie de decisiones: elección de los componentes que entrarán a formar parte del índice para que éste sea representativo del conjunto, elección del período base y tipo de índice que se va a utilizar (Laspeyres, Paasche, etc.) teniendo en cuenta el coste asociado a la formación elegida. Precisamente teniendo en cuenta el coste es la formulación de Laspeyres la más empleada ya que, como vimos, sus coeficientes de ponderación, cuya determinación requiere costosísimos análisis y toma de datos, están referidos al período base. Luego a medida que nos alejamos de dicho período, como la actividad económica está sujeta a una constante evolución por cambios en los hábitos de consumo y en los procesos tecnológicos, el conjunto de los componentes y sus coeficientes de ponderación dejan de ser representativos del fenómeno objeto de estudio. La solución es someter al índice a una profunda revisión de forma periódica, volviendo a elegir los componentes más representativos y sus nuevos coeficientes de ponderación. • Enlace o empalme de series de números índices con distinta base La necesidad de la renovación periódica, justificada como se ha señalado anteriormente por una variación del contexto socioeconómico que pretende medir, nos lleva a contar con dos series de índices que tienen períodos base distintos y hay que enlazarlos o empalmados para poder estudiar el fenómeno comparando su evolución con una única base. El período base que se mantiene es el de la serie que lo tiene más cercano al momento actual de comparación aplicando el coeficiente de enlace o empalme a la serie más antigua.
1~
100
=¡e= 7o o
que es idéntico a la expresión [ 4.20]. Ejemplo 4.9 Para un conjunto de artículos, se tienen dos series de números índices de precios de Laspeyres que son las siguientes: Años
Base 1980
Base 1990
1987 1988 1989 1990 1991 1992 1993 1994
250 260 280 290
100 115
122 127 135
Enlazar las dos series con base 1990. Solución:
El c·oeficiente de enlace será: 1980 - 1i~~g - 10011990 -: 11990 - 290 - 0,345 1980
Aplicando este coeficiente de enlace a la serie más antigüa con base 1980, la serie enlazada será:
1 !
224
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J. N
J~99o
Años 1987 1988 1989 1990 1991 1992 1993 1994
250 260 280 290
X
X X X
0,345 = 86,3 0,345 = 89,7 0,345 = 96,6 0,345 = 100 115 122 127 135
I'o
+ Al'o =
L
Obsérvese que el coeficiente de enlace sólo se aplica a la serie con base en 1980 para que quede conectada con la que tiene base más actualizada que es la de 1990. También hay que resaltar que se actúa como si el índice de precios de Laspeyres cumpliese la propiedad circular aunque sabemos que no es cierto.
N
I I' = o
N
p¡,q¡.
=,.,.,1:....--_
:...,i
N
L
Pioqio
I
i=1
Pit P-·p¡.q¡.
N
L
L Pioqio í=l
í=1
+ M;.~)·W¡
N
L
Apitqio
N
=
i=N1
L
Pioqio
L
M;,!·W¡
i=o
i=1
de donde se deduce que la repercusión R; producida por la variación de la i-ésima componente en el índice general será: Ap.q.
R= i
'''•=M'· i,o W¡
N
L
i= 1
Pioqio
Evidentemente la suma de todas las repercusiones individuales de cada componente será: N
N
L
R¡=
i=1
L
M;,!·w; =M~
i=1
que coincide con la variación total del índice general. La variación en porcentaje del índice general será:
io
í=l
í=1
N
M' _o
donde w; son las ponderaciones de cada índice 1;,! dentro del índice general, expresadas en tantos por uno. Si suponemos que en las diferentes magnitudes simples (precios) se produ- ' cen variaciones, expresadas por:
¡t
·lOO=
N
-~ Ap¡,·q¡. 1-1 N
L
0
·lOO=
Pit'qio
í=1
L
M;,!·W¡
_i=-::1:-----N
L
I;,!·W¡
í=l
La repercusión en porcentaje de la componente i-ésima en el índice general será: R. Ap. ·q. ___!·lOO= " •• ·lOO= I~
entonces el nuevo índice será:
(I;,!
Y restando ambas expresiones, tendremos la variación del índice general:
Repercusión y participación en las variaciones de un índice
Frecuentemente nos interesa conocer la repercusión que tiene la subida de precios de uno o varios artículos en el índice general, por ello aquí vamos a considerar un índice tipo Laspeyres y examinaremos la repercusión y participación de un producto en las variaciones del índice. Sabemos que un índice de Laspeyres tiene la forma:
+ Ap¡,)qio
(p¡,
:....;=....:1' - -N- ; - o - - - - -
M~=
4. 1O.
225
NúMEROS ÍNDICES
N
L i=l
Pit'qio
,··
226
:~:,.~··.
''· ~..
NÚMEROS ÍNDICES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
También se verifica que la suma porcentual para todas las componentes será igual a la variación porcentual del índice gene~al. , Para terminar, definimos la particpación, en térmmos porcentuales, de cada componente i-ésima en el índice general como:
227
El índice complejo de valor para N componentes será: N
1 = v1
L
Pitqit
=,...:1:....___
..:..,i
N
L
[4.23]
Pioqio
i= 1
La evolución de la expresión 4.23 a lo largo del tiempo está motivada por las variaciones conjuntas de los precios y las cantidades no pudiendo aislarse la influencia de cada una. En economía interesa analizar la evolución del valor del conjunto de mercancías N bajo la óptica de lo que se denomina a precios constantes, o sea, sin que se produzcan variaciones en los precios de los distintos componentes. Para conseguirlo se realiza la operación conocida como deflactación de series de valores expresados en precios o pesetas corrientes de cada añ.o.
Evidentemente se verifica que: N
L
P;= 100
i=1
4. 11. 4. 11 .l.
índices de valor y deflactación de series económicQs
Índices de valor
En economía se produce un gran número de bienes y servicios que son adquiridos por las familias, las empresas, el gobierno, etc. Estos bienes Y servicios gozan de una gran heterogeneidad y para agregarlos .hay que someterlos a un proceso de homogeneización a través de la obtenctón de su valor aplicando un sistema de precios. Este proceso de m~tiplicar, ~antidades de bienes por sus respectivos precios nos transforma cantidades fístcas heter?g:neas (leche, pescado, fruta, automóviles, ordenadores, etc.) en valores economtcos que son homogéneos al estar expresados en la misma unidad de cuenta (pesetas, dólares, marcos, etc.), y por tanto s~ables o agr~gables. Los índices de valor nos permiten estudiar la evolución a lo largo del tiempo la cuantificación monetaria de un conjunto de bienes. Este v.alor se llama nominal o en pesetas corrientes o de cada añ.o cuando los prectos son los del período de comparación: N
v; = L
Pitqit
[4.21]
Pioqio
[4.22]
i= 1
El valor en el período base será: N
Vo
=L
i=1
4.11.2.
Deflactación de series económicas
Como se ha indicado anteriormente para poder comparar el valor de un conjunto de bienes en dos períodos distintos, interesa aislarlo de la subida, inflación, o de la bajada, deflación, de sus respectivos precios. Todos sabemos que el problema que tienen la mayorías de los gobiernos en los distintos países es el control de la inflación, ya que distorsiona las relaciones entre los distintos agentes económicos. Con las subidas de precios que no sean debidas a una mejora en la calidad de los bienes y los servicios, el poder adquisitivo de la moneda disminuye, ya que con un billete de 5.000 ptas. en 2000 no pueden comprarse las mismas cosas que en 1990. Para poder efectuar análisis comparativos de una serie de valor entre distintos períodos hay que pasarla de pesetas corrientes o de cada año a pesetas constantes o del período que se considere como base. Esto es lo que se denomina deflactar la serie dividiendola por el índice de precios que se considere más adecuado. El índice elegido recibe el nombre de deflactor de la serie. Veamos a continuación el papel que juegan los índices de precios que más se utilizan como son los de Laspeyres y Paasche como deflactores de series económicas. Si la expresión [4.21], que es una serie de valor a precios corrientes, se divide por un índice de precios de Laspeyres tendremos:
228
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
229
NúMEROS ÍNDICES
sido el siguiente: 100, 105, 107, 110 y 112. Obtener la serie de la renta disponible en pesetas constantes del primer período. [4.24] Solución:
Según nos indica la expresión [ 4.24] podemos concluir que al deflactar una serie de valor a precios corrientes por un índice de precios de Laspeyres no nos da una serie de valor a precios constantes, sino V" · Qp que es el producto del valor en el año base por un índice cuántico de Paasche. Luego PL no es un verdadero deflactor, aunque en la práctica se utiliza como tal ya que es el índice que se suele elaborar siendo el único disponible. El que sí es un verdadero deflactor es el índice de Paasche ya que:
En las expresiones [4.24] y [4.25] al dividir la serie económica dada V, por los índices de precios, éstos están expresados en tantos por uno; luego la serie de la renta disponible expresada en pesetas corrientes se divide por la serie de los índices de precios expresados en tantos por uno: 1,00; 1,05; 1,07; 1,10 y 1,12: Renta disponible en pesetas constantes 250.000/1,00 = 275.000/1,05 = 300.000/1,07 = 325.000/1,10 = 350.000/1,12 =
[4.25]
4.12. es decir: Serie de valores monetarios · . Í . . = Serie de valores reales (preCios constantes) ndice de precios .. La expresión [ 4.25] nos da el valor actual de un conjunto de mercancías 1, 2, ... , i, ..., N a precios constantes Pia del año base. Según seala serie económica que se desea deflactar así habrá que elegir el índice de precios más adecuado. Si se desea expresar la renta disponible de las familias en pesetas constantes de un determinado año, el deflactor adecuado será el índice de precios de consumo (IPC); si se desea deflactar una serie del valor de un conjunto de productos industriales, su deflactor adecuado será un índice de precios industriales (IPI), etc.
250.000 261.905 280.374 295.455 312.500
Índice de precios de consumo (IPC)
1
El Índice de Precios de Consumo (IPC) es el indicador general más conocido por la influencia y efecto que produce en el mundo económico, se elabora y se publica mensualmente y su objetivo es medir la evolución del nivel de precios de los bienes y servicios consumidos por todos los hogares residentes en España. Todo IPC debe de tener dos cualidades: -
la representatividad, y la comparabilidad temporal
Ejemplo 4.10
El nivel de representatividad del IPC vendrá determinado por· el grado de adaptación de este índice a la realidad económica del momento. Así pues los bienes y serVicios seleccionados deberán ser los más consumidos por la mayoría de la población, los establecimientos donde se recogen los precios deben de ser los más visitados y la importancia o ponderación de los diferentes bienes y servicios debe responder a las tendencias de consumo de los hogares. La segunda cualidad se refiere a la comparabilidad temporal, lo cual quiere decir que todos los elementos que definen el IPC deben permanecer estables
La renta disponible de una familia durante cinco períodos de tiempo expresada en pesetas corrientes ha sido la siguiente 250.000, 275.000, 300.000, 325.000 y 350.000. Para el mismo período el índice de precios de consumo ha
2002.
1
Se reproducen los conceptos y definiciones public~dos en la Metodología del I.N.E. Año
rl C"C·C'
'
230
CASAS-SÁNCHEZ, J. M. y SANTOS-PE1'1AS, J.
a lo largo del tiempo excepto, lógicamente, los precios que se recogen mensualmente. Así pues, se consigue que cualquier variación en el IPC sea debida solamente a cambios en los. precios de los bienes y servicios que fueron seleccionados. A continuación, resumimos la Metodología del Índice de Precios de Consumo con base 2001, elaborada por el Instituto Naconal de Estadística (INE).
4.12. l.
Características principales
a) Período base Es aquel cuyos precios sirven de referencia para medir la evolución de los mismos durante el período de vigencia del sistema. El período base es el año 2001, lo cual quiere decir que todos los índices que se calculen estarán referidos a este año, y además la media aritmética de los índices mensuales para este año base se hace igual a 100. b) Período de referencia de las ponderaciones Es el período durante el cual se desarrolla la ECPF (Encuesta Continua de Presupuestos Familiares) que nos proporciona la información básica, sobre los gastos de las familias en bienes y servicios de consumo, para la obtención de las ponderaciones. Este nuevo sistema se ha realizado con la información obtenida de la ECPF, que nos proporciona información básica sobre gastos de las familias en bienes y servicios de consumo, durante el período segundo trimestre de 1999 al primer trimestre de 2001 (1 de abril de 1999 al 31 de marzo de 2001 ).
¡ 1
l l
¡
NÚMEROS ÍNDICES
231
Se define la cesta de la compra como el conjunto de bienes y servicios para los que se recogen los precios mensualmente, y cuya evolución representa la de todos los precios de consumo de la economía. La selección se realiza según la importancia de cada uno, medida a partir del gasto realizado por las familias residentes en España y que se obtiene de la ECPF. El número total de artículos que componen esta nueva cesta de la compra es de 484, agrupados en 12 grupos, 37 subgrupos, 80 clases y 117 subclases. Además se mantienen las 57 rúbricas existentes y se amplía el número de grupos especiales hasta 27. La muestra para la recogida de la información necesaria se ha diseñado teniendo en cuenta: -
selección de municipios selección de zonas comerciales y establecimientos determinación del número de observaciones.
En resumen la muestra de municipios está formada por 141 municipios para artículos de alimentación y 157 para el resto, recogiendo aproximadamente 180.000 precios mensuales. Cada uno de los artículos están perfectamente descritos y muy bien especificados con el fin de facilitar al agente encuestador su identificación y permitir la correcta recogida de los precios. Las ponderaciones, representan la importancia relativa que tiene cada artículo de la cesta de la compra frente a los demás, así pues, si designamos por W; la ponderación del artículo i-ésimo, esta se obtiene como cociente del gasto realizado en las parcelas representadas por dicho artículo durante el período al que hace referencia la ECPF y el gasto total realizado en ese período.
w. = _G_a_s_to_re_a_h_'z_a_d_o_e_n_l_a_s-=-p_a_rc_e_la_s_r_e-=-p_re_s_e_n_ta_d_a_s_,p'-o_r_e_l_a_r_tí_cul_o_i e) Campo de consumo, cesta de la compra y ponderaciones El campo de consumo del IPC está constituido por todos los bienes y servicios que los hogares destinan al consumo, quedando excluidos los gastos en bienes de inversión, los autoconsumos, los autosuministros y los alquileres imputados. Los bienes y servicios en la ECPF han sido clasificados según la clasificación internacional de consumo COICOP (Classificastion of Individual Consuption by Purpose), de tal manera que cada parcela de consumo de la ECPF estará representada en el IPC por uno o más artículos, de manera que la evolución de sus precios represente la de todos los elementos que integran dicha parcela.
'
Gasto total
Las ponderaciones permanecen fijas a lo largo del período de vigencia del sistema de índice de precios de consumo. Un mismo artículo puede tener ponderaciones diferentes en las distintas agrupaciones geográficas-provincias, comunidades autónomas y total Nacional, según el gasto que refleja la ECPF en cada uno de estos conjuntos. En las Tablas 4.1, 4.2, 4.3 y 4.4 aparecen las diferentes agrupaciones y las ponderaciones de los diferentes artículos. En la Tabla 4.5 se dan las ponderaciones por grupos de artículo para las diferentes Comunidades Autónomas. Análogamente se tienen las restantes ponderaciones para las Comunidades Autónomas. Ver metodología INE.
232
CASAS-SÁNCHEZ,J. M. y SANTOS-PEÑ'AS, J. TABLA 4.1.
Número de artfculos por grupo del JPC-Base 2001
TABLA 4.2.
(Continuación)
Ponderación 01. 02. 03. 04. 05. 06. 07. 08. 09. 10. 11. 12.
Alimentos y bebidas no alcohólicas Bebidas alcohólicas y tabaco Vestido y calzado Vivienda Menaje Medicina Transporte Comunicaciones Ocio y cultura Enseñanza Hoteles, cafés y restaurantes Otros
171 12 67 18 60 13 31 3 40 8 24 37
Total
484
Ponderaciones Grupos
Fuente: INE.
TABLA 4.2.
Ponderaciones por grupos, subgrupos, clases y subclases de artículos del IPC-Base 2001 para el total Nacional.
Ponderaciones Grupos 01 Alimentos y bebidas no alcohólicas 011 Alimentos 0111 Pan y cereales 01111 Arroz 01112 Pan 01113 Pasta alimenticia 01114 Pastelería, bollería y masas cocinadas 01115 Harinas y cereales 0112 Carnes 01121 Carne de vaca 01122 Carne de ternera y añojo 01123 Carne de porcino 01124 Carne de ovino 01125 Carne. de ave 01126 Charcutería 01127 Preparados de carne 01128 Otras carnes y casquería 0113 Pescados, crustáceos y moluscos 01131 Pescado fresco y congelado 01132 Crustáceos y moluscos 01133 Pescado en conserva y preparados 0114 Productos lácteos, quesos y huevos 01141 Leche 01142 Otros productos lácteos 01143 Quesos
Subgrupos
233
NÚMEROS ÍNDICES
Clases
Subclases
218,63 206,452 33,784 1,125 18,639 1,328 10,880 1,811 56,460 1,222 11,236 4,683 7,701 8,892 17,910 2,984 1,832 31,238. 17,163 7,655 6,420 30,829 12,869 7,689 7,807
01144 Huevos 0115 Aceites y grasas 01151 Mantequilla y margarina 01152 Aceites 0116 Frutas 01161 Frutas frescas 01162 Frutas en conserva y frutos secos 0117 Legumbres, hortalizas y patatas 01171 Legumbres y hortalizas frescas 01172 Legumbres.y hortalizas secas 01173 Legumbres y hortalizas congeladas y en conserva 01174 Patatas y sus preparados 0118 Azúcar, chocolates y confituras 01181 Azúcar 01182 Chocolates y configuras 01/9 Otros productos alimenticios 012 Bebidas no alcoh6licas 0121 Café, cacao e infUsiones 01211 Café, cacao e infusiones 0]22 Agua mineral, refrescos y zumos 01221 Agua mineral, refrescos y zumos 02 Bebidas alcohólicas y tabaco 021 Bebidas alcoh6licas 0211 Espirituosos y licores 02111 Espirituosos y licores 0212 Vinos 02121 Vinos 0213 Cerveza 02131 Cerveza 022 Tabaco 0221 Tabaco 02211 Tabaco
Subgrupos
Clases
Subclases 2,463
8,152 0,597 7,554 17,813 15,093 2,720 17,602 9,480 1,249 3,549. 3,324 7,192 1,339 5,853 3,383 12,178 4,062 4,062 8,116 8,116
32,17
99,28 03 Vestido y calzado 031 Vestido 0311 Prendas de vestir 03111 Prendas exteriores de hombre 03112 Prendas interiores de hombre 03113 Prendas exteriores de mujer 03114 Prendas interiores de mujer 03115 Prendas de vestir de niño y bebé 0312 Complementos y reparaciones de prendas de vestir 03121 Complementos y reparaciones de prendas de vestir
8,999 1,755 1,755 4,445 4,445 2,799 2,799 23,171 23,171 23,171 79,258 76,337 27,476 1,729 33,508 2,863 10,761 2,921 2,921
234
TABLA
235
NÚMEROS ÍNDICES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
TABLA
4.2. (Continuación)
4.2. (Continuación) Ponderaciones
Ponderaciones ' Grupos 032 Calzado y sus reparaciones 0321 Calzado 03211 Calzado de hombre 03212 Calzado de mujer 03213 Calzado de niño y bebé 0322 Reparación de calzado 03221 Reparación de calzado
Clases
Grupos
Subclases
20,023 19,833 7,406 8,758 3,669 0,189 0,189
110,26 04 Vivienda 041 Alquiler de vivienda 0411 Alquiler de vivienda 04111 Alquiler de vivienda 042 Conservacwn de la vivienda 0421 Materiales para la conservación de la vivienda 04211 Materiales para la conservación de la vivienda 0422 Servicios para la conservación de la vivienda 04221 Servicios para la conservación de la vi. vienda 043 Otros servicios relacionados con la vivienda 0431 Distribución de agua 04311 Distribución de agua 0432 Recogida de basura, alcantarillado y otros servicios 04321 Recogida de basura, alcantarillado y otros servicios 044 Electricidad, gas y otros combustibles 0441 Electricidad 04411 Electricidad 0442 Gas 04421 Gas 0443 Otros combustibles 04431 Otros combustibles OS Menaje 051 Muebles y otros enseres 0511 Muebles y otros enseres 05111 Muebles 05112 Otros enseres 052 Artículos textiles para el hogar 0521 Artfculos textiles para el hogar 05211 Artículos textiles para el hogar 053 Electrodomisticos y reparaciones 0531 Electrodomésticos y reparaciones
Subgrupos
22,073 22,073 22,073 17,146 3,373 3,373 13,774 13,774 29,991 8,725 8,725
05311 Frigoríficos, lavadoras y lavavajillas 05312 Cocinas y hornos 05313 Aparatos de calefacción y de aire acondicionado 05314 Otros electrodomésticos 05315 Reparación de electrodomésticos 054 Utensilios de cocina y menaje 0541 Utensilios de cocina y menaje 05411 Cristalería, vajilla y cubertería 05412 Otros utensilios de cocina y menaje 055 Herramientas y accesorios para cada y jardin 0551 Herramientas y accesorios para casa y jardin 05511 Herramientas y accesorios para casa y jardín 056 Otros bienes y servicios para el hogar 0561 Artfculos no duraderos para el hogar 05611 Artículos de limpieza para el hogar 05612 Otros artículos no duraderos para el hogar 0562 Servicio doméstico y otros servicios para el hogar 05621 Servicio doméstico y otros servicios para el hogar
Subgrupos
Clases
Subclases 4,606 1,833 2,464 1,038 0,855
1,972 1,972 0,782 1,190 1,820 1,82 1,820 23,810 15,736 12,546 3,191 8,074 8,074
21,266 21,266 41,049 25,426 25,426 11,484 11,484 4,139 4,139
63,571 19,547 19,54? 16,557 2,990 5,626 5,626 5,626 10,795 10,795
06 Medicina 28,062 061 Medicamentos, otros productos farmacéuticos y material terapéutico 0611 Medicamentos, otros productos farmacéuticos y material terapéutico 06111 Medicamentos y otros productos farmacéuticos 06112 Material terapéutico 062 Servicios médicos, dentales y paramédicos no hospitalarios 0621 Servicios médicos y paramédicos no hospitalarios 06211 Servicios médicos y paramédicos no hospitalarios 0622 Servicios dentales 06221 Servicios dentales 063 Servicios hospitalarios 0631 Servicios hospitalarios 06311 Servicios hospitalarios
16,203 16,203 10,779 5,425 10,841 4,344 4,344 6,498 6,498 1,018 1,018 1,018
r
¡:, 1' 1
1 1
1
236
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
1
·1
TABLA 4.2.
(Continuación)
TABLA 4.2.
(Continuación) Ponderaciones
Ponderaciones Grupos 07 Transporte 155,76 071 Vehículos 0711 Automóviles 07111 Automóviles 0712 Otros vehículos 07121 Otros vehículos 072 Bienes y servicios relativos a los vehículos 0721 Repuestos y accesorios de mantenimiento 07211 Repuestos y accesorios de mantenimiento 0722 Carburantes y lubricantes 07221 Carburantes y lubricantes 0723 Servicios de mantenimiento y reparaciones 07231 s_ervicios de mantenimiento y reparac10nes 0724 Otros servicios relativos a los vehículos 07241 Otros servicios relativos a los vehículos 073 Servicios de transprote 0731 Transporte por ferrocarril 07311 Transporte por ferrocarril 0732 Transporte por carretera 07321 Transporte por carretera 0733 Transporte aéreo 07331 Transporte aéreo 0734 Otros servicios de transporte 07341 Otros servicios de transporte 08 Comunicaciones 081 Comunicaciones 0811 Servicios postales 08111 Servicios postales 0812 Equipos y servicios telefónicos 08121 Equipos y servicios telefónicos
Sub grupos
Clases
Subclases
Grupos
71,769 69,286 69,286 2,483 2,483 72,912
1
1,383 1,383 53,075 53,075 15,255 15,255 3,198 3,198 11,079 1,585 1,585 5,945 5,945 1,934 1,934 1,615 1,615
25,729
09 Ocio y cultura 67,263 091 Equipos y soportes audiovisuales, fotográficos e informáticos 0911 Equipos de imagen y sonido 09111 Equipos de imagen y sonido 0912 Equipos fotográficos y cinematográficos 09121 Equipos fotográficos y cinematográficos 0913 Equipos infonnáticos 09131 Equipos informáticos 0914 Soporte para el registro de imagen y sonido 09141 Soporte para el registro de imagen y sonido
237
NÚMEROS ÍNDICES
25,729 0,311 0,311 25,417 25,417
'l
·~
J
13,651 4,721 4,721 0,788 0,788 4,333 4,333
i J
'·11
.,"
l
1
¡
3,136 3,136
0915 Reparación de equipos audiovisuales, Jotográficos e infonnáticos 09151 Reparación de equipos audiovisuales, fotográficos e informáticos 092 Artículos recreativos y deportivos; floristeria y mascotos 0921 Artículos recreativos y deportivos 09211 Juegos y juguetes 09212 Otros artículos recreativos y deportivos 0922 Floristerfa y mascotas 09221 Floristería y mascotas 093 Serviciós recreativos, deportivos y culturales 0931 Servicios recreativos y deportivos 09311 Servicios recreativos y deportivos 0932 Servicios culturales 09321 Servicios culturales 094 Libros, prensa y papeleria 0941 Libros 09411 Libros 0942 Prensa y revistas 09421 Prensa y revistas 0943 Material de papelerfa 09431 Material de papelería 095 Viaje organizPdo 0951 Viaje organizado 09511 Viaje organizado
Subgrupos
Clases
Subclases
0,672 0,672 10,379 6,146 5,467 0,679 4,233 4,233 14,526 5,713 5,713 8,813 8,813 17,200 7,098 7,098 7,792 7,792 2,310 2,310 11,507 11,507 11,507
10 Enseñanza 101 Enseñanza 1011 Educación infantil y primaria 10111 Educación infantil y primaria 1012 Enseñanza secundaria 10121 Enseñanza secundaria 1013 Enseñanza superior 10131 Enseñanza superior 1014 Otras enseñanzas 10141 Otras enseñanzas
17,444
11 Hoteles, cafés y restaurantes 111 Restaurantes, bares y cafeterías 1111 Restaurantes, bares y cafeterías 11111 Restaurantes, bares y cafeterías 112 Hoteles y otros alojamientos 1121 Hoteles y otros alojamientos 11211 Hoteles y otros alojamientos
112,708
17,444 3,447 3,447 3,59 3,590 5,913 5,913 4,494 4,494
106,217 106,217 106,217 6,490 6,490 6,490
238
TABLA 4.2.
TABLA 4.3.
(Continuación)
69,124 12 Otros bienes y servicios 121 Bienes y serivicios para el cuidado personal 1211 Servicios para el cuidado personal 12111 Servicios para el cuidado personal 1212 Artículos para el cuidado personal 12121 Artículos para el cuidado personal 122 Artfculos de uso personal 1221 Joyería, bisutería y relojeria 12211 Joyería, bisutería y relojería 1222 Otros artículos de uso personal 12221 Otros artículos de uso personal 123 Servicios sociales 1231 Servicios sociales 12311 Servicios sociales 124 Seguros 1241 Seguros para la vivienda 12411 Seguros para la vivienda 1242 Seguros médicos 12421 Seguros médicos 1243 Seguros de automóvil 12431 Seguros de automóvil 1244 Otros seguros 12441 Otros seguros 125 Servicios financieros 1251 Servicios financieros 12511 Servicios financieros 126 Otros servicios 1261 Otros servicios 12611 Otros servicios
Subgrupos
Clases
Subclases
22,531 10,241 10,241 12,290 12,290 5,173 3,342 3,342 1,831 1,831 2,314 2,314 2,314 34,693 4,447 4,447 6,725 6,725 18,534 18,534 4,986 4,986 0,278 0,278 0,278 4,135 4,135 4,135
Fuente: INE.
TABLA 4.3.
Ponderaciones por rúbricas del1PC-Base 2001 para el total Nacional Grupos
01. 02. 03. 04. 05. 06. 07. 08.
Cereales y derivados Pan Carne de vacuno Carnedeovino Carne de porcino Carne de ave Otras carnes Pescado fresco y congelado
Ponderación 15,144 18,639 12,458 4,683 7,701 8,892 22,727 17,163
¡ 1
¡
j
l ·J
J
.,~
J
] j
(Continuación)
Grupos
Ponderación
09. Crustáceos, moluscos y preparados de pescado 10. Huevos 11. Leche 12. Productos lácteos 13. Aceites y grasas 14. Frutas frescas 15. Frustas en conserva y frutos secos 16. Legumbres y hortalizas frescas 17. Preparados de legumbres y hortalizas 18. Patatas y sus preparados 19. Café, cacao e infusiones 20. Azúcar 21. Otros preparados alimenticios 22. Agua mineral, refrescos y zumos 23. Bebidas alcohólicas 24. Tabaco 25. Prendas de vestir de hombre 26. Prendas de vestir de mujer 27. Prendas de vestir de niño y bebé 28. Complementos y reparaciones de prendas de vestir 29. Calzado de hombre 30. Calzado de mujer 31. Calzado de niño 32. Reparación de calzado 33. Viviendas en alquiler 34. Calefacción, alumbrado y distribución de agua 35. Conservación de la vivienda 36. Muebles y revestimientos de suelo 37. Textiles y accesorios para el hogar 38. Electrodomésticos y reparaciones 39. Utensilios y herramientas para el hogar 40. Artículos no duraderos para el hogar 41. Servicios para el hogar 42. Servicios médicos y similares 43. Medicamentos y material terapéutico 44. Transporte personal 45. Transporte público urbano 46. Transporte público interurbano 47. Comunicaciones 48. Objetos recreativos 49. Publicaciones 50. Esparcirnien to 51. Educación infantil y primaria 52. Educación secundaria 53. Educación universitaria 54. Otros gastos de enseñanza 55. Artículos de uso personal 56. Turismo y hostelería 57. Otros bienes y servicios .
14,074 2,463 12,869 15,496 8,152 15,093 2,720 9,480 4,799 3,324 4,062 1,339 9,236 8,116 8,999 23,171 29,205 36,371 10,761 2,921 7,406 8,758 3,669 0,189 22,073 49,774 38,412 19,225 5,948 10,795 3,792 17,214 12,520 18,584 16,203 163,215 5,824 5,255 25,729 24,030 11,879 14,526 4,684 4,828 6,337 5,761 21,053 124,214 18,043
Ponderaciones· Grupos
239
NÚMEROS íNDICES
CASAS-SÁNCHEZ, J. M. y SANTOS-PE:&AS, J.
Fuente: INE.
~
o Q. o
Q.
()
0\ ()
e o
""Wf?'~---wn=ne&li!.li!aiili~i:i5~.ti!=inítjlliW"ñ..WF
~=2i!Mifn'iA""'2"2D!-1"Ri"'n~~dt"iWCJ'fP"'iil~
TTIRWG;Hqí
, ~,
TABLA 4.5. Ponderaciones por grupos de art(culos del IPC-Base 2001 para el total Nacional y Comunidades Aut6nomas
General Base 2001 Alimentos y bebidas no alcohólicas Bebidas alcohólicas y tabaco Vestido y calzado Vivienda Menaje Medicina Transporte Comunicaciones Ocio y cultura Enseñanza Hoteles, cafés y restaurantes Otros bienes y servicios
General Base 2001 Alimentos y bebidas no alcohólicas Bebidas alcohólicas y tabaco Vestido y calzado Vivienda Menaje Medicina Transporte Comunicaciones Ocio y cultura Enseñanza Hoteles, cafés y restaurantes Otros bienes y servicios Fuente: INE.
Nacional
Andalucía
Aragón
Asturias
Baleares
Canarias
Cantabria
CastillaLeón
CastillaLa Mancha
1.000 218,630 32,170 99,280 110,260 63,571 28,062 155,760 25,729 67,263 17,444 112,708 69,124
1.000 237,973 39,351 103,535 101,803 64,405 26,154 160,406 24,501 59,043 9,918 109,565 63,346
1.000 217,498 32,209 111,695 116,334 71,807 26,677 140,750 27,971 69,054 14,492 107,059 64,454
1.000 216,700 28,867 107,895 110,829 63,748 26,505 161,305 26,439 61,244 15,684 113,830 66,956
1.000 197,884 33,463 90,989 107,832 64,870 34,479 176,282 28,310 59,098 21,213 105,972 79,609
1.000 222,791 30,286 83,964 104,409 66,637 35,364 166,754 25,811 75,953 19,949 107,128 60,954
1.000 218,708 29,773 121,718 118,695 60,357 31,268 148,845 27,022 61,839 10,611 103,265 67,898
1.000 239,175 28,359 108,934 116,057 66,059 22,897 146,555 28,200 57,476 14,979 108,095 63,216
1.000 239,250 32,699 111,472 111,728 60,819 27,610 159,386 24,867 53,067 8,745 107,531 62,826
Comunidad Comunidad de Madrid de Murcia
Cataluña
Comunidad valenciana
Extremadura
Galicia
1.000
1.000
1.000
1.000
1.000
213,766 29,941 88,982 119,976 58,404 29,908 149,067 25,521 78,205 25,203 107,177 73,849
210,876 34,961 93,447 102,352 67,061 31,235 162,910 27,872 67,081 11,637 115,320 75,248
253,461 34,889 113,631 94,792 65,962 27,263 156,063 25,389 54,409 8,307 104,772 61,060
234,773 31,828 114,926 96,466 70,672 27,493 162,053 22,499 59,243 14,240 99,956 65,850
193,122 28,580 92,276 119,264 57,335 27,724 153,954 26,820 75,371 24,751 128,098 72,706
Navarra
País Vasco
La Rioja
Ceuta y Melilla
1.000
1.000
1.000
1.000
1.000
215,028 43,577 99,212 99,950 73,416 23,432 172,502 23,384 62,120 8,819 105,462 73,096
188,242 25,754 113,839 102,932 79,493 30,582 169,382 22,248 73,700 18,605 111,291 63,932
210,050 28,387 99,091 107,540 65,400 25,661 147,368 24,192 66,435 21,520 132,728 71,627
223,861 34,453 98,757 113,123 65,625 29,285 138,750 26,364 69,940 15,161 119,611 65,070
290,189 50,038 117,779 105,805 60,037 17,557 98,189 29,219 58,617 5,051 99,268 68,251
z
e
S:: ti1 ~
otzl
-~ ( ")
ti1
CZl
N
.¡::..
m
::J
o()
o.
t;¡:n;c
c:n:c
t::e t::e
~
~
N
............... ......,. .....
~
~
~
11
([)"
"' "' 11' 11' tiJ CI'J "' CI'J \1'.) 00 11' 00
~-M
CJ)
~
oo
01010101010 010000\VIW o-NV->00000\
'-<
-º~
::J -+
o.
::J
o()
TABLA
Año
1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977
4.6. fndice General Nacional. Sistemas IPC-Base 1992 Enero
3,365 3,489 3,848 4,309 4,794 4,930 5,020 5,038 5,560 5,842 6,657 7,197 7,593 8,110 8,301 8,646 9,285 10,082 10,895 12,423 14,762 16,807 20.542
Febrero
3,376 3,532 3,869 4,313 4,817 4,926 4,979 5,061 5,604 5,846 6,771 7,191 7,652 8,110 8,251 8,613 9,278 10,074 10,912 12,465 14,903 16,997 20.849
Marzo
3,289 3,389 3,566 3,889 4,397 4,843 4,920 4,957 5,105 5,713 5,864 6,824 7,191 7,684 8,193 8,301 8,679 9,376 10,172 11,002 12,736 15,000 17,391 21,348
Abril
Mayo
Junio
3,289 3,408 3,604 3,906 4,491 4,873 4,924 4,970 5,177 5,709 5,886 6,874 7,260 7,791 8,265 8,399 8,727 9,475 10,172 11,158 13,015 15,264 17,743 21,736
3,289 3,410 3,621 3,916 4,520 4,888 4,909 4,957 5,243 5,741 5,901 6,902 7,366 7,818 8,238 8,399 8,670 9,533 10,222 11,322 13,179 15,452 18,556 21.926
3,277 3,401 . 3,609 3,906 4,514 4,860 4,905 4,930 5,270 5,635 5,980 6,871 7,380 7,750 8,261 8,301 8,703 9,573 10,246 11,494 13,236 15,494 18,442 22.539
Juilio
3,280 3,401 3,598 3,967 4,544 4,860 4,903 4,930 5,270 5,695 6,109 6,880 7,376 7,755 8,193 8,366 8,867 9,573 10,386 11,617 13,393 15,740 18,556 23.278
Agosto
3,267 3,408 3,604 4,023 4,574 4,868 4,913 4,938 5,257 5,754 6,205 6,915 7,389 7,868 8,198 8,392 9,007 9,590 10,493 11,808 13,614 15,987 18,713 24,033
Septiem. Octubre Noviem. Diciem.
3,269 3,431 3,630 4,080 4,646 4,894 4,943 4,942 5,289 5,741 6,266 6,981 7,366 7,890 8,185 8,408 9,048 9,704 10,641 12,012 13,828 16,241 19,065 24,368
3,286 3,459 3,662 4,166 4,689 4,909 4,956 4,961 5,340 5,757 6,369 7,018 7,411 7,922 8,211 8,440 9,138 9,811 10,714 12,202 13,975 16,241 19,329 24,747
3,314 3,474 3,713 4,234 4,732 4,926 4,962 5,038 5,477 5,829 6,516 7,169 7,540 8,087 8,265 8,515 9,162 9,944 10,731 12,217 14,361 16,347 19,690 24,947
3,344 3,485 3,779 4,279 4,787 4,969 4,969 5,047 5,547 5,851 6,592 7,210 7,589 8,087 8,320 8,605 9,188 10,074 10,814 12,350 14,558 16,610 19,894 25,144
z
e
S: ti:l ~
otzl
~
......
(")
ti:l tzl
N
w """"
tv
TABLA
Año
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
t
4.6. (Continuación) Enero
25,545 29,806 34,804 39,818 45,572 51,761 58,007 63,438 69,308 . 73,489 76,768 81,680 87,144 93,025 98,576 103,185 108,346 113,074 117,462 120,847 123,215 125,111 128,712 133,413
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiem. Octubre Noviem.
Diciem.
25,796 30,037 35,115 40,020 45,927 52,021 58,227 63,898 69,617 73,802 76,978 81,738 87,697 92,895 99,233 103,218 108,385 113,628 117,782 120,765 122,927 125,185 128,894 133,851
26,127 30,349 35,304 40,817 46,378 52,337 58,696 64,296 69,852 74,231 77,536 82,260 88,018 93,197 99,592 103,581 108,743 114,290 118,200 120,825 122,984 125,737 129,405 134,415
26,677 30,807 35,645 41,223 46,988 53,056 58,973 64,959 70,022 74,399 77).66 82,481 88,218 93,399 99,485 104,035 109,171 114,896 118,871 120,869 123,289 126,202 129,943 135,113
26,944 31,167 35,892 41,415 47,668 53,276 59,292 65,163 70,217 74,307 77,262 82,598 88,211 93,664 99,745 104,322 109,394 114,942 119,281 121,045 123,450 126,198 130,159 135,624
27,216 31,442 36,449 41,451 48,126 53,588 59,712 65,052 70,862 74,325 77,562 83,048 88,483 93,934 99,726 104,581 109,512 115,051 119,181 121,041 123,530 126,225 130;553 136,081
27,806 32,121 36,964 42,263 48,744 53,779 60,629 65,422 71,570 75,078 78,586 84,396 89,672 95,100 100,050 104,955 109,941 115,069 119,340 121,263 123,986 126,772 131,346 136,415
28,291 32,437 37,397 42,778 49,082 54,501 61,050 65,520 71,773 75,045 79,363 84,590 90,065 95,453 100,962 1Q5,583 110,651 115,394 119,678 121,798 124,318 127,312 131,897 136,745
28,524 32,864 37,795 43,118 49,139 54,937 61,174 66,239 72,516 75,737 80,060 85,485 91,013 96,233 101,795 106,180 110,988 115,848 119,970 122,401 124,410 127,557 132,238 136,726
29,303 33,872 39,025 44,647 50,901 57,122 62,278 67,371 72,930 76,284 80,742 86,304 91,955 97,038 102,227 107,262 111,914 116,748 120,497 122,925 124,653 128,290 133,366 136,978
28,785 33,305 38,098 43,603 49,631 55,682 61,543 66,580 72,787 76,187 80,150 85,830 91,821 96,838 101,856 106,576 111,229 116,064 120,134 122,356 124,421 127,509 132,576 136,584
Fuente: INE. Estos datos tienen carácter oficial a los efectos regulados por la Ley 29/94, de 24 de noviembre, de Arrendamientos Urbanos.
28,911 33,385 38,487 43,981 49,793 56,249 61,859 67,093 72,620 76,012 80,105 85,969 91,729 96,985 101,921 106,755 111,422 116,372 120,141 122,599 124,309 127,714 132,906 136,483
(")
> Vl > '{' Vl
>-
z (")
::t: tt1
.N ~
~ '< Vl
~ ...,
o Vl .;;¡ tt1 z.
> JI' ~
246
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
NÚMEROS íNDICES
e) Actualización de rentas entre dos meses ambos anteriores a enero de 2002 o ambos posteriores a enero de 2002 La expresión a utilizar para actualizar rentas utilizando el IPC, en ambos casos es: IPC mes final Renta actualizada = Renta inicial x - - - - - ' - - [4.27] /PC mes inicial Ejemplo 4.11 Se desea actualizar la renta de una vivienda de 600 €, utilizando el IPC, desde agosto de 1998 a diciembe de 2001. Solución:
La expresión a utilizar será: Índice LAU mes final 5 Renta actualizada = Renta inicial · - - - - - - - - IPC mes inicial
Se desea actualizar el alquiler de una vivienda de 700 € con el IPC, desde enero de 2001 a marzo de 2002. Solución:
Sabemos que = 700 € Renta inicial antes de actualizar IPC de enero de 2001(Tabla 4.6) = 133,413 Índice LAUde marzo de 2002 (Tabla 4.8) = 138,642
Renta inicial antes de actualizar = 600 € IPC agosto 1998 (Tabla 4.6) = 124,318 IPC diciembre 2001 (Tabla 4.6) = 136,483
Utilizando la expresión [ 4.28] tenemos:
Utilizando la expresión [4.27] tenemos: 136,483 , Renta actualizada = 600 € x 124 318
=
658,71 €
Renta actualizada = 700 € x
d) Actualización de rentas desde meses anteriores a enero de 2002 a enero de 2002 y meses posteriores Para ello hay que utilizar el índice de la Ley de Arrendamientos Urbanos (Índice LAU), que se obtiene multiplicando el IPC general del mes por el coeficiente LAUde ese mismo mes, así pues se tendría la Tabla 4.8.
Mes Enero Febrero
Marzo Abril
Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Fuente: INE.
[4.28]
Ejemplo 4.12
Sabemos que
TABLA 4.8.
247
indices LAU para el año 2002
Coeficientes LAU
IPC año 2002
Índice LAU 2002
1,357700 1,361911 1,356739 1,351849 1,351895 1,353461 1,366497 1,368930 1,361919 1,353368 1,349495 1,350862
101,262 101,350 102,188 103,575 103,948
137,490 138,036 138,642 140,018 140,527
138,642 = 727,435 € 133 413
'
El IPC es el indicador de la inflación o pérdida del poder adquisitivo de las rentas disponibles de las familias ya que sólo incluye bienes y servicios destinados al consumo final de los hogares. En el IPC no se contempla las subidas de precios de los bienes y servicios de naturaleza intermedia adquiridos por los sectores en el proceso productivo. La inflación subyacente es el IPC sin los alimentos no elaborados ni los productos energéticos.
4. 13.
Índices de Precios de Consumo Armonizado (IPCA) 6
Es un indicador estadístico cuyo objetivo es proporcionar una medida común de la inflación que permita realizar comparaciones internacionales. Para llegar a este índice, y a lo largo de un período transitorio, año 1996, se realizaron las modificaciones y ajustes necesarios sobre los IPC de cada país ' Esta expresión no es válida para comparar períodos inferiores a un año. 6 Metodología INE.
248
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
NúMEROS íNDICES
miembro de UE hasta conseguir un índice con unas características esenciales comunes a todos los países. El primer índice, después del período ,transitorio, se refiere a enero de 1997 con base en 1996 7• El IPCA de cada país cubre las parcelas que superan el uno por mil del gasto total de gasto de la cesta de la compra naCional, siendo excluidos del IPCA los servicios médicos y la enseñanza reglada. Además la ponderación de algunas parcelas no se incluye totalmente, es el caso de los seguros, para los que solo se consideran los gastos ligados a las primas netas, los autom6viles, de los cuales se elimina los gastos correspondientes a ventas entre consumidores, o los medicamentos y productos farmacéuticos, que solo incluyen los no subvenCionados. Así pues, después de estas · exclusiones, la ponderaCión total eliminada de la estructura del IPC español es aproximadamente del 5%. El IPCA está formado por doce grandes grupos cuyas respectivas ponderaCiones aparecen en la Tabla 4.9.
A partir de las IPCA de los quince países miembros, la ofiCina de estadística de la Unión Europea (EUROSTAT) obtiene un indice de Precio de Consumo de la Uni6n Europea como media ponderada de los IPCA de dichos índices.
,
4. 14. Otros lndices o Indicadores de Coyuntura elaborados Además del IPC, que sin duda es el indicador más relevante ya que la subida generalizada de los preCios al consumo tiene una enorme repercusión en los ámbitos soeioeconómicos, existen otra serie de índices que nos completan el panorama coyuntural de nuestra economía. fndice de Producci6n Industrial (IPI) 8
a) TABLA
01. 02. 03. 04. 05. 06. 07. 08. 09. 10. 11. 12.
4.9.
Grupos y ponderaciones que integran el IPCA
Grupos
Ponderaciones %
Alimentos y bebidas no alcohólicas Bebidas alcohólicas y tabaco Vestido y calzado Vivienda Menaje Medicina Transporte Comunicaciones Ocio y cultura Enseñanza Hoteles, cafés y restaurantes Otros
27,5 3,2 11,4 11,2 6,5 0,8 14,6 1,6 6,9 0,1 11,8 4,4
Fuente: INE.
La fórmula que se utiliza para obtner el IPCA, es la misma que para obtener el IPC español, la fórmula de Laspeyres: I
="¿ w.I.
11
i
donde el índice de cada artículo I; se obtiene como coCiente de las medias aritméticas de sus preCios. Las ponderaCiones W; permanecen fijas mes a mes. 7
249
El Reglamento del Consejo.número 2494/95 de 23 de octubre de 1995 establece las directrices para la obtención de índices comparables.
Es un índice de naturaleza cuántica que mide la evoluCión mensual de la actividad productiva de las ramas industriales, excluida la construcCión. Mide la evoluCión conjunta de la cantidad y de la calidad, eliminando la influencia de los precios. Para su obtenCión se elabora una encuesta continua de periodicidad mensual dirigida a más de 9.000 establecimientos. El organismo responsable de su elaboraCión es el INE, en donde puede encontrarse la metodología completa. fndice de Precios Industriales (IPRJ) 9
b)
Completa con el anterior la panorámica coyuntural de la industria en nuestro país. Mide la evoluCión mensual de los precios de los productos industriales, fabricados y vendidos en el mercado interior, en el primer paso de su comerCializaCión, es decir, de los preCios de venta a salida de fábrica obtenidos por los establecimientos industriales en las transacCiones que éstos efectúan, excluyendo los gastos de transporte, comerCialización e IVA facturado. , Para su obtención se realiza una encuesta continua de periodicidad mensual, que investiga todos los meses más de 6.000 establecimientos industriales. 8 9
Índice de Producción Industrial (IPI). Base 1990. INE. Índice de Precios Industriales (IPRI). Base 1990. INE.
250
CASAS-SÁNCHEZ, J. M. y SANTOS-P>IÑAS, J.
--~---------------
e) Índices de Comercio al por Menor (ICM) 10
Ejercicios
' El objetivo principal de estos Índices de Comercio al por Menor es conocer las características fundamentales de las empresas dedicad.ts al comercio al por menor en España, permitiendo medir a corto plazo, la ev )lución de la actividad en el sector.
Índice de Precios Hoteleros (IPH) 11
d)
l. Los precios y cantidades anuales producidos en cierta factoría han resultado ser, para el período 1990-1994, los siguientes:
Es una medida de la evolución mensual de los precios que los empresarios hoteleros aplican a sus clientes. Para su obtención se utiliza la Encuesta de Ocupación en Alojamientos Turísticos: Establecimientos Hoteleros. Se investigan mensualmente alrededor de 8.500 establecimientos hoteleros.
Año t
Precio p1
Cantidad q1
1990 1991 1992 1993 1994
200 210 225 235 250
35 38 39 36 40
e) Índices de cotización bursátil Miden las fluctuaciones de las cotizaciones de las acciones que se registran diariamente en los diferentes mercados bursátiles, haciendo referencia a la cotización de los valores en el momento de cierre de la sesión. A partir de las cotizaciones de cada valor se elaboran índices de grupos (bancos, alimentación, construcción, etc.). Estos índices, convenientemente ponderados según el volumen, y utilizando fórmulas tipo Laspeyres nos llevan a obtener el índice general de la bolsa o un índice tipo IBEX-35.
Determinar en tantos por uno: a) b) e)
La variación relativa de precios con base 1991. Los índices cuánticos con base 1991 y 1990. El valor del producto en pesetas constantes de 1991 como base.
Solución: a)
P~ 1
=
t
90,91, ... , 94.
=
1!.!_ número índice simple de precios con base 1991, P91
b)
Q~ 1 = _!l!.._ y Q~ 0 =.!!!... (t = 90, 91, 92, 93, 94)
e)
~=
q91
q90
P91qt
Recogidos en una tabla resultan ser: Año
~90 10
11
Índice de Comercio al por Menor (ICM). Base 2001. INE. Índice de Precios Hoteleros (IPH). Base 2001. INE.
91 1992 1993 1994
Precio relativo
Índice cuántico
Índice cuántico
Valor
p~l
Q~l
Q~o
~
0,9523809 1 1,0714286 1,1190476 1,1904762
0,9210526 1 1,0263158 0,9473684 1,0526316
1 1,0857143 1,1142857 1,0285714 1,1428571
7.350 7.980 8.190 7.560 8.400
252
2.
El número índice de producción en tantos por uno en el año 1994, con base 1980, fue 2,38. Sabiendo que en 1980 la producción fue de 3.~00 kilogramos del producto, calcular la producción en toneladas métricas (1 tm = 1.000 kg) en el año 1994.
Soluci6n: a)
4
Pi, 9
7
=
I1 ~
+ 40. 3.000 + 50. 1.500 + 65. 1.000 35. 5.000 + 40 · 3.000 + 50· 1.500 + 65 · 1.000
Pi, t qi, 97
35.5.000
~ ~7 qi,97
Soluci6n: 94 Q94 = 80 = 2 38 = q
q 80
'
q
=
94
3.200 kg
=>
q94
= 3.200. 2,38 = 7.616 kg =
.
~~~.oob + 120.000 + 75.000 + 65.000 = 1 435.000
7,616 tm
98
-
p L, 97
-
37. 5.000
3.
Una marca de electrodomésticos fabrica, en cierta cadena industrial, cuatro tipos de exprimidores automáticos que reciben el nombre de modelo A, B, C y D. En los años 1997, 1998 y 1999, los precios recomendados de venta y el número de unidades de cada modelo producidas se recogen en esta tabla:
40. 5.000
Modelo
A
B
e
D
Precio (u.m.)
N.0 de unidades
Precio (u.m.)
N.0 de unidades
Precio (u.m.)
N.0 de unidades
35 40 50 65
5.000 3.000 1.500 1.000
37 45 55 68
5.200 2.500 1.700 1.200
40 47 58 70
5.400 2.500 1.800 1.300
. Sl
+ 68.000
t =
1998
+ 47.3.000 + 58. 1.500 + 70. 1.000
--------:--::-::-:-:-------
435.000
+ 141.000 + 87.000 + 70.000
1
1999
435.000
::~::~ ~ 1,1448276 b)
si
t
= 1999
4 t
PP,91 =
=
I i=l
Pitqit
35 . 5.000
+ 40. 3.000 + 50. 1.500 + 65 . 1.000
_:4:____::___ _
I i=l
Pi, 91qit
1,
si
t =
435.000 1997
Se pide en tantos por uno: Los índices de precios de Laspeyres con base 1997. b) Los índices de precios de Paasche con base 1997. e) Los índices cuánticos de Laspeyres con base 1997. d) El valor en pesetas constantes de 1997 de la producción en los tres años. e) El valor en u.m. corrientes. f) El índice de precios de Fisher con base 1997. a)
= 1997
435.000
200.000 1998
t
+ 45. 3.000 + 55. 1.500 + 68. 1.000
470.500 - - .-- ~ 1,0816092 43 5 000 p99 L, 97 -
si
'
185.000 + 135.000 + 82.500 435.000
1997
253
NÚMEROS íNDICES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
p98 97 P,
+ 45 . 2.500 + 55 . l. 700 + 68 . 1.200 + 40 · 2.500 + 50· 1.700 + 65 · 1.200 192.400 + 112.500 + 93.500 + 81.600 182.000 + 100.000 + 85.000 + 78.000
37 . 5.200 35 · 5.200
---------:-:----:--::-::-~---:-::--:-~
480.000 - - .-445 000
~
1,0786517,
.
Sl
t =
998 1
254
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
P,
40 5.400 + 47 2.500 + 58 1.800 + 70 1.300 35 · 5.400 + 40 · 2.500 + 50 • 1.800 + 65 · 1.300
=
p99
o
97
o
o
528.900 _ 463 500
=
e)
4
o
216.000 + 117.500 + 104.400 + 91.000 189.000 + 100.000 + 90.000 + 84.500
Vg 9 =
1,1411003,
si
QL, 97 =
=
4
L
1,
si
528.900 u.m. de 1999
o
= jPi. 97 P~. 97 = 1,
si
t
=
1997
t = 1999
ql,tP1,97
1= 1
t
P 1, 99 q 1, 99 =
f)
4
L
L 1= 1
P}, 97 ~
255
NÚMEROS ÍNDICES
~ j1,0816092·1,07865l7
=
1,0801294, si
t
=
1998
~ j1,1448276·1,1411003
=
1,1429624, si
t =
1999
t = 1997
ql, 97P1, 97
1=1
445.000 _QQQ = 1,0229885, 435 463.500
= 435 _000 = d)
SI
4.
t = 1998
Una nave industrial ha sido alquilada para su explotación al precio de
750.000 u.m. en el año 1996. Si el índice de precios al consumo ha evolucio-
nado de este modo: 1,0655172,
,Y= V97 + V98 + V99 =
si t = 1999
1.343.500 u.m. de 1997
donde 4
v97
=
L PI, 97ql, 97 = 1= 1
v98
=
L
435.000 u.m. de 1997
4
Pt, 97ql, 98
=
445.000 u.m. de 1997
PI, 97ql, 99
=
463.500 u.m. de 1997
Año t
Índice de Precios al Consumo (Base 1996) r91 en tantos por uno
1996 1997 1998 1999
1,06 1,11 1,20
1
¿Cuál será el precio de alquiler para 1999, si en ese año se revisó el precio de acuerdo con los incrementos de precios al consumo?
1=1
4
v99
=
L
Solución:
1=1
e)
V = Vg 7
+ Vg 8 + Vg 9
=
1.535.000 u.m. corrientes
Será el nuevo precio para 1999:
donde
750.000 · I~~ = 750.000 · 1,2 = 900.000 u.m.
4 Vg7
=L
P1, 99q1, 9 7
= 498.000
u.m. de 1999
1= 1
4
Vg8
=
L1 PI, 99ql, 98 =
5.
i=
= 40. 5.200 + 47. 2.500 + 58. 1. 700 + 70. 1.200 = = 208.000 + 117.500 + 98.600 + 84.000= 508.100
u.m. de 1999
Demostrar que: P L · Qp = P P · QL = P F · QF siendo P L y QL los índices de Laspeyres de precios y cantidad, PP y Qp los índices de Paasche de pr~cios y cantidad respectivamente, y P F y QF los índices de Fisher de precros y cantidad.
256
257
NÚMEROS ÍNDICES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
B exportó a A
Solución:
L L
qitPit Qp=....:i_ _ qioPit
:;.
PLQP =
L Pitqi; L Pioqio
1990
_,i_ _
1994
Productos
1' 2'
L qitPio QL=...:.i_ _ L qioPio
Precio
Cantidad
Precio
Cantidad
15 35
600 200
20 45
750 400
Se pide:
L Pitqio L Pitqit L Pioqit' i
Calcular los índices de precios de Laspeyres y Paasche de exportación de A y B, y deBa A, con base 1990 (en tantos por uno). Calcular los índices cuánticos respectivos (en tantos por uno). ¿Existe déficit o superávit comercial para el país A, en 1990 y 1994?
a)
...!.i_ _
b)
i
e)
Solución: a)
Índice de Precios de Exportación de A a B
De donde p94
=
90
L,
=
p94
6.
El intercambio comercial entre dos paises A y B, se recogen en la información siguiente (en miles de u.m.)
P,
=
90
A exportó a B
=
7.500 5.000
+ 4.800 + 14.000 + 3.750 + 12.000
7.500 5.000
+ 6.400 + 17.500 + 5.000 + 15.000
26.300 20.750 ~ 1,2674699 15. 500 10 · 500 31.400 25.000
+ 32. 200 + 35. 500 + 25 · 200 + 30 · 500
~ 1' 256
Índices de Precios de Exportación de B a A
1994
1990
15. 500 + 32. 150 + 35. 400 10 · 500 + 25 · 150 + 30 · 400
Productos Precio
Cantidad
Precio
Cantidad
p'94 L,
1 2 3
10 25 30
500 150 400
15 32 35
500 200 500
90
p'94 P,
90
= 20. 600 + 45. 200 = 12.000 + 9.000 = 21.000 ,. . ., 15" 600
+ 35 • 200
9.000
+ 7.000
16.000 -
1 3125 •
= 20. 750 + 45. 400 = 15.000 + 18.000 = 33.000 ,. . ., 15 · 750
+ 35 · 400
11.250
+ 14.000
1 3069307 25.250- •
258 b)
CASAS-SÁNCHEZ, J. M. y SANTOS-PE]\¡AS, J.
Solución:
Índices Cuánticos de Exportación de A a B 94
QL, 90
94
Qp, 90
El valor de 1 millón de u.m. de 1990 será de valor diferente que 1 millón de u.m. de 1991 o 1992, etc. Concretamente se deprecia en un 8 % cada año respecto del anterior; luego el valor de 1 millón de u.m. de 1990, pasa a ser:
-25.000 ~ - 1,2048193 . 20 750 -
a) b) e)
31.400 ~ 26.300- 1,1939163
d)
Índices Cuánticos de Exportación de B a A
º'
94 90
L,
0,92 millones de u.m. en el año 1991, pues 0,92 = 1/I~b 0,8464 millones de u.m. en el año 1992, pues 0,8464 = 0,92 2 = 1/I~~ 0,778688 millones de u.m. en el año 1993, pues 0,778688 = 0,92 3 = 1/I~~ 0,7163929 millones de u.m. en el año 1994, pues 0,7163929 = 0,92 4 = 1/I~ó
Luego, en millones de u.m. constantes de 1990, la valoración del patrimonio de la compañía es:
25.250 = - - ~ 1 578125 16.000 '
Año
t94 - 33.000 ~ Qp, 90- 21.000- 1,5714286
e)
259
NÚMEROS ÍNDICES
t
1990
1991
1992
30
32,2
32,1632
Valor Vr (en millones de u.m. de 1990)
Valor exportado de A aBen 1990: V90 = 20.750, en miles de u.m. de 1990. Valor exportado deBa A en 1990: ~o= 16.000, en miles de u.m. en 1990. Luego, en 1990 hubo superávit para A valorado en 4.750, miles de u.m. de 1990. Valor exportado de A aBen 1994: V94 Valor exportado deBa A en 1994: ~ 4
= =
31.400, en miles de u.m. de 1994. 33.000, en miles de u.m. de 1994.
Luego, en 1994 hubo déficit para A valorado en 1.600, miles de u.m. de 1994.
1994
31,14752 32,954073
Donde:
v; =
Vr/1~ 0 = Vr(0,92)f- 1990 ,
t =
1990, 1991, 1992, 1993 y 1994.
Siendo ~o el índice de precios que produce la depreciación de la moneda en el año t en base 1990.
8. El índice de precios al consumo en tantos por uno, en tres años consecutivos ha sido: Año
7. Una moneda se deprecia anualmente en un 8% respecto del año precedente. Disponemos de los valores (en millones de u.m.) del patrimonio de cierta compañía; estos son:
1993
t
IPc:-1
1992
1993
1994
1,05
1,04
1,032
Obtener el índice medio en estos tres años.
, Año
t
Valor
1
Vr (en millones de u.m.)
1990 30
1991
1992
1993
1994
35
38
40
46
Deflactar estos valores teniendo en cuenta la depreciación anual de la moneda Utilizada.
Solución: El índice medio pedido, al que denotamos IPC, debe de verificar que: 1994
fl
t=
1992
1994
fl
IPC:_ 1 = t=
1992
IPC = (IPC) 3
260
CASAS-SÁNCHEZ, J. M. y SANTOS-PE:firAS, J.
Luego:
Capítulo 5 IPC=
3~ 1994
TI
JPC!-1
=th,05·1,04·1,032~tf1,126944~
Estudio clásico o descriptivo de las series temporales
t= 1992
~
1,0406406 (media geométrica de los índices anuales)
De este modo el índice de precios al consumo en el período 91-94 será: JPC1994 1991
= (IPC)3
ya que Jpc 1994 1991
= ¡pc1992 ¡pc1993. JPC1994 = JPC. JPC. IPC = (IPC)3 1991. 1992 1993
Es decir, la evolución de los precios al consumo en tres años consecutivos ha elevado los precios de 1991 a 1994 una cantidad igual al producto de los tres índices de la tabla; pero esta elevación de precios habría resultado la misma, a efectos de 1994, si hubiéramos tenido un índice constante interanual igual al promedio geométrico IPC.
5. 1.
Introducción
En el presente capítulo, igual que ha ocurrido con la elaboración de. los números índices, vamos a seguir tratando de estudiar los fenómenos económicos (el consumo familiar, la inflación, los tipos de interés, el paro, etc.) a lo largo de la variable tiempo. Así como con los números índices se estudia la evolución de una magnitud en una serie de períodos de tiempo, con el estudio descriptivo de las series tratamos de hacer predicciones del fenómeno en estudio teniendo en cuenta sus características históricas o del pasado. Lo denominamos estudio clásico o descriptivo de las series temporales ya que se ha venido empleando en exclusividad desde la segunda mitad del siglo XIX hasta 1970 en que aparece un nuevo enfoque debido a los estadísticos Box y Jenkins con sus conocidos modelos univariantes de series temporales. Estos modelos se estudian en profundidad en los cursos de Econometría ya que requieren un conocimiento previo de procesos estocásticos y de las distribuciones de probabilidad que siguen dichos procesos. En el tratamiento clásico o descriptivo que se desarrollará en el presente capítulo se empleará el método tradicional de aislar lo que se conoce con el nombre de componentes de una serie económica temporal.
5.2.
Concepto de serie temporal y definición de sus componentes
Se defme como serie temporal (también denominada histórica, cronológica o de tiempo) a un conjunto de datos, correspondientes a un fenómeno econó-
262
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
mico, ordenados en el tiempo. Así serán series temporales las ventas de nuestra empresa en cada uno de los últimos diez años, los costes financieros, la renta disponible de nuestros clientes potenciales, etc. Es fundamental que los datos estén ordenados en el tiempo de forma que cada observación deberá estar asociada a un determinado período. Luego en esencia una serie de tiempo es una distribución de frecuencias bidimensional (y, t) donde la variable endógena y1 es la magnitud en estudio y la exógena o independiente es el tiempo t. Pero sólo existe una sola variable y1 que constituye lo que se conoce como modelo univariante de serie temporal que se autoexplica por su propio pasado, no existiendo ninguna variable explicativa o exógena que nos permita establecer una relación causa-efecto como se estudió en la regresión y correlación. Se estudia el pasado histórico de y1 (sus componentes) de forma descriptiva y bajo el supuesto de que su estructura va a permanecer constante se hacen predicciones para el futuro. En la representación gráfica de las series temporales se utilizan los ejes cartesianos de la misma forma que se vio en la regresión bidimensional. En el eje de abscisas se representa el tiempo t y los valores de la magnitud observada y1 en ordenadas con lo que se obtiene una serie de puntos (t, y1) que, al unirlos nos dan un impacto gráfico de la serie del que se puede sacar unas primeras conclusiones de la evolución histórica de la magnitud. Ejemplo 5.1 La cifra de las ventas trimestrales de un supermercado en el período 1990-1994, expresadas en millones de pesetas constantes de 1990, han sido los siguientes: 60, 70, 50, 80, 70, 80, 60, 100, 50, 60, 30, 70, 40, 50, 25, 60, 90, 95, 80, 110. Efectuar su representación gráfica comentando la evolución de la serie. Solución:
En el gráfico 5.1 sobre el eje de abscisas se han llevado los 20 trimestres de los cinco años considerados y en el de ordenadas el valor de las ventas expresadas en millones de pesetas. Puede observarse que las ventas oscilan de unos trimestres a otros y que en 1991 (trimestres 5, 6, 7 y 8) aumentan en relación con los de 1990 (trimestres 1, 2, 3 y 4). En 1992 (trimestres 9, 10, 11 y 12) la magnitud baja de nivel comparada con los datos de -los trimestres de los dos años anteriores ocurriendo lo mismo en 1993 (trimestres 13, 14, 15 y 16). En cambio la magnitud recupera unos niveles que están por encima de todos los anteriores en 1994 (trimestres 17, 18, 19 y 20). En el estudio clásico de las series temporales se considera que la concreción de la magnitud en un determinado valor y en un determinado período es consecuencia de la actuación de cuatro componentes o fuerzas: la tendencia
263
Yt
110
100 90 80 70 60 50 40 30
20 10 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 GRAFICO 5.1.
t
Serie de tiempo de las ventas trimestrales de un supermercado.
secular, las variaciones cíclicas, las variaciones estacionales y las variaciones accidentales. O sea el que las ventas del 19.0 trimestre del ejemplo 5.1 sean 80 millones de pesetas tiene su origen en la actuación conjunta de estas cuatro componentes. Vamos a definirlas. - Tendencia (T): Es una componente de la serie que refleja su evolución a largo plazo. Este largo plazo será distinto según sea la naturaleza de la serie, pero cuantos más períodos se tengan mejor será el análisis. En el ejemplo 5.1 la tendencia se obtendría teniendo en cuenta la evolución de las ventas a lo largo de todo el período de cinco años. En el gráfico 5.2 se representa por una línea recta creciente, ya que puede observarse que al considerar todo el conjunto de observaciones las de los últimos trimestres superan, en líneas generales, las alcanzadas en los anteriores. Esta componente, en el conjunto de toda serie, puede ser de naturaleza estacionaria o constante (se representaría por una paralela al eje de abscisas), de naturaleza lineal (creciente o decreciente según que el coeficiente angular de la recta sea positivo o negativo), de naturaleza parabólica, de naturaleza exponencial, u otras posibles. - Las variaciones cíclicas (C): Es una componente de la serie que recoge las oscilaciones periódicas de amplitud superior a un año. Estas oscilaciones no son regulares y se presentan en los fenómenos económicos cuando se dan de forma alternativa etapas de prosperidad o de depresión. En el gráfico 5.2 se
264
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
observa una variación cíclica en las venta del supermercado con una amplitud de unos dos años y medio (la amplitud se mide trazando una pan:¡.lela al eje de abscisas equidistante en los extremos de las ondas del ciclo y contando los períodos de tiempo existentes entre los puntos consecutivos que surgen al cortar dicha paralela al gráfico del ciclo C). La caída de las ventas del supermercado en los años 1992 y 1993 tiene su origen en la recesión económica que sufrió nuestí:o país en los mencionados años y que afectó al consumo familiar. Pero la tendencia creciente de la serie hace que en 1994 las ventas alcancen niveles superiores, en pesetas constantes, a los que existían en 1990 y 1991. - Las variaciones estacionales (E): Es una componente de la serie que recoge las oscilaciones que se producen en períodos de repetición iguales o inferiores a un año. Su nombre proviene precisamente de las estaciones climatológicas: invierno, primavera, verano y otoño. Si se considera el año como el período marco o de repetición pueden observarse las fluctuaciones de la magnitud a lo largo de sus trimestres como ocurre en el ejemplo 5.1, de sus meses, de sus cuatrimestres, etc. Si el período de repetición es el mes pueden observarse las fluctuaciones en sus distintos días; decenas, etc. (por ejemplo, debido a la disponibilidad monetaria de los individuos, el consumo de gasolina para los automóviles aumenta en la primera decena del mes y disminuye en la última). Si es una semana existen una serie de comportamientos fluctuantes a lo largo de sus días provocados por las costumbres, hábitos individuales: hacer las compras los viernes y sábados, ir a los espectáculos, etc. Pueden ponerse multitud de ejemplos en los que se dan las variaciones estacionales como una serie de oscilaciones que suelen ser repetitivas y regulares en períodos cortos. En cambio las oscilaciones cíclicas no guardan regularidad y se dan en períodos largos superiores al año. El origen de las variaciones estacionales puede estar en factores físico~ naturales como son las estaciones climatológicas o en factores culturales y de tradición: fiestas navideñas, vacaciones, horarios comerciales, etc. El clima afecta a la venta de una serie de productos: los helados y refrescos se venden · fundamentalmente en verano y la ropa de abrigo en invierno. Si nos fijamos en las fluctuaciones trimestrales de las ventas del supermercado del ejemplo 5.1 puede observarse que de forma regular son mayores sistemáticamente en los segundos y cuartos trimestres en comparación con los primeros y terceros. Ello es debido a la estacionalidad de las compras de las familias. En verano están las vacaciones y la clientela del supermercado se desplaza a otros lugares de esparcimiento quedando la población de la zona de influencia del mercado muy disminuida. En el cuarto trimestre se ·da un aumento sensible por las compras navideñas. En el primer trimestre el consumo se retrae por la famosa cuesta de enero al haberse quedado agotadas las disponibilidades y la paga extra en el mes de diciembre. El segundo trimestre se suele comportar con un
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
265
cierto nivel de recuperación respecto al primero. En consecuencia podemos concluir que las ventas del supermercado a los hogares fluctuan de acuerdo con factores de tipo cultural y de tradición (vacaciones, fiestas navideñas, etc.). - Las variaciones accidentales (A): Es una componente de la serie temporal que recoge las fluctuaciones erráticas que se dan por la ocurrencia de fenómenos imprevisibles (un pedido extraordinario a nuestra empresa, una huelga, una catástrofe, etc.). También reciben el nombre de variaciones irreguIarest residuales o erráticas. Además de los fenómenos imprevisibles o extraordinarios también existen perqueñas variaciones de origen aleatorio cuyas causas pueden ser múltiples. En el ejemplo 5.1 una variación accidental producida por una causa extraordinaria (un gran pedido de una fábrica para que el supermercado facilite las cestas de Navidad de su personal) es el enorme salto de la magnitud que en el octavo trimestre pasa a ser 100 millones de pesetas. En cambio las variaciones accidentales son muy pequeñas y afectan a cada valor de la magnitud teniendo su origen en múltiples causas. En el gráfico 5.2, aunque los valores de las componentes de la serie temporal del ejemplo 5.1 son desconocidos, se realiza una representación teórica de las mismas. La tendencia T la representamos por una recta creciente a lo largo de todo el período de forma que el crecimiento constante para cada valor de t vendrá dado por el coeficiente angular de dicha recta. La otra componente que también se manifiesta a largo plazo es la variación cíclica C. Las variaciones estacionales E tienen una gran importancia y sus oscilaciones siguen los períodos trimestrales de forma repetitiva. Las de menor importancia cuantitativa son las variaciones accidentales A ya que en términos genéricos son pequeñas fluctuaciones debidas a una multitud de causas si se exceptúa el movimiento extraordinario del período número ocho debido a un fenómeno único y no usual (el gran pedido de cestas de navidad que ha realizado la fábrica). Ahora cabe hacerse una pregunta básica: ¿Cómo actuan los cuatro componentes para que como resultado den los distintos valores de la serie observada? En el estudio clásico de las series temporales se han manejado dos hipótesis de trabajo: - Los valores observados de cualquier serie temporal son el resultado de la adición de las cuatro componentes: Yt = T+ C +E+ A
[5.1]
La expresión [5.1] se conoce con el nombre de esquema o hipótesis aditiva para descomponer la serie observada en sus cuatro componentes. Si nos centramos en los datos del ejemplo 5.1 significa que los valores observados de las ventas (60, 70, 50, 80, 70, etc.) son el resultado de sumar la componente tendencia}, la cíclica, la estacional y la accidental.
266
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Yt
110 100 90 80 70 60
e
representación gráfica de la serie y se observa que las oscilaciones aumentan a lo largo de los períodos con una tendencia creciente, puede afirmarse que está actuando el esquema multiplicativo. Si las oscilaciones son regulares, no expansivas a lo largo de la serie, puede concluirse que está actuando un esquema aditivo. Una forma analítica de determinar el esquema de trabajo más adecuado es obtener las diferencias absolutas y relativas de los valores observados entre períodos consecutivos (Yt+ 1
-
Yt
y Y;.
1 ).
Seguidamente
se calcularía los coeficientes de variación de estas dos series y si el de la Yt) es inferior qu~ el de la segunda Yt+ 1, se dirá que la hipótesis Yt aditiva es la más adecuada. Por el contrario, si el coeficiente de variación del cociente es más pequeño diremos que el esquema válido es el multiplicativo. No obstante estos posibles análisis previos con la componente estacional, debemos concluir que la inmensa mayoría de las magnitudes económicas se adaptan perfectamente al esquema multiplicativo. Seguidamente vamos a ver los distintos métodos para aislar o determinar los componentes de una serie temporal. primera (Yt+ 1
50
40 30 20 10 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 GRÁFICO
267
5.2. Representación teórica de las componentes de la serie temporal del ejemplo 5.1.
- Los valores observados de cualquier serie temporal son el resultado de la multiplicación de las cuatro componentes: Yt
=
T x ex Ex A
[5.2]
Esta expresión [5.2] admite variantes para recoger el supuesto de que la componente accidental o errática es independiente de las demás y no sigue ninguna regularidad periódica como ocurre con los demás. Esta independencia implica que la componente A aparezca de forma aditiva: Yt
=
T x ex E+ A
' [5.3]
Los métodos que se utilizan para aislar las componentes de las series temporales están basados en algunos de los anteriores esquemas aunque no puede establecerse una generalización del problema ya que no en todas las • series temporales aparecen todas las componentes. Así, por ejemplo, si la serie tiene periodicidad anual está exenta de las variaciones estacionales. Para resolver el problema de cuál debe ser el esquema o hipótesis a utilizar en cada caso, si aditiva o multiplicativa, habrá que efectuar un análisis previo de la · serie por métodos gráficos o analíticos. Estos procedimientos se basan en el comportamiento de la componente estacional. Si por ejemplo se realiza una
5.3.
-
Determinación de la tendencia
La tendencia es una componente fundamental en el estudio de las series temporales ya que nos proporciona el hilo conductor de la evolución del fenómeno a largo plazo. Su determinación sólo debe efectuarse cuando se disponga de una larga serie de observaciones (se aconseja a partir de doce o quince años), ya que en otro caso se podrían obtener conclusiones erróneas. De los múltiples métodos que se han ideado para tratar de aislar la tendencia de las demás componentes vamos a tratar los más sencillos y conocidos. Método gráfico
a)
Es el método más sencillo para obtener una línea de tendencia de una serie temporal sin necesidad de hacer operaciones aritméticas. Por esta razón es el más impreciso, aunque puede darnos una primera aproximación al sentido de la tendencia. El método tiene las siguientes fases: -
Se efectúa la representación gráfica de la serie observada Yt· Se unen mediante segmentos rectilíneos todos· los puntos altos de la serie obteniéndose la línea poligonal de cimas. Idem con los puntos bajos obteniéndose la línea poligonal de fondos. Se trazan perpendiculares al eje de abscisas por los puntos de cima y de fondos.
268
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
-
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
La tendencia viene dada por la línea amortigUada que une los puntos medios de los segmentos, es decir la línea de tendencia tiene, por ordenadas la media aritmética de las ordenadas de las dos líneas anteriores.
269
o puntos altos. e) La línea poligonal de fondos F o de puntos bajos. d) Los puntos medios de los segmentos de unión (P 1, P 2 , P 3 , P 4 , P 5 , P 6 y P 7 ) de las líneas e y F. e) Y, por último la línea que une dichos puntos medios que nos indica la dirección de la tendencia que es predominantemente creciente.
Ejemplo 5.2 b)
La serie trimestral de las ventas de una empresa son las siguientes expresadas en millones de pesetas.
~
T
l.o
2.0 3.0 4.0
1991
1992
1993
1994
50 80 70 60
20 50
50 70 50 40
70 100 90 60
40
30
Método de las medias móviles
Es un método de naturaleza mecánica que consiste en sustituir la serie temporal observada por una amortiguada o suavizada obtenida por el cálculo reiterado de valores medios y ql!e nos representa la tendencia. Su aplicación consiste en lo siguiente: -
Representar la tendencia de forma gráfica. Solución:
En el gráfico 5.3 pueden observarse los siguientes elementos: a) La representación gráfica de la serie observada. b) La línea poligonal e de cimas Yt
-
100 90 80 70 60 50 40 30 20
Partimos de la serie temporal observada y1• Se obtienen sucesivas medias aritméticas para cada y1 con un número de observaciones anteriores y posteriores que se ha fijado de antemano. Si el número de observaciones utilizado es impar la media ji1 obtenida coincide (está centrada) con el período t. Si el número utilizado es par la ji1 no coincide con el período t (está descentrada) y hay que volver a calcular una nueva media aritmética y1 utilizando los y1 con lo que se obtiene una serie de medias móviles centradas con los períodos de tiempo. Las observaciones que se utilizan para obtener las medias aritméticas suele coincidir con los períodos inferiores al año que contiene la serie (por ejemplo serán tres si son cuatrimestres, cuatro si son trimestres, doce si son meses, etc.); si el período de repetición fuese la semana, las medias se obtendrían con todos sus días. La serie formada por ji1 o por y1, según sea impar o par el número de observaciones utilizadas, nos indica la línea amortiguada de la tendencia.
Ejemplo 5.3
Las ventas trimestrales de una fábrica de calzado expresadas en millones de pesetas para los años 1992, 1993 y 1994 son las siguientes:
~
Trim
l.er trimestre
10
2. o trimestre 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 GRÁF1CO
5.3. Serie de tiempo de las ventas trimestrales de un supermercado.
3!' trimestre 4. o trimestre
1992
1993
1994
150 165 125 170
155 170 135 165
160 180 140 180
270
271
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
Obtener las series de tendencia por el método de las medias móviles empleando tres y cuatro observaciones. Comentar las ventajas e inconv~nientes de utilizar más o menos observaciones en el cálculo de las medias aritméticas.
Puede observarse que en esta nueva serie de medias móviles cada ji1 se obtiene del anterior sin más que suprimir el primer valor y añadir el siguiente. También observamos que para el período uno y el doce no existe ningún valor de ji., con lo que a medida que se aumenta el número de observaciones utilizados para obtener las medias móviles, más valores se pierden por los extremos, aunque frente a este incoveniente existe la ventaja de obtener una serie más amortiguada o suave para indicar la tendencia. Esta viene dada gráficamente teniendo los puntos determinados por ji2 , ji 3 , ... , ji 11 como puede observarse en el gráfico 5.4.
Solución:
Empleando tres observaciones
Como se ha indicado anteriormente la ventaja es que al ser datos impares la serie de medias móviles está centrada con los períodos de las observaciones. El inconveniente es que al ser trimestres deberían tomarse cuatro observaciones para promediar todas las variaciones de las cuatro estaciones con objeto de eliminarlas (no se olvide que nuestro objetivo es aislar la componente tendencia! de todas las demás). No obstante como ejercicio vamos a emplear sólo tres observaciones de forma sucesiva ya que al ser impares la serie ji1 queda automáticamente centrada con los distintos períodos o valores de t.
Yt
y,
200 Yt
175 150 + 165 + 125 3 Yz Y3 =
+ Y3 + Y4
Y3 Y4 =
+ Y4 + Ys
_
+ Ys + Y6
Ys =
-
3 3
Y4
3
=
146,6
165 + 125 + 170 3 = 153,3 125 + 170 + 155 3
=
150
170 + 155 + 170 3 = 165
+ Y6 + Y1
_ Y6 Y?=
+ Y1 + Ys
170 + 135 + 165 3 = 156,6
_ Y1 Ys =
+ Ys + Y9
135 + 165 + 160 3 = 153,3
_ Ys Y9 =
+ Y9 + Y1o
Y1o =
Y9
3
155+170+135 3 = 153,3 2 GRÁFICO
3 3
+ Y1o + Y11
Y1o Y11 =
125 100
Ys Y6 =
3
150
3
+ Y11 + Y12 3
165 + 160 + 180 3 = 168,3 160 + 180 + 140 3 = 160 180 + 140 + 180 3
=
166,6
5.4.
3
4
5
6
7
8
9
10
11
12
Representaci6n de la tendencia a través de las medias m6viles y, obtenidas con tres observaciones.
Empleando cuatro observaciones
En este ejemplo al ser datos trimestrales, lo más correcto es emplear cuatro observaciones para obtener las sucesivas medias móviles. El inconveniente es que al ser un número par de datos la primera serie ji,. está descentrada respecto a los períodos de tiempo y hay que volver a promediar los distintos ji,. dos a dos para obtener una nueva serie de medias móviles y, que se corresponden con los períodos de los datos observados. La serie ji,. descentrada será:
272
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
_
= y 1 + y 2 + y 3 + y4 = 150 + 165 + 125 + 170 = 4
Y2,s
-
Y3,s
_
4
4
= y4 + y 5 + y 6 + y 1 = 170 + 155 + 170 + 135 = 4
_
4
= Ys + y 6 + y 1
+Ya= 155
170
+ 135 + 165 = 4
=Ya Y9,s
=
y9
+ Y9
+Y lO+ Yu = 165
+
160
+ y 10 + y 11 + y 12 =
160
+
180
4
+ 140 + 180 = 4
165
En esta serie de medias móviles con cuatro observaciones (número par) puede verse que dichas medias se corresponden con períodos ficticios, q~e no existen en la serie observada que son t' = 2,5; 3,5; ... ; 10,5. O sea, que la pnmera media aritmética 152,5 corresponde a un período irreal que está justo entre el período dos y el tres; la segunda 153,75 está en un t' = 3,5 que está entre el tres y el cuatro, etc. Para centrar estas medias con los períodos reale~ de las observaciones se vuelven a promediar los valores Yr• dos a dos obteméndose la serie Yr que está centrada en los períodos observados t: =
Y3 =
Y4
= hs + hs = 152,5 + 153,75 = 153 125 2
2
'
= hs + Y4,5 = 153,75 + 155 = 154 375 2
2
'
=
=
'
2
6 25 15 '
2
'
= Y?_ 5 + .Ya,s = 157,5 + 160 =
YlO
16125
+ 157,5 =
=
Y9 =
4
155
= hs + Y?_ 5 = 156,25 + 157,5 = 156 2 2 ' 875
, 156 25
+ 180 + 140 =
2
y1
=
160
+-Ys,s
2
Ya
4
Y4,5
273
= Ys,s + hs = 157,5 + 156,25 = 156 875
, 157 5
= 135 + 165 + 160 + 180 =
4
Y!O,S
=
Y6
155
= y 6 + y 1 + Ya + y 9 = 170 + 135 + 165 + 160 = 157,5 4 4
_ _ y 1 +Ya + y 9 + y 10 Ys,s4
_
+
4
Y6,s
Y1,s
4
-
=
Ys =
4
= y 3 + y4 + y 5 + y 6 = 125 + 170 + 155 + 170 =
Ys,s
_
, 152 5
4
= Y2 + Y3 + Y4 + Ys = 165 + 125 + 170 + 155 = 153,75
Y4,s
_
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS' SERIES TEMPORALES
2
Ya.s
+-Y9,s 2
2
15 8' 75
160 + 161,25 2 = 160,625
= Y9,s + YlO,s = 161,25 + 165 = 163 125 2
2
'
Esta serie Yr centrada en los períodos tes la que nos representa la tendencia como se indica en el gráfico 5.5. Puede verse que se han perdido cuatro observaciones: las de los dos primeros períodos y las de los dos últimos. Si la comparamos con la serie Yr que nos indica la tendencia utilizando tres valores observados vemos que es mucho más suave o amortiguada ya que sus valore~ máximos y mínimos son 163,125 y 153,125 mientras que en aquélla son 168,3 y 146,6; pero en ésta se pierden cuatro valores y en aquélla sólo dos. En resumen se debe resaltar que el método mecánico de las medias móviles tiene como objetivo aislar la componente tendencial de todas las demás mediante la suavización o amortiguamiento de la serie observada. Al ir promediando los valores observados de forma sucesiva se eliminan los efectos de las otras componentes cuando existan: variaciones estacionales, accidentales y cíclicas. Si los datos se observan en períodos inferiores al año, en el supuesto de que el período de repetición sea éste (meses, trimestres, cuatrimestres, etc.) es conveniente que para calcular las medias móviles se emplean tantas observaciones como estaciones consideradas (12 para los meses, 4 para los trimestres, 3 para los cuatrimestres, etc.) ya que se consigue una adecuada eliminación de la componente estacional que normalmente se presentará de una forma regular en dichos períodos. Hay que tener presente centrar la serie de medias móviles cuando los datos sean pares ya que cualquier dato se debe corresponder con toda exactitud con su período correspondiente. Otra cuestión muy distinta es cuando los datos de la serie son anuales y queremos obtener la tendencia a través de las medias móviles. Al ser observaciones de períÓdo anual no existe componente estacional ya que no se dan
__ ,_,~-···-
274
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
275
e) El método analítico de los mínimos cuadrados
Yt
Yt 200 Yt 175 150
125 100
Este método tiene la ventaja, en comparación con el de las medias móviles, de que expresa la tendencia a través de una función matemática que relaciona la magnitud que se está estudiando con el tiempo t que actúa como variable independiente. El ajuste lo realizamos por el método de los mínimos cuadrados que ya se estudió en la regresión entre dos variables estadísticas. En primer lugar conviene representar gráficamente la serie temporal observada con objeto de decidir qué tipo de función es la más adecuada: de tipo lineal, parabólico, etc. Aquí sólo vamos a tratar el ajuste lineal ya que representa a la mayoría de los fenómenos económicos. Como ya sabemos el método mínimo cuadrático consiste en minimizar la suma de los cuadrados de las diferencias entre los valores observados en los distintos períodos y los estimados por la ecuación de la recta:. [5.4]
Y1 =a+ bt
siendo las ecuaciones normales: n
2 GRÁFICO
5.5.
3
4
5
6
7
8
9
10
11
12
1
¡; 1
¡; 1
[5.5]
Representación de la tendencia a través de medias móviles ji1 obtenidas con cuatro observaciones.
períodos inferiores al año. ¿Cuántos años se deben tomar para calcular las medidas móviles? Lo ideal es tomar los mismos años que tenga la amplitud del ciclo completo pero no siempre es fácil determinarlo. Lo que suele hacerse es obtener varias series de medidas móviles con distinto número de observaciones (tres años, cinco, siete, etc.) y elegir la que esté más suave o amortiguada observando sus valores extremos. Como se ha indicado en la introducción al presente capítulo el objetivo fundamental del estudio de las series de tiempo es hacer predicciones de la correspondiente magnitud. El principal inconveniente del método mecánico de las medias móviles es que no permite efectuar dichas predicciones ya que no obtenemos la estimación de la tendencia a través de una funcién matemátiea sino a través de una serie amortiguada. Este hecho hace que se utilice poco para determinar la tendencia cuando se quieran realizar pronósticos de evolución de cara al futuro; pero sí se utiliza cuando queremos obtener índices de variación estacional como se verá en el próximo epígrafe al estudiar dicha componente. Los programas de ordenador para desestacionalizar series de tiempo están basados en el principio de las medias móviles.
n
L y = na+ b L
n
n
¡;1
¡;1
L Yr··t=a L
n
t+b
L ¡;
t2
1
donde n es el total de observaciones que coincide con el número de períodos de tiempo. El sistema de ecuaciones normales [5.5] se simplifica efectuando un cambio de variable t' = t- 0 1 si el número de períodos es impar siendo 0 1 el valor que ocupa el lugar central de la serie de instantes o períodos t, y t' = 2(t - o;) n
cuando es par de forma que
L
t' = O. El origen de trabajo
o; es en el caso
¡';1
de los pares la media aritmética de los dos valores que ocupan los dos lugares centrales de la serie de períodos t. Haciendo este cambio de variable el sisten
ma [5.5] al ser
L
t' =O queda reducido a:
1'=1 n
L
y1 =na
t=1
[5.6] t= 1
t'= 1
276
CASAS-SÁNCHEZ, J. M. y SANTOS-PE:ril"AS, J.
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
Despejando los parámetros de la recta que son las incógnitas del sistema queda:
siendo: n
I
n
L
277
Yt
st'y
t= 1 a=--
[5.7]
n
r
=
t'Yr ~ n
-
(l'.Y)
[5.13]
n
¿
n
L Yl b=~ ¿ t'2
s;. =~-(l'f n
[5.8]
n
t'2 [5.14]
t'= 1
[5.15] que nos permite establecer la recta estimada:
Yr =a+ bt'
[5.9]
y deshaciendo el cambio de variable tendremos la ecuación que nos da la tendencia:
Yr Yr
= =
Ejemplo 5.4
a + b(t - Or)
[5.10]
o;)
[5.11]
a + 2b(t -
según que el número de instantes o período sea impar o par respectivamente. Cuando las observaciones están en períodos inferiores al año (meses, trimestres, cuatrimestres, etc.) antes de hacer el ajuste conviene calcular las medias anuales para eliminar la componentes estacional que nos puede distorsionar el mismo empleando en las expresiones [5.7] y [5.8] dicha media Yr en vez de los datos observados Yr· Esta operación se efectúa como se indica en el ejemplo 5.4. Si las observaciones son anuales se utilizan directamente dichos datos ya que no existe el problema estacional. Como se ha indicado al principio la gran ventaja de este método es que nos permite hacer predicciones de cara al futuro de la magnitud en estudio, puesto que basta sustituir en las expresiones [5.10] y [5.11] eJ valor de t gor esos períodos futuros que nos interesan. También podemos dar una medida de fiabilidad de dichas predicciones a través del coeficiente de determinación que en este caso será: 2 _
R -
(Sr·yt 2 2 sr.·Syr
El significado de las anteriores expresiones ya se estudió en su momento cuando la regresión y correlación lineal simple entre dos variables estadísticas. La única diferencia es que aquí la variable independiente no es una magnitud económica sino el tiempo.
[5.12]
En los datos de la serie temporal del ejemplo 5.3 obtener la tendencia lineal ajustando la correspondiente recta por el método de los mínimos cuadrados. En la función estimada hacer una predicción de las ventas medias trimestrales para 1997 comentando la fiabilidad de la misma. Soluci6n: a)
Estimaci6n de la tendencia
La tendencia vendrá dada por la recta Yr =a+ bt siendo de las observaciones trimestrales del ejemplo 5.3: 150 + 165
Y2
=
Ys
Y9 Y3 =
+ Y6 + Y1 + Ya 4
+ Y1o + Yu + Y12 4
155
+ 125 + 170 4
+ 170 + 135 + 165 4
=
Yr la media anual
152,5
= 156,25
160 + 180 + 140 + 180 4 = 165,00
278
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
Como el número de períodos es impar para facilitar los cálculos hacemos el siguiente cambio de variable:
Luego la predicción de las ventas medias trimestrales para 1997 es de 183 millones pesetas. Multiplicando por cuatro tendremos los de todo el año:
o, =
t' = t -
183 x 4 e) (2
ji, t'
t
ji,
t'
1992 1993 1994
152,50 156,25 165,00
-1
-152,50
o
o
1
165,00
1
o
o
.Y,= 473,75
I
I
o
t'=
t'== 1
t=l
y,. t'
-2
Y,
= 12,5 I
3
t'=l
t=l
t'2 = 2
Para conocer la fiabilidad de la predicción calculamos el coeficiente de determinación a través de las expresiones [5.12], [5.13], [5.14] y [5.15].
I
y;= 74.895,31
12,5 473,75 =--0·--=416 3 3 '
t=l
3
¿
3
s
2 t'
¿
ji, 473 75 t=l- - = - ,. --1 5792 a= ,
3
3
=
t= 1
3
¿
t'2
=
t'2
~ 3
(l') 2 =
~3 -
02
=
o' 66
3
ji. t' t
=
¿
3
¿
732 millones de pesetas
Fiabilidad de la predicción
Aplicando las expresiones 5. 7 y 5.8 tenemos
b
=
23.256,25 24.414,06 27,225,00
1
3
3
3
3
I
?e
t - 1993
obteniéndose la siguiente tabla:
279
12,5 2
=
6 25
~
'
3
74.895,31 ( ) - 1579 2 3 '
=
= 24.965,10 - 24.932,41 = 32,69
t'=1
Luego: ji,= a+ bt' = 157,92
-2
•= y, _ 2 S - =1- - - y 2 =
+ 6,25t'
R2
=
(s,.1y
s;.. s;
=
(4,16f 0,66 x 32,69
17,30 = O7939 21,79 '
= --
t
Deshaciendo el cambio de variable según la expresión [5.10] tendremos la siguiente estimación de la tendencia:
+ 6,25(t - 1993) = 157,92 - 12.456,25 + 6,25t = = - 12.298,33 + 6,25t
ji,= 157,92
b)
Predicción de las ventas para 1997
Se obtienen sustituyendo en la tendencia estimada el parámetro t por 1997: YI997
+ 6,25 X 1997 = -12.298,33 + 12.481,25 = 183 millones de pesetas
= -12.298,33 =
Se observa que el coeficiente de determinación está en el mínimo aceptable con lo que el grado de fiabilidad de la predicción no es muy elevado. Como ya se indicó al definir la componente tendencia!, ésta puede seguir un modelo estacionario o de media constante, siendo una paralela a la altura de la ordenada en origen ya que el coeficiente angular de la recta sería cero. La estimación de media constante se realizaría por mínimos cuadrados a través de la expresión [5.7]. La [5.8] sería nula. Puede seguir un modelo lineal y como hemos visto la estimamos globalmente ajustando una recta por el método de los mínimos cuadrados. Si la tendencia es exponencial seguirá un modelo de la forma: [5.16]
280
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Tomando logaritmos neperianos en la expresión [5.16] el modelo de tendencia exponencial pasa a ser lineal en el logaritmo neperiano de la variable:
In y 1 =(a+ bt)lne =a+ bt
[5.17]
En la expresión [5.17] se aplica el método de los mínimos cuadrados como ya conocemos para estimar a y b. En la estimación de la tendencia y con objeto de hacer predicciones en períodos más cortos que los que se suelen emplean en los ajustes de funciones de forma global, se emplean los alisados exponenciales de la serie observada. Aunque estos métodos de análisis de la tendencia no los vamos a desarrollar indicaremos que el suavizado de la variable observada se obtiene calculand¿ una media ponderada con los datos de los distintos períodos anteriores a t y la observación de dicho período. Las observaciones más cercanas a t son las que más se ponderan.
mixta (multiplicativa en los componentes a largo plazo y aditiva en las varia. dones accidentales). En los dos métodos que se van a explicar seguidamente para determinar las variaciones estacionales se establecen las hipótesis de que la estacionalidad es regular o estable en el tiempo y lo que actúa es el esquema multiplicativo, al que se adaptan la mayoría de los fenómenos económicos, en el método de las medias móviles y el aditivo cuando se hace un ajuste mínimo cuadrático para determinar los componentes a largo plazo. a)
Método de la raz6n a la media m6vil para determinar la componente estacional en una serie temporal
Este método aisla la componente estacional mediante la eliminación sucesiva de las demás componentes. En la aplicación del método se siguen los siguientes pasos: -
5.4.
Determinación de las variaciones estacionales
Cuando se definió esta componente se estableció que eran oscilaciones de la magnitud en estudio en períodos de repetición de un año (cuatrimestres, trimestres y meses) o inferiores (por ejemplo el período de repetición puede ser el mes y sus componentes las semanas, etc.). Cuando se pretende en los fenómenos económicos analizar su evolución real hay que eliminar la componente estacional ya que sus fluctuaciones pueden distorsionarla. Este proceso recibe el nombre de desestacionalización de la serie observada. Por ejemplo si se observan las ventas trimestrales del supermercado del ejemplo 5.1 vemos que en 1990 al pasar del tercer trimestre al cuarto aumentan en 30 millones. ¿Qúe ha ocurrido?, ¿este aumento se debe a la eficacia publicitaria y de personal de la empresa o a que en el cuarto trimestre están las fiestas de Navidad y el consumo familiar aumenta? Está claro que si se observa la serie el segundo y cuarto trimestre son estacionalmente altos y el primero y el tercero son estacionalmente bajos. Luego si se quiere analizar la evolución real de las ventas del supermercado hay que desestacionalizar la serie con lo que se podrán comparar los distintos trimestres. Antes de proceder a la determinación de las variaciones estacionales hay que asegurarse de que existen haciendo una representación gráfica de los valores observados y viendo la regularidad en las oscilaciones. En ciertas ocasiones la estacionalidad no tiene regularidad variando de posición y amplitud en las oscilaciones de un período de repetición a otro. Por otro lado hay que determinar si la que actúa es la hipótesis aditiva, multiplicativa o
281
Se determina la tendencia por el método de medias móviles centradas en los períodos LY1). Se divide (hipótesis multiplicativa de actuación de las componentes) la serie observada y1 por su correspondiente media móvil centrada con lo que estamos eliminando de forma conjunta las componentes del largo plazo (tendencia y ciclo). Se está considerando que la tendencia a través de las medias móviles nos representa también a la componente cíclica con lo que se está eliminando de la serie observada el conjunto T x C: Yr
TxC
TxCxExA - - - - - - = E xA TxC
[5.18]
Como se observa en la expresión [5.18] en la serie observada, una vez que se ha eliminado la componente mixta tendencia-ciclo (T x C) sigue quedando la componente accidental A. Luego el paso siguiente será: -
-
Con objeto de eliminar la componente accidental de la serie
~ se
Yr calculan las medias aritméticas a nivel de cada estación (la media de todos los cuatrimestres, trimestres, meses, etc.). Si las observaciones son trimestrales tendremos cuatro medias (M 1, M 2, M 3 y M 4 ); si son cuatrimestrales serán tres; si son mensuales serán doce, etc. Estas medias nos representan de forma aislada la importancia de la componente estacional. Obtención de los índices de variación estacional: Se calcula la media aritmética anual MA de las medias estacionales M 1, M 2 , M 3 , •••que será la base de los índices de variación estacional expresados en tantos por 100: / 1
M M2 =M~ x 100, / 2 = MA x 100; ... ;etc.
282
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
Habrá tantos índices como estaciones o medias estacionales tengan las observaciones y nos indicarán la importancia de la variación $!Stacional al pasar a un período a otro. Si un índice expresado en tantos por 100 nos da 80 quiere decir que por el mero hecho de ser esa estación la magnitud en estudio es un 20 por 100 más baja de su tendencia media. Una vez obtenidos los índices de variación estacional puede desestacionalizarse la serie observada dividiendo cada valor de la correspondiente estación por su índice correspondiente expresado en tantos por uno.
283
Realizando las sucesivas divisiones queda:
~
1992
T
l.o 2.0 3.0 4.0
-
0,8163 1,1012
1993
1994
0,9921 1,0837 0,8606 1,0400
0,9970 1,1035 -
Ejemplo 5.5 De la serie de ventas trimestrales del ejemplo 5.3 obtener los índices de variáción estacional por el método de la razón a la media móvil. Desestacionalizar con dichos índices la serie observada.
Solución: Las medias móviles centradas utilizando las cuatro observaciones, están calculados en el ejercicio 5.3 y son las siguientes:
~
T
1.0 2.0 3.0 4.0
1992 -
153,125 154,375
1993 156,25 156,875 156,875 158,75
y
1,
ya
Esta serie recoge de forma aislada la componente estacional pero todavía unida a la accidental que no ha sido eliminada. En definitiva es un índice expresado en tantos por uno en el que la base de comparación es la tendencia y el ciclo representados por las medias móviles centradas en los períodos de tiempo. Estos índices brutos ya nos arrojan mucha información sobre la componente estacional. Puede observarse que los trimestres primero y tercero son estacionalmente bajos al ser los índices menores a la unidad y los segundos y cuartos son altos al superar la mitad. Estas variaciones presentan regularidad ya que se mantienen en los distintos años. Las variaciones accidentales las eliminamos obteniendo las medias aritméticas de los cuatro trimestres:
1994
M
160,625 163,125
1
Mz
-
=
=
M3 = Esta serie nos representa las variaciones de los componentes a largo plazo T x C. Dividiendo la serie observada y1 del ejercicio 5.3 por y1 tenemos:
~
T
l.o 2.0 3.0 4.0
1992 -
125/153,125 170/154,375
1993
1994
155/156,25 170/156,875 135/156,875 165/158,75
160/160,625 180/163,125 -
•
M4 =
0,9921
+ 0,9970 2
1,0837
+ 1,1035 2
0,8163
+ 0,8606 2
1,1012
+ 1,0400 2
=
09945 '
= 1,0936 =
0,8385
=
1,0706
A partir de las anteriores medias calculamos la media aritmética anual que será la base para obtener los índices de variación estacional: MA =
-
M 1 +M 2 +M 3 +M4 ---='-------"'---"---...:!: 4 0,9946 + 1,0936 + 0,8385 + 1,0706 4
=
0,9993
284
285
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
Tomando como base de comparación esta media aritmética anual obtenemos los verdaderos índices de variación estacional expresados en ~antos por uno:
Efectuando las divisiones queda la siguiente serie de ventas desestacionalizada:
M1
0,9946
~
11 = MA = 0,9993 = 0•9953
Años
Trimestres
1,0936 12 = MA = 0,9993 = 1,0944 M2
M3
Lo 2.0 3.0 4.0
0,8385
13 = MA = 0,9993 = 0,8391 14
M4 1,0706 = MA =O 9993 = 1•0714 '
1¡
= 99,53;
13 = 83,91;
12
= 109,44
1994
150,71 150,77 148,97 158,67
155,73 155,34 160,89 154,00
160,76 164,50 166,85 168,00
Método de la tendencia por ajuste mínimo cuadrático para determinar la componente estacional en una serie temporal bajo la hipótesis aditiva 1
b)
14 = 107,14
El 11 significa que en los primeros trimestres las ventas realizadas prácticamente no estan sujetas a las variaciones estacionales ya que el índice es prácticamente la unidad en tantos por uno ó 100 en tantos por 100; sólo descienden un insignificante 0,47 por 100. El 12 significa que por el hecho de ser segundos trimestres, con independencia de la política comercial que siga la empresa, las ventas aumentan en un 9,44 por 100. El 13 significa que en los terceros trimestres la estacionalidad afecta de forma significativa las ventas de la empresa ya que bajan un 16,09 por 100. Por último observando el 14 vemos que la estacionalidad en dicho trimestre es alcista empujando a las ventas en un 7,14 por 100. Por último vamos a desestacionalizar la serie observada en el ejemplo 5.3. Como estamos dentro de la hipótesis multiplicativa para eliminar la influencia estacional en las ventas observadas las dividimos en cada estación por su respectivo índice de variación estacional expresado en tantos por uno:
~S
1992
1993
1994
Lo 2.0 3.0 4.0
150/0,9953 165/1,0944 125/0,8391 170/1,0714
155/0,9953 170/1,0944 135/0,8391 165/1,0714
160/0,9953 180/1,0944 140/0,8391 180/1,0714
T
1993
La anterior serie representa las ventas de la empresa prescindiendo de las oscilaciones estacionales pudiéndose comparar los datos de los distintos períodos. Se llega a la conclusión que existe una tendencia real alcista con pequeñas oscilaciones motivadas por causas accidentales.
Expresados en tantos por 100 serán: i
1992
'
Nuestro objetivo sigue siendo aislar la componente estacional de la serie por eliminación sucesiva de todos los demás. La diferencia con el método de la razón a la media móvil es que en este caso las componentes a largo plazo (tendencia junto con ciclo) las obtenemos mediante un ajuste por mínimos cuadrados de las medias aritméticas anuales ji1 y se actúa bajo la hipótesis aditiva. Luego los pasos a seguir son los siguientes: -
-
-
Se calculan las medias anuales de los datos observados y1: ji1 , ji2 , ji3 , •.• Si las observaciones son trimestrales estas medias se obtienen con cuatro datos, si son mensuales con doce, etc. Sería el caso de que el período de repetición es el año. Si es otro las medias se obtendrían con sus componentes. Se ajusta una recta por mínimos cuadrados ji1 =a+ bt empleando el proceso y formulación [5.7] y [5.8] que ya se estudió en su momento que nos representa a la tendencia. Sabemos que el coeficiente angular b de la recta nos mide el incremento medio anual de la tendencia que influirá de distinta forma al pasar de una estación a otra como se verá más adelante. Se calculan con los datos observados las medias estacionales (M 1 , M 2 , M 3 , ••• , etc.) con objeto de eliminar la componente accidental. Estas medias aritméticas son brutas ya que siguen incluyendo los componen-
1 Existe también el método de la razón a la tendencia que es equivalente al de las medias móviles y actúan con la hipótesis multiplicativa.
286
-
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
tes a largo plazo (tendencia y ciclo) y tienen que someterse a una corrección de las mismas. Empleando el incremento medio anual dado por el coeficiente se obtienen las medias estacionales corregidas de las componentes a largo plazo (M'1 , M~, M~, ..., etc.) bajo el esquema aditivo (se resta): M'1 = M 1 ya que estamos en la primera estación y no está influida por
la tendencia con lo que no hay que restar nada. M~
1· b • ya que hemos pasado de la primera esn.o de estacwnes tación a la segunda hay que restar la parte proporcional del incremento anual de la tendencia.
= M2
M~ =
-
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
Solución:
El ajuste de la recta por mínimos cuadrados está resuelto en el ejemplo 5.4 siendo:
Yr = 12.296,33 + 6,25t El incremento medio anual es b = 6,25. Con los datos observados en el ejemplo 5.3 calculamos las medias estacionales sin corregir de la componente extraestacional (T + C). De esta forma eliminamos la componente accidental:
-
de la tendencia, o sea
150 + 155 + 160 = 155 3
M2 =
165+170+180 3 = 171,6
M
=
125 + 135 + 140 _ _ 3 . - 133,3
n.
od
=
170 + 165 + 180 = 171,6 3
3
2·b
. · e estaciOnes M4
Para la r-ésima estación la media estacional corregida de la tendencia interestacional será: M' = M ___(.:....r_-_l...:....)b_ _
' -
M1 =
2·b
• ya que como M~ pertenece a la tercera n. 0 de estaciones estación han transcurrido dos estaciones luego hay que restar de la media sin corregir M 3 dos proporciones del incremento anual
M3
'
n.o de estaciones
Seguidamente se obtienen las medias aritméticas estacionales corregidas de la parte que les corresponde a cada una del incremento medio anual de la tendencia: M~=
Los índices de variación estacional se obtienen con la misma sistemática utilizada en el método de la razón a la media móvil: con las medias estacionales corregidas se obtiene la media aritmética anual M'A que sirve de base para calcular los índices: M'
l¡ =M'~
M' 2
M1
=
l·b
M~= M4-
Ejemplo 5.6 Con los datos de la serie temporal del ejercicio 5.3 obtener los índices de variación estacional por el método de ajustar una recta a las medias anuales.
_
= 171,6- 1
X
1,5625
133,3 .,. . 2
X
1,5625 = 130,2083
43·b = 171,63X
1,5625 = 166,9791
2·b
-
100; 12 =M'~ x lOO; ... ,etc.
Obtenidos estos índices de variación estacional estamos en condiciones de desestacionalizar la serie como se ha efectuado anteriormente.
155
= M2- 4
M~ = M 3
M'
X
287
4
=
=
170,1041
La media aritmética anual para que sirva de base en el cálculo de los índices de variación estacional será: M'A =M~+ M~+ M~+ M~= 155 + 170,1041 + 130,2085 + 166,9771 .4 4 =
155,5673
288
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Los índices de variación estacional expresados en tantos por uno son: 11 =
M~ =
M' A
155 155 5673
'
= 09964 '
170,1041 = 1 0934 155,5673 ' 13
14
M' M'A
~~~:~~~~ = 0,8370
M~ M' A
= 166,9791 = 1 0733 155 5673 ' '
=--3
=
Puede observarse que si se comparan estos índices con los obtenidos por el método de la razón a la media móvil son prácticamente iguales (existen pequeiías diferencias a partir del tercer decimal) lo que indica que la estacionalidad es muy regular y no expansiva con lo que es indiferente el método que se aplique.
5.5.
Determinación de las variaciones cíclicas
Cuando hemos definido esta componente se ha dicho que recoge las oscilaciones periódicas de larga duración. El problema es que estos movimientos no suelen ser regulares como los estacionales y su determinación encierra dificultades de forma que como se ha apuntado en los casos prácticos se suelen tratar conjuntamente con la tendencia llamando componente extraestacional al efecto de (T x C) si estamos en el marco multiplicativo o (T + C) si es el aditivo. A pesar de estas dificultades se puede tratar de aislar el ciclo bajo la hipótesis multiplicativa dejándolo como residuo con la eliminación de la tendencia y la variación estacional. Los pasos serían: -
Estimar la tendencia. Calcular los índices de variación estacional. Se desestacionaliza la serie observada. . , Se elimina la tendencia dividiendo cada valor desestacionalizado por la serie de tendencia.
Expresando el proceso en forma de cociente sería: y TXE
__ t_=
TxExCxA =CxA TxE
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
289
El proceso finalizaría intentando eliminar la componente accidental A y determinando el período de los ciclos que nos llevaría a un tratamiento de análisis armónico que superaría el nivel descriptivo que estamos dando al tratamiento clásico de las series temporales.
' ...no
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
Ejercicios
291
Predecir las rentas en 2004 y su nivel de fiabilidad comparando los resultados con los obtenidos en el ejercicio 5.4. Solución:
Como el número de períodos es par hacemos el siguiente cambio de variable:
l.
En el ejemplo 5.4 hemos estimado la siguiente tendencia:
y, =
-12.342,08
Suponiendo que esta tendencia lineal recoge el efecto o componente extraestacional (representa la tendencia y el ciclo conjuntamente); predecir el valor de los trimestres primero y segundo del año 2002 teniendo en cuenta la variación estacional bajo la hipótesis aditiva y admitiendo que la componente accidental es irrelevante. Solución:
Primero hacemos la predicción trimestral media que será:
h
t' = 2(t- O;)
+ 6,25t siendo:
1998
1
ot
=
+ 1999 2
=
1998 5 '
En este caso como las observaciones son anuales no existe el problema de la estacionalidad no teniendo que obtener ningún tipo de media anual realizándose el ajuste con las ventas anuales.
= -12.342,08 + 6,25 x 2.002 =
002
=
170 millones de ventas medias trimestrales
Teniendo en cuenta los índices de variación estacional del ejemplo 5.6 tenemos: y 1 = 170 x 0,9964 = 169,38 millones de ptas.
= 170 x 1,0934 = 185,87 millones de ptas. y 3 = 170 x 0,8370 = 142,29 millones de ptas. y2
y 4 = 170 x 1,0733 = 182,46 millones de ptas.
t
( = 2(t - 1998,5)
y,
y,·(
(2
y¡
1996 1997 1998 1999 2000 2001
-5 -3 -1 1 3 5
540 565 580 610 625 660
-2.700 -1.695 -580 610 1.875 3.300
25 9 1 1 9 25
291.600 319.225 336.400 372.100 390.625 435.600
6
I
t'=l
2. La fábrica de calzado del ejemplo 5.3 ha tenido las siguientes ventas anuales en los últimos seis años (período 1996-2001) expresadas en millones de pesetas:
6
t' =O
6
6
I y,= 3.58o I Yl = 810 I r=l
t=l
t'=l
Empleando las expresiones 5. 7 y 5.8 tenemos: 6
Años
Ventas (millones de ptas.)
1996 1997 1998 1999 2000 2001
540 565 580 610 625 660
t~l y, 3.580 ~ a = - - = - - = 596 66 6 6 ' 6
" t:--1
y,t'
I
t'2
810
b= 6 - - = - = 1157 t'=l
70
'
6
r2
= 7o
I y¡ = 2.145.55o t=l
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
CASAS-SÁNCHEZ, J. M. y SANTOS-PE"&AS, J.
292
Luego la estimación de la tendencia para predecir las ventas de 2004 es: '
y1 = a
+ bt'
=
293
3.
!Jn. concesionario de una determinada marca de automóviles ha vendido los stgwentes vehículos en los últimos tres años:
596,66 + 11,57t'
~S
Deshaciendo el cambio de variable tenemos
T
l.o
+ 11,57 · 2(t- 1998,5) = = 596,66-46.245,29 + 23,14t = -45.648,63 + 23,14t
Yt = 596,66
2.0 3.0 4.0
1999
2000
2001
6
12
10 15
4 5
12
14 25 12 16
7
La predicción de las ventas anuales para 2004 será: y2004
=
Obtener:
+ 23,14 X 2004 = 45.648,63 + 46.372,56 = 723,93 millones de ptas.
-45.648,63
;=: -
Los índices de variación estacional aplicando el método de la tendencia por mínimos cuadrados bajo la hipótesis aditiva (si se trabajara con la hipótesis multiplicativa habría que aplicar el método de la razón a la media móvil o bien el método de la razón a la tendencia por mínimos cuadrados, que no se ha explicado en esta obra). b) Desestacionalizar la serie observada y1• e) Predecir el número de automóviles vendidos para cada trimestre de 2003. a)
El nivel de fiabilidad nos lo da el coeficiente de determinación:
~(135)2
R2 = (St•y/ = S~. S 2 t
Yr
11 66 '
X
1580,64
=
18.225 18.440,7
= 0,988
Siendo los cálculos de la covarianza y varianzas: Soluci6n:
a)
Obtención de los índices de variación estacional: - Se calculan las medias anuales:
6
¿ r2 70 11 (? St'2 = - 6- - r =6- - O= ' oo .
t'=l
72
6
¿ y;
s2 = ~
~ _ y2 6
= 2•145•550 - (596,66f 6
- _ Yt Yt-
+ Y2 + Y3 + Y4
- _ Ys Y2-
+ Y6 + Y1 + Ys
- _ Y9
+ Yto + Ytt + Y12
= 1588,51
Si se comparan estos resultados con los obtenidos en el ejemplo 5.4 o~ser vamos que allí la predicción fue de 732 millones de pesetas con un coeficiente de determinación del 0,7939. En cambio al haber utilizado aquí el doble de observaciones (seis en vez de tres) la fiabilidad ha aumentado enormemente. Luego la predicción de 723,93 millones de ventas para 2004 es la que deben considerar los directivos de la empresa en su toma de decisiones.
Y3-
6
+ 12 + 4 + 5 4
4 10
= 6,75
+ 15 + 7 + 12 4
4
14
=
11,00
+ 25 + 12 + 16
4
4
= 16,75
Se estima la tendencia ajustando una recta por mínimos cuadrados. Para ello, al ser datos impares se hace el cambio de variable t'
= t - 0 1 = t - 2ooo.
294
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
t
t'=t-2000
Yt
1992 1993 1994
-1
6,75 11,00 16,75
o 1
3
3
¿ t' =o
¿
t'-¡
t'yt
-6,75
o
16,75
Yt
1
45,56 121,00 280,56
1 3
3
¿
¿ y = 10
y1 = 34,5
1
(2 = 2
¿ .v; =
447,12
n
Yt
L
34 5 = - ' = 11,5 3
b
-
1·b ~ 1x5 _ 4 = 17,33--- = 16,083 4
M;= M 3
-
2·b ~ 2 X 5 ~ 4 = 7,66- - -= 5,16 4 3·b
3
3
L a= t=1
M~= M 2
M~=M4 -4=11,00-
Aplicando las expresiones [5.7] y [5.8] tenemos: t'Yt.
10
= !.=_!_____ = -2 = n
¿
M'A
=
M'1 +M'2 +M'3 +M'4 4
t'= 1
Luego la recta con el cambio de variable será:
y1 = a + bt' =
11,5
+ 5t'
Deshaciendo el cambio se tendrá la estimación de la tendencia (será la estimación de la componente extraestacional, o sea tendencia y ciclo ya que no los diferenciamos):
y1 = 11,5 + 5(t - 2000) = 11,5 - 10.000 + 5t = -9.988,5 + 5t El parámetro b o coeficiente angular nos da el incremento ~edio anual ~ue sufre y1 al pasar de un año a otro (como sabemos Y1 es la medta anual obtemda con los cuatro trimestres). - Se calculan las medias estacionales sin corregir por filas en los datos observados Yr .
M1 = M2 = M3 =
M4
-
=
6
+ 10 + 14 3
=
10
12 + 15 + 25 ~ = 17,33 3 4
+ 7 + 12 3
M'
10
M'
5
11
=M'~= 9,625 = 1'039;
13
=M'~= 9,625 = 0' 537;
X
3,33 =7,25 4
10 + 16,083 + 5,16 + 7,25 4 = 9,625 M~ 16,083 12 = M'A = 9,625 = 1•671 M~
1,25
14 = M'A = 9,625 = 0•753
b) Desestacionalización de la serie observada: a cada valor observado se le resta (por ser el esquema aditivo) su correspondiente «componente estacional», que es: Ek = Mk- Et
donde k = 1, 2, 3, 4 denota el trimestre considerado, y Et es la «componente extraestacional» o media de los valores ajustados por la recta y = a + b¡ (i = 1, 2, ..., 12) en los índices i = 1, 5 y 9 para el primer trimestre, i = 2, 6 y 10 para el segundo trimestre, i = 3, 7 y 11 para el tercero y finalmente i = 4, 8 y 12 para el cuarto trimestre. La recta ajustada a los 12 datos es: y = a01
+ b(i -
a 10)
donde
~
= 7,66
5 + 12 + 16 = 11 00 3 ,
3
Por último los índices de variación estacional se obtienen en tantos por uno tomando como base la media anual corregida:
5
t'2
a01
138
=
12 =
11,5
a10 = 6,5
\
Las anteriores medias se corrigen de la tendencia empleando de forma adecuada (restando al estar en la hipótesis aditiva) el incremento medio anual de tendencia (b):
295
M 1 = 10
t= 1
1'=1
1=1
M~=
-2
t'2
o
3
t-1
ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES
b
m11
=-
m20
=
a 11
a 10 a 01
-
a20
-
2 a 10
=
1.047
a11 =
U
a 20 =
12 =
650
= 87,25 54,16
87,25 - 6,5 · 11,5 2 = 1,048 54,16 - 6,5
296
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
y sustituyendo tenemos:
Capítulo 6
y = 11,5 + 1,048 (i - 6,5)
de donde:
Ef = 11,5 + 1,048(5 E! = 11,5 + 1,048(6 E; = 11,5 + 1,048(7 = 11,5 + 1,048(8 -
E:
y de aquí, como Ek E 1 = 0,0734,
=
6,5)
Fenómenos aleatorios y sucesos
= 9,9266
6,5) = 10,9755 6,5) = 12,0245 6,5) = 13,0734
Mk- Et resulta:
E 2 = 6,3578,
E 3 = -4,3578
y E 4 = -2,0734
La serie desestacionalizada será:
~S
2000
1999
T
1.0 2.0 3.0 4.0
y¡Y2Y3Y4-
E¡= E2 ~ E3 ~ E4 ~
6 6 8 7
y5 Y6Y7Ya-
E1 ~ E2 ~ E3 ~ E4 ~
6. 1.
2001 10 9 11 14
y9 Y1oYuy 12 -
E1 ~ E2 ~ E3 ~ E4 ~
14 19 16 18
e) Para predecir el número de automóviles que se van a vender en 2003 empleamos la tendencia lineal estimada para el año 2003, admitiendo la hipótesis de que la tendencia permanece estable: Yt996
= -9.988,5 + 5 =
26,5
~
X
2003 =
27 automóviles como media anual de los trimestres
Como la hipótesis es aditiva, solo queda añadir la componente estacional Ek al valor ji 1996 para así obtener las predicciones trimestrales en 1996:
+ E¡ ~ 27 ji2003,2. 0 = jil996 + E2 ~ 33 Y2003,3.0 = jil996 + E3 ~ 22 Y2oo3 4° = YJ996 + E¡ ~ 24 Y2oo3 1 a
automóviles, respectivamente.
= YJ996
\
Introducción
El propósito de este capítulo será dar unos conceptos básicos y fundamentales para poder introducir en el capítulo siguiente el concepto y teoría de la probabilidad. Cuando estudiábamos la Estadística Descriptiva, decíamos que dentro de la Estadística podíamos considerar dos grandes ramas, perfectamente diferenciadas, no sólo por los objetivos que se persiguen, sino también por los métodos que se utilizan. Estas son: la Estadística Descriptiva o Deductiva y la Inferencia Estadística o Estadística Inductiva. La Inferencia Estadística la utilizaremos cuando la observación de la población no es exhaustiva, sino que sólo observamos un subconjunto o muestra de la misma, de tal manera que los resultados o conclusiones obtenidas de la muestra los generalizamos a la población. La muestra se toma para obtener un conocimiento o información de la población, pero nunca nos proporcionará una información exacta sino que incluirá un cierto nivel de incertidumbre. Así, por ejemplo, supongamos que un nuevo producto se lanza al mercado y seleccionamos una muestra de comercios para realizar una cierta evaluación sobre la reacción hacia ese producto por parte del consumidor, con el fin de poder conocer la posible demanda y si el producto sería consumido a nivel nacional. Evidentemente y basándonos en la información que nos proporcionará esa muestra es imposible conocer con exactitud la reacción de la población completa y cualquier medida sobre el comportamiento del consumidor contendrá inevitablemente incertidumbre.
298
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
FENÓMENOS ALEATORIOS Y SUCESOS
Pero sin embargo, sí será posible, a partir de la muestra, hacer afirmaciones sobre la naturaleza de esa incertidumbre, que· vendrá expresada en el lenguaje de Probabilidad, siendo por ello un concepto necesario y muy importante en la inferencia estadística, ya que nos permitirá pasar de las afirmaciones hechas con certeza a partir de la muestra a pronosticar en términos de probabilidad situaciones en la población. Si consideramos la definición de Estadística dada por V. Barnett (1982) «la Estadística es la ciencia que estudia cómo debe emplearse la información y cómo dar una guía de acción en situaciones prácticas que envuelven incertidumbre» observamos que aparece el término «situaciones prácticas que envuelven incertidumbre» que equivale a lo que nosotros llamaremos experimentos aleatorios, de gran interés en el cálculo de probabilidades y en la Estadística en general.
6.2.
Fenómenos aleatorios
La idea de experimento se utilizará con cierta frecuencia en este y en los próximos los primeros capítulos. Un experimento es cualquier situación u operación en la cual se puede presentar uno o varios resultados de un conjunto bien definido de posibles resultados, por ejemplo, registrar el valor de una acción de bolsa en un instante determinado, lo cual puede dar lugar a un conjunto de posibles resultados, lanzar una moneda al aire, o un dado, etc. En la actividad diaria nos encontramos con ciertos tipos de fenómenos o experimentos que se pueden reproducir un gran número de veces, en condiciones similares dando lugar a un conjunto de dos o más posibles resultados. Estos experimentos pueden ser de dos tipos determinísticos y aleatorios. Diremos que el experimento es determinístico cuando al repetirlo bajo idénticas condiciones iniciales se obtienen siempre los mismos resultados. Por ejemplo, si tenemos una regla milimetrada y una barra metálica, un experimento puede consistir en preguntarle a un individuo la medida en milímetros de la barra. Si repetimos, varias veces, el experimento bajo idénticas condiciones y obtenemos la misma medida en milímetros diremos que se trata de un experimento determinístico. Sin embargo, si el experimento lo repetimos bajo idénticas condiciones iniciales y no se obtienen siempre los mismos resultados diremos que estamos ante un experimento aleatorio. Por ejemplo:
.
-
.
El lanzamiento de una moneda observando la sucesión de caras y cruces que se presentan. El lanzamiento simUltáneo de dos dados observando la sucesión de resultados.
-
299
El cambio diario del valor del dólar observando la sucesión de valores en pesetas. El número de llamadas a un teléfono durante períodos de cinco minutos. El preguntar la intención del voto. Entrevistar a una persona para determinar la marca que prefiere de un producto determinado, etc.
Para ser más precisos podemos citar, como características de un experimento aleatorio, las siguientes: 1. 0
El experimento se puede repetir indefinidamente bajo idénticas condiciones. 2.° Cualquier modificación mínima en las condiciones iniciales de la repetición puede modificar completamente el resultado final del experimento. 3. 0 Se puede determinar el conjunto de los posibles resultados del experimento, pero no se puede predecir previamente un resultado particular. ·. 4.o Si el experimento se repite un número grande de veces, entonces aparece algún modelo de regularidad estadística en los resultados obtenidos. El significado de las tres primeras características no tiene dificultad alguna, y la cuarta nos indica que cuando el experimento se realiza un número grande de veces tienden a estabilizarse los resUltados del experimento aleatorio, en el sentido de que cada uno de los posibles resultados tiende a salir un número similar de veces. Así pues, si el experimento aleatorio consiste en el lanzamiento de una moneda perfecta al aire, en donde todos los posibles resultados son cara o cruz, y realizamos 100 repeticiones (lanzamientos) podremos comprobar que el número de veces que aparece cara sería similar al de cruz, es decir, la frecuencia relativa de cara tendería a aproximarse a 1/2. Análogamente sucede si en una urna introducimos 2 bolas blancas y 3 negras, idénticas salvo en su color, sin mirar sacamos una bola anotamos el color y la devolvemos a la urna y realizamos esta operación un número grande de veces, entonces podremos comprobar que las frecuencias relativas de obtener bola blanca tenderá a estabilizarse hacia 2/5 y la de bola negra hacia 3/5.
6.3.
Espacio muestra!
Asociado a todo experimento aleatorio tendremos el conjunto de los posibles resultados que se pueden obtener cuando tiene lugar el experimento aleatorio.
300
FENÓMENOS ALEATORIOS Y SUCESOS
A cada uno de los posibles resultados del experimento aleatorio se le llama resultado básico o elemental, comportamiento individual o punto muestra); y el registro sistemático de los resultados obtenidos en sucesiones de experimentos aleatorios da lugar a un conjunto de datos estadísticos. Los resultados básicos elementales serán definidos de tal manera que no puedan ocurrir dos simultáneamente, pero sí ocurrirá uno necesariamente. Al conjunto de todos los resultados elementales del experimento aleatorio le llamaremos conjunto universal, espacio muestra) o espacio de comportamientos y lo designaremos por E. ·
duales, sino que deseamos observar el número de caras en los dos lanzamientos, entonces tendremos un segundo espacio muestral E 1 :
Ejemplo 6.1 Consideremos el experimento aleatorio consistente en lanzar un dado al aire. Los resultados básicos o elementales serán que aparezca un 1, 2, 3, 4, 5 ó 6. No pueden ocurrir dos resultados conjuntamente, sino que necesariamente debe ocurrir uno. El espacio muestral es el conjunto formado por los seis posibles resultados elementales: E= {1, 2, 3, 4, 5, 6} i
il
n !1
.,"j
'
301
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
El conjunto de posibles resultados elementales de un experimento aleato- · rio, y por tanto el espacio muestral, dependerá de cómo sea observado o del enfoque que le demos al experimento. Así pues, se podrán asociar diferentes espacios muestrales a un mismo experimento aleatorio. En efecto, consideremos el ejemplo siguiente:
E 1 = {0, 1, 2} donde 1, por ejemplo, indica que se ha obtenido solamente una cara en los dos lanzamientos. Luego hemos visto que un experimento aleatorio puede tener diferentes espacios muestrales, dependiendo de la,observación que nos interese del experimento. En este ejemplo concreto existe una correspondencia entre los puntos de ambos espacios muestrales, así pues: E 1 -+E O-+ (TT) 1 -+ (HT), (TH)
2 -+(HH) Los espacios muestrales asociados a un experimento aleatorio pueden ser de tres clases: -
Espacio muestral finito. Espacio muestral infinito numerable. Espacio muestral continuo.
Veamos en qué consiste cada uno de ellos . Espacio muestra) finito
Ejemplo 6.2 Sea el experimento aleatorio consistente en lanzar· dos veces una moneda al aire. Si deseamos observar las caras y cruces obtenidas en una repetición del experimento, entonces el espacio muestral correspondiente, que lo designaremos por E, tendrá los cuatro puntos siguientes: E= {(HH), (H1), (TH), (TT)};
H =cara, T =cruz
donde HT, por ejemplo, indica que en el primer lanzamiento ha aparecido cara y en el segundo cruz. Pero si en el experimento aleatorio no nos interesan los resultados indivi-
Un espacio muestral diremos que es finito, cuando tiene un número finito de elementos. Por ejemplo, los espacios muestrales asociados a los experimentos aleatorios descritos en los ejemplos 6.1 y 6.2. Espacio muestra) infinito numerable Un espacio muestral será infinito numerable si tiene un número infinito numerable de elementos; o dicho de otra forma, si se puede establecer una aplicación biyectiva entre los elementos del espacio muestral y la sucesión de números naturales. También se suele llamar espacio muestra) discreto indistintamente a los casos finito e infinito numerable.
FENÓMENOS ALEATORIOS Y SUCESOS
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
302
303
Ejeinplo 6.4
Ejemplo 6.3 Sea el experimento aleatorio consistente en lanzar un ~a?? hasta que s~a obtenido el 1, y que estamos interesados en todas las postbtlidades, es dectr, el 1 puede ser obtenido en el primer lanzamiento, o bien en el segundo lanzamiento pero después de haber obtenido un 2, o un 3, o un 4, ? un 5, o un 6, o bien en el tercer lanzamiento pero después de haber obtemdo (2, 2),' (2, 3), (2, 4), (2, 5) o (2, 6), etc. El espacio muestra! será:
E= {(1), (2, 1), (3, 1), (4, 1), (5, 1), (6, 1) (2, 2, 1), (2, 3, 1), (2, 4, 1), (2, 5, 1), (2, 6, 1), (3, 2, 1), (3, 3, 1), (3, 4, 1), (3, 5, 1), (3, 6, 1), (4, 2, 1), (4, 3, 1), (4, 4, 1), (4, 5, 1), (4, 6, 1),
.....................................................................................
(2, 2, 2, 1), (2, 2, 3, 1), (2, 2, 4, 1), (2, 2, 5, 1), (2, 2, 6, 1), ............... } Si el experimento aleatorio consiste eri lanzar el dado hasta que aparezca e11, o sea, que puede aparecer el 2, 3, 4, 5 ó 6 pero no el 1, entonces el espacio muestra! correspondiente sería: El = {(1),
(1,
1),
(1, 1,
1),
(1, 1, I, 1), (1, 1, 1, 1, 1), ...}
en donde por 1 representamos cualquier número diferente al l. Pero los elementos del espacio muestra! E, nos están indicando el número de lanzamientos que podemos hacer con el dado antes de que nos aparezca el 1, por tanto podremos establecer una correspondencia con la sucesión de números naturales y tendremos este otro espacio muestra! E 2 •
E2
=
{1, 2, 3, 4, 5, 6, 7, 8, ...}
cuyos elementos nos indican el número de tiradas para que aparezca el 1 por primera vez. Los espacios muestrales obtenidos en este ejemplo son infinitos numerables o simplemente numerables. Espacio muestral continuo Si el espacio muestra! tiene un número infinito no numerable de elementos, diremos ·que es de tipo continuo. Es decir, si no se puede establecer una correspondencia biunívoca entre los elementos del espacio muestra! Y la sucesión de números naturales.
Supongamos que el experimento aleatorio consiste en tirar una bola muy perfecta sobre el suelo totalmente pulido y horizontal de una habitación y estamos interesados en la posición que ocupará esa bola sobre la superficie del suelo. Es evidente pensar que la bola pueda quedarse parada en cualquier punto de la superficie del suelo, luego el espacio muestra! correspondiente será: E = {toda la superficie del suelo de la habitación}
y es de tipo continuo, no pudiendo establecer correspondencia alguna entre los puntos de la superficie del suelo de la habitación y la sucesión de números naturales.
6.4.
Sucesos
En muchos casos cuando realizamos un experimento aleatorio no nos interesan, directamente, los resultados elementales del experimento aleatorio, sino que lo que nos puede interesar es algún subconjunto de esos resultados elementales, es decir un conjunto contenido en el espacio muestral. Por ejemplo, en el caso del lanzamiento de un dado nos puede interesar saber si el resultado ha sido un número impar, que ocurrirá si al realizar el experimento aleatorio ha aparecido 1, 3 ó 5, es decir, nos interesa el subconjunto A = {1, 3, 5} del espacio muestra! E = {1, 2, 3, 4, 5, 6}. A tales subconjuntos se les llaman sucesos. Luego un suceso S es un subconjunto del espacio muestra!, es decir, un subconjunto de resultados elementales del experimento aleatorio. Y diremos que ocurre o se presenta el suceso, cuando al realizarse el experimento aleatorio da lugar a uno de los resultados elementales pertenecientes al subconjunto que define el suceso. Podemos considerar cuatro tipos de sucesos, según el número de elementos que entren a formar parte del suceso: a)
Suceso elemental, suceso simple o punto muestral es cada uno de los resultados posibles del experimento aleatorio; luego un suceso elemental consta de un solo elemento del espacio muestra! E. Es decir los sucesos elementales son subconjuntos del espacio muestra! formados por un solo elemento. b) Suceso compuesto, es el que consta de dos o más sucesos elementales. e) Suceso seguro, cierto o universal, es el que consta de todos los sucesos elementales del espacio muestra! E, es decir, coincide con el espacio muestral E, por ello lo notaremos también por E.
FENÓMENOS ALEATORIOS Y SUCESOS
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
304
A este suceso se le llama seguro o cierto porque ocurre siempre, ya que al realizar el experimento aleatorio se obtendrá con seguridad uno de los posibles resultados o sucesos elementales de E, y por tanto ocurrirá E. d) Suceso imposible, es el que no tiene ningún elemento del espacio muestra! E, y por tanto no ocurrirá nunca. Lo notaremos por c/J.
Ejemplo 6.5 Supongamos el experimento aleatorio de lanzar un dado al aire y observar · el número que aparece. El espacio muestral será el formado por todos los posibles resultados, o sea, que aparezca 1, 2, 3, 4, 5 6 6, y lo indicaremos como E = {1, 2, 3, 4, 5, 6}
espacio muestral, por tanto no ocurrirá nunca, pues no es posible obtener un número mayor que 6 en el lanzamiento del dado. Ejemplo 6.6 Consideremos un experimento aleatorio que consiste en lanzar tres veces una moneda al aire. Si realizamos una vez el experimento y deseamos observar las caras y cruces obtenidas, entonces el espacio muestral correspondiente será el formado por todos los posibles resultados: E= {(HHH), (HH1), (HTH), (THH), (HTI), (TH1), (ITH), (TTI)}
donde, por ejemplo, el resultado (HTH) significa que en el primer lanzamiento ha aparecido cara, en el segundo cruz y el tercero cara. Serán posibles sucesos, por ejemplo, los siguientes: A1
Algunos posibles sucesos serán:
A 2 = que aparezca el 2 = {2}
A4 =que aparezca el4 = {4} As = que aparezca el 5 = {5} A 6 =que aparezca el 6 = {6} A 1 = que aparezca número par = {2, 4, 6}
= {(HHT), (THH), (THT)}
A 2 = {(HHH), (TTH)}
A3 A4
A1 = que aparezca el 1 = {1} A3 =que aparezca el 3 = {3}
305
= {(HTH), (THH), (TTH)}
= {(THH)}
en donde los sucesos A1 , A 2 y A 3 son compuestos ya que constan de dos o más elementos, el suceso A4 es simple o elemental, y el suceso cierto o seguro sería el propio espacio muestral E, pues contiene todos los posibles resultados del experimento. Sin embargo, si consideramos el suceso A que incluye el resultado (HHTT), tendremos que
A8 = que aparezca un número menor que 3 = {1, 2}
A=cp
A 9 =que aparezca un número mayor que 4 = {5, 6}
sería un suceso imposible, en este experimento aleatorio, ya que estamos considerando tres lanzamientos de una moneda al aire, y como vemos no contiene ningún elemento o resultado de los incluidos en el espacio muestral E, siendo por tanto imposible que se verifique un suceso cuyos elementos no pertenecen al espacio muestral E.
A10 = que aparezca un número mayor que 6 = 4J etc. Los sucesos A1 , A 2 , A3 , A4 , As, A 6 son simples, pues constan de un solo elemento o resultado posible del experimento. El suceso A 1 , ocurrirá si ocurre el suceso A 2 , A4 o A 6 , o sea, si aparece un 2, un 4 6 un 6, luego será un suceso compuesto, pues consta de dos o más sucesos elementales. Análogamente los sucesos A8 y A 9 son compuestos. El suceso A10 sería el suceso imposible, pues no tiene ningún elemento del
6.5.
Operaciones con sucesos
Con los sucesos operaremos de manera similar a como lo hacíamos con los conjuntos y las operaciones se definen de manera análoga.
306
FENÓMENOS ALEATORIOS Y SUCESOS
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Los sucesos que consideramos, evidentemente, serán los correspondientes a un experimento aleatorio y por tanto serán subconjuntos del ,espacio muestra! E. Suceso contenido en otro Dados dos sucesos A y B de un experimento aleatorio, diremos que el suceso A está contenido en B, y lo indicaremos por A e B, si cada suceso elemental perteneciente a A pertenece también a B, es decir si siempre que ocurre el suceso A, también ocurre el suceso B. Considerando el experimento aleatorio del lanzamiento de un dado, si designamos por: A= que aparezca el 2 ó el 4 = {2, 4}
307
Unión de sucesos Dados dos sucesos A y B, se define la unión de ambos sucesos A y B, como otro suceso, que indicaremos por A u B, compuesto por los resultados o sucesos elementales pertenecientes a A, o a B, o a los dos a la vez, así pues: A u B = al suceso que se presenta cuando A ó B, o ambos ocurren.
Gráficamente lo representaremos utilizando el diagrama de Venn, como se ve en el gráfico 6.1. E
B = que aparezca un }lúmero par = {2, 4, 6}
el suceso A e B, pues los resultados o. sucesos elementales 2 y 4 de A, pertenecen a B. Diremos también que A implica a B y lo denotaremos por A => B.
A u B = zona sombreada
Igualdad de sucesos Dados dos sucesos A y B, diremos que son iguales, si siempre que ocurre el suceso A también ocurre el suceso B, y siempre que ocurre el suceso B ocurre el suceso A, y lo indicaremos por A = B. Es decir se verifica: A=B
AeB} Be A
Sean los sucesos:
GRÁFICO
6.1.
Unión de sucesos.
Sean los sucesos: A = obtener, en el lanzamiento de un dado, un número impar = {1, 3, 5} B =obtener, con el lanzamiento de un dado, un número mayor que 4 = {5, 6}
A= obtener un número par al lanzar un dado= {2, 4, 6} B = obtener un múltiplo de 2 = {Í}
aquí se verifica que: A e B pues siempre que ocurre A ocurre B, Be A pues siempre que ocurre B ocurre A,
luego A= B.
el suceso unión será: A u B = {1, 3, 5} u {5, 6} = {1, 3, 5, 6}
o sea, obtener un 1, un 3, un 5 ó un 6 en el lanzamiento del dado. En general, dados n sucesos A 1 , A 2 , ••• , An, su unión A 1 u A 2 u A 3 u · · · u An es otro suceso formado por los resultados o sucesos elementales que pertenecen al menos a uno de los sucesos A; (i = 1, 2, ... , n).
308
r
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Análogamente al caso de dos sucesos, representaremos por n
UA i=l
1=
al suceso que se presentará cuando al menos uno de los sucesos A; ocurre.
309
FENÓMENOS ALEATORIOS Y SUCESOS
es otro suceso, formado por los resultados o sucesos elementales que pertenecen a todos los sucesos A; (i = 1, 2, ..., n). Representaremos por
n n
De manera análoga podríamos definir la unión de sucesos para un número infinito numerable o no numerable de sucesos.
A; = al suceso que se presentará cuando todos los sucesos A1
i= 1
ocurren.
Intersección de sucesos
Sucesos disjuntos, incompatibles o excluyentes
Dados dos sucesos A y B, se define la intersección de ambos sucesos A y B, como otro suceso, que indicaremos por A n B, compuesto por los resultados o sucesos elementales que pertenecen simultáneamente a A y a B, es decir:
Dados dos sucesos A y B, diremos que son disjuntos, incompatibles o mutuamente excluyentes si su intersección A n B =
A n B = suceso que se presenta cuando A y B ocurren a la vez.
Gráficamente aparece en el gráfico 6.2: E
A
B
A
A
GRÁFICO
6.2.
n
B
B = zona sombreada
Jntersecci6n de sucesos.
Considerando los dos mismos sucesos que hemos utilizado como ejemplo en el caso de la unión, ahora, para el caso de la intersección, tendremos:
GRÁFICO
6.3.
Sucesos disjuntos.
En el ejemplo que venimos considerando sean los sucesos
A = obtener un número par al lanzar un dado = {2, 4, 6} A n B = {1, 3, 5} n {5, 6}
En general, dados n sucesos A 1, A 2 ,
... ,
= {5}
A., su intersección
B =obtener un número impar al lanzar un dado= {1, 3, 5} A n B = {2, 4, 6} n {1, 3, 5} =
luego A y B son excluyentes, pues su intersección es el conjunto o suceso vacío.
310
FENÓMENOS ALEATORIOS Y SUCESOS
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
311
Sistema exhaustivo de sucesos Sí los sucesos A1 , A 2 , A 3 , todos ellos
•••
A" son tales que verifican que la unión de
es igual al espacio muestra! E, diremos que forman una colección o sistema exhaustivo de sucesos; y sí además verifican que A; n Aj =
Vi
#j
A = zona sombreada
(i, j = 1, 2, ..., n)
entonces diremos que forman un sistema compÍeto de sucesos o una partición de E. En general, dados n sucesos A1, A 2 , ••• , A" diremos que son mutuamente excluyentes, disjuntos o incompatibles dos a dos, sí cada pareja de sucesos son mutuamente excluyentes, es decir, sí A;nAj =
Vi =f.j
(i,j = 1, 2, ... , n)
GRÁFICO
6.4.
Suceso complementario.
Diferencia de sucesos
Sí· consideramos el conjunto de todos los sucesos elementales que constituyen un espacio muestra!, podemos decir que forman una colección de sucesos mutuamente excluyentes y exhaustivo, ya que de todos ellos sólo debe de ocurrir uno y no pueden ocurrir dos simultáneamente.
Dados dos sucesos A y B, se define la diferencia de ambos sucesos A y B, que representaremos por A - B, como otro suceso constituido por los sucesos elementales que pertenecen a A y no pertenecen a B. Se puede expresar: A-B=AnB
Análogamente
Suceso complementario o contrario Dado un suceso A, se define el suceso complementario o contrario de A, como otro suceso que ocurre cuando no ocurre el suceso A. O bien, es el suceso constituido por los sucesos elemel!!_ales del espacio muestra! E que no pertenecen a A. Lo representaremos por A. En el gráfico 6.4 tenemos su representación. Si consideramos el suceso A= obtener, en el lanzamiento de un dado, un número par.= {2, 4, 6}
el suceso complementario será: A= {1, 3, 5} =obtener en el lanzamiento de un dado un número impar.
Los sucesos A y A constituyen también un sistema completo de sucesos.
,
B-A=BnA
Observemos que A-B=f.B-A
Sus representaciones aparecen en el gráfico 6.5. Diferencia simétrica de sucesos Dados dos sucesos A y B, se define la diferencia simétrica de ambos sucesos A y B, que la representaremos por A ti B, como otro suceso constituido por los sucesos elementales que pertenecen a A, o a B pero que no pertenecen simultáneamente a ambos.
312
FENÓMENOS ALEATORIOS Y SUCESOS
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
313
Como ejemplo, consideremos los siguientes sucesos:
E
A = obtener, en el lanzamiento de un dado, un 1, un 2 ó un 4 = {1, 2, 4} B = obtener, en el lanzamiento de un dado, un 2, un 5 ó un 6 = {2, 5, 6}
B
la diferencia simétrica será: A - B = zona sombreada
A .1. B = (A n B) u (B nA) = ({1, 2, 4} n {1, 3, 4}) u ({2, 5, 6} n {3, 5, 6}) = =
{1, 4} u {5, 6} = {1, 4, 5, 6}
efectivamente, el suceso que nos da la diferencia simétrica está constituido por los sucesos elementales que pertenecen a A ó B pero no a la intersección de ambos.
6.5. l.
E
A
Propiedades de las operaciones con sucesos
Los sucesos asociados a un experimento aleatorio verifican las siguientes propiedades: B- A = zona sombreada
l.
E =
2. .E u A = E, E nA = A, 3. GRÁFICO
= E, A = A
= A, A u A
An
=
E,
A=
Propiedad idempotente
AuA=A AnA=A
6.5. Diferencia de sucesos.
La representación gráfica de la diferencia simétrica de sucesos aparece en el gráfico 6.6. E
4.
Propiedad conmutativa:
AuB=BuA AnB=BnA 5.
Propiedad asociativa: A 1 u (A 2 u A 3 ) = (A 1 u A 2 ) u A 3 A 1 n (A 2 n A 3 ) = (A 1 nA 2 ) nA 3
A
~
B = zona sombreada
6.
•
Propiedad distributiva: A 1 u (A 2 n A 3 ) = (A 1 u A 2 ) n (A 1 u A 3 ) A 1 n (A 2 u A 3 ) = (A 1 n A 2 ) u (A 1 n A 3 )
7.
GRÁFICO
6.6.
Diferencia simétrica de sucesos.
Propiedad simplificativa:
Au(AnB) =A An(AuB)=A
FENÓMENOS ALEATORIOS Y SUCESOS
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑ"AS, J.
314 8.
6.
Leyes de Morgan:
(A u B) = A n B; en general (AnB)
=
AuB; en general
(~1 A;) = iQl A;
(ó
A;)=
;~1 A;
Ejemplo 6.7 Sean A 1 , A 2 y A 3 tres sucesos del espacio m~~stral E de un experime~to aleatorio. Expresar las siguientes afirmaciones utlhzando los sucesos antenares. l. 2.
6.6.
El suceso que ocurra A 1, y A 2 o A 3 pero no ambos simultáneamente lo expresaremos como:
Sucesiones de sucesos
Llamaremos sucesión de sucesos, a una familia de sucesos A 1 , A 2 , A 3 , ... en la que los sucesos aparecen ordenados por el subíndice n. La representaremos por {An}, n = 1, 2, 3, ...
Los tres sucesos ocurren. Ninguno de los tres sucesos ocurre. 3. Exactamente uno de los sucesos ocurre. 4. Exactamente dos de los sucesos ocurren. 5. Ocurre A 2 o A 3 pero no A 1 . 6. Ocurre A 1 , y A 2 o A 3 pero no ambos.
Sucesión creciente
Teniendo en cuenta los conceptos anteriores tendremos:
y la representaremos por {An j}.
1.
Los tres sucesos ocurren, o sea ocurre el A 1, el A 2 y el A 3 , lo expresaremos por la intersección:
Una sucesión de sucesos {An} diremos que es creciente si se verifica:
Sucesión decreciente Una sucesión de sucesos {An} diremos que es decreciente si se verifica:
2.
Ninguno de los tres sucesos ocurre Al
3.
Íl
A2 Í l A3
=
(Al u A2 u A3)
Exactamente uno de los sucesos ocurre, o sea, puede ocurrir el suceso A 1 , pero ni el A 2 ni el A 3, o bien ocurrir el A 2, pero ni A 1 ni el A 3, 6 también puede ocurrir el A 3 , pero ni el A 1 ni el A 2 , y lo expresaremos como:
y la representaremos por {An!}. Límite de una sucesión Si tenemos una sucesión creciente {An j} el límite será:
4.
Exactamente dos de los sucesos ocurren, o sea, puede ocurrir los sucesos A 1 y A 2 pero no A 3 , o bien ocurrir el A 1 y eLA 3 pero no A 2 , o también A 2 y A 3 pero no A 1, y lo expresaremos como:
{(A¡ 5.
Íl
A2) Í l A3) u {(A¡ Í l A3) Í l A2} u {(A2 Í l A3) Í l A¡}
315
00
lím An = n-J.oo
U An n==l
y si tenemos una sucesión decreciente el límite será:
El suceso que ocurra A 2 o A 3 pero no el A 1 lo expresaremos como:
n An 00
lím An = n-too
n=l
316
FENÓMENOS ALEATORIOS Y SUCESOS
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
317
;
Más generalmente, para cualquier sucesión de sucesos {An} defmimos los límites inferior y superior: A0 A
0
= lím inf An = =
lím sup An
=
"º (Dn 1
A k)
nol (Qn Ak)
Veamos qué significado tienen estos sucesos: A0
=
lim inf An
=
lJ (rl Ak)
n~
1
=
k~n
= (A 1 11 A 2 11 A3 ...)u (A 2 11 A3 11 A4 ••.)u (A 3 11 A4 11 As ...) u ... Si tenemos un resultado o suceso elemental s E A 0 , esto implicará que el suceso elemental s pertenecerá a uno de los paréntesis de la expresión anterior, lo cual implica también que pertenece a la infinidad de sucesos Ak exc~pto quizá a un número fmito. Así pues si perteneciera por primera vez al tercer paréntesis, ello significaría que pertenece a los sucesos A3 , A4 , As, ... excepto a los sucesos A1 y A 2 . Luego el límite inferior A 0 de la sucesión es un suceso constituido por los resultados o sucesos elementales que pertenecen a todos los sucesos de la sucesión excepto quizá a un número fmito de sucesos. Análogamente A
0
=
lím sup An =
nol (Qn Ak) =
= (A 1 u A 2 u A 3 ... ) 11 (A 2 u A 3 u A4 ... )
11
(A 3 u A4 u As ...) 11 ...
si tenemos un resultado o suceso elemental sE A 0 , esto implicará que el suceso elemental s pertenecerá a toda la infmidad de los paréntesis de la expresión anterior, y por tanto a una infinidad de sucesos Ak. Así pues diremos que el límite superior A 0 de la sucesión es un suceso constituido por todos los resultados o sucesos elementales que pertenecen a una infinidad de sucesos de la sucesión. En el supuesto de que se verifique: A0
=
lím inf An = lím sup An = A 0 =A
diremos que la sucesión es convergente, y se suele expresar como:
6. 7.
Como hemos venido observando los sucesos los consideramos como conjuntos, siendo válido para los sucesos todo lo ·estudiado en la teoría de conjuntos, con la siguiente tabla de correspondencias: Teoría de sucesos
Teoría de conjuntos
-Suceso. - Suceso elemental. - Suceso seguro o espacio muestral. - Sucesos incompatibles. - Suceso contrario. - Suceso imposible. - Unión de sucesos. - Intersección de sucesos. - Un suceso A implica a B.
-
o lim An n-+ oo
=
A
Subconjunto del conjunto universal. Punto del conjunto universal. Conjunto universal. Conjuntos disjuntos. Conjunto complementario. Conjunto vacío. Unión de conjuntos. Intersección de conjuntos. El conjunto A está contenido en B.
Para llegar a la construcción axiomática del Cálculo de Probabilidades, . necesitamos dar unas estructuras algebraicas básicas construidas sobre los sucesos de la misma manera que se construían sobre los conjuntos. Llamaremos colección de conjuntos a un conjunto cuyos elementos son conjuntos. Así pues el conjunto de las partes de E, Sil = W>(E), que es el conjunto formado por todos los subconjuntos de E, o por todos los sucesos contenidós en el espacio muestra} E, será una colección de conjuntos o sucesos. Luego una colección de sucesos es un conjunto cuyos elementos a su vez son conjuntos o sucesos. Para llegar a la estructura de Álgebra de Sucesos o Álgebra de Boole, partimos de una colección d¡: sucesos, Sil= W'(E), entre cuyos elementos tenemos definidas las operaciones: -
unión de sucesos, intersección de sucesos, y complementario de un suceso,
que además, verifican las propiedades que indicamos al exponer las operaciones con sucesos. Diremos que la colección de sucesos, d, no vacía, tiene estructura de Álgebra de Sucesos o Álgebra de Boole, si Sil es una clase cerrada frente a las operaciones de complementario, unión e intersección de sucesos en número finito, es decir si se verifican las condiciones siguientes: V A E Sil se verifica que su complementario II. V A1, A 2 E Sil se verifica que A1 u A 2 E d. I.
An -+ A,
Algebra de sucesos
AE
d.
319
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
FENÓMENOS ALEATORIOS Y SUCESOS
Estas dos condiciones son suficientes para definir el Álgebra de Sucesos, pues la condición 1, nos pone de manifiesto que la operación complementaria de un suceso es cerrada, ya que si un suceso pertenece a la colección de sucesos .sfl, también pertenece a ella su complementario. Análogamente la condición 11, indica que la operación unión de sucesos es cerrada, pues si dos sucesos pertenecen a stl, también pertenecerá el suceso unión. Lo relativo a que la intersección sea cerrada y que el número de sucesos sea finito se obtiene como consecuencia de las condiciones anteriores, como ahora indicaremos. De las dos condiciones anteriores, se deducen las siguientes consecuencias:
Si hacemos la extensión al caso de un número infinito numerable de sucesos, ent,onces nos aparece una nueva estructura algebraica que recibe el nombre u-Algebra o Campo de Borel. Diremos que ~n conjunto o colección de sucesos no vacío, stl = \P(E), tiene estructura de u-Aigebra o Campo de Borel, si se verifican las dos condiciones siguientes:
318
l.
El espacio muestral E E stl. En efecto, sea un suceso A
AE
stl.
00
U A¡ E
stl
i=l
E
stl entonces:
Si los sucesos A y B E stl, se verifica que A n B En efecto, como A, B E stl,
E
stl,
stl.
E
por la condición 1 se verifica que A_E sf!.:. y B E stl; por la condición 11 se verifica que A u B E stl; de nuevo, en virtud de la condición 1: (A u B)
E
stl
pero según las leyes de Morgan: (A u B) = A n B = A n B
E
stl
3.
El suceso imposible, c/J E stl. La demostración es análoga a la consecuencia l.
4.
Si los sucesos A 1 , A 2 , A3 ,
... ,
Si V A E stl se verifica que su complementario Si V A 1 , A 2 , A3 , ... E stl se verifica que A 1 u A 2 u A 3 u ··· =
por la condición 1 se verifica que AE stl_;_ por la condición 11 se verifica que A u A pero A u A = E, luego E E stl 2.
l. 11.
A.
E
stl se verifica que n
A 1 u A 2 u A 3 u··· u A.=
U A¡ E
stl
i=l
n A¡ n
A 1 n A 2 n A 3 n ···nA.=
E
stl
i= 1
Para demostrar esto, bastará aplicar sucesivamente la condición 11 y la consecuencia 3, respectivamente. Lo cual prueba que, efectivamente, las operaciones unión e intersección de un número finito de sucesos son cerradas.
Aplicando las Leyes de Morgan también se deduce que la intersección de un número infinito numerable de sucesos pertenecientes a stl, también pertenece a stl. Antes de concluir este apartado hemos de indicar que cuando el espacio muestral E es finito todos los subconjuntos de E se pueden considerar como sucesos. Pero esto no ocurre cuando el espacio muestra! es infinito, pues en este caso es muy difícil considerar el conjunto formado por todos los subconjuntos posibles, existiendo subconjuntos que no pueden considerarse como sucesos. Por ello nos vamos a referir a espacios muestrales finitos o infinitos numerables en donde no tendremos dificultad para fijar los sucesos. En el caso de un espacio muestral finito nos basaremos en la estructura de Álgebra de Boole, en donde podemos realizar las operaciones de unión, intersección y complementario de sucesos, teniendo la certeza de que son operaciones cerradas, es decir que nos darán sucesos pertenecientes al conjunto o colección stl 1. Si el espacio muestra! es infmito numerable entonces recurriremos a la estructura de u-Álgebra o Campo de Borel, en donde las operaciones de unión, intersección y complementario de sucesos son cerradas aplicándolas una infinidad numerable de veces, es decir dan sucesos que pertenecen a la misma colección de sucesos stl. Resumiendo podemos decir que a partir del espacio muestral E hemos llegado a definir la colección de sucesos stl que tiene la estructura de Álgebra de Sucesos·o Álgebra de Boole si el espacio muestra! es finito, o bien tiene la estructura de u-Álgebra si el espacio muestral es infinito. Al par (E, stl) en donde E es el espacio muestra! y stl, una u-Álgebra, sobre E, le llamaremos espacio o conjunto medible, en el cual será posible establecer una medida o probabilidad, como después veremos. 1 Se puede demostrar gue toda Álgebra de Boole construida sobre un espacio muestra! de dimensión flnita es una a-Algebra.
l ¡1
¡r
il¡ '¡
l 11
ldi . ~¡
320
CASAS-SÁNCHEZ, J. M. y SANTOS-PE'I'IAS, J.
6.8.
FENÓMENOS ALEATORIOS Y SUCESOS
Métodos de enumeración o conteo
En este apartado daremos algunas técnicas útiles para contar el número de resultados o sucesos de un experimento aleatorio, que después serán de gran aplicación para resolver ejercicios y problemas de probabilidades.
La tabla de doble entrada, como su propio nombre indica, es útil para relacionar dos pruebas, indicándonos los resultados que integran el espacio muestral al realizar los correspondientes experimentos, pudiendo indicar sobre la tabla determinados sucesos en los que estemos interesados.
Ejemplo 6.8
Consideremos el experimento aleatorio consistente en lanzar dos dados al aire. La correspondiente tabla de doble entrada sería: · 2
1
2
3
4
5
6
1
*
2
3 4
5
6
*
*
*
*
d~emos los cinco resultados que aparecen dentro de la región recuadrada, 0 bten observando dentro de la tabla las parejas que sumen 6. En . generaL con m elementos a 1 , a2 , a 3 , •••, am y n elementos b1' b2' ·b3, ..., bn' es posible formar m· n pares, (a,, b.) tales que cada par tiene al menos algún elemento diferente de cada grupo.
6.8.2.
Tablas de doble entrada
6.8.1.
*
321
Principio de multiplicación
Si tenemos los conjuntos e 1 , e 2 , •.• , ek, que tienen respectivamente n¡, n2, ..., nk elementos podemos formar en total n 1 • n2 . n3 ..... nk, k~uplas, donde en cada k-upla el primer elemento pertenece a e ' el segundo a e el . 1 2• t ercero a e3 ..• y e1 u'1 timo a ek. En el caso particular de que n 1 = n 2 = ··· = nk = n, el número posible de k-uplas será nk. Así pues en el ejemplo anterior del lanzamiento de dos dados al aire el número de posibles parejas hemos visto que ha sido 62 = 36. Este principio es de utilidad en el caso de un experimento aleatorio com~ puesto por otros k experimentos aleatorios. En efecto, sea E el espacio muestra} correspondiente al experimento aleatorio compuesto y sean E E E 1 k . ' ¡, 2' ... , k os ~spacws muestrales ~orrespondientes a los experimentos que integran el expenmento. compuesto, siendo n1 , n2, ..., nk el número de posibles resultados de los espaCios muestrales E 1 , E 2 , ••• , Ek, respectivamente entonces el número de posibles resultados para el espacio muestral E será n:. n2 ..... nk.
*
6.8.3.
Diagramas de árbol
* * *
. Este diagrama nos permite indicar de manera sencilla el conjunto de posibles resultados en un exprimento aleatorio, siempre y cuando los resultados del experimento puedan obtenerse en diferentes fases sucesivas. Para ello bastará con seguir todos los recorridos posibles del diagrama de árbol.
*
en donde los asteriscos representan los resultados posibles, que en este caso son 36 parejas, cuya primera componente es la de la columna marginal y la segunda componente es la fila marginal. Cuando estemos interesados en algún resultado concreto, por ejemplo, número de resultados o sucesos elementales en los que aparece una pareja que sume 6, no tenemos nada más que observar los valores marginales y obten~
Ejemplo 6.9
Sea el experimento aleatorio compuesto consistente en lanzar al aire un dad_o y después tres veces consecutivas una moneda, de manera que un posible resultado de este experimento aleatorio recogerá el resultado del dado y los resultados posibles del lanzamiento de la moneda. El espacio muestral correspondiente tendrá 6 · 2 · 2 · 2 = 48 resultados posibles, según el principio de multiplicación.
322
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
FENÓMENOS ALEATORIOS Y SUCESOS
El espacio muestral será:
El diagrama de árbol correspondiente será: Tirada del dado
Primera tirada de moneda
323
Segunda tirada de moneda
E
Tercera tirada de moneda
= {(1, H, H,
H), (1, H, H, T), (1, H, T, H), (1, H, T, T) (1, T, H, H), (1, T, H, T), (1, T, T, H), (1, T, T, T) (2, H, H, H), (2, H, H, T), (2, H, T, H), (2, H, T, T) (2, T, H, H), (2, T, H, T), (2, T, T, H), (2, T, T, T) (3, H, H, H), (3, H, H, T), (3, H, T, H), (3, H, T, T) (3, T, H, H), (3, T, H, T), (3, T, T, H), (3, T, T, T) (4, H, H, H), (4, H, H, T), (4, H, T, H), (4, H, T, T) (4, T, H, H), (4, T, H, T), (4, T, T, H), (4, T, T, T) (5, H, H, H), (5, H, H, T), (5, H, T, H), (5, H, T, T) (5, T, H, H), (5, T, H, T), (5, T, T, H), (5, T, T, T) (6, H, H, H), (6, H, H, T), (6, H, T, H), (6, H, T, T) (6, T, H, H), (6, T, H, T), (6, T, T, H), (6, T, T, T)}
H H T H
H T
T
H H T H
T T
T H
que efectivamente tiene 48 sucesos.
T H
6.8.4.
T H
Combinaciones
H H
Combinaciones, variaciones y permutaciones
T
2
T H
T
T
Llamaremos combinaciones de m elementos tomados de n en n, al número de subconjuntos den elementos que se pueda formar con los m elementos del conjunto inicial; de manera que dos subconjuntos serán distintos si difieren, al menos, en uno de sus elementos. Las representaremos por:
e m,n
H H T
H
H
=
e· m
= (m) = m(m - 1)(m - 2) n
n!
00
o
(m - n
+ 1) = __m_!_ n!(m- n)!
Las diferentes combinaciones n-arias que se pueden formar a partir de m elementos, van a diferir, unas de otras, por lo menos en un elemento, es decir los diferentes subconjuntos se diferenciarán por lo menos en un elemento.
T T H
6 H
T H
T T
T
Combinaciones con repetición Si en los subconjuntos anteriormente formados se pueden repetir los elementos entonces tenemos las combinaciones con repetición. Es decir, a partir de los m elementos, formamos subconjuntos de n elementos, tales que dos de sus elementos, tres, cuatro, ..., hasta n elementos, pueden ser el mismo. El número total de subconjuntos de este tipo serán las combinaciones con
324
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
repetición, que las representamos por:
C'
=
C'"
m, n
m
=
(m+ n
Ejercicios
n - 1)
=
(m+ n - 1)! n!(m- 1)!
Variaciones Dado un conjunto de m elementos, llamaremos variaciones de orden n, a los distintos subconjuntos que se pueden formar con los m elementos, tomados den en n; de manera que dos subconjuntos serán distintos si difieren, bien en algún elemento, o bien en el orden de colocación cuando tienen los mismos elementos. Los representaremos por:
V.m,n =m· (m- 1) ·(m- 2) · ... ·(m- n
m!
+ 1) = (m-n.)'
Variaciones con repetición Si en los subconjuntos anteriores se pueden repetir los elementos, o sea, que dos de sus elementos, tres, cuatro, ... hasta los n elementos pueden ser el mismo, entonces tenemos las variaciones con repetición, que las representaremos por:
Permutaciones , i
·]
a) Hombre contratado. b) Menor de 25 años. e) Mujer mayor de 25 años. á) Hombre mayor de 25 ó mujer menor de 25 años. e) Mujer mayor de 25 años y hombre menor de 25 años.
Soluci6n:
V'm,n =m"
i
l. Una empresa contrata hombres y mujeres que podemos clasificar en menores o mayores· de 25 años. Expresar los cinco sucesos que corresponden al perftl de contratado:
Llamaremos permutaciones de orden n, a las distintas ordenaciones que se pueden obtener con los n-elementos, tomados de n en n; de manera que dos permutaciones formadas a partir de los mismos elementos sólo se diferenciarán en el orden de colocación de sus elementos. Las representaremos por: P.= n! = 1·2·3· ... ·(n- 1)·n
a) b)
Podemos denotar A al suceso {hombre contratado}. Llamando B al suceso {menor de 25 años contratado}, el suceso pedido es: B.
e)
AnB = AuB
B) u (A n B) = A~ B e) (A n B) n (A n B) = ifJ á)
(A n
Permutaciones con repetición Las permutaciones de n elementos, k-distintos, de los cuales uno se repite x 1 veces, otro se repite x 2 veces, etc., de manera que x 1 + ··· + xk = n reciben el nombre de permutaciones con repetición de n elementos. Las representamos ' por:
.
px1. xz, ... , Xk
"
donde
n!
= ----xl!·x2!· ... ·xk!
2. Un sistema productivo requiere, para su funcionamiento, el trabajo de producción y de control de calidad. De hecho, trabajan 2 productores, aunque con uno solo de ellos se puede producir, y 1 controlador de calidad. Se pide caracterizar los sucesos: a) Un día se produce. b) Un día se controla la calidad. e) Un día funciona el sistema productivo (produce y controla). á) Un día se produce, pero no se controla la calidad. e) Un día no se produce ni se controla. f) Un día sólo se produce o sólo se controla.
326
CASAS-SÁNCHEZ, J. M. y SANTOS-PE~AS, J.
FENÓMENOS ALEATORIOS Y SUCESOS
5.
Solución:
Suceso P 1 : el productor 1 acude al trabajo un día. Suceso P 2 : el productor 2 acude al trabajo un día. Suceso C: el controlador acude al trabajo un día.
En el ejercicio anterior, determinar los sucesos: Sa: No se da ninguno de los sucesos S1 , S2 y S3.
a) b)
Sean los sucesos:
327
Sb: Se da uno exactamente. Se: Se dan los tres sucesos.
e)
Solución:
Con esta notación de los sucesos P 1 , P 2 y C, los sucesos pedidos son: a)
P 1 uP 2
a)
Sa = S 1 nS2 nS3 = (S 1 uS2 uS 3)
b)
e
b)
sb =(S¡ í\ s2 í\ S3) u {5\ í\ s2 í\ S3) u {S¡ í\ s2 í\ S3)
e)
(P 1 uP 2 ) n C
e)
Sc=S 1 nS2 nS3.
d)
(P 1 uP 2 )n C = (P 1 uP 2 ) - C
e)
P 1 nP2 nC=(P 1 uP 2 uC)
f)
[(P 1 u P 2) n
CJ u [(P 1 u P 2) n C] = (P t u P 2) A C
3.
En una empresa hay 2 subdirectores nácionales y 1 subdirector extranjero. De entre ellos (los tres subdirectores) se promociona uno a director. La empresa dispone de tres directores, 2 nacionales y 1 extranjero, a los cuales se añade el director promocionado. Obtener un sistema completo de sucesos del subdirector promocionado; también, un sistema completo de los directores resultantes.
6.
Simplificar los sucesos: a)
[(A n B) u C] n [(B n C) u A] = S 1
b)
[(A u B) n
CJ nA= S2
Solución: a)
S 1 = [(A u C) n (Bu C)] n [(Bu A) n (A u C)] = (A u C) n (A u B) n (B u C) =
=
=~nBnC)u~nBnC)u~nlinC)u~nBn~
Solución: Sistema completo de sucesos: s. y s. (subdirector nacional y subdirector extranjero). Sistema completo de sucesos: D. y D. («director nacional» y «director extranjero»).
expresado éste último suceso como unión de sucesos incompatibles o disjuntos.
4.
7. Una compañía de seguros de automóviles, asegura vehículos según el sexo del propietario, su edad (inferior a 30 o mayor o igual a esa edad), el tipo de vehículo (utilitario o de lujo) y la antigüedad del vehículo (menos de 3 años o de antigüedad mayor o igual). ¿Cuántas pólizas serían necesarias para asegurar cualquier caso posible?
Sean los sucesos: S 1 : Se lanzará al mercado un nuevo producto. S2 : Habrá crecimiento económico nacional. S3 : Se contratará a más empleados en la empresa.
Los tres referidos a una fecha futura. Determinar el suceso S, consistente en que se den dos de ellos exactamente. Solución:
b)
s2
= [(A u B) nA] n e= [(AnA) u (B n A)J n e = = [
Solución: Por el principio de multiplicación los distintos tipos de pólizas, son en número: 2 · 2 · 2 · 2 = 2 4 = 16, por haber 2 sexos, 2 intervalos de edad, 2 tipos de vehículos y 2 tipos de antigüedad.
CASAS-SÁNCHEZ, J. M. y SANTOS-PE:t'l"AS, J.
328
8.
FENÓMENOS ALEATORIOS Y SUCESOS
Calcular los límites de las sucesiones de sucesos en forma de intervalos:
a) [n! 1' 1)
Solución: El número de billetes diferentes que pueden imprimirse con origen y destino distinto será:
b) [O,
1+ 2n ~ 1)
e)
~ 1' 1 + n ! 1]
[n2
329
v22,2
22) 22! 22·21 = c22,2. p 2 = ( 2 2! = 2! 20! 2! = -2-2 = 22. 21 = 462 tipos de billetes
10. En una división de una empresa hay 12 empleados. ¿Cuántos grupos de tres empleados pueden formarse como jefes, y en cuántos entrará un empleado concreto?
Solución: Solución: a) La sucesión es creciente, lím [ n ...... oo
n
!
1 , 1) =
a)
V[n ! 1, 1) = (0, 1).
n-1
b)
b) La sucesión es decreciente, lím n-+oo
e)
[o, 1 + 2 ~ 1) = 0[o, 1 + 2n ~ 1) = [O, 1]. n
12) 12! 12. 11·10 cl2,3= ( 3 =3!9!= 6 =2·11·10=220posiblesgruposde 3 jefes
n-1
C 11 , 2 = ( 11) = -11·10 - = 55 grupos que inclurn a un empleado con2 2 creto.
11. En el parking de la UNED hay 13 plazas de garaje alineadas para un Departamento y existen dos plazas de garaje prefijadas para el director y el subdirector de un Departamento. Si además hay 11 profesores, ¿de cuántas formas pueden colocarse sus coches?
No es creciente ni decreciente,
Solución:
n
n
P 11 = 11! = 39.916.800 colocaciones
" ' [- 1 A0 = " 'U -1 -] = "'(O, 1 + -1 -] =(0, 1]. 2- , 1 +k+1 n=lk=nk+1 n=l n+1 Como: '
A 0 = A0
=>
1 1 lím [ - , 1 + - -] = A0 = A0 = (0, 1]. 2
n-+oo
n
+1
n
,
+1
12. Una empresa textil vende sus telas en lotes de 3 rollos. Sabiendo que dispone de 11 tipos de estampados diferentes, ¿cuántos posibles lotes puede ofrecer? Solución:
9. Una línea de ferrocarril tiene 22 estaciones. ¿Cuántos billetes diferentes pueden imprimirse con origen y destino distinto?
C'11 3 = (11 + 3 - 1) = (13) = ~ = 13. 12. 11 = 286 lotes • 3 3 10!3! 6
330
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
13. En el ejercicio anterior, ¿cuántos posibles lotes pueden formarse con '2 rollos iguales y 1 de distinto color?
Capítulo 7 Probabilidad
Solución:
V11 , 2
=
C 11 , 2 P 2
=
(~)2! =
110 lotes diferentes
14. En el diseño de un parking alineado de 13 plazas, se reservan 2 plazas grandes para el director y el subdirector, y 11 medianas para los profes?res, pero ahora pueden ordenarse alineadas arbitrariamente, ¿cuántas postbles ordenaciones pueden diseñarse? Solución: P 11 ·2 13
= -13!- =
11!2!
d 78 or enacwnes o
15. .Si se disponen seis bombos, que contienen cada uno 5 números diferentes del O al 4 y se extrae un número de cada uno de los bombos ordenados de izquierda a derecha, cuántos boletos pueden salir ordenando los dígitos extraídos en el mismo orden en que se disponen los bombos? Solución:
VS. 6 =
56
=
15.625 boletos
16. En el ejercicio 13, la empresa textil dispone de 11 tipos de rollos de tela estampados diferentes. Un lote consiste en 3 rollos. ¿Cuantos lotes puede ofrecer que incluya un rollo determinado? Solución: C'11 , 2
= ( 11 + 2- 1) = (12) = 66 lotes. 2
2
7.1.
Introducción
En el capítulo anterior hemos introducido, entre otros, los conceptos de experimento aleatorio, sucesos, operaciones con sucesos, etc. Indicábamos que cuando un experimento aleatorio se repite un gran número de veces los posibles resultados tienden a presentarse un número muy parecido de veces, lo cual indica que la frecuencia con que aparece cada resultado tiende a estabilizarse. El concepto o idea que generalmente se tiene del término probabilidad es adquirido casi de manera intuitiva, siendo suficiente para manejarlo en la vida corriente. Pero debido a la gran importancia del concepto en sí, a la gran aplicación y desarrollo que ha recibido en los más variados campos de la ciencia (física, economía, biología, etc.) es por lo que se considera imprescindible su estudio, y a él vamos a dedicar este capítulo dando la terminología y estructura básica necesaria para poder llegar a dar una teoría sobre la probabilidad. Ahora nos va a interesar una medida numérica de la posibilidad de que ocurra un suceso A cuando se realiza el experimento aleatorio. A esta medida la llamaremos probabilidad del suceso A y la representaremos por P(A). La probabilidad es una medida sobre la escala O a 1; correspondiendo el valor cero al suceso imposible, o sea el que no ocurre nunca, y el valor 1 al suceso seguro. Para los restantes sucesos, daremos una probabilidad comprendida entre O y 1, de tal manera que será tanto más probable que ocurra un suceso cuanto mayor sea su probabilidad. Así pues, frecuentemente decimos que el hecho de que ocurra un accidente de automóvil es más probable en ciertas épocas del año que en otras.
332
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
PROBABILIDAD
Hechas estas indicaciones, nos surge la necesidad de dar un concepto de probabilidad, de tal forma que podamos asignar probabilidades ados diferentes sucesos de un experimento aleatorio. Este concepto de probabilidad no será único, ya que se pueden considerar diferentes enfoques o puntos de vista, así pues, aquí expondremos el punto de vista objetivo y el subjetivo. Dentro del enfoque objetivo se puede considerar una definición clásica o a priori de la probabilidad y otra frecuentista o a posteriori.
Cada uno de los posibles resultados tendrá la misma posibilidad, es decir todas las caras del dado tienen la misma posibilidad de aparecer y será un 1/6; siendo este valor la probabilidad de cada uno de los sucesos elementales que integran el espacio muestra!:
7.2.
Consideremos un experimento aleatorio, cuyo correspondiente espacio muestral E está formado por un número n, finito, de posibles resultados distintos y con la misma posibilidad de ocurrir {e 1, e2 , e3 , •••, en}. Entonces si n1 resultados constituyen el subconjunto o suceso A 1, n2 resultados constituyen el suceso A 2 , ••• y nk resultados constituyen el suceso Ak de tal manera que:
1
P(e 1 ) = P(1) =
6
= P(2) =
6
P(e 6 ) = P(6) =
61
P(e 2 )
Definición clásica de la probabilidad
333
1
que se interpreta como el cociente entre el número de casos favorables para cada resultado o suceso elemental que es 1, y el número total de posibles resultados que es 6. Si ahora consideramos un suceso A = {1, 3, 5} = que aparezca cara impar
y las probabilidades de los sucesos A 1 , A 2 ,
... ,
Ak serán:
Es decir, la probabilidad de cualquier suceso A es igual al cociente entre el número de resultados favorables o resultados que integran el suceso A y el número total de elementos o posibles resultados del espacio muestra! E. Luego una fórmula para calcular la probabilidad de un suceso cuando todos los posibles resultados tienen la misma probabilidad de ocurrir será:
la probabilidad del suceso A será: P(A) = Número de casos favorables = ~ =
!
Número de casos posibles
2
6
Si el suceso considerado fuera: A= {5, 6} =que aparezca un resultado mayor que 4
.
2
1
6
3
P(A) =- =-
Número de casos favorables de A Número de casos posibles de E
P(A) = - - - - - - - - - - - , - -
que se conoce con el nombre de regla de Laplace para espacios muestrales finitos. Veamos ahora cómo se aplica la regla de Laplace para algún caso concreto. Supongamos el experimento aleatorio «lanzar un dado al aire», en donde el dado se supone que es perfecto y el lanzamiento totalmente imparcial, teniendo todos los posibles resultados la misma posibilidad de aparecer; y cuyo correspondiente espacio muestra! es:
No siempre resulta tan fácil y directa la aplicación de la regla de Laplace, pues los sucesos del espacio muestra! deben ser distintos y tener todos ellos la misma posibilidad de ocurrir. Supongamos, por ejemplo, que realizamos un experimento aleatorio que consiste en lanzar al aire dos monedas simultáneamente y estamos interesados en conocer la probabilidad de que aparezcan dos cruces. Para ello empezaríamos por obtener los posibles resultados que se pueden presentar al lanzar las dos monedas al aire que serían: -Dos caras. - Dos cruces. - Una cara y una cruz.
y como uno de estos resultados es el suceso, dos cruces, cuya probabilidad nos interesa, se podría decir que la probabilidad buscada es 1/3. Pero esto no es cierto ya que los tres resultados no tienen la misma posibilidad de ocurrir, pues el resultado cara-cruz puede aparecer también como cruz-cara, siendo , por tanto el espacio muestra! o conjunto de posibles resultados E
3.0
n
n
P(E) =
¿
P(e;) = 1
i~l
resulta que: 1 P(e;) = -, n
Vi= 1, 2, 3, ..., n
y si designamos por A = {e 1 , e2 , ..., ek} el suceso formado por k sucesos elementales, siendo k :::;; n, tendremos: k
L
i~ 1
k P(e ) = - = i n
número de casos favorables número de casos posibles
Observemos que la probabilidad verifica las siguientes condiciones: 1. 0
2. 0
La probabilidad de cualquier suceso es siempre un número no negativo comprendido entre O y l. En efecto, dicha probabilidad viene dada por ~ en donde n; es menor que n, y ambos son no negativos. n La probabilidad del suceso seguro, E, vale 1, pues en este caso n; será igual a n, ya que el suceso seguro E o espacio muestral contiene todüi! n los posibles resultados y la probabilidad será ;; = l. Por eje~plo, la probabilidad de obtener un resultado inferior a 9 al lanzar un dado será l. Análogamente la probabilidad del suceso imposible,
+ n + .. · + n, _
n
1 2 ---=---=----_.:_ - 1 n n
todos distintos con la misma posibilidad de ocurrir. La probabilidad correcta del suceso, dos cruces, sería 1/4. Más concretamente, si consideramos el espacio muestra! finito E= {e 1, e2, ... , e.}, para que se pueda aplicar la regla de Laplace es necesario que todos los sucesos elementales sean equiprobables, es decir:
P(A) =
La probabilidad de la unión de varios sucesos incompatibles o excluyentes es igual a la suma de las probabilidades de cada uno de los sucesos. En efecto, sean los sucesos A 1 , A 2 , ..., A" compuestos cada uno de ellos por n1 , n2 , ... , n, resultados elementales del espacio muestra] E, y tales que A; n Ai -:f.
= {HH, HT, TH, TT}
y como
335
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
334
+ -n2 + ... + -n, n
n
tendremos: P(A 1 u A 2 u .. · u A,) = P(A 1 )
+ P(A 2 ) + .. · + P(A,)
Esta defmición de la probabilidad clásica fue una de las primeras que se dieron, alrededor del año 1900, y se conoce con el nombre de regla de Laplace ya que se le atribuye a él. También se le suele llamar probabilidad a priori, pues para calcularla .es necesario conocer, antes de realizar el experimento aleatorio, el correspondiente espacio muestra! y el número de resultados o sucesos elementales que entran a formar parte del suceso cuya probabilidad pretendemos determinar; pudiendo calcular la probabilidad de cualquier suceso antes de realizar el experimento aleatorio. La aplicación de la definición clásica de probabilidad puede presentar dificultades de aplicación en algunos casos. Concretamente, cuando el espacio muestra! es infinito, o bien cuando los posibles resultados de un experimento no son igualmente probables. Por ejemplo, en un proceso de fabricación de un determinado tipo de piezas, pueden aparecer algunas piezas defectuosas, siendo la mayoría buenas, y en este caso si quisiéramos determinar la probabilidad de que una pieza fuera defectuosa no podríamos utilizar la definición clásica de probabilidad, pues necesitaríamos conocer previamente el resultado del proceso de fabricación (experimento aleatorio). Otro ejemplo sería el determinar la probabilidad de que una mujer muera antes de una determinada edad, etc. Para resolver, entre otros, estos problemas se hace. una extensión de la definición de probabilidad, de manera que se pueda aplicar con menos restricciones. Llegando a la definición frecuentista de la probabilidad.
7.3.
Definición frecuentista de la probabilidad
Dados dos sucesos incompatibles A 1 y A 2 tales que A1 u A 2 =A e: E entonces cada vez que se presente el suceso A, se presentará necesariamente uno y sólo uno de los sucesos A 1 o A 2 , y si realizamos n repeticiones del
336
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
experimento aparecerá n' veces el suceso A de tal forma que
siendo: n1 : el número de veces que aparece A1 y n 2 : el número de veces que aparece A 2 • Luego tendremos que:
PROBABILIDAD
el experimento muchas veces y observaríamos que las frecuencias relativas tienden a estabilizarse. Pero esta estabilización es relativa, pues en algunos casos las frecuencias relativas tienden a estabilizarse muy pronto, es decir, con pocas repeticiones del experimento aleatorio se observa la estabilización y sin embargo en otros casos la estabilización de las frecuencias relativas es más lenta, teniendo que repetir muchas veces el experimento aleatorio para que aparezca esa estabilización. Así pues, consideremos un experimento aleatorio que consiste en lanzar una moneda equilibrada al aire, o sea, una moneda muy perfecta, siendo los posibles resultados cara (H) o cruz (T); si repetimos 200 veces el experimento obtenemos los resultados de la tabla 7.1. TABLA 7.1.
Esta propiedad se puede generalizar al caso de n sucesos incompatibles. La teoría frecuentista de la probabilidad asegura que existe el siguiente límite cuando n tiende a infinito:
1ím n-+c:.o
n. ....! =
n
i = 1, 2, 3, ..., k
P(A;),
siendo P(A.) la probabilidad del suceso A;. Luego ia definición frecuentista de la probabilidad consiste en definir la probabilidad como el límite cuando n tiende a infinito de la proporción o frecuencia relativa del suceso. En general,. si realizamos un experimento aleatorio cuyo correspondiente espacio muestra! es E y designamos por A cualquier suceso perteneciente ~1 espacio muestra] E y repetimos en las mismas condiciones, n veces el expenmento aleatorio, tendremos que la frecuencia relativa del suceso A será: n(A)
n
en donde n(A) es el número de veces que ha aparecido el suceso A en las n repeticiones del experimento. Cuando el número n de repeticiones del experimento se hace muy grande, 0 sea, cuando n tiende a infinito, la frecuencia relativa converge hacia un valor que llamaremos probabilidad del suceso A, P(A), o sea: P(A) = lím n(A) n-+co
n
Pero como es imposible llegar a este .límite, ya que no podemos repetir el experimento un número infinito de veces, lo que sí podemos hacer es repetir
337
Número de lanzamientos
Resultados de 200 lanzamientos de una moneda al aire.
Número de caras cada 10 lanzamientos
Suma acumulada de caras
1
o
10
o
6 2 6 5 6 6 7 5 3 5 5 7 5 4 3 3 5 6 6 6
6 8 14 19 25 31 38 43 46 51 56 63 68 72 75 78 83 89 95 101
20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200
Frecuencia relativa de caras
o 0,600 0,400 0,467 0,475 0,500 0,517 0,543 0,537 0,511 0,510 0,509 0,525 0,523 0,514 0,500 0,487 0,488 0,494 0,500 0,505
La cuarta columna de la tabla 7.1 nos da la frecuencia relativa de aparición del suceso cara. Por ejemplo, cuando hemos realizado 40 repeticiones del experimento la frecuencia relativa de caras es 19 . 40 = 0,475
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
338
y cuando se han realizado 170 repeticiones la frecuencia relativa es '
~~0488 170
'
lo cual nos indica que cuando el número n d~ repeticiones ?el experimen~o aumenta la amplitud de las variaciones disnunu~e. Es decrr,. la frecuencta rélativa tiende a estabilizarse o a presentar regulandad estadística en torno a un valor, en nuestro ejemplo, 0,5, a medida que n crece. Si representamos gráficamente la primera y cuarta c~lumna de la tabl~ 7.1, llevando en el eje de abscisas el número de lanzanuentos y en el eje de ordenadas la frecuencia relativa de las caras, gráfico 7.1, observamos que efectivamente la amplitud de las variaciones decrece cuando n aumenta, tendiendo a fluctuar alrededor del valor 0,5. . ----···-----··---------------------------------·-····-·········
------------------ ··········-·····------ --------------------
-----------·······-····----· ---------------------- ·----···----------------------------····-----
0,9 0,8
-----------------------······--·
-------····----------- ------------------------ ------------------
----------·---------------·--------- -----------------····
.. --···----··----- -------------------------
- ········-------·· ··----····------··------------------------------··--·--·-···----····-----···-·---·····---- ···----····----······----
···-----------····------------------- ···-·-----·------····---- -··--------····-----···---
.. ---·--------····------···----··· ----···----···---····----··---- ·····---···-----····-----······-------···---···------------------------ --------------·-------·····--
--------------------·--------·
····----·------····-----·------------------------ ----------------------------·
····---·····---·····-- --·------------------·----- ····---····· ---·····----------- ----- --------···---- ---·---------------------
oo
10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 Número de lanzamientos '
GRÁFICO 7.1.
.
Representación gráfica del número de lanzamientos de una moneda al aire y frecuencia relativa de las caras.
Este valor 0,5, al cual tiende la frecuencia relativa cuando el número de repeticiones se hace muy grande, es la probab~dad del suce~~ cara. El hecho de que las frecuencias relativas tiendan a estabilizarse en torno del valor 0,5 es debido a que la moneda que hemos utilizado estaba totalmente
339
equilibrada, o sea, era imparcial, y los dos posibles sucesos, cara y cruz, son igualmente probables. Si la moneda hubiera sido doblada o golpeada, al repetir muchas veces el experimento aleatorio (lanzamiento al aire de la moneda) nos podía haber llevado a un valor diferente del 0,5, como podían haber sido del 0,61, 0,48, O, 71, ... siendo éstos los valores alrededor de los cuales se hubieran estabilizado las frecuencias relativas, resultando entonces que la probabilidad del suceso cara no hubiera sido 0,5, sino que sería 0,61, 0,48, 0,71, ... A esta defmición frecuentista de la probabilidad se le llama también probabilidad a posteriori ya que sólo podemos dar la probabilidad de un suceso después de repetir y observar, un nl1mero grande de veces, el experimento aleatorio correspondiente. Algunos autores también las llaman probabilidades teóricas.
7.4.
Interpretación subjetiva de la probabilidad
Hemos visto que tanto la defmición clásica como la frecuentista de la probabilidad se basan en las repeticiones del experimento aleatorio, pero hay muchos experimentos que no se pueden repetir bajo las mismas condiciones, y por tanto habrá muchas situaciones donde la interpretación objetiva de la probabilidad no puede ser aplicada, teniendo que recurrir a un punto de vista alternativo que no depende de las repeticiones del experimento aleatorio sino que consiste en considerar la probabilidad como un concepto subjetivo que expresa el grado de creencia o confianza individual sobre la posibilidad de que el suceso ocurrió. Es decir, la probabilidad subjetiva representa un juicio personal sobre el resultado de un experimento aleatorio, pudiendo ser muy diferente del juicio personal o probabilidad subjetiva asignada por otra persona. Luego la probabilidad subjetiva es la evaluación personal de la probabilidad de un fenómeno aleatorio. Con el fin de aclarar lo que entendemos por grado de creencia o confianza individual consideremos el siguiente ejemplo, que va a consistir en un partido de fútbol entre dos equipos A y B que juegan por primera vez; no disponemos de información sobre resultados anteriores puesto que es la primera vez que van a jugar, solo se tiene información sobre algunos jugadores de ambos equipos. Como no han jugado en ocasiones anteriores no podemos atribuirle probabilidad objetiva al posible resultado del partido, es decir como no existen resultados de partidos anteriores, no podemos asignarle probabilidad de tipo frecuentista o a posteriori ni de tipo clásico o a priori a los tres posibles resultados del partido: -
que gane el equipo A, que gane el equipo B, o que empaten.
340
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Sin embargo, basándonos en el conjunto de la posible información qm:' podamos tener acerca de los diferentes jugadores o aun sin ella, se puede emitir un juicio personal o grado de creencia sobre el posible resultado, que sería la probabilidad subjetiva que se asigna a cada posible resultado. Así pues un determinado observador puede asignar las siguientes probabilidades subjetivas. Probabilidad de que gane el equipo A = 0,7 Probabilidad de que gane el equipo B = 0,2 Probabilidad de que empaten = 0,1 Otro observador puede asignar diferentes probabilidades subjetivas: Probabilidad de que gane el equipo A = 0,3 Probabilidad de que gane el equipo B = 0,2 Probabilidad de que empaten = 0,5 Siendo, por tanto, posible que diferentes· observadores tengan diferentes grados de creencia sobre los posibles resultados emitiendo juicios personales o probabilidades subjetivas diferentes e igualmente válidas. De esta forma hemos emitido un juicio (un número) que refleja nuestra opinión sobre el posible resultado, y que es la probabilidad subjetiva asignada a ese resultado. Siendo este número o probabilidad subjetiva una propiedad característica que depende del propio observador. Para el objetivista las cosas suceden de diferente forma: admite que la probabilidad es una propiedad característica de cada acontecimiento y no depende del observador, limitán.dose éste a calcular su valor a partir de un conjunto de información impuesto por el propio acontecimiento e independiente del observador. Es decir, dos observadores diferentes pueden dar para un mismo suceso dos valores distintos desde el punto de vista subjetivo, sin embargo, esto no puede ocurrir en el punto de vista objetivo, pues en este caso . uno de los dos o ambos han medido malla probabilidad y un ser infinitamente inteligente daría el valor exacto. En lo sucesivo nos referiremos a la probabilidad objetiva aunque en algún apartado, como por ejemplo en teoría de la decisión podremos utilizar poobabilidades subjetivas, pero entonces lo indicaremos expresamente 1• 1 Como autores representantes del punto de vista objetivo tenemos: Gournot, Borel, Berstein, Keynes, Kolmogorov, Jeffreys, Von-Misses y Reichenbard. Como representantes del punto de vista subjetivo: Ramsey, De Finetti, Koopman, Savage, Good, etc.
PROBABILIDAD
7.5.
341
Definición axiomática de la probabilidad
La definici~~ axiomá~ica de la probabilidad es quizás la más simple de t~das las defimcwnes y Ciertamente es la menos controvertida ya que, esencialmente, es una definición basada en un conjunto de axiomas que establecen los requisitos mínimos para dar una definición de probabilidad. La ventaja fundamental de la definición axiomática de la probabilidad es que nos permite lleg~r a un. desar.rollo riguroso y matemático de la probabilidad. Esta aproximaCión ~xtomática de la probabilidad fue introducida, inicialmente, por el matemático ruso A. N. Kolmogorov y posteriormente aceptada por estadísticos y matemáticos en general 2• . J?ado el espacio muestra} E y la cr-álgebra .st1 = Ql>(E), diremos que una funCión de conjunto P definida sobre .st1 y con valores en [0, 1], P: .st1
--+
[0, 1]
es una probabilidad, si satisface los siguientes axiomas de Kolmogorov: A.l. P(A) ~ O, para cualquier suceso A A.II. P(E) = 1.
E
.st1.
A.~II. Dada una sucesión numerable de sucesos incompatibles, A1, A 2 , se verifica que
••• E
.st1,
o bien
. Si la función de conjunto P asigna el valor p == P(A) al suceso A, entonces diremos que p o P(A) es la probabilidad del suceso A. La terna formada por el espacio muestra} E, la cr-álgebra .st1 y la probabilidad P, (E, .st1, P), recibe el nombre de espacio probabilístico.
2
Un axioma es una afirmación que se admite como verdadera; mientras que un teorema es una afirma~i~n qu~ pue~e ser deducida .~e axioma~ ? de otras propiedades y teoremas previos. En la defrmoón axiOmática de la probabilidad, admlluemos como verdaderas varias afirmaciones simples sobre la probabilidad, y estas afirmaciones serán los axiomas de probabilidad.
342
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
PROBABILIDAD
343
7 .5. 1. Teoremas elementales o consecuencias de los axiomas ' Los siguientes resultados se deducen directamente de los axiomas de probabilidad de Kolmogorov. 1 + P (0)
A.ll
A.III
l
l
r---
A.ll ----~
l
= P (E) + P (0) = : P (E u 0) : , _________ 1
Teorema 7.1
~-La probabilidad del suceso imposible es nula
L
P(ifl)=O GRAFICO 7.2. Demostración del teorema 7.1.
Demostración:
Sabemos que
Teorema 7.2 Euifl=E
y
Enifl=ifl
Para cualquier ~uceso A complementario P(A) es
Por el axioma III (A.III), resulta que P(Eu ifl) = P(E)
+ P(ifl)
P(E)
+ P( ifl)
=
1 + P( ifl) = 1
d se verifica que la probabilidad de su
P(A)
= 1
y como por el axioma II (A.II), P(E) = 1,
E
= 1-
P(A)
Demostración:
Teniendo en cuenta que:
resulta que AuA=E
y
AnA= 4J
P(ifl) =O
Aplicando los axiomas A.II y A.III tenemos: Es decir, la probabilidad del suceso imposible es cero, pero si para cualquier suceso A resulta que P(A) = O, diremos que A es un suceso nulo, pero esto no implica que A = ifl. Análogamente sucede con el suceso E, pues si para cualquier suceso A se verifica que P(A) = 1, diremos que A es un suceso casi seguro, pero esto no implica que A = E. Un diagrama gráfico de la demostración viene dado por el gráfico 7.2.
1 = P(E)
= P(A u A) = P(A) + P(A)
de donde se deduce que P(A) = 1 - P(A)
344
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
PROBABILIDAD
345
o bien que P(A) = 1 - P(A)
E
Un diagrama gráfico de la demostración viene dado por el gráfico 7.3.
B
AuA=E
A. m
t
P(A) +P(A)
A.ll ¡- - - - - - -_---- - - - :
: P(A u A) =P(E):
'--------------
t
= GRÁFICO 7.4.
Diagrama de Venn.
si, A e B, entonces podemos expresar B como B = Au(B- A)
pero A y B - A son disjuntos, luego por A.III tendremos: GRÁFICO 7.3.
Demostración del teorema 7.2.
P(B) = P[A u (B - A)] = P(A) =>
Teorema 7.3
+ P(B -
P(B - A) = P(B) - P(A)
y como por el axioma A.I,
La probabilidad P es monótona no decreciente, es decir P(B- A)?: O
V A, B
E
.sfl,
con A e B
=>
P(A) :::;; P(B)
resulta que
y además
P(B) - P(A) ?: O P(B - A) = P(B) - P(A)
de donde P(B);;?; P(A)
Demostraci6n:
Observando el diagrama de Venn del gráfico 7.4.
y consecuentemente P(A),:;; P(B)
A)
=>
347
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
346
son disjuntos, por el axioma A.III tendremos que:
Teorema 7.4 Para cualquier suceso A
E
B)
[7.1]
P(B) = P(A n B) + P(A n B)
[7.2]
P(A) = P(A n B) + P(A n
.54., se verifica que P(A) ~ l.
P(A u B) = P(A n B) + P(A n
Demostración: Ya que A e: E, por el teorema 7.3 resulta que P(A) ~ P(E) = 1
~
P(A) ~ 1
P(A)
l
E
+ P(B) -
P(A n B) = P(A n B)
+ P(A n B) + P(A n B)
bros son Iguales, luego se verifica que: P(A u B) = P(A)
Demostración: Observando el diagrama de Venn del gráfico 7.5 podremos escribir
+ P(B) -
P(A n B)
Este teorema se puede generalizar a más de dos sucesos, así pues para el caso de tres sucesos A, B, C E sil tendremos P(A u Bu C) = P(A)
+ P(B) + P(C)- P(A n
B)- P(A n C)- P(B n C)
+ P(AnBnC)
E
En general paran sucesos A 1, A 2 ,
••• ,
An
E
sil se verifica que
Teorema 7.6 7.5. Diagrama de Venn.
A = (A n B) u (A n B) B = (A n B) u (A n B) A u B = (A n B) u (A n B) u
Para dos sucesos cualesquiera A y B P(A u B)
~
E
sil se verifica que
P(A) + P(B)
(A n B) Demostración:
y como los sucesos
(A n B), (A n B), (A n B)
[7.4]
Y compar~ndo la expresión [7.3] con la [7:4] resulta que los segundos miem-
.s4. se verifica que
P(A u B) = P(A) + P(B) - P(A n B)
GRÁFICO
[7.3]
De las expresiones [7.1] y [7.2], sumando miembro a miembro y pasando al primer miembro P(A n B) tendremos
Teorema 7.5 Para dos sucesos cualesquiera A, B
B) + P(A n B)
Es una consecuencia inmediata del teorema 7.5.
+
348
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J. PROBABILIDAD
En general podemos escribir que
349
y por el axioma A.III P(lím A.)= P(A 1) n-+ oo
En el caso de que los sucesos fueran disjuntos entonces se verifica la igualdad
= n-+ límoo
+ P(A 2
[P{A 1 )
= lím P[A 1 n-+oo
-
A1)
+ P(A 2 -
u (A 2
-
+ P(A 3 A 1)
A 2)
+ P(A 3 -
A 1) u (A 3
-
+ ···
=
+ ··· + P(A.- A._ 1 )] =
A 2)
A 2 ) u· .. u (A,. - A._
)] 1
y teniendo en cuenta la expresión [8.5] resulta que:
Teorema 7.7 Dada una sucesión creciente de sucesos {A 1 , A 2 , A 3 , ••• }que abreviadamente representaremos por {A. j} entonces se verifica que: lím P(A.) n-oo
= p( lím
~-oo
A.)
= P(
º
con lo que queda demostrado.
Teorema 7.8
A.)
n-1
Dada una sucesión decreciente de sucesos {A 1 , A 2 , A , 3 · damente {A.J}, entonces se verifica que:
Demostración:
...}
o abrevia-
Denotemos por
A = A1 u A 2 u A 3 u · · · = lím A. = n-+o:::J
con lo cual
P(A)
= P(lím n-+oo
A.)
U A. n=l
º
= P(n-1
Demostración: Designamos por
A.)
n A. 00
A = A 1 n A 2 n A 3 n .. · = lím A. =
Como la sucesión es creciente se verifica
n-+oo
A1 e A 2 e A 3 e ...
n=l
[7.6]
y consecuentemente
y los sucesos A 1, A 2
-
A 1 , A 3 - A 2 , A4- A3, ..., A.- An-l• ...
son disjuntos entre sí y tales que:
A. = A 1 u (A 2
-
A 1 ) u (A 3 - A 2 ) u {A4 - A 3 ) u ···u (A. - A.- 1 )
tomando límites cuando n tiende a infinito tenemos: lím A.= A 1 u (A 2
-
A 1) u (A3 - Az) u···
[7.5]
Como la sucesi~n {A.!} es decreciente, entonces la sucesión de sus sucesos complementarios {A. j} es creciente y, consecuentemente, el complementario del suceso A representado en la expresión [7.6], aplicando las leyes de Morgan, será: A
= A1 u A2 u A3 u · · · = lím A. =
u :A. 00
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
350
2.
y según el teorema 7.7 P(A) = P(lím An)
= P(
n-+oo
Según vimos en el teorema 7.5, teníamos la expresión: A= (AnB)u(AnB)
UAn)
Luego
n=l
y por el teorema 7.2 P(A) = 1 - P(A)
P(A) = P[(A n B) u (A n B)] = P(A n B) =
1 - lím P(AJ
=1-
lím [1 - P(An)]
= lím
P(An)
1 2
n-+ oo
n-+ oo
n-+ oo
= lím
P(AJ
n-+oo
= P(lím
An)
=
P(
0
+ P(A u
B)
1 + P(AnB) 6
- =-
luego P(A)
351
-
. 1
P(A n B) =
An)
1
2
1
2 - 6 = 6= 3
n-1
n-+oo
3.
como queríamos demostrar.
Aplicando el teorema 7.2, tenemos: P[(A u B)] = 1 - P(A u B)
Ejemplo 7.1 Sean los sucesos A, By
Pero según el teorema 7.5
e con probabilidades 1
1
P(A)=l,
P(B)=3
y
1 P(C)=¡
P(A u B)
= P(A) + P(B) -
P(A n B)
1 2
1 3
Por tanto, sustituyendo se tiene:
y tales que
1
P(AnB)
=6
---
P[(A u B)]
=1-
Ane=qy Bne=qy
4.
2 1 - = 3 3
Teniendo en cuenta las leyes de Morgan, sabemos que:
Obtener l.
P[(A nB)],
luego
2. P(AnB), 3. P[(A uB)],
4.
-
-
P(A n B)
---
5.
5. P[AuBuC].
1 3
= P(A u B) = -
P(AnB)y
Sabemos que: Ane=qy
Solución:
Bne=qy
l. Teniendo en cuenta el teorema 7.2, tenemos:
---
1 6
5 6
P[(A n B)] = 1 - P(A n B) = 1 - - = -
1 2 = 6 3
=- +- - -
Pero (A u B) n e = (A n C) u (B n C) = qy
352
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J. PROBABILIDAD
luego (A u B) y C son sucesos disjuntos y teniendo en cuenta el axioma A.III resulta: 2 1 11 P(A u Bu C) = P[(A u B) u C] = P(A u B) + P(C) = 3 + ¡ = 12
353
Pero por el teorema 7.5 tenemos P(A u B) = P(A)
+ P(B)
- P(A n B)
Y por el teorema. 7.4, Ejemplo 72 P(A uB)
Analizadas las estadísticas de visitantes a los museos de una ciudad durante el año 2000 se ha observado que 1.000.000 de personas han visitado el total de museos. En particular se sabe que 700.000 personas han visitado el museo A y 500.000 han visitado el museo B, y no se tiene información del resto. Obtener: l. La probabilidad de 2. La probabilidad de 3. La probabilidad de 4. La probabilidad de
que que que que
~
1
Luego P(A)
+ P(B)
- P(A n B) ~ 1
O, 7 + 0,5 - P(A n B) 0,2
un visitante visite el museo A. un visitante visite el museo B. visite los dos museos A y B. visite al menos uno de los dos museos.
~
~
1
P(AnB)
Resulta que 0,2 ~ P(A nB) ~ 0,5
Solución:
4.
Designamos por A el suceso de visitar el museo A, análogamente por B el suceso de visitar el museo B, y llamamos C al suceso visitar otros museos.
Razonando de manera análoga al apartado anterior tenemos:
l.
Teniendo en cuenta la definición de probabilidad, tenemos que: - 700.000 P(A) - 1.000.000 -
2.
El suceso «que visite al menos uno de los museos» lo representamos por A u B, luego tenemos que calcular P(A u B).
o7 '
= P(A) :( P(A) + P(A nB) = P(A u
B) :( 1
0,5
= P(B) :( P(B) + P(A n
B) :( 1
3. El suceso «que visite los dos museos A y B» lo designamos por A n B, luego tenemos que calcular P(A n B). Sabemos que A= (A nB)u(AnB) B = (A n B) u (A n B)
Luego P(A nB) ~ P(A nB)
0,7
P(A n
0,5
P(A nB)
Ejemplo 7.3
La probabilidad de que un estudiante A apruebe el examen final de Estadística es 0,7, la de otro estudiante Bes 0,5 y la probabilidad de que aprueben los dos estudiantes es 0,4. Obtener las probabilidades de los siguientes sucesos: l. Que al menos uno de los dos apruebe el examen. 2. Que ninguno apruebe el examen. 3. Solamente uno apruebe el examen. Solución:
Designamos por:
Por tanto podemos decir que ~
0,5
= P(A u
0,7 ~ P(A u B) ~ 1
500.000 = 0,5 1.000.000
+ P(A nB) = P(A) = B) ~ P(A n B) + P(4 n B) = P(B) =
B)
luego
Análogamente P(B) =
0,7
-
Suceso A: el estudiante A aprueba. Suceso B: el estudiante B aprueba.
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
354
7.6.
Entonces P(A) = 0,7 P(B) = 0,5 P(A nB)
1.
= 0,4
El suceso «que al menos uno de los dos apruebe el examen» será: A 1 = AuB
luego P(A 1 ) = P(A u B) = P(A)
2.
+ P(B)- P(A n
B) = 0,7
+ 0,5 - 0,4 = 0,8
El suceso «que ninguno apruebe el examen» será: A 2 =AnB=AuB
Luego P(A 2 ) = P(A u B) = 1 - P(A u B) = 1 - 0,8 = 0,2
3. El suceso «que solamente uno apruebe el examen» será A3
= (A n B) u (A n B) = A 6. B
pero como estos sucesos (A n
Ji) y (A n
P(A 3 ) = P(A n B)
B) son disjuntos
+ P(A n B)
355
Probabilidad condicionada
En los apartados anteriores hemos introducido el concepto de probabilidad considerando que la única información sobre el experimento era el espacio muestral. Sin embargo, hay situaciones en las que se incorpora información suplementaria respecto de un suceso relacionado con el experimento aleatorio en cuestión cambiando su probabilidad de ocurrencia. Así pues, el hecho de introducir más información, como puede ser que otro suceso ha ocurrido, conduce a que determinados resultados no pueden haber ocurrido, variando el espacio de resultados y cambiando consecuentemente sus probabilidades. Consideremos dos sucesos relacionados de tal manera que la probabilidad de que ocurra un suceso depende de si el otro suceso ha ocurrido o no. Por ejemplo, sea un experimento que consiste en observar si el dólar sube (aumenta de valor) frente a la peseta. Designamos por A el suceso «el dólar sube frente a la peseta .en el mercado español antes de que nuestro mercado abra a las nueve de la mañana» y sea B el suceso «el dólar sube en el mercado americano después de abrir». Ambos sucesos, A y B están relacionados, ya que los mercados se moverán probablemente en la misma dirección muchos días, pero no necesariamente todos los días. Por lo tanto la P(B) de que el dólar subiría frente a la peseta en el mercado americano no es igual que la probabilidad de que ocurra el suceso B (que el dólar suba en el mercado americano después de abrir) cuando se conoce que el dólar ha subido en el mercado español, suceso A. Por ejemplo, supongamos que el dólar sube frente a la peseta el 70% de los días en el mercado español y el 60 % de los días en ambos mercados, el americano y el español, es decir: · P(A) = 0,7
Sabemos que
P(AnB)
A= (AnB)u(AnB)
=>
P(A) = P(AnB)
= (A n B) u (A n
=>
P(B) = P(A n B)
B
B)
+ P(AnB) + P(A n B)
= 0,6
Entonces, si se sabe que el dólar sube, frente a la peseta, en el mercado español, la probabilidad de que habiendo sucedido esto suba en el mercado americano será:
de donde se deduce que P(AnB) 6 P(A) = 7 ~ 0,86
P(AnB) = P(A)- P(AnB) P(AnB)
= P(B)- P(AnB)
y sustituyendo en la expresión de P(A 3 ) tenemos: P(A 3 ) = P(A) - 2 · P(A n B)
+ P(B) = O, 7 - 2 · 0,4 + 0,5 = 0,4
A este cociente P(AnB) P(A)
356
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
PROBABILIDAD
se le llama probabilidad condicionada del suceso B, cuando el suceso A ha ocurrido y se denota de la forma P(B/A) =
A.III.
357
Sea {A;} una sucesión de sucesos disjuntos dos a dos, entonces
P(AnB) P(A)
En efecto:
Definición 7.1. Probabilidad condicionada. p
Dados un espacio probabilístico (E, .stJ., P) asociado a un experimento aleatorio, y un suceso A E .stJ., tal que P(A) > O. Para cualquier suceso B E .stJ., se define la probabilidad condicionada de B dado A o probabilidad de B condicionada a A como sigue 3 P(B/A) =
P(A n B) P(A)
oo
(
U AjA
)
P[(.D A;) nA] = --•-_1_ - - -
=
P[_U
P(A)
i=l
(A¡ nA)]
~·-=~1---,----=
P(A)
Ycomo los sucesos A 1 nA; A 2 nA, ... son disjuntos dos a dos se verifica que
[7.7]
, P(A) > O
y sustituyendo, resulta:
p( UAjA)= f
Se puede probar fácilmente que la probabilidad condicionada cumple los tres axiomas de Kolmogorov. En efecto:
i=l
A. l.
VB
E
=
P(B nA) ::::; P(A)
=
L P(AjA) i=l
Este axioma también se verifica para el caso de que tengamos un número finito de sucesos en .stJ.. Luego efectivamente se verifican los axiomas de Kolmogorov. Partiendo de la definición de la probabilidad condicionada P(B/A), dada por la expresión [7.7], podemos escribirla en forma de producto, llegando a obtener la regla de multiplicación de probabilidades o probabilidad compuesta, dada por:
P(A n B) .stJ., P(B/A) = P(A) ~ O
pues el cociente entre dos cantidades no negativas es otra no negativa. Además, como: BnAcA
i=l
P(A; nA) P(A)
P(BnA) P(A) ::::; 1
P(A n B) = P(A) · P(B/A)
Luego:
[7.8]
Análogamente, considerando la probabilidad condicionada P(A/B): O::::; P(B/A)::::; 1
A. U.
P(A/B) = P(A n B) P(B) '
')
\
P(E/A) = 1
P(B) > O
tendríamos que:
En efecto: _ P(E n A) P(E/A) P(A)
= P(A) = P(A)
1
P(A n B) = P(B) · P(A/B)
[7.9]
de donde igualando las expresiones [7.8] y [7.9] tendremos: 3
Observemos que si P(A) =O, entonces no tiene sentido esta definición, pues la P(B/A) se hace infinito. Esto se puede evitar haciendo una definición más rigurosa (Wilks, pág. 25).
P(A)·P(B/A) = P(B)·P(A/B)
[7.10]
358
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
La definición de probabilidad condicionada dada por la expresión [7.7] se puede extender a cualquier número finito de sucesos del espacio mues,tral. Así pues, para el caso de tres sucesos A, B y C tendremos:
PROBABILIDAD
de donde se tiene que: P(A/B)
= P(A) · P(B/A) = 0,95 · 0,7 =
P(AnBn C) P(A/B n C) = P(B n C) , P(B n C) > O
o bien: P(AnBn C) P(C) ,
P(C) >O
Ejemplo 7.4 Una entidad bancaria pretende introducir un sistema casi automático de concesión de préstamos para autoconsumo de importe máximo 10.000 euros, y para ello analiza su fichero de los préstamos, de características parecidas, que han sido concedidos en los últimos años llegando a obtener la siguiente información:
-
P(B)
0,8
0,665 ~ 0 83 0,8 - • ·
Ejemplo 7.5 P(A n B/C) =
-
359
El 5 % de los préstamos que se concedieron en ese período presentaron algún problema en el pago. El 70 % de las peticiones de préstamo que se habían hecho en el período analizado, se informaron favorablemente, cuando no ha habido incumplimiento de pagos según se sabe en la actualidad, y se concedieron de acuerdo con los baremos exigidos en aquella época por el banco.
En la actualidad el 80 % de las solicitudes de este tipo de préstamos cumplen automáticamente las condiciones fijadas por el banco, informándose favorablemente. Determinar la probabilidad de que estas peticiones que son informadas favorablemente no presenten ningún problema en el momento de la cancelación del préstamo.
. El dueño de_ una tienda de ropa para hombres ha observado el comportamiento de sus clientes durante un largo período de tiempo. Como consecuencia de ese período de observación afirma que la probabilidad de que un cliente que entra a la tienda compre una camisa es 0,4, pero de los que compran una camisa el 50% compran también una corbata, y solamente un 10% compran la corbata cuando no han comprado la camisa. Obtener las probabilidades de que los clientes compren lo siguiente: l. Una camisa y una corbata. 2. Una corbata. 3. Una camisa o una corbata. 4. Una corbata pero no una camisa. Solución:
Consideraremos los dos sucesos básicos: C: Compra una camisa. B: Compra una corbata. Sabemos que P(C) = 0,4
Solución:
P(B/C)
Designemos los siguientes sucesos: A: Suceso incumplimiento en el pago, P(A) = 0,05. B: Suceso informe favorable de la solicitud, P(B) = 0,80. B/A: Suceso informe favorable cuando no ha habido incumplimiento de • pago, P(B/A) = 0,7. A/B: Suceso cumplimiento en el pago cuando el informe ha sido favorable.
La probabilidad que se pide es: P(A/B), la cual se obtendrá utilizando la expresión: P(A) · P(B/A) = P(B) · P(A/B)
= 0,5
P(B/C) = 0,1
El espacio muestra] para este experimento aleatorio será: E= {CnB, CnB, CnB,
CnB}
Las probabilidades de los sucesos que nos piden son: l.
Probabilidad de comprar una camisa y una corbata: P(C n B) = P(C) · P(B/C)
= 0,4 · 0,5 =
0,2
T PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
360
7.6.1.
2. Probabilidad de comprar una corbata P(B) = P[( e n B) u (C n B)] = P( e n B)
+ P(C n B) =
0,2 + 0,06 = 0,26
=
361
Teorema de la probabilidad compuesta o producto
Sean n-sucesos A 1 , A 2 ,
... ,
An
E
d, y tales que
ya que P(C n B) = P(C) · P(B/C) = 0,6 · 0,1 = 0,06
3.
entonces se verifica q~e:
Probabilidad de comprar una camisa o una corbata
P(A 1 n A 2 n · · · n An) =
P(euB) = P[(enB)u(enB)u(enB)] =
+ P( e n B) + P(C n B) = = 0,2 + 0,2 + 0,06 = 0,46
=
P( e n B)
=
pues
P(A 1 )·P(A 2 /A 1 )·P(A 3 /A 1 nA 2 )· ... ·P(AjA 1 n ... nAn_ 1 ) [7.11]
Demostración: P(enB) = P(C)·P(B/C) = 0,4·0,5 = 0,2
Veamos en primer lugar que las probabilidades condicionadas que intervienen están definidas, para ello podemos escribir:
o bien, directamente P(e u B) = P(e)
+ P(B)- P(e n B) =
0,4
+ 0,26- 0,2 =
0,46
y teniendo en cuenta el Teorema 8.3, tendremos: 4. Probabilidad de comprar una corbata pero no una camisa: P(C n B) = P(C). P(B/C) = 0,6 · 0,1 = 0,06
El correspondiente árbol de probabilidad sería:
rlB
Prc)
-
()
¡C)"" '
\
B
CnB
P(CnB)=0,2
CnB
P(CnB)=0,2
CnB
P(CnB)=0,06.
lo cual prueba que efectivamente las probabilidades que intervienen en las probabilidades condicionadas de la expresión [7.11] están bien definidas, es decir, son mayores que cero las probabilidades de los sucesos que condicionan. Para demostrar la expresión [7.11], lo haremos por recurrencia, partiendo del caso de dos sucesos A 1 , A 2 , sabemos que:
de donde:
Análogamente, para tres sucesos tendremos:
""O,6
P(A 1 n A 2 n A3) = P[(A 1 n A 2 ) n A3 ] = P(A 1 n A 2 ) • P(A 3 /A 1 n A 2 ) P(ii/Cj""0,9
B
CnB
P(C n
ii) =0,54
=
P(A 1 ) • P(A 2 /A 1 ) • P(A 3 /A 1 n A 2 )
362
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
PROBABILIDAD
y en general se tiene:
Ejemplo 7.6
P(A 1 n ···nA,.)= P[(A 1 n ··· nAn_ 1)nAJ = P(A 1 n ··· n An_ 1) · P(A,jA1 n ··· n An-1) = P(A 1) · P(A 2 /A 1) · P(A 3/A 1 n A 2 )· ••• • P(A,jA 1 n ··· n An_ 1)
7.6.2.
363
Una empresa constructora dedicada a la construcción y venta de viviendas en tres grandes municipios de Madrid M 1 , M 2 y M 3 , vende en el municipio M 1 el 60 % de las viviendas, en el municipio M 2 el 30 % y en el municipio M 3 el 10% de las viviendas construidas. De experiencias anteriores tanto de esta empresa como de otras se sabe que un determinado porcentaje de familias no efectúan el pago de las letras mensuales que previamente habían aceptado,· siendo este porcentaje del 2 %, del 4 % y del 6 %, en cada municipio respectivamente. Determinar la probabilidad de que una familia cualquiera pague sus letras.
Teorema de la probabilidad total
Sean n-sucesos disjuntos, A1, A 2 , P(AJ > O,
í
••• ,
An
E
.stt, con
= 1, 2, ..., n
Solución:
y tales que forman un sistema completo de sucesos, es decir, que
Sean los sucesos: M 1 : la familia es del municipio M 1 M 2 : la familia es del municipio M 2 M 3 : la familia es del municipo M 3 B: la familia paga las letras.
n
U A;=E i= 1
Entonces para cualquier suceso B E .stt, cuyas probabilidades condicionadas P(B/A;) son conocidas, se verifica que:
Del enunciado se deduce: P(M 1) = 0,6,
P(M 2) = 0,3,
P(M 3 ) = 0,1,
n
P(B)
=
L P(AJ. P(B/A;)
[7.12]
P(B/M 1) = 0,02,
i= 1
P(B/M 2 ) = 0,04,
P(B/M 3) = 0,06
P(B/M 2 ) = 0,96,
P(B/M 3 ) = 0,94
y consecuentemente: Demostración:
P(B/M 1 ) = 0,98,
Sabemos que:
n
U (B n A;), unión de sucesos disjuntos i=l
luego
¡¡
Podemos aplicar el teorema de la probabilidad total, pues los tres sucesos forman un sistema completo de sucesos, ya que los tres sucesos son disjuntos, pues cada familia que compra una vivienda es solo de uno de los tres municipios y la unión de los tres sucesos nos da el suceso seguro E. Luego tendremos que la probabilidad de que una familia cualquiera pague sus letras será:
!1
t1
3
P(B) =
L
P(M J. P(B/M J = P(M 1). P(B/M 1) + P(M2). P(B/M2) + P(M 3). P(B/M3)
i=l
= 0,6. 0,98 + 0,3. 0,96 + 0,1· 0,94 = 0,97
364
7.6.3.
Teorema de Boyes
litudes nos permiten modificar nuestro grado de creencia original, obteniendo la probabilidad a posteriori P(AJB). En resumen, diremos que es muy corriente llamar a las probabilidades que aparecen en la expresión [7.13] del teorema de Bayes como sigue: · P(AJ: Probabilidades a priori, se asignan inicialmente al suceso. P(AJB): Probabilidades a posteriori. P(B/A;): Verosimilitudes. Podemos decir que el teorema de Bayes, además de ser una aplicación de las probabilidades condicionadas, es fundamental para el desarrollo de la estadística bayesiana, la cual utiliza la interpretación subjetiva de la probabilidad, es decir, considera que la probabilidad viene afectada por la experiencia previa, la cual va a influir en nuestro grado de creencia y consecuentemente en la probabilidad que le asignamos al suceso en cuestión, y ésta sería una probabilidad subjetiva.
Admitimos las mismas hipótesis de partida del teorema de la probabilidad total. Es decir, sean n-sucesos disjuntos A 1, ..., An E .stl, con P(A;) > O y tales que forman un sistema completo de sucesos, entonces para cualquier suceso B E .stl, se verifica:
P(AJB)
=
P(A;) · P(B/AJ n
L
[7.13]
P(A;)·P(B/A;)
i=l
Demostración: Teniendo en cuenta las expresiones [7.8] y [7.9], tenemos que: P(A¡nB)
Ejemplo 7.7
= P(AJ·P(B/AJ = P(B)·P(AJB)
Un banco analiza las fechas de los cheques que emiten sus clientes y llega a la conclusión de que las personas que tienen fondos en su cuenta corriente emiten cheques con fecha posterior, solamente en un 0,2 % de los casos. Sin embargo, el 95 % de las personas que no tienen fondos en su cuenta corriente emiten cheques con fecha posterior. También se conoce que en general la proporción de cheques que llegan a la ventanilla del banco y que tienen fondo es del 92 %. En un determinado instante se recibe un cheque en caja con fecha atrasada, determinar la probabilidad de que ese cheque sea de un cliente que no tiene fondos en su cuenta.
y de aquí deducimos que P(AJB) = P(AJ·P(B/AJ P(B)
y teniendo en cuenta el valor dado a P{B), en el teorema de la probabilidad total [7.12], resulta: P(AJB)
=
P(A;) · P(B/AJ
Solución: A1 : El cheque que se recibe es de un cliente sin fondos. A 2 : El cheque que se recibe es de un cliente con fondos. B: El cheque que se recibe tiene fecha atrasada.
n
L
365
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
P(AJ·P(B/A¡)
i=l
Examinando ambos teoremas se pone de manifiesto que el teorema de Bayes, en cierto modo, responde a la inversa de como lo hace el teorema de la probabilidad tótal, pues en este último se han realizado los sucesos A; y entonces hacemos inferencia sobre la realización del suceso B, sin embargo, en el teorema de Bayes de la realización del suceso B inferimos sobre· la realiza- ' ción de cada A¡. En ambos teoremas partimos de un sistema completo de sucesos A. i = 1 2, ..., n, los cuales pueden ser interpretados como hipótesis, a sus probabilidade~ P(AJ se les llama probabilidades a priori, ya que son las que se asignan inicialmente a los sucesos A¡, y a las probabilidades P(B/AJ se les considera como verosimilitudes del suceso B admitiendo la hipótesis A;. Estas verosimi-
Del enunciado tenemos que: P{A 1 ) = 0,08;
P(A 2 )
= 0,92;
P(B/A 1 )
= 0,95;
P(B/A 2 )
= 0,002
Nos piden P(A¡jB) que será según la expresión [8.12] del teorema de Bayes: P{A 1 ) · P(B/A 1 ) P(A¡jB) = P(A 1)· P(B/A 1 ) + P(A 2 ) • P(B/A 2 ) 0,08 ·0,95 0,08. 0,95 + 0,92. 0,002
--~--'----- ~
,¡
0,98
366
7.7.
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Independencia de sucesos
367
igualando las expresiones [7.14] y [7.15],
En el apartado 7.6 definíamos la probabilidad del suceso B condicionada por el suceso A, P(B/A), y considerábamos que la información que se tiene del suceso A tiene algún efecto sobre la probabilidad del suceso B, de tal manera que podremos decir:
P(A) · P(B)
= P(B) · P(A/B)
luego P(A) = P(A/B)
Cuando P(B/A) > P(B) entonces el suceso A favorece al B, y Cuando P(B/A) < P(B) entonces el suceso A desfavorece al B.
y las tres condiciones son equivalentes.
Si admitimos que la ocurrencia del suceso A no tiene ningún efecto sobre el suceso B, y consecuentemente la P(B/A) es igual a la probabilidad marginal, P(B), es decir
Por tanto, podemos decir que si el suceso B es independiente del suceso A, entonces el suceso A también es independiente del suceso B, lo que equivale a decir que ambos sucesos son mutuamente independientes.
P(B/A) = P(B)
La definición de independencia se puede extender a más de dos sucesos. Así pues, diremos que los sucesos A, B y C son independientes si se verifican las siguientes condiciones.
entonces el suceso B es independiente del suceso A, surgiendo así el concepto de independencia estocástica o independencia de sucesos. Diremos que dos sucesos A y B son independientes si se verifica una cualquiera de las siguientes condiciones equivalentes:
l. P(A n 2. P(A n 3. P(B n 4. P(A n
l. P(B/A) = P(B), si P(A) >O. 2. P(A/B) = P(A), si P(B) >O. 3. P(A n B) = P(A) · P(B).
Las tres primeras condiciones indican la independencia dos a dos, y para que sean los tres sucesos independientes en su conjunto o mutuamente iildependientes se tiene que verificar también la cuarta condición. En general, diremos que n-sucesos A 1 , A 2 , ..., An son mutuamente independientes, o en su conjunto, si se verifican para
Estas tres condiciones son equivalentes, en efecto: P(AnB) P(A) ,
P(B/A) =
B) = P(A) · P(B). C) = P(A) · P(C). C) = P(B) · P(C) B n C) = P(A) · P(B) · P(C).
si P(A) >O
l~i
si B es independiente de A, P(B/A)
= P(B) =
.. ·~n
las siguientes condiciones:
P(A nB) P(A)
P(A¡ n Ai) = P(A¡) · P(A)
de donde P(A n B) = P(A) · P(B)
P(A¡ n Ai n Ak) = P(AJ · P(Ai) · P(Ak)
[7.14]
pero, también sabemos que P(A/B) =
P(AnB) P(B) ,
si P(B) > O
1
de donde P(A n B) = P(B) · P(A/B)
[7.15]
1
El número de condiciones serán:
(;) + (;) + ... + (:) = 2"- n- 1
368
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
369
PROBABILIDAD
ya que del binomio de Newton tenemos:
2" = (1
+ Í)" =
f (n)
x=O
=
=
Si solo se verifican las
G)
P(B/C)
X
=
7 0,0 = 0,175 "# P(B) 0,4
=>
By e no
indepe~dientes
Una consecuencia inmediata de la definición de independencia de sucesos la podemos dar mediante el siguiente teorema.
(~) + G) + xt2 (:) 1+n+
P(B n C) P(C)
=
Teorema 7.9
f (n)
Si A y B son dos sucesos independientes entonces también lo son los sucesos
x=2 X
A y B,
primeras condiciones entonces diremos que son
A y B
y
A y B
independientes dos a dos. Demostraci6n:
Ejemplo 7.8
Si A y B son independientes entonces se verifica que
En una gran ciudad se venden tres periódicos, y se sabe por· diferentes estudios que el 20 % leen el periódico A, el 30 % el periódico B, el 40 % el periódico e, el 6 % leen el A y el B, el 7 % leen el B y e y el 12 % leen el A y C. Decir si son independientes los sucesos «leer cada uno de los periódicos».
P(A/B) = P(A) P(B/A) = P(B) P(A n B) = P(A) · P(B)
y tendremos: Soluci6n:
= 1 - P(A/B) = 1 - P(A) = P(A)
=>
A y B independientes
P(B/A) = 1 - P(B/A) = 1 - P(B) = P(B)
=>
A y B independientes
P(A/B)
Sean los sucesos: A: Leer el periódico A. B: Leer el periódico B. C: Leer el periódico C.
- P(A/B)
Las respectivas probabilidades son: P(A)
=
P(A n B) P(AuB) P(B) = P(B)
1 - [P(A)
= 0,06, P(B n
P(A nB) P(B)
0,06 = 0, 3 = 0,2 = P(A)
=>
O 12 = 0,3 "# P(A) 4
=>
C)
= 0,07, P(A n
C)
1 - P(A u B) P(B)
P(A n B)] =
P(B)
= 0,2, P(B) = 0,3, P(e) = 0,4
P(A n B)
+ P(B) -
=
= 0,12
1 - P(A) - P(B)
+ P(A) · P(B) =
P(B) P(A/B)
P(A/C)
= =
P(An C) P(C)
=
¿,
A y B independientes
[1 - P(A)] [1 - P(B)]
=
P(B) A y e no independientes
= P(A) · P(B) = P(A)
P(B)
=>
A y B independientes
1
371
PROBABILIDAD
Razonando de modo similar al ejercicio anterior,
Ejer~icios
3.
Un lote de 5 piezas tiene una defectuosa. En el envío del lote de la fábrica al comerciante, se pierde una de las 5 piezas en el transporte. De las cuatro piezas que llegan se examina una de ellas y resulta ser no defectuosa. ¿Cuál es la probabilidad de que la pieza perdida sea la defectuosa?
l. En una división empresarial trabajan 18 hombres y 12 mujeres. Se seleccionan 3 persona al azar y con igual probabilidad para cada trabajador. Hallar la probabilidad de que todas las personas seleccionadas sean mujeres.
Solución: De fábrica hay 4 buenas y 1 defectuosa. Se pierde una en el transporte, con lo que pueden llegar:
Solución: Sean los sucesos: S;: ser mujer la seleccionada en la i-ésima extracción, i = 1, 2, 3.
A1
n S;.
=4 buenas, con probabilidad 1/5,
3
El suceso cuya probabilidad nos piden es:
P(A 1 ) = 1/5.
A2
i=l
Aplicando la regla del producto:
= 3 buenas y
1 defectuosa, con probabilidad 4/5, P(A 2 ) = 4/5.
Se selecciona una pieza de A 1 o A 2 y resulta ser buena (Suceso que llamamos B). La pro habilidad pedida es: P(A 1 IB).
Hemos aplicado la regla de Laplace para el cálculo de cada probabilidad, de S 1 , (S2 1S 1 ) y (S 3 IS 1 n S2). El suceso (S 2 I S 1 ) indica que en la segunda selección se obtiene a una mujer, siempre que en la primera selección se obtuvo otra mujer que no podrá ser seleccionada en sucesivas extracciones. El suceso (S 3 IS 1 11 S2) indica que se selecciona una mujer, supuesto que previamente se seleccionaron otras dos que no podrán volver a ser seleccionadas en la tercera extracción.
Es decir si la seleccionada al final es buena, la probabilidad del suceso A 1 es la de qu; haya al final 4 buenas y por ello la 5.• perdida era defectuosa. A 1 y A 2 son dos sucesos mutuamente excluyentes y exhaustivos. Por ello podemos aplicar la fórmula de Bayes con n = 2,
P(A 1 IB) = P(A 1 ) P(BIA 1 )
2.
En un pedido de 10 electrodomésticos se sabe que uno de ellos está defectuoso de fábrica. En un día se venden 3 de ellos. Calcular la probabilidad de que se vendan tres en buen estado.
+ P(A 2 ) P(BIA 2 )
1/5 ·1 1/5. 1 + 4/5. 3/4
Solución:
1/5
1/5
1
+ 3/5
4
Podemos deducir también que:
Sean los sucesos: Bi: el i-ésimo electrodoméstico vendido está en Buen estado, i = 1, 2, 3. El suceso cuya probabilidad nos piden es B1 11 B 2 11 B 3 •
P(A 2 1 B) 1
l, -1
1
3
= 1- P(A 1 IB) = 1- ¡ = 4'
372
373
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEl'TAS, J.
5.
En una exposición náutica se han presentado 30 embarcaciones de recreo y 38 de tipo industrial, pesquero o de servicios (policía, Cruz Roja, etc.). Un visitante ha hecho un pedido de 2 embarcaciones distintas, entre las expuestas. Sabiendo que cada embarcación tiene la misma probabilidad de que se adquiera, y además que una de la 2 embarcaciones pedidas es de recreo, calcular la probabilidad de que la otra también sea de recreo.
es decir, si la pieza examinada del lote que se recibe es buena, la probabilidad de que se haya perdido en el transporte una pieza buena, es 3/4.
4.
Una empresa dispone de tres factorías que producen 1.000, 2.000 y 4.000 productos respectivamente. La proporción de productos que no superan el control de calidad es de 0,01; 0,02 y 0,03 respectivamene. Calcular: ·
Soluci6n:
La probabilidad de que un producto de la empresa no supere el control de calidad. b) Si se observa un producto y supera el control de calidad, ¿cuál es la probabilidad de que haya sido fabricado en la 3.a factoría?
a)
I.Jamamos R; al suceso consistente en pedir una embarcación de recreo en i-ésimo lugar, sin reemplazo de otra similar a la exposición antes del siguiente pedido unitario «i + 1». Nos piden la probabilidad del suceso:
Soluci6n:
P(R 2IR 1) =
a) Cualquier producto ha sido fabricado en la La, 2.a o r factoría y sólo en una de ellas. Llamamos F 1 , F 2 y F 3 al suceso «El producto ha sido fabricado en la I.R, 2.a ó 3.a factoría respectivamente». Llamamos e al SUCeSO «SUpera el Control de calidad de la empresa» y C será su complementario. Por el teorema de la probabilidad total, P(C) = P(F 1)P(CIF 1)
29 (por la regla de Laplace), 67
o bien por la definición de probabilidad condicionada
P(R2IR 1) =
+ P(F 2)P(CIF2) + P(F 3)P(CIF3) =
C~) /(~)
P(R1 n R2) e3o 2/ e6s 2 P(R) =e . ¡e 68,1 . = (30)/(68) = 1 30.1
1
1.000 2.000 4.000 = 7.000 0,01 + 7.000 0,02 + 7.000 0,03 = o
o
1
o
30· 29/68 67 2 2 30/68 o
1 4 12 17 =-+-+-=700 700 700 700 4 b)
l C) =
P(F 3
P(F 3 )P(e!F 3 ) = P(F 3 )[1- P(CIF 3 )] = P(C) 1 - P(C)
4 -7·0,97
0 03 ' ) 17 1 -700 1
7(
6.
-
En un país, la probabilidad de que una empresa industrial contamine, si hay ley ecológica, es de 0,01. La probabilidad de que se promulgue una ley ecológica es 0,5, y la probabilidad de que una empresa industrial contamine es 0,1. Calcular:
388
=~=683"
700
A ~;
·('
Apli_cando la definición de probabilidad condicionada, y usando la propiedad P(S) = 1 - P(S), y el apartado a) de este mismo ejercicio.
29 67"
Y·¡ ·~:i
f
il
La probabilidad de que la empresa no contamine y haya ley ecológica. La probabilidad de que contaminando la empresa, haya ley ecológica. La probabilidad de que no habiendo ley ecológica, la empresa no contamine. d) La probabilidad de que habiendo ley ecológica, la empresa no contamine.
a) b) e)
374 Soluci6n:
P( A 1 1B)
Llamamos L al suceso «Se promulga ley ecológica», y empresa contamina». Datos del problema: P(eiL)=0,01 a)
; P(L)=0,5
;
e
e)
P(A 1 11 B)
P(e)=0,1
P(A
)
P(B 1A
)
1 1 = --:-1-=..:........!"----:...._:_____:.:_ 0
I
P(B)
P(A¡) P(B 1A¡)
i=O
llamando A¡ al suceso «el primer grupo tiene i libros mal clasificados», i =O, 1, 2, ... , 10. {A;}{2 0 es una colección de sucesos mutuamente excluyentes y exhaustiva, por lo que aplicamos el teorema de la probabilidad total:
= 0,5 . 0,99 = 0,495
P(LI C) =
=
al suc~so «la
P( e 11 L) = P(L) P(CIL) = 0,5 · [1 - P( CIL)] = 0,5 · [1 - 0,01] =
b)
375
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
P(B) =
¡~o P(A¡) P(B
1
A;) = (ya que P(B 1 A 0 ) =
O)
P(L 11 C) P(L) - P( e 11 L) 0,5 - 0,495 0,005 1 P(C) = P(C) = 0,1 = (},1 = 20
- P(e 11L) 0,405 0,405 0,405 405 81 P(eiL) = P(L) = 1- P(L) = 1-0,5 = = 500 = 100 = 0' 81
0:S
Puesto que: 1- P(C) = P(C) = P(e11L)
+ P(e11L) = 0,495 + P(e11L)
= p(e 11 L) = o,9 d)
=>
o,495 = 0,405.
P(e11L) 0,495 495 99 P(eiL) = P(L) = = 500 = 100 = 0' 99 ·
0:S
De este ejemplo teórico se deduce que de no haber ley ecológica a haberla,
la probabilidad de que la empresa no contamine aumenta del 81% (apartado e)) al 99 % (apartado d)).
7.
Una estantería del jefe de contabilidad de una empresa tiene 10 libros de facturación de bienes de consumo familiar y 11 libros de facturas de bienes de servicios y maquinaria para otras empresas. Al pasar el servicio de limpiezas deja en desorden esta clasificación. El jefe de contabilidad, al consultar un libro de facturas del primer grupo de 10 observa que está mal clasificado pues corresponde al segundo grupo. ¿Cuál es la probabilidad de que sea el único libro mal clasificado del primer grupo de 10 libros? Soluci6n:
Si llamamos A 1 al suceso «el primer grupo tiene un solo libro mal clasificado» y B al suceso «al extraer un libro del primer grupo, el libro está mal clasificado», la probabilidad pedida es:
i~l 10
8.
(11)(1010 )i i
110
- - - ~ 0,000059 1.847.560
i
Un editor cuenta con dos procesadores de texto, A y B. Las probabilidades de que fallen son la misma, P, para A y B, pero el procesador A admite un fallo, mientras que B admite dos fallos antes de averiarse. ¿Qué probabilidad tiene el suceso «A se avería antes que B»? Determinarla si P = 0,05.
376
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
PROBABILIDAD
377
Solución:
Sean FA y F B los sucesos «falla A» y «falla B dos veces». Sus probabilidades son:
y
y
respectivamente. El suceso cuya probabilidad se pide es: FA n FB.
10. Un tetraedro regular tiene 4 caras (triángulos equiláteros) numeradas con los números 1, 2, 3 y 4 respectivamente. Se lanza al aire y se observa la cara inferior (base) al detenerse. El tetraedro está bien construido y por ello la probabilidad de cada cara es la misma. ¿Son independientes en probabilidad los sucesos S 1 = {1 o 2}, S2 = {1 o 3} y S3 = {2 o 3}?
donde hemos supuesto la independencia de los sucesos FA y F B• y de aquí: P(FAnFB)
=P- P·P =
2
P(1 - P 2 )
= P- P 3 = =
0,049875 (si P
=
0,05) Solución:
9. Una publicidad sobre cierto producto consta de 10 páginas con precios. Antes de proceder a su reproducción impresa, un experto en márketing ha detectado un error tipográfico en el precio de un accesorio del producto, además de que asegura que es el único error. Un empleado descuidó anotar dónde estaba el error por lo que debe revisar las páginas. Si ha revisado 2 páginas y no tienen error, ¿cuál es la probabilidad de que el error esté en una 3.a página? Solución:
pero: Llamamos E al suceso «el error está en la 3.a página que revisa» P(E)
=
1
8
(aplicando la regla de Laplace). ' Como suceso condicionado, sea D el suceso «no hay error en las dos páginas revisadas», y así la probabilidad pedida es:
P(EID) =
9 8 1 P(E n D) 10 9 8 1 P(D) =~=s· 10 9
ya que D = D 1 n D 2 siendo D; =«no hay error en la i-ésima página revisada» (i = 1, 2). Por ello:
Luego son sucesos (S 1, S2 y S3 ) estocásticamente dependientes o dependientes en probabilidad. Aunque, eso sí, son independientes dos a dos.
11. Una empresa distribuye productos agrícolas, ganaderos y pesqueros, para la alimentación. Su calidad puede ser de primera o no. Las probabilidades de que un artículo agrario, ganadero o pesquero, sea de primera calidad, son respectivamente 0,6, 0,5 y 0,7. Las proporciones de productos agrícolas, ganaderos y pesqueros son del 45 %, 35% y 20 %, respectivamente.
PROBABILIDAD
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
378 Se pide:
a) La probabilidad de que un producto de primera calidad de la empresa, sea agrario. b) Ídem, sea ganadero. e) Ídem, sea pesquero.
379
12. En un taller hay 3 máquinas la primera se avería al mes con probabilidad 0,04, la segunda con 0,06, y la tercera con 0,1. Sus averías son independientes en probabilidad. Se pide: a) b) e)
Probabilidad de que se averíe una sola máquina en el mes. Probabilidad de que se averíen las tres máquinas. Probabilidad de que se averíen la primera y segunda, pero no la tercera.
Solución:
Sean los sucesos A, G y P (productos Agrarios, Ganaderos y Pesqueros). Sea I el suceso «el producto es de primera calidad». Sabemos que:
P(I 1A) P(II G) P(IIP)
0,6} 0,5 0,7
= = =
P(A)
=
0,45}
P(G) = 0,35 P(P) = 0,2
Solución:
Teniendo en cuenta que si los sucesos I, JI y /JI son independientes en probabilidad, también lo son cualquier combinación de ellos o sus complementarios tomados de 3 en 3. (Véase el ejercicio 15). a)
El suceso a calcular su probabilidad, es:
A = (In JI n JI!) u (in JI n JI/) u (f n JI n JI/) Además A, G y P constituyen una colección de sucesos mutuamente excluyentes y exhaustiva. Por todo ello, aplicando el teorema de Bayes, tenemos:
a)
P(A 1/)
=
P(A) P(I 1A) P(I)
=
donde representamos por /, JI o JI/ a los sucesos se avería la máquina primera, segunda o tercera, respectivamente.
0,45 · 0,6 _ 0,27 _ 270 _ 54 _ 18 _ .i_ 0,585 - 0,585 - 585 - 117 - 39 - 13.
P(A)
+ P(G)P(IIG) + P(P)P(IIP) = = 0,45. 0,6 + 0,35. 0,5 + 0,2. 0,7 = 0,27 + 0,175 + 0,14 = 0,585 P(G) P(I 1G)
P(G 1 /) =
e)
P(P l I) =
P(I)
0,175
35
= 0,585 = 117
P(P)P(II P) 0,14 140 28 P(I) = 0,585 = 585 = 117
o también podía calcularse así:
P(P 1/) = 1 - P(A 1/)
-
P(G 1I) = 1
54 35 28 -m - 117 =m
dado que P u A u G es el suceso universal, y los sucesos P, A y G son disjuntos dos a dos.
=
0,03384 + 0,05184
=
P(I) = P(A)P(IIA)
b)
=
+ P(i n JI n /JI) = P(I) P(II) P(JII) + P(I) P(JI) P(JII) + P(I) P(II) P(JI/) = 0,04. 0,94. 0,9 + 0,96. 0,06. 0,9 + 0,96. 0,94. 0,1 =
=
P(I n JI n JI/) + P(i n JI n /JI)
+ 0,09024 =
0,17592
b)
P(I n JI n JI/) = P(I) P(JI) P(IJI) = 0,04 · 0,06 · 0,1 = 0,00024
e)
P(I n JI n JI!) = P(I) P(II) P(JII) = 0,04 · 0,06 · 0,9 = 0,00216
13. De un producto de consumo básico ofrecido por una empresa, se sabe que la probabilidad de satisfacer las exigencias del posible cliente es 0,901, la de que un cliente vuelva a serlo es 0,91, y la probabilidad de satisfacer al cliente si éste ha vuelto a serlo (cliente), es de 0,99. Se pide: a)
La probabilidad de que habiendo satisfecho al cliente, éste vuelva a serlo (cliente). b) La probabilidad de que no habiendo satisfecho al cliente, éste vuelva a ser cliente.
380
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
Solución:
b)
Llamamos S al suceso «cliente satisfecho» y V al suceso «vuelve a adquirir el producto». a)
!:!::
0,999889.
b)
P(V)P(SIV) 0,91· 0,01 P(VIS} = P(S) = 0,0
!:!::
0,0919191.
901
99
La satisfacción del cliente prácticamente asegura que vuelva a ser cliente, mientras que si no se le satisface no vuelve a serlo (cliente) en más del 90% de los casos.
14.
Probar, que si los sucesos A y B son independientes en probabilidad, también lo son:
A y B independientes
pendientes e)
P(V)P(SIV) 0,91· 0,99 P(VIS) = P(S) = 0,
=>
A y B independientes
a)
A, By C.
b)
e)
A, By C. -- A, By C.
d)
Ay B11C. A y BvC.
b)
A y B.
f)
A y BAC.
e)
A y B.
g)
A y B- C.
h)
AyC-B.
= P(A) P(B).
Como B = (A 11 B) v (A 11 B), unión de sucesos disjuntos. Luego
b)
=>
-
A y B independientes
a)
=>
-
A y B inde-
a)
A y B independientes A y C independientes A, B y C independientes ~ B C . d di y m epen entes { y además: P(A 11 B 11 C) = P(A) P(B) P( C).
= P(B) - P(A 11 B) = P(B) - P(A) P(B) =
A y' B independientes A y e independientes
= [1 - P(A)] P(B) = P(A) P(B),
B y C independientes y además:
P(B) = P(A11B) P(A 11 B)
B y A inde-
Solución:
A y B son independientes si y sólo si verifican P(A 11 B)
a)
=>
15. Probar, que si los sucesos A, By C son independientes en probabilidad, también lo son:
e)
a)
B y A independientes
pendientes.
A y B.
A y B son independientes si y sólo si P(A 11 B) = P(A) P(B).
=>
A y B independientes.
a)
Solución:
381
PROBABILIDAD
+ P(A11B)
al ser A y B independientes en probabilidad.
=>
Por el ejercicio 14, entonces:
B 11 C = (A
11
B 11 C) v (A 11 B 11 C),
382
CASAS-SÁNCHEZ, J. M. y SANTOS-PEÑAS, J.
16. Un sistema de seguridad tiene una probabilidad 0,05 de que se produzca un peligro al día. La probabilidad de que se active el sistema un día, habiendo peligro es de 0,99. La probabilidad de que se active el sistema un día, no habiendo peligro es del 0,02. Calcular:
unión disjunta, por lo que de la axiomática de Kolmogorov (axioma III), P(B n C) = P(A n B n C) P(A n B n C)
+ P(A n
B n C)
=
P(B n C) - P(A n B n C)
=
[1 - P(A)] P(B) P(C)
=
=>
P(B) P(C) - P(A) P(B) P(C)
=
a) La probabilidad de que habiéndose activado el sistema de seguridad, haya efectivamente peligro. b) La probabilidad de que haya peligro pero no se active el sistema.
= P(A) P(B) P(C),
por lo que A, B y C son independientes en probabilidad. b) A, B y
e
independientes a)--
Y e independientes
=>
B, A y
,:;_
A, B y C independientes
e independientes
--
=>
A,· B y
B, A
=>
e indepen-
Solución: Llamamos:
P al suceso «Se produce peligro» un día.
A al suceso «Se activa el sistema de seguridad».
dientes. Datos: e)
A, B y
e independientes
y B independientes
,:;_
b)
--
A, B y
=>
e,
e independientes
A y B independientes
=>
A
A, B y
e
P[A n (B n C)] = P(A) · [P(B) P(e)] = P(A) · P(B n e).
e)
P[A n (Bu C)] = P[(A n B) u (A n C)] =
a)
= P[(A
=
=
P(B n C)J
=
= P(A n B n C) + P(A n B n C) = P(A) P(B) P(C} + P(A) P(B) P( C) = = P(A)[P(B) P(C) + P(B) P(C)] = P(A) · P[(B n C) u (B n C)] = = P(A) P(B Ll C).
P[A n (B- C)]
h)
A, B y
= P(A n B n C) = P(A)P(B n C) = P(A)P(B- e).
e independientes => A, e y B independientes
independientes.
=
495 685
= ~ ,...,
137 - O, 7226277 .
+ P(P) P(AIP) = 0,05 · 0,99 + 0,95 · 0,02 =
0,0495 + 0,019
=
0,0685
P(P nA)
= P(P) P(AIP) = P(P) [1 - P(AIP)] = 0,05 (1 - 0,99) = = 0,05. 0,01 = 0,0005
C) u (jj n C)]} =
n B n e) u (A n B n C)]
0,0495 0,0685
= b)
P{A n [(B n
=
P(A)
P(A) = P(P) P(AIP)
C).
g)
_ P(P) P(AIP)
P son una coleccción de sucesos mutuamente excluyentes y exhaustivos por lo que podemos hacer uso del Teorema de la Probabilidad Total:
n B)
P[A n (BLl C)]
0,99
P y
+ P(A n C) - P(A n B n C) = = P(A)P(B) + P(A)P(C)- P(A)P(B)P(C) = = P(A) [P(B) + P(C)- P(B)P(C)] = P(A)[P(B) + P(C)f)
=
P(A 1 P) = 0,02
P(P 1A) -
d)
= P(A) P(B u
P(P) = 0,05
f(A 1 f.)
e,
=>
independientes.
= P(A
383
PROBABILIDAD
g)
=>
A y
e-
B
Bibliografía
ARANDA, J., GóMEZ, J.: lntroducci6n a la Estadística Econ6mica y Empresarial. DM PPU, 1992. ARNAIZ, G.: lntroducci6n a la Estadística Te6rica. Lex Nova, 1986. BARO, S.: Estadística Descriptiva. Parramón, 1985. CALOT, G.: Curso de Estadística Descriptiva. Paraninfo, 1982. CASA ARUTA, E.: 200 Problemas de Estadística Descriptiva. Vicens Vives, 1990. CASAS, J., CALLEALTA, J., NUÑEZ, J., TOLEDO, l., UREÑA, C.: Curso Básico de Estadística Descriptiva. Instituto Nacional de Administración Pública,' 1986. CASAS, J., SANTOS, J.: Introducci6n a la Estadfstica para Economía y Administraci6n de Empresas. Ed. Centro de Estudios Ramón Areces, 1996. COQUILLAT, F.: Estadfstica Descriptiva: Metodología y Cálculo. Tebar Flores, 1991. DURÁ, J. M.; LóPEZ, J. M.: Fundamentos de Estadística. Ariel, 1988. ESCUDER, R.: lntroducci6n a la Estadística Econ6mica. Tebar Flores, 1986. FREMANO, L.: Elementos de Estadística Aplicada. Euramérica, 1971. INE: Metodología. Índice de Precios de Consumo. Base, 1992. KAZMIER-DfAZ, M.: Estadística Aplicada en Administraci6n y Economía. McGraw Hill, 1992. LóBEZ URQUÍA, J.: Estadística Intermedia: Descriptiva, Probabilidades y Te6rica, Muestreo, Actuarial. Vicens-Vives, 1989. MONTIEL, A., Rius, F., BARÓN, F.: Elementos Básicos de Estadística Econ6mica y Empresarial, Prentice Hall, 1997. PEÑA, D., ROMO, S. lntroducci6n a la Estadística para las Ciencias Sociales, McGraw-Hill, 1997.
386
BIBLIOGRAFÍA
PÉREZ SUÁREZ, R.: Análisis de Datos Económicos J. Métodos Descriptivos. Pirámide, 1993. PULIDO, A., SANTOS, J ..: Estadística Aplicada para ordenadores personales. Pirámide, 1998. SIERRA BRAVO, R.: Ciencias Sociales: Análisis Estadístico y Modelos Matemáticos. Paraninfo, 1981. URIEL, E., MUÑlZ, M.: Estadística Económica y Empresarial. AC, 1988. WONNACOTI, T.: Fundamentos de Estadística para Administración y Economía. Limusa, 1981.
LffiROS DE EJERCICIOS BARO, J.: Estadística Descriptiva. Aplicaciones Económico-Empresariales. Parramon, 1985. CASA ARUTA, E.: 200 Problemas de Estadística Descriptiva. Vicens-Vives, 1979. CASAS, J. M., GARdA, C., RIVERA, L. F., ZAMORA, A. I.: Problemas de Estadística Descriptiva. Probabilidad e Inferencia. FERNÁNDEZ, C, FUENTES, F.: Curso de _Estadística Descriptiva, Teórico y Práctica. Ariel, 1995. GARCíA BARBANCHO, A.: Ejercicios de Estadística Descriptiva para Economistas. Ariel, 1975. LóPEZ ORTEGA, J.: Problemas de Estadística para Ciencias Económicas y Empresariales: Cálculo de Probabilidades. Tebar, 1994. MU1\ioz VÁZQUEZ, A. y otros: Problemas de Estadística Descriptiva, 1992. MURGUI, J. S., AYBAR, C., y otros: Estadística para Economía y Administración de Empresas: Aplicaciones y Ejercicios. Puchades, 1992.