1.1 BREVE INTRODUCCION A LA ESTADISTICA En el siglo XIX, la estadística entra en una nueva fase de su desarrollo con la generalización del método para estudiar fenómenos de las ciencias naturales y sociales. Galton y Pearson se pueden considerar como los padres de la estadística moderna, pues a ellos se debe el paso de la estadística deductiva a la estadística inductiva. Los fundamentos de la estadística actual y muchos de los métodos de inferencia son debidos a R. A. Fisher. Se interesó primeramente por la eugenesia, lo que le conduce, siguiendo los pasos de Galton a la investigación estadística, sus trabajos culminan con la publicación de la obra Métodos estadísticos para investigaciones. En él aparece la metodología estadística tal y como hoy la conocemos. A partir de mediados del siglo XX comienza lo que podemos denominar la estadística moderna, uno de los factores determinantes es la aparición y popularización de los computadores. El centro de gravedad de la metodología estadística se empieza a desplazar técnicas de computación intensiva aplicadas a grandes masas de datos, y se empieza a considerar el método estadístico como un proceso iterativo de búsqueda del modelo ideal
1.2 CONCEPTO DE ESTADISTICA ESTADISTICA La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.
1.3 ESTADISTICA DESCRIPTIVA Se puede definir como un método para describir numéricamente conjuntos numerosos. Por tratarse de un método de descripción numérica, utiliza el número como medio para describir un conjunto, que debe ser numeroso, ya que las permanencias estadísticas no se dan en los casos raros. No es posible sacar conclusiones concretas y precisas de los datos estadísticos. La finalidad última de la estadística descriptiva es resumir la información de conjuntos más o menos numerosos de datos. Para ello se asienta en un concepto
inmediato a la tarea de recuento: la frecuencia, frecue ncia, medida empírica de la ocurrencia de los distintos estados que puede presentar una variable.
1.4 ESTADISTICA INFERENCIAL INFERENCIAL Estudia la probabilidad de éxito de las diferentes soluciones posibles a un p roblema en las diferentes ciencias en las que se aplica y para ello utiliza los datos observados en una o varias muestras de la población. Mediante la creación de un modelo matemático infiere el comportamiento de la población total partiendo de los resultados obtenidos en las observaciones de las muestras. La inferencia estadística intenta tomar decisiones basadas en la aceptación o el rechazo de ciertas relaciones que se toman como hipótesis. Esta toma de decisiones va acompañada de un margen de error, cuya probabilidad está determinada. La estadística inferencial tiene dos objetivos básicos; a) obtener conclusiones válidas acerca de una población sobre la base de una muestra, es decir, que las conclusiones que obtengamos de una mues tra se puedan extrapolar a la población que dio origen a esa muestra b) poder medir el grado de incertidumbre presente en dichas inferencias en términos de probabilidad.
1.5 BREVE INTRODUCCION A LA ESTADISTICA INFERENCIAL INFERENCIAL La Estadística Inferencial puede dar respuesta a muchas de las necesidades que la sociedad actual puede requerir. Su tarea fundamenta l es el análisis de los datos que se obtienen a partir de experimentos, con el objetivo de representar la realidad y conocerla. Permite la recolección de datos importantes para el estudio de situaciones que se presentan a diario y permite dar respuesta a los problemas de una forma útil y significativa. La Estadística Inferencial se centra en tomar una pequeña muestra representativa de la población y a partir pa rtir de ésta, infiere que el resto de la población tiene el mismo comportamiento. En caso de que no sea factible realizar realizar un estudio completo por cuestiones de tiempo, recursos o costo, se puede calcular un tamaño de muestra para medir solo algunos elementos de la población, posteriormente se infiere que el resto de la población se comporta igual que la muestra tomada. El hecho es que la ciencia se basa en todo aquello que se pueda constatar empíricamente, es medible, cuantificable y se puede hacer acopio de la información
para armar cuadros estadísticos... una vez con la información acumulada resultado de diversos experimentos verificables, se puede inferir a partir de la información estadística..... En las ciencias sociales ocurre algo semejante en tanto es con los datos que dan las encuestas que se puede armar o articular la información estadística e inferir resultados a partir de una muestra que deberá ser estadísticamente representativa para que resulte una verdadera inferencia. Importancia de la toma de muestras. Es de gran importancia ya que con un muestreo de toda la población se puede examinar y sacar conclusiones en base a una pequeña parte de la misma, dando por sentado que los resultados obtenidos en la muestra es de hecho representativa de toda la población, una ventaja muy grande es que es mucho más sencillo trabajar con una pequeña parte de un todo que con su totalidad. Además, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación.
1.6 TEORIA DE DESICIONES EN ESTADISTICA ESTADISTICA Un proceso de decisión presenta las siguientes características principales: • Existen al menos dos posibles formas de actuar, que llamaremos alternativas o
acciones, excluyentes entre sí, de manera que la actuación según una de ellas imposibilita cualquiera de las restantes. • Mediante un proceso de decisión se elige una alternativa, que es la que se ll eva a
cabo. • La elección de una alternativa ha de realizarse de modo que cumpla un fin
determinado. El proceso de decisión consta de las siguientes fases fundamentales: • Predicción de las consecuencias de cada actuación. Esta predicción deberá
basarse en la experiencia y se obtiene por inducción sobre un conjunto de datos. La recopilación de este conjunto de datos y su utilización entran dentro del campo de la Estadística. • Valoración de las consecuencias de acuerdo con una escala de bondad o
deseabilidad. Esta escala de valor dará lugar a un sistema de preferencias. • Elección de la alternativa mediante un criterio de decisión adecuado. Este punto
lleva a su vez asociado el problema de elección del criterio más adecuado para nuestra decisión, cuestión que no siempre es fácil de resolver de un modo totalmente satisfactorio.
1.7 COMPONENTES DE UNA INVESTIGACION INFERENCIAL La investigación estadística es una actividad que apela a diversas técnicas con el propósito de llegar a la esencia de la realidad. El proceso de la investigación estadística implica una serie de pasos; pues lanzarse a investigar sin un criterio previo o preparación adecuada puede demandar más tiempo del programado. POBLACION :
es el conjunto formado por todos los valores posibles que puede asumir, el variable objeto de estudio. Es bueno tener en cuenta que el término población se interpreta de dos maneras cuando se hace un estudio estadístico, a saber: 1. La interpretación propia en el Análisis Estadístico. 2. Como el conjunto de objetos sobre los cuales actúa la variable considerada.
MUESTRA:
es cualquier subconjunto de la población, escogido al seguir ciertos criterios de selección. La muestra es el elemento básico sobre el cual se fundamenta la posterior inferencia acerca de la población de donde se ha tomado. Por ello, su escogencia y selección debe hacerse siguiendo ciertos procedimientos que son ampliamente tratados en la parte de la estadística llamada Teoría de muestreo. Para llegar a ese objetivo a través de un u n proceso racional y eficaz, se aconseja que se tengan en cuenta los siguientes pasos: 1. Formulación del problema. En este punto se debe especificar de manera clara la pregunta que se debe responder y la población de datos asociada a sociada a la pregunta. Los conceptos deben ser precisos y deben ponerse limitaciones adecuadas al problema motivadas por el tiempo, dinero disponible y la habilidad de los Investigadores. 2. Diseño del experimento. Este aspecto es de gran importancia, puesto que la recolección de datos requiere dinero y tiempo. Es siempre nuestro deseo obtener máxima Información con el mínimo costo (dinero y tiempo) posible. Incluir excesiva Información en la muestra es a menudo costoso y antieconómico. Incluir poca también es poco satisfactorio. 3. Recolección de datos. Esta parte, por lo general, es la que exige más tiempo en la Investigación.
Esta recolección debe ajustarse a reglas estrictas ya que de los datos esperamos extraer la Información deseada. 4. Tabulación y descripción de los resultados. En esta etapa, los datos muéstrales se exponen de manera clara y se ilustran con representaciones Tabulares y gráficas (diagramas. histogramas, etc.); además se calculan las medidas estadísticas apropiadas al proceso inferencial que haya sido escogido. 5. Inferencia estadística y conclusiones. Este último paso constituye tal vez la contribución más importante de la estadística e stadística al proceso inferencial. Aquí se fija el nivel de confiabilidad para la inferencia; esto es debido a que las conclusiones derivadas de inferencias estadísticas jamás se pueden tomar con un 100% de certeza, pero sí se les puede asociar un nivel de confiabilidad; en términos de probabilidad denominados nivel de confianza y nivel de significancia. El proceso Inferencial nos llevará a una conclusión estadística estad ística que servirá de orientación a quien o quienes deban tomar la decisión (administrativa o clínica) sobre el tema objeto de estudio.
1.8 RECOLECCIÓN DE DATOS Termina la etapa de planteamiento, se procede a distribuir y a recoger los formularios, controlando el número de formularios entregados y recogidos y, al mismo tiempo, verificando la calidad de las informaciones obtenidas. CODIFICACIÓN: Cumplido el proceso de revisión de cada una de las respuestas obtenidas, se procede a la codificación de las mismas, especialmente cuando se va a sistematizar. TABULACIÓN: Puede ser manual, sistematizada o computarizada y su selección dependerá: De la cantidad de formularios que se van a utilizar. Del número de preguntas que tenga el formulario Del tiempo y de los recursos, ya sea financieros o de equipos, disponibles. ANÁLISIS E INTERPRETACIÓN: Esta etapa se puede considerar como la más importante del informe, ya que el análisis de los datos tendrá que ver con la formulación del objetivo mismo de la investigación y de las hipótesis establecidas. INFORME: Se llega a la etapa de elaboración del informe, ya sea para uso interno de la empresa o para terceros. La redacción y entrega del informe final, corresponde a la última etapa de la investigación y a la culminación de los trabajos que la misma causo. A pesar de que el informe constituye un todo indivisible, podemos considerar
tres partes perfectamente identificables: introducción, conclusiones y apéndices. PUBLICACIÓN: Propone hacer llegar a las personas interesadas el resultado del estudio, teniendo en cuenta todos los aspectos considerados en el proceso, p roceso, de tal forma que los datos sean comprensibles, con la correspondiente validez de las conclusiones.
1.9 ESTADÍSTICA PARAMÉTRICA (POBLACIÓN Y MUESTRA ALEATORIA). La estadística paramétrica es una rama de la estadística inferencial que comprende los procedimientos estadísticos y de decisión que están basados en las distribuciones de los datos reales. Estas son determinadas usando un número finito de parámetros. EJEMPLO Si conocemos que la altura de las personas sigue una distribución normal, pero desconocemos cuál es la media y la desviación de dicha normal. La media y la desviación típica de la desviación normal son los dos parámetros que queremos estimar. Cuando desconocemos totalmente que distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico, que nos ayude a conocer primero la distribución. La mayoría de procedimientos paramétricos requiere conocer la forma de distribución para las mediciones resultantes de la población estudiada. Para la inferencia paramétrica es requerida como mínimo una escala de intervalo, esto quiere decir que nuestros datos deben tener un orden y una numeración del intervalo.
1.10 APLICACIONES La estadística es una ciencia de aplicación práctica casi universal en todos los campos científicos: En las ciencias naturales: se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos. En las ciencias sociales y económicas: es un u n pilar básico del desarrollo de la demografía y la sociología aplicada. En economía: suministra los valores que ayudan a descubrir interrelaciones entre múltiples parámetros macro y microeconómicos. En las ciencias médicas: permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los índices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etcétera.
Números índices Otros métodos de presentación de datos utilizados en estadística se basan en el empleo de números índices. Tales números reflejan la evolución que experimenta con el paso del tiempo una variable estadística de interés. Así, se toma como referencia del índice el valor de la variable en un instante dado, de manera que sus valores posteriores se expresan como una razón de cambio con respecto a dicha referencia (a menudo, en forma de porcentaje). Un ejemplo típico de empleo de números índices es el índice bursátil, cuya definición obedece a criterios diferentes en cada país (índice Dow Jones, en la Bolsa de Nueva York; índice Nikkei, en Tokio, etcétera). Estadísticas comunes Varios estudios estadísticos comunes que aparecen con frecuencia en los medios de comunicación son los siguientes: Encuesta de Población Activa (EPA), elaborada por el Instituto Nacional de Estadística (INE) con periodicidad trimestral, según recomendaciones de la Organización Internacional del Trabajo (OIT), para obtener y clasificar datos sobre la actividad de la población. Esta encuesta se realiza por muestreo, y los resultados se ordenan por edad, sexo, nivel de estudios, profesión y otros parámetros. Índice de Precios al Consumo (IPC), que mide por medios estadísticos la evolución experimentada por los precios pre cios de los bienes y servicios consumidos por la población española. Se basa en la Encuesta de Presupuestos Familiares (EPF), y selecciona varios centenares de artículos, clasificados en ocho grupos, que se consideran representativos de la evolución de los precios. Los artículos seleccionados componen lo que se denomina cesta de la compra, considerada en la encuesta. Producto Interior Bruto (PIB), que registra la producción nacional de un país en bienes y servicios asociados a procesos considerados productivos. Poder adquisitivo, que maneja combinadamente datos del Salario Mínimo Interprofesional (SMI) y el IPC.
INSTITUTO TECNOLOGICO DE SALTILLO
ESTADISTICA INFERENCIAL I UNIDAD 1 INTRODUCCION A LA ESTADISTICA INFERENCIAL A. JOEL MAXIMILIANO GARCIA VELAZQUEZ ING. FRANCISCO JAVIER RODRIGUEZ SANCHEZ
SALTILLO, COAH.
6 de febrero de 2018