PRUEBA DE HIPOTESIS DE CHI CUADRADO Objetivos
1. Realizar contrastes de hipótesis paramétricos para la media de una población normal. 2. Realizar contrastes de hipótesis paramétricos para comparar dos medias de variables normales en muestras independientes y en muestras apareadas. 3. Realizar contrastes de hipótesis para comparar dos proporciones. 4. Realizar contrastes de hipótesis no-paramétricos de independencia para variables cualitativas. 5. Realizar contrastes de hipótesis no-paramétricos de bondad de ajuste de distribuciones. . Realizar contrastes de hipótesis no-paramétricos de aleatoriedad. !. Realizar contrastes de hipótesis no-paramétricos de dos muestras independientes y de dos muestras relacionadas.
Conceptos básicos Contraste de hipótesis. "n contraste de hipótesis es un proceso estad#stico mediante el cual se investi$a si una propiedad %ue se supone %ue cumple una población es compatible con lo observado en una muestra de dicha población. &s un procedimiento %ue permite ele$ir una hipótesis de trabajo de entre dos posibles y anta$ónicas. Hipótesis Estadística. 'odo contraste de hipótesis se basa en la (ormulación de dos hipótesis e)haustivas y mutuamente e)clusivas*
1. +ipótesis nula , H0 2. +ipótesis alternativa , H1 a hipótesis H0 es la %ue se desea contrastar. /onsiste $eneralmente en una a(irmación concreta sobre la (orma de una distribución de probabilidad o sobre el valor de al$uno de los par0metros de esa distribución. &l nombre de nula si$ni(ica sin valor e(ecto o consecuencia lo cual su$iere %ue H0 debe identi(icarse con la hipótesis de no cambio ,a partir de la opinión actual no di(erencia no mejora etc. H0 representa la hipótesis %ue mantendremos a no ser
%ue los datos indi%uen su (alsedad y puede entenderse por tanto en el sentido de neutra. a hipótesis H0 nunca se considera probada aun%ue puede ser rechazada por los datos. 6or ejemplo la hipótesis de %ue dos poblaciones tienen la misma media puede ser rechaada (0cilmente cuando ambas di(ieren mucho analizando muestras su(icientemente $randes de ambas poblaciones pero no puede ser "demostrada" mediante muestreo puesto %ue siempre cabe la posibilidad de %ue las medias di(ieran en una cantidad lo su(icientemente pe%ue7a para %ue no pueda ser detectada aun%ue la muestra sea muy $rande. 8ado %ue descartaremos o no la hipótesis nula a partir de muestras obtenidas ,es decir no dispondremos de in(ormación completa sobre la población no será posib!e "arantiar #ue !a decisi$n to%ada sea !a correcta&
a hipótesis H1 es la ne$ación de la nula. 9ncluye todo lo %ue H0 e)cluye. ¿Qué asignamos como H0 y H1 ?
a hipótesis H0 asi$na un valor espec#(ico al par0metro en cuestión y por lo tanto 'e! i"ua!( sie%pre )or%a parte de H0& a idea b0sica de la prueba de hipótesis es %ue los hechos ten$an probabilidad de rechazar H0. *a hip$tesis H0 es !a a)ir%aci$n #ue podr+a ser rechaada por !os hechos& E! inter,s de! investi"ador se centra- por !o tanto- en !a H1& La rega de decisión. &s el criterio %ue vamos a utilizar para decidir si la hipótesis nula planteada debe o no ser rechazada. &ste criterio se basa en la partición de la distribución muestral del estad#stico de contraste en dos re$iones o zonas mutuamente e)cluyentes* Re$ión cr#tica o re$ión de rechazo y Re$ión de no-rechazo. !egión de norecha#o. &s el 0rea de la distribución muestral %ue corresponde a los valores del estad#stico de contraste pró)imos a la a(irmación establecida
en H0. &s lostanto valores del estad#stico de contraste %ue nosdel conducen a de decidir H0decir . &s por el 0rea correspondiente a los valores estad#stico contraste %ue es probable %ue ocurran si H0 es verdadera. :u probabilidad se denomina nive! de con)iana y se representa por . / $ & !egión de recha#o o región crítica. &s el 0rea de distribución muestral %ue corresponde a los valores del estad#stico de contraste %ue se encuentran tan alejados de la a(irmación establecida en H0 %ue es muy poco probable %ue ocurran si H0 es verdadera. :u probabilidad se denomina nive! de si"ni)icaci$n o nive! de ries"o y se representa con la letra 0 .
;a de(inidas las dos zonas la re$la de decisión consiste en rechazar H0 si el estad#stico de contraste toma un valor perteneciente a la zona de rechazo o mantener H0 si el estad#stico de contraste toma un valor perteneciente a la zona de no-rechazo. E! ta%a1o de !as onas de rechao 2 no/rechao se determina (ijando el valor
de < es decir (ijando el nivel de si$ni(icación con el %ue se desea trabajar. :e suele tomar un 1= o un 5=. a (orma de dividir la distribución muestral en zona de rechazo y de no-rechazo depende de si el contraste es bilateral o unilateral. a zona cr#tica debe situarse donde puedan aparecer los valores muestrales incompatibles con H0. Estadístico de contraste. "n estad#stico de contraste es un resultado muestral %ue cumple la doble condición de*
6roporcionar in(ormación emp#rica relevante sobre la a(irmación propuesta en la H0. 6oseer una distribución muestral conocida
%ipos de contrastes. Contrastes para%,tricos3 /onocida una v.a. con una determinada distribución
se establecen a(irmaciones sobre los par0metros de dicha distribución. Contrastes no para%,tricos* as a(irmaciones establecidas no se hacen en base a la distribución de las observaciones %ue a priori es desconocida &
%ipos de hipótesis de contraste. Hip$tesis si%p!es3 a hipótesis asi$na un >nico valor al par0metro desconocido H: θ = θ0 Hip$tesis co%puestas* a hipótesis asi$na varios valores posibles al par0 metro desconocido H: θ ∈ , θ1 θ2 )
H0 ? θ ? θ0 H1 ? θ @ θ0
:imple - /ompuesta
H0 ? θ A θ0 H1 ?θ B θ0
/ompuesta - /ompuesta
H0 ? θ C θ0 H1 ? θ D θ0
/ompuesta - /ompuesta
La !egas de decisión.
a. Contrastes &iateraes' :i la hipótesis alternativa da lu$ar a una re"i$n cr+tica 'a a%bos !ados( del valor del par0metro diremos %ue el test es &iatera o de dos coas . :e rechaza H0 si el estad#stico de contraste cae en la zona cr#tica es decir si el estad#stico de contraste toma un valor tan $rande o tan pe%ue7o %ue la probabilidad de obtener un valor tan e)tremo o m0s %ue el encontrado es menor %ue < E2.
b.
Contraste uni!atera!3 :i la hipótesis alternativa da lu$ar a una re"i$n cr+tica 'a un so!o !ado de! va!or de! pará%etro(- diremos %ue el test es uniatera o de una soa coa
:e rechaza H0 si el estad#stico de contraste cae en la zona cr#tica es decir si toma un valor tan $rande %ue la probabilidad de obtener un valor como ese o mayor es menor %ue < .
Contraste bi!atera!
Contraste uni!atera!3 Co!a a Contraste uni!atera!3 Co!a a !a derecha
!a i#uierda
H0 ? θ A θ0
H 0 ? θ C θ0
H1 ?θ B θ0
H1 ? θ D θ0
H0 ? θ ? θ 0 H1 ? θ @ θ0
La decisión'
6lanteada la hipótesis (ormulados los supuestos de(inido el estad#stico de contraste y su distribución muestral y establecida la re$la de decisión el paso si$uiente es obtener una muestra aleatoria de tama7o n calcular el estad#stico de contraste y tomar una decisión*
:i es estad#stico de contraste cae en la zona cr#tica se rechaza H0. :i es estad#stico cae en la zona de no rechazo se mantiene H0.
Si rechaa%os Ho a)ir%a%os #ue !a hip$tesis es )a!sa es decir %ue a(irmamos
con una probabilidad e%uivocarnos %ue hemos conse$uido probar %ue esa hipótesis es (alsa. 6or
Errores de %ipo ( y ((.
Error de tipo I3 :e comete cuando se decide rechazar la hipótesis
nula H0 %ue en realidad es verdadera. a probabilidad de cometer ese error es 0. )4 Rechaar H0 5 H0 es verdadera 6 7 0
Error de tipo II3 :e comete cuando se decide no rechazar la hipótesis
nula H0 %ue en realidad es (alsa. a probabilidad de cometer ese error es 8 . )4 9o rechaar H0 5 H0 es )a!sa 6 7 8
6or tanto
. / 0 es !a probabi!idad de to%ar una decisi$n correcta cuando H0 es verdadera. . / 8 es !a probabi!idad de to%ar una decisi$n correcta cuando H0 es )a!sa&
E! si"uiente cuadro resu%e !as ideas3 9atura!ea de H0 :erdadera
;a!sa
Error de tipo I
Decisi$n correcta
)*$
)*1+
Decisi$n correcta
Error de tipo II
)*1$
)*+
Rechaar H0 Decisi$n 9o rechaar H0
a di(icultad al usar un procedimiento basado en datos muestrales es %ue debido a la variabilidad de muestreo puede resultar una muestra no representativa y por tanto resultar#a un rechazo erróneo de H0. a probabilidad de cometer un error de tipo 9 con nuestra decisión es una probabilidad conocida pues el valor de < lo (ija el propio investi$ador. :in embar$o la probabilidad de cometer un error de tipo 99 F es un valor desconocido %ue depende de tres (actores*
a hipótesis H1 %ue consideremos verdadera.
&l valor de < .
&l tama7o del error t#pico ,desviación t#pica de la distribución muestral utilizada para e(ectuar el contraste.
!eaciones entre os errores de %ipo ( y ((. &l estudio de las relaciones entre los errores lo realizamos mediante el contraste de hipótesis*
6ara ello utilizamos la in(ormación muestral proporcionada por el estad#stico media muestral
/ual%uier valor atribuido a G 1 en H1 ,siempre mayor a GH $enerar0 distribuciones muestrales distintas para la media muestral. Iun%ue todas tendr0n la misma (orma unas estar0n m0s alejadas %ue otras de la curva de H0 es decir unas ser0n distintas de otras >nicamente en el valor asi$nado a G1 .
/uanto m0s se aleje el valor G1 de GH m0s hacia la derecha se desplazar0 la curva H1 y en consecuencia m0s pe%ue7a se har0 el 0rea F . 6or lo tanto e! va!or de 8 depende de! va!or concreto de < . #ue considere%os verdadero dentro de todos !os a)ir%ados por H1 &
Cuanto %a2or es 0 - %enor es 8 . :e relacionan de (orma inversa. 6ara una distancia dada entre G H y G1 el solapamiento entre las curvas correspondientes a uno y otro par0metro ser0 tanto mayor cuanto mayor sea el error t#pico de la distribución muestral representada por esas curvas ,cuanto mayor es el error t#pico de una distribución m0s ancha es esa distribución. ; cuanto mayor sea el solapamiento mayor ser0 el valor de F.
RelacionesJentreJlosJerroresJdeJtipoJ9JyJtipoJ99
&n lu$ar de buscar procedimientos libres de error debemos buscar procedimientos para los %ue no sea probable %ue ocurran nin$>n tipo de estos errores. &sto es un buen procedimiento es a%uel para el %ue es pe%ue7a la probabilidad de cometer cual%uier tipo de error. a elección de un valor particular de corte de la re$ión de rechazo (ija las probabilidades de errores tipo 9 y tipo 99. 8ebido a %ue H0 especi(ica un valor >nico del par0metro ha2 un so!o va!or de 0 & :in embar$o hay un valor di(erente de 8 por cada va!or de! pará%etro reco"ido en H1 & &n $eneral un buen contraste o buena re$la de decisión debe tender a %ini%iar !os dos tipos de error inherentes a toda decisión. /omo 0 #ueda )ijado por e! investi"ador- tratare%os de e!e"ir una re"i$n donde !a probabi!idad de co%eter e! error de tipo II sea !a %enor .
"sualmente se dise7an los contrastes de tal manera %ue la probabilidad a sea el 5= ,HH5 aun%ue a veces se usan el 1H= ,H1 o 1= ,HH1 para adoptar condiciones m0s relajadas o m0s estrictas. )otencia de un contraste. &s la probabilidad de decidir H1 cuando ésta es cierta )4 decidir H1 5 H1 es verdadera 6 7 . / 8
&l concepto de potencia se utiliza para medir la bondad de un contraste de hipótesis. /uanto m0s lejana se encuentra la hipótesis H1 de H0 menor es la probabilidad de incurrir en un error tipo 99 y por consi$uiente la potencia tomar0 valores m0s pró)imos a 1. :i la potencia en un contraste es siempre muy pró)ima a 1 entonces se dice %ue el estad#stico de contraste es muy potente para contrastar H0 ya %ue en ese caso las 0 1 muestras cierta. ser0n con alta probabilidad incompatibles con H cuando H sea
6or tanto puede interpretarse la potencia de un contraste como su sensibilidad o capacidad para detectar una hipótesis alternativa. a potencia de un contraste cuanti(ica la capacidad del criterio utilizado para rechazar H0 cuando esta hipótesis sea (alsa &s deseable en un contraste de hipótesis %ue las probabilidades de ambos tipos de error (ueran tan pe%ue7as como (uera posible. :in embar$o con una muestra de tama7o pre(ijado disminuir la probabilidad del error de tipo 9 < conduce a
incrementar la probabilidad del error de tipo 99 F. &l recurso para aumentar la potencia del contraste esto es disminuir la probabilidad de error de tipo 99 es aumentar el tama7o muestral lo %ue en la pr0ctica conlleva un incremento de los costes del estudio %ue se %uiere realizar &l concepto de potencia nos permite valorar cual entre dos contrastes con la misma probabilidad de error de tipo 9 < es pre(erible. :e trata de esco$er entre todos los contrastes posibles con < pre(ijado a%uel %ue tiene mayor potencia esto es menor probabilidad F de incurrir en el error de tipo 99. &n este caso el ema de Keyman-6earson $arantiza la e)istencia de un contraste de m0)ima potencia y determina cómo construirlo. 6otencia de un contraste de hipótesis
Contrastes de hip$tesis para%,tricos &l propósito de los contrastes de hipótesis es determinar si un valor propuesto ,hipotético para un par0metro u otra caracter#stica de la población debe aceptarse como plausible con base en la evidencia muestral. 6odemos considerar las si$uientes etapas en la realización de un contraste* 1. &l investi$ador (ormula una hipótesis sobre un par0metro poblacional por ejemplo %ue toma un determinado valor 2. :elecciona una muestra de la población 3. /omprueba si los datos est0n o no de acuerdo con la hipótesis planteada es decir compara la observación con la teor#a a. :i lo observado es incompatible con lo teórico entonces el investi$ador puede rechazar la hipótesis planteada y proponer una nueva teor#a b. :i lo observado es compatible con lo teórico entonces el investi$ador puede continuar como si la hipótesis (uera cierta. os contrastes de hipótesis %ue construye :6:: son los proporcionados por las Pruebas T estas son de tres tipos* Prueba T para una muestra, Prueba T para muestras independientes y Prueba T para muestras relacionadas
Contrastes de hip$tesis para !a %edia de una pob!aci$n nor%a!
&l procedimiento Prueba T para una muestra mediante SPSS contrasta si la media de una población di(iere de una constante especi(icada. 6ara obtener una 6rueba ' para una muestra se eli$e en el men> principal Ana!iar5Co%parar %edias5Prueba T para una %uestra&&&
&n la salida correspondiente se selecciona una o m0s variables cuantitativas para contrastarlas con el mismo valor supuesto. 6or ejemplo en la si$uiente salida se muestra un contraste para el caso en %ue la media de la variable !on"itud sea i$ual a 2H , :a!or de prueba3 2H
6ulsando Opciones&&& se puede ele$ir el nivel de con(ianza.
:e pulsa Continuar 2 Aceptar. :e obtiene un resumen estad#stico para la muestra y la salida del procedimiento.
&sta salida muestra el tama7o muestral la media la desviación t#pica y error t#pico de la media.
&sta salida muestra los resultados del contraste de la t de Student con un intervalo de con(ianza para la di(erencia entre el valor observado y el valor teórico ,contrastado. /ada una de las columnas de la tabla muestra*
t ? LL!L* &l valor e)perimental del estad#stico de contraste $l ? 14* os $rados de libertad :i$.? HHHH* &l p-valor o nivel cr#tico del contraste 8i(erencia de medias ? M.312!* &s la di(erencia entre la media teórica ,2H y la media observada ,2M.312! M5= 9ntervalo de con(ianza ? ,!.H3 11.524* &s el intervalo de con(ianza para la di(erencia entre la media teórica y la media observada al nivel de con(ianza del M5=.
Contrastes de hip$tesis para dos %uestras independientes
8e un modo $eneral dos muestras se dice %ue son independientes cuando las observaciones de una de ellas no condicionan para nada a las observaciones de la otra siendo dependientes en caso contrario. &n realidad el tipo de dependencia %ue se considera a estos e(ectos es muy especial* cada dato de una muestra tiene un homónimo en la otra con el %ue est0 relacionada de ah# el nombre alternativo de muestras apareadas. 6or ejemplo supon$amos %ue se %uiere estudiar el e(ecto de un medicamento sobre la hipertensión a un $rupo de 2H individuos. &l e)perimento se podr#a plani(icar de dos (ormas* a.
Iplicando el medicamento a 1H de estos individuos y dejando sin tratamiento al resto. 'ranscurrido un tiempo se miden las presiones san$u#neas de ambos $rupos y se contrasta la hipótesis +H* N1 ? N2 vs +1* N1 DBN2 para evaluar si las medias son i$uales o no. /omo las muestras est0n (ormadas por individuos distintos sin relación entre s# se dir0 %ue son muestras independientes.
b.
Iplicando el medicamento a los 2H individuos disponibles y anotando su presión san$u#nea antes y después de la administración del mismo. &n este caso los datos vienen dados por parejas presión antes y después y tales datos est0n relacionados entre s#. as muestras son apareadas.
&l pa%uete estad#stico :6:: realiza el procedimiento Prueba T para muestras independientes en este procedimiento se compara la media de dos poblaciones normales e independientes. 6ara realizar dicho contraste los sujetos deben asi$narse aleatoriamente a las dos poblaciones de (orma %ue cual%uier di(erencia en la respuesta sea debida al tratamiento ,o (alta de tratamiento y no a otros (actores. &l procedimiento Pruebade T las para muestras independientes contrasta si la di(erencia medias de dos poblaciones mediante normales :6:: e independientes di(iere de una constante especi(icada. 6ara obtener una 6rueba ' para muestras independiente se selecciona en el men> principal Ana!iar5Co%parar %edias5Prueba T para %uestras independientes&&&
:e accede a la si$uiente ventana
donde se puede seleccionar una o m0s variables cuantitativas y se calcula una Prueba T di(erente para cada variable. 6or ejemplo en esta salida se selecciona la variable asimetría. I continuación se selecciona una sola variable de a$rupación en nuestro caso la variable )arte y se pulsa De)inir =rupos para especi(icar los códi$os de los $rupos %ue se %uieran comparar. Oamos a contrastar la i$ualdad de medias de la variable asimetría se$>n la variable )arte ,/anopy :prouts
6ulsando De)inir =rupos... se muestra la si$uiente pantalla
donde se especi(ican el n>mero de $rupos %ue se %uieren comparar. :e pulsa Continuar y después Aceptar y se obtienen las si$uientes pantallas %ue muestran un resumen estad#stico para las dos muestras y la salida del procedimiento.
6ara realizar un contraste de di(erencia de medias de dos poblaciones independientes hay %ue contrastar previamente las varianzas de dichas poblaciones. &sta salida nos muestra el valor e)perimental del estad#stico de contraste ,Pe)p ? 2.H45 este valor deja a la derecha un 0rea i$ual a H.1! ,:i$.? H.1! por lo tanto no se puede rechazar la hipótesis nula de i$ualdad de varianzas. I continuación se realiza el contraste para la di(erencia de medias suponiendo %ue las varianzas son i$uales. a tabla nos muestra el valor e)perimental del estad#stico de contraste ,te)p ? 1.233 y el p-valor ? H.24H ,:i$.? H.24H por lo tanto no se puede rechazar la hipótesis nula de i$ualdad de medias. 'ambién se puede concluir el contraste observando %ue el intervalo de con(ianza para la di(erencia de medias ,-H.H525 H.1M224 contiene al cero.
Contrastes de hip$tesis para %uestras apareadas
&l pa%uete estad#stico :6:: realiza el procedimiento Prueba T para muestras apareadas en este procedimiento se comparan las medias de dos variables de un solo $rupo. /alcula las di(erencias entre los valores de cada caso y contrasta si la media di(iere de cero. 6ara obtener una Prueba T para muestras relacionadas se eli$e en los men>s Ana!iar5Co%parar %edias5Prueba T para %uestras re!acionadas&&&
:e accede a la si$uiente ventana
donde se selecciona un par de variables pulsando en cada una de ellas. a primera variable aparecer0 en la sección Se!ecciones actua!es como ,aria&e 1 y la se$unda aparecer0 como ,aria&e -. "na vez seleccionado el par de variables en nuestro caso sim/ y sim/ se pulsa el botón de (lecha para moverlas a la ventana de :ariab!es re!acionadas. :e puede realizar el contraste para m0s de una pareja de variables simult0neamente.
Il pulsar Continuar y después Aceptar se obtiene un resumen estad#stico para las dos muestras y la salida del procedimiento.
6ara cada variable se presenta la media tama7o de la muestra desviación t#pica y error t#pico de la media.
&sta salida muestra para cada pareja de variables* el n>mero de datos el coe(iciente de correlación y el p-valor asociado al contraste + H* r ? H (rente a + 1* r DB H. &l coe(iciente de correlación es i$ual a -H.L1 por lo tanto las variables est0n relacionadas en sentido inverso cuando una crece la otra decrece. Qbservando el p-valor ,H.2H deducimos %ue no se puede rechazar la hipótesis nula ,+H* r ? H por lo tanto no e)iste correlación entre las variables. ,a correlación no es si$ni(icativa.
&sta salida muestra el valor e)perimental del estad#stico de contraste ,t ? 3.MHL y el p-valor i$ual a H.H1! por lo tanto se debe rechazar la hipótesis nula de i$ualdad de medias.
Contrastes de hip$tesis para dos proporciones independientes& >uestras "randes
&l contraste de hipótesis para la comparación de dos proporciones independientes se basa en la distribución apro)imada de un estad#stico muestral %ue re%uiere muestras $randes. &l pa%uete estad#stico :6:: no incluye el c0lculo de dicho estad#stico permitee)acto el c0lculo de otros cuatro estad#sticos para muestras $randes y elpero estad#stico de Pisher para muestras pe%ue7as. &l contraste de comparación de dos proporciones es un caso particular del contraste de homo$eneidad de dos muestras de una variable cualitativa cuando ésta sólo presenta dos modalidades. 6or ello el procedimiento %ue vamos a realizar es el an0lisis de una tabla de contin$encia 2)2. 6ara obtener el procedimiento Tablas de continencia se eli$e en los men>s Ana!iar5Estad+sticos descriptivos5Tab!as de contin"encia&&&
&n la ventana emer$ente se seleccionan las variables dicotómicas %ue se van a contrastar. 6or ejemplo en la si$uiente salida se muestra el procedimiento de 'ablas de contin$encia en el %ue se comparan las variables 2e3o y 4umador para ello se han seleccionado la variable Se?o y mediante el botón de (lecha se ha pasado al campo ;i!as* y la variable 4umador %ue se ha pasado al campo Co!u%nas* ,:e desea comparar la proporción de (umadores en los $rupos ,hombres y mujeres.
:e pulsa el botón Casi!!as&&& y se selecciona en ;recuencias @Observadas y en Porcentajes @;i!a
:e pulsa Continuar y en la pantalla correspondiente se pulsa el botón Estad+sticos&&& y se selecciona Chi/cuadrado
:e pulsa Continuar y Aceptar. :e muestran la Tabla de continencia y los contrastes !hicuadrado
/ada casilla de esta tabla muestra la (recuencia observada y el porcentaje %ue ésta representa sobre el total de la (ila la tabla de contin$encia :e)o Pumador. as proporciones muestrales %ue vamos a comparar son 1HE2 y 14E24 . 6ara ello se realiza un contraste bilateral para evaluar si e)isten di(erencias si$ni(icativas entre ambas proporciones muestrales ,+ H* p1 - p2?H (rente a +1* p1 - p2 DBH
&sta tabla muestra los resultados de cinco estad#sticos para la comparación de ambas proporciones. Seneralmente en el caso de muestras $randes se eli$e el estad#stico Correcci$n por continuidad. 8icho estad#stico calcula el estad#stico /hi-cuadrado con la corrección por continuidad de ;ates. &n nuestro caso el valor de dicho estad#stico es 1.25M y el p-valor asociado es H.22 ,:i$. asintótica bilateral por lo tanto no se debe rechazar la +ipótesis nula es decir las di(erencias observadas entre las proporciones de (umadores en los dos $rupos no son estad#sticamente si$ni(icativas. &n el caso de muestras pe%ue7as se decide a partir del Estad+stico e?acto de ;isher&
Contrastes de hip$tesis no para%,tricos &n la sesión anterior hemos estudiado contrastes de hipótesis acerca de par0metros poblacionales tales como la media y la varianza de ah# el nombre de contrastes paramétricos. &n estad#stica paramétrica se trabaja bajo el supuesto de %ue las poblaciones poseen distribuciones conocidas donde cada (unción de distribución teórica depende de uno o m0s par0metros poblacionales. :in embar$o en muchas situaciones es imposible especi(icar la (orma de la distribución poblacional. &l proceso de obtener conclusiones directamente de las observaciones muestrales sin (ormar los supuestos con respecto a la (orma matem0tica de la distribución poblacional se llama teor+a no para%,trica. &n esta sesión vamos a realizar procedimientos %ue no e)i$en nin$>n supuesto o muy pocos acerca de la (amilia de distribuciones a la %ue pertenece la población
y cuyas observaciones pueden ser cualitativas o bien se re(ieren a al$una caracter#stica ordenable. &stos procedimientos reciben el nombre de Contrastes de hip$tesis no para%,tricos&
Is# uno de los objetivos de esta sesión es el estudio de contrates de hipótesis para determinar si una población tiene una distribución teórica espec#(ica. a técnica %ue nos introduce a estudiar esas cuestiones se llama Contraste de !a Chi/cuadrado para !a Bondad de Ajuste. "na variación de este contraste se emplea para resolver los Contrastes de Independencia. 'ales contrastes pueden utilizarse para determinar si dos caracter#sticas ,por ejemplo pre(erencia pol#tica e in$resos est0n relacionadas o son independientes. ; por >ltimo estudiaremos otra variación del contraste de la bondad de ajuste llamado Contraste de Ho%o"eneidad. 'al contraste se utiliza para estudiar si di(erentes poblaciones son similares ,u homo$éneas con respecto a al$una caracter#stica. 6or ejemplo %ueremos saber si las proporciones de votantes %ue (avorecen al candidato I al candidato T o los %ue se abstuvieron son las mismas en dos ciudades.
E! procedi%iento Prueba de !a Chi/cuadrado
+emos a$rupado los procedimientos en los %ue el denominador com>n a todos ellos es %ue su tratamiento estad#stico se aborda mediante la distribución !hi cuadrado. &l procedimiento Prueba de !hicuadrado tabula una variable en cate$or#as y calcula un estad#stico de !hicuadrado. &sta prueba compara las (recuencias observadas y esperadas en cada cate$or#a para contrastar si todas las cate$or#as contienen la misma proporción de valores o si cada cate$or#a contiene una proporción de valores especi(icada por el usuario. 6ara obtener una prueba de !hicuadrado se eli$en en los men>s Ana!iar5Pruebas no para%,tricas5Cuadros de diáo!o"o anti"uos5Chi/ cuadrado&&&
&n la salida correspondiente se selecciona una o m0s variables de contraste. /ada variable $enera una prueba independiente.
6or ejemplo en la si$uiente salida se muestra una Prueba de !hicuadrado en la %ue la variable a contrastar es 5ía de a semana ,:e desea saber si el n>mero de altas diarias de un hospital di(iere dependiendo del d#a de la semana
:e pulsa Opciones&&& para obtener estad#sticos descriptivos cuartiles y controlar el tratamiento de los datos perdidos
Il pulsar Continuar y Aceptar se muestran las si$uientes salidas
&n esta salida se muestra* 9 observado* Uuestra la (recuencia observada para cada (ila ,d#a. :e observa en esta tabla %ue el n>mero de altas diarias de un total de 5LM altas por semana es* 44 el domin$o !L el lunes etc. 9 esperado* Uuestra el valor esperado para cada (ila ,suma de las (recuencias observadas dividida por el n>mero de (ilas. &n este ejemplo hay 5LM altas
observadas por semana resultando alrededor de L4 altas por d#a. Residua!* Uuestra el residuo ,(recuencia observada menos el valor esperado. a
tabla muestra %ue el domin$o hay muchas menos altas de pacientes %ue el viernes. 8e lo %ue parece deducirse %ue todos los d#as de la semana no tienen la misma proporción de altas de pacientes. 6or >ltimo la si$uiente salida muestra el resultado del contraste !hicuadrado
&l valor e)perimental del estad#stico de contraste de !hicuadrado es i$ual a 2M.3LM y el p-valor asociado es menor %ue H.HH1 ,:i$ ? H.HHH por lo tanto se rechaza la hipótesis nula. &n consecuencia el n>mero de altas en los pacientes di(iere dependiendo del d#a de la semana.
Contrastes de Independencia3 Procedi%iento Tab!as de contin"encia
&l procedimiento Tablas de continencia proporciona una serie de pruebas y medidas de asociación para tablas de doble clasi(icación. 6ara obtener tablas de contin$encia se selecciona en el men> principal Ana!iar5Estad+sticos descriptivos5Tab!as de contin"encia&&&
&n el cuadro de di0lo$o resultante se especi(ican las variables %ue (orman la tabla. "na de las variables se introduce en ;i!as* y la otra variable se introduce en Co!u%nas*
Estad+sticos&&& &n este cuadro de especi(ican di0lo$o se pulsa el botón se accede a otra ventana donde se los valores numéricos %ue se y desea obtener. :e selecciona Chi/cuadrado
:e pulsa Continuar y se selecciona Casi!!as&&& para obtener (recuencias observadas y esperadas porcentajes y residuos
:e pulsa Continuar y se selecciona ;or%ato para especi(icar el orden de las cate$or#as ,ascendente o descendente
:e pulsa Continuar y Aceptar. :e muestran las si$uientes salidas
donde*
* K>mero de datos v0lidos con los %ue se trabaja es el 1HH= de los datos * n>mero de datos no v0lidos
a si$uiente salida nos muestra la 'abla de /ontin$encia de las variables seleccionadas
6or >ltimo muestra el resultado del contraste de hipótesis.
&l p-valor ,:i$ ? H.25 indica %ue no debe rechazarse la hipótesis de independencia.
Otros contrastes no para%,tricos
E! procedi%iento Prueba bino%ia!
&l procedimiento Prueba binomial compara las (recuencias observadas de las dos cate$or#as de una variable dicotómica con las (recuencias esperadas en una distribución binomial con un par0metro de probabilidad especi(icado. 6or de(ecto el par0metro de probabilidad para ambos $rupos es H.5. :e puede cambiar el par0metro de probabilidad en el primer $rupo. :iendo la probabilidad en el se$undo $rupo i$ual a uno menos la probabilidad del primer $rupo. :i las variables no son dicotómicas se debe especi(icar un punto de corte. Uediante el punto de corte se divide la variable en dos $rupos el (ormado por los casos mayores o i$uales %ue el punto de corte y el (ormado por los casos menores %ue el punto de corte. 6ara obtener una Prueba binomial se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5Bino%ia!&&&
&n la salida correspondiente se selecciona una o m0s variables de contraste numéricas.
:e deja la opción por de(ecto Contrastar proporci$n* H.5H. ,Vueremos ver si el porcentaje de mujeres en un determinado estudio es del 5H= es decir %ueremos contrastar +H* p ? H.5 (rente a + 1* p DB H.5. &n esta ventana se pulsa el botón Opciones&&& y se accede a otra ventana para obtener estad#sticos descriptivos cuartiles y controlar el tratamiento de los datos perdidos. :e pulsa Aceptar y se muestra la si$uiente salida
:6:: realiza un contraste bilateral. 8e un total de 4!4 personas se observa %ue el 54 = son hombres y el 4= son mujeres. &l p-valor del contraste ,:i$. asintót. bilateral es H.H nos indica %ue no debe rechazarse la hipótesis nula. &ste procedimiento permite dicotomizar una variable continua. 6or ejemplo %ueremos saber si el 3H= de las personas de un estudio son menores de 25 a7os. 6ara resolverlo en el campo De)inir !a dicoto%+a pondr#amos en el Punto de corte* el valor de 25 y en el campo Contrastar proporci$n* pondr#amos H.3H. Contraste de a!eatoriedad& Test de Rachas
&l procedimiento Prueba de #achas contrasta si es aleatorio el orden de aparición de los valores de una variable. :e puede utilizar para determinar si la muestra (ue e)tra#da de manera aleatoria. "na racha es una secuencia de observaciones similares una sucesión de s#mbolos idénticos consecutivos. &jemplo* W W - - - W - - W W W W - - - , rachas. "na muestra con un n>mero e)cesivamente $rande o e)cesivamente pe%ue7o de rachas su$iere %ue la muestra no es aleatoria. 6ara obtener una Prueba de #achas se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5Cuadros de diáo!o"o anti"uos5Rachas&&&
&n la salida correspondiente se selecciona una o m0s variables de contraste numéricas.
&n el campo Punto de corte se especi(ica un punto de corte para dicotomizar las variables seleccionadas. :e puede utilizar como punto de corte los valores observados para la media la mediana o la moda o bien un valor especi(icado. os casos con valores menores %ue el punto de corte se asi$nar0n a un $rupo y los casos con valores mayores o i$uales %ue el punto de corte se asi$nar0n a otro $rupo. :e lleva a cabo una prueba para cada punto de corte seleccionado. &n esta ventana se pulsa el botón Opciones&&& y se accede a otra ventana para obtener estad#sticos descriptivos cuartiles y controlar el tratamiento de los datos perdidos. :e pulsa Aceptar y se obtiene la salida del procedimiento
&n esta salida se muestran los si$uientes valores*
:a!or de !a prueba 7 .&FG* &s el punto de corte para dicotomizar la
variable seleccionada. &n esta tabla el punto de corte es la media muestral
Casos :a!or de prueba 7 .* 8e los 5H casos contrastados 21 de ellos
tienen valores menores %ue la media. os consideramos los casos ne$ativos
Casos :a!or de prueba 7 J* 8e los 5H casos contrastados 2M de ellos
tienen valores mayores %ue la media. os consideramos los casos positivos
9K%ero de rachas 7 F* "na racha se de(ine como una secuencias de
casos al mismo lado del punto de corte ,sucesión de s#mbolos idénticos consecutivos
L 7 &GJ* Oalor e)perimental del estad#stico de contraste Si"& Asint$t @bi!atera! 7 &F* &l p-valor o nivel cr#tico del contraste %ue nos indica el rechazo de la hipótesis de aleatoriedad
Contraste sobre bondad de ajuste3 Procedi%iento Prueba de Mo!%o"orov/ S%irnov
&l procedimiento Prueba de $olmooro%Smirno% para una muestra compara la (unción de distribución acumulada observada de una variable con una distribución teórica determinada %ue puede ser la distribución Kormal la "ni(orme la de 6oisson o la &)ponencial. a & de $olmooro%Smirno% se calcula a partir de la di(erencia mayor ,en valor absoluto entre las (unciones de distribución acumulada teórica y observada. &sta prueba de bondad de ajuste contrasta si las observaciones podr#an razonablemente proceder de la distribución especi(icada. 6ara obtener una Prueba de $olmooro%Smirno% se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5Cuadros de diá!o"o anti"uos5M/ S de . %uestra&&&
:e muestra la si$uiente ventana
&n esta salida se puede ele$ir una o m0s variables de contraste numéricas cada variable $enera una prueba independiente. &le$iremos la variable Crecimiento una vez seleccionada la variable se pasa al campo Contrastar variab!e* mediante el botón de (lecha o pulsando dos veces en la variable
:e selecciona la distribución a la %ue %ueremos ajustar los datos en el campo Distribuci$n de contraste. &n esta ventana se pulsa el botón Opciones&&& y se accede a otra ventana para obtener estad#sticos descriptivos cuartiles y controlar el tratamiento de los datos perdidos :e pulsa Aceptar y se obtiene la salida del procedimiento
&n esta salida se muestran los si$uientes valores*
.N* K>mero de observaciones del (ichero de datos &* K>mero medio de plantas .&NF* 8esviación t#pica del n>mero de plantas &.G* 8i(erencia mayor encontrada entre el valor teórico de la distribución normal y el valor observado &.* 8i(erencia positiva mayor encontrada entre la distribución teórica y
la distribución emp#rica
/&.G* 8i(erencia ne$ativa mayor encontrada entre la distribución teórica y la distribución emp#rica
.&G.* Oalor e)perimental del estad#stico de contraste
&* p-valor asociado al contraste
&l p-valor+,:i$. Isintót ,bilateral ? H.HH2 indica %ue debe rechazarse la hipótesis H de normalidad de (orma %ue no se admite %ue la distribución de los datos sea de tipo Kormal. Pruebas para dos %uestras independientes
&l procedimiento Pruebas para dos muestras independientes compara dos $rupos de casos e)istentes en una variable y comprueba si provienen de la misma población ,homo$eneidad. &stos contrastes son la alternativa no paramétrica de los tests basados en el t de :tudent sirven para comparar dos poblaciones independientes. :6:: dispone de cuatro pruebas para realizar este contraste.
*a prueba U de >ann/hitne2 es la m0s conocida de la pruebas para dos
muestras independientes. &s e%uivalente a la prueba de la suma de ran$os de Xilco)on y a la prueba de YrusZal-Xallis para dos $rupos. Re%uiere %ue las dos muestras probadas sean similares en la (orma y contrasta si dos poblaciones muestreadas son e%uivalentes en su posición. *a prueba L de Mo!%o"orov/S%irnov 2 !a prueba de rachas de a!d/ o!)oQit son pruebas m0s $enerales %ue detectan las di(erencias entre las posiciones y las (ormas de las distribuciones. *a prueba de Mo!%o"orov/ S%irnov se basa en la di(erencia m0)ima absoluta entre las (unciones de distribución acumulada observadas para ambas muestras. /uando esta di(erencia es si$ni(icativamente $rande se consideran di(erentes las dos distribuciones. *a prueba de rachas de a!d/o!)oQitcombina y ordena las observaciones de ambos $rupos. :i las dos muestras proceden de una misma población los dos $rupos deben dispersarse aleatoriamente en la ordenación de los ran$os. *a prueba de reacciones e?tre%as de >oses presupone %ue la variable
e)perimental a(ectar0 a al$unos sujetos en una dirección y a otros en dirección opuesta. a prueba contrasta las respuestas e)tremas compar0ndolas con un $rupo control. 6ara obtener Pruebas para dos muestras independientes se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5Cuadros de diá!o"o anti"uos5 %uestras independientes&&&
:e muestra la si$uiente ventana
&n esta salida se puede ele$ir una o m0s variables de contraste numéricas. :e eli$e la variable %iempo una vez seleccionada la variable se pasa al campo Contrastar variab!e* mediante el botón de (lecha o pulsando dos veces en la variable. :e selecciona de a$rupación en nuestro casotiempo la variable es 6rupo ,:e desea una sabervariable si las persona (umadoras tardan m0s en dormirse %ue las no (umadoras
:e pulsa De)inir "rupos&&& para dividir el archivo en dos $rupos o muestras y emer$e la si$uiente ventana
6ara se$mentar el archivo en dos $rupos o muestras se introduce un valor entero para el =rupo . y un valor entero para el =rupo . Is# en los campos =rupo . y =rupo se ponen los valores con los %ue est0n codi(icados ;u%ador ,con 1 y 9o;u%ador ,con 2 respectivamente. /omo indica la si$uiente salida
Continuar :e pulsa se y como est0 marcado de(ectosalidas el test ' de (ann )hitne* pulsa Aceptar y se obtiene las por si$uientes
as observaciones de ambos $rupos se combinan para (ormar una sola muestra se ordenan linealmente y se les asi$na un ran$o asi$n0ndose el ran$o promedio en caso de producirse empate conservando su identidad como $rupo. &l estad#stico ) de )ilco+on )m- es la suma de los ran$os asociados con las observaciones %ue ori$inariamente constituyen la muestra menor ,Pumadores. :e realiza est0 elección ya %ue se piensa %ue si la población de Pumadores est0 situada por debajo de la población de KoPumadores entonces los ran$os menores tender0n a asociarse con los valores de los Pumadores. &llo producir0 un valor pe%ue7o para el estad#stico )m. :i es cierto lo contrario ,la población de Pumadores est0 situada por encima de la población de KoPumadores entonces los ran$os mayores se encontrar0n entre los Pumadores dando lu$ar a un valor $rande del estad#stico )m. 8e esta (orma se rechaza + H si el valor
observado )m(uera demasiado pe%ue7o o demasiado $rande para %ue se debiera al azar. :i las di(erencias entre los $rupos se deben al azar el ran$o promedio de los dos $rupos deber#a ser apro)imadamente i$ual. &n la salida anterior se observa %ue hay una di(erencia de alrededor de siete minutos ,Ran$o promedio de Pumadores es 1!.! el de los KoPumadores es 11.H!. :iendo mayor el tiempo %ue tarda en dormirse los Pumadores. &n la si$uiente salida se muestran los valores e)perimentales de los estad#sticos de contrastes y el p-valor asociado
:6:: calcula dos estad#sticos* U de >ann/hitne2 y de i!co?on como ambos estad#sticos son e%uivalentes :6:: muestra un >nico valor de p-valor ,:i$. Idem0s en el c0lculo de dicho p-valor aplica una apro)imación a la distribución normal la cual sólo es v0lida para muestras $randes. &l estad#stico ' de (ann)hitne* como el de ) de )ilco+on dependen de las observaciones de los dos $rupos linealmente ordenadas. &l estad#stico ' es el n>mero de veces %ue un valor de los Pumadores precede al de los KoPumadores. &l &stad#stico ' ser0 $rande si la población de los Pumadores est0 situada por encima de la población de los KoPumadores y ser0 pe%ue7o si sucede lo contario. &l estad#stico de contraste )m es la suma de los ran$os asociados a los Pumadores. /omo sospechamos %ue los Pumadores tardan m0s tiempo en %uedarse dormidos %ue los KoPumadores se rechaza la +ipótesis nula de %ue no e)isten di(erencias entre los dos $rupos si el valor de )m es demasiado pe%ue7o para %ue se deba al azar. &l p-valor asociado al contraste H.H32 nos conduce a rechazar la hipótesis nula de %ue no e)iste di(erencias entre los dos $rupos y concluimos %ue los
Pumadores tienden a tardar m0s tiempo en %uedarse dormidos %ue los KoPumadores. Procedi%iento Pruebas para dos %uestras re!acionadas
&stas pruebas comparan las distribuciones de dos poblaciones relacionadas. :e supone %ue la distribución de población de las di(erencias emparejadas es simétrica. SPSS dispone de cuatro pruebas para realizar este contraste !a prueba de si"nos- !a prueba de i!co?on de !os ran"os con si"no- !a prueba de >c9e%ar y !a prueba de ho%o"eneidad %ar"ina!& a prueba apropiada
depende del tipo de datos*
8atos continuos se utiliza la prueba de si"nos o la prueba de i!co?on de !os ran"os con si"no. a prueba de !os si"nos calcula las di(erencias entre las dos variable y clasi(ica las di(erencias como positivas ne$ativas o empatadas. :i las dos variables tienen una distribución similar el n>mero de di(erencias positivas y ne$ativas no di(iere de (orma si$ni(icativa. a prueba de i!co?on de !os ran"os con si"no tiene en cuenta la in(ormación del si$no de las di(erencias y de la ma$nitud de las di(erencias entre los pares. 8ado %ue esta prueba incorpora m0s in(ormación acerca de los datos es m0s potente %ue la prueba de los si$nos.
8atos binarios se utiliza la prueba de >c9e%ar dicha prueba se usa normalmente cuando las medidas est0n repetidas es decir la respuesta de cada sujeto se obtiene dos veces una antes y otra después de %ue ocurra un evento especi(icado. &sta prueba determina si la tasa de respuesta inicial ,antes del evento es i$ual a la tasa de respuesta (inal ,después del evento. &s >til para detectar cambios en la respuesta en los dise7os del tipo antesdespués.
8atos cate"$ricos se utiliza la prueba de ho%o"eneidad %ar"ina! . &s una e)tensión de la prueba de UcKemar a partir de la respuesta binaria a la respuesta multinomial. /ontrasta los cambios de respuesta utilizando la distribución de /hi-cuadrado y es >til para detectar cambios de respuesta en dise7os antes-después.
6ara obtener pruebas para dos muestras relacionadas se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5 Cuadros de diá!o"o anti"uos5 %uestras re!acionadas&&&
:e muestra la si$uiente ventana
&n esta salida se puede ele$ir una o m0s variables de contraste numéricas. 6ara ello se pulsa en cada una de las variables. a primera de ellas aparecer0 en la sección Se!ecciones actua!es como :ariab!e. se pulsa en la variable Crudo la se$unda variable aparecer0 como :ariab!e se pulsa en la variable Cocido. I continuación se pulsa en el botón de (lecha para incluir las variables en la campo Contrastar pares* :e pulsa Aceptar y se muestra la si$uiente salida
&n el te)t de )ilco+on los ran$os est0n basados en el valor absoluto de la di(erencia entre las dos variables contrastadas. &l si$no de la di(erencia es usado para clasi(icar los casos en uno o tres $rupos* di(erencia menor %ue H ,ran$os ne$ativos mayor %ue cero ,ran$os positivos o i$ual a cero ,empates. os casos de empates son i$norados
&l p-valor asi$nado al contraste H.H21 ,:i$ asintótica bilateral nos indica %ue se debe rechazar la hipótesis nula de %ue no e)isten di(erencias entre los dos $rupos