Prueba de Hipotesis de Chi Cuadrado

PRUEBA DE HIPOTESIS DE CHI CUADRADO Objetivos

1. Realizar contrastes de hipótesis paramétricos para la media de una población normal. 2. Realizar contrastes de hipótesis paramétricos para comparar dos medias de variables normales en muestras independientes y en muestras apareadas. 3. Realizar contrastes de hipótesis para comparar dos proporciones. 4. Realizar contrastes de hipótesis no-paramétricos de independencia para variables cualitativas. 5. Realizar contrastes de hipótesis no-paramétricos de bondad de ajuste de distribuciones. . Realizar contrastes de hipótesis no-paramétricos de aleatoriedad. !. Realizar contrastes de hipótesis no-paramétricos de dos muestras independientes y de dos muestras relacionadas.

Conceptos básicos Contraste de hipótesis. "n contraste de hipótesis es un proceso estad#stico mediante el cual se investi$a si una propiedad %ue se supone %ue cumple una población es compatible con lo observado en una muestra de dicha población. &s un procedimiento %ue permite ele$ir una hipótesis de trabajo de entre dos posibles y anta$ónicas. Hipótesis Estadística. 'odo contraste de hipótesis se basa en la (ormulación de dos hipótesis e)haustivas y mutuamente e)clusivas*

1. +ipótesis nula , H0 2. +ipótesis alternativa , H1  a hipótesis H0 es la %ue se desea contrastar. /onsiste $eneralmente en una a(irmación concreta sobre la (orma de una distribución de probabilidad o sobre el valor de al$uno de los par0metros de esa distribución. &l nombre de nula si$ni(ica sin valor e(ecto o consecuencia lo cual su$iere %ue H0 debe identi(icarse con la hipótesis de no cambio ,a partir de la opinión actual no di(erencia no mejora etc. H0 representa la hipótesis %ue mantendremos a no ser

%ue los datos indi%uen su (alsedad y puede entenderse por tanto en el sentido de neutra. a hipótesis H0 nunca se considera probada aun%ue puede ser rechazada por los datos. 6or ejemplo la hipótesis de %ue dos poblaciones tienen la misma media puede ser rechaada (0cilmente cuando ambas di(ieren mucho analizando muestras su(icientemente $randes de ambas poblaciones pero no puede ser "demostrada" mediante muestreo puesto %ue siempre cabe la posibilidad de %ue las medias di(ieran en una cantidad lo su(icientemente pe%ue7a para %ue no pueda ser detectada aun%ue la muestra sea muy $rande. 8ado %ue descartaremos o no la hipótesis nula a partir de muestras obtenidas ,es decir no dispondremos de in(ormación completa sobre la población no será posib!e "arantiar #ue !a decisi$n to%ada sea !a correcta&

a hipótesis H1 es la ne$ación de la nula. 9ncluye todo lo %ue H0 e)cluye. ¿Qué asignamos como H0 y H1 ?

a hipótesis H0 asi$na un valor espec#(ico al par0metro en cuestión y por lo tanto 'e! i"ua!( sie%pre )or%a parte de H0& a idea b0sica de la prueba de hipótesis es %ue los hechos ten$an probabilidad de rechazar H0. *a hip$tesis H0 es !a a)ir%aci$n #ue podr+a ser rechaada por !os hechos& E! inter,s de! investi"ador se centra- por !o tanto- en !a H1& La rega de decisión. &s el criterio %ue vamos a utilizar para decidir si la hipótesis nula planteada debe o no ser rechazada. &ste criterio se basa en la partición de la distribución muestral del estad#stico de contraste en dos re$iones o zonas mutuamente e)cluyentes* Re$ión cr#tica o re$ión de rechazo y Re$ión de no-rechazo. !egión de norecha#o. &s el 0rea de la distribución muestral %ue corresponde a los valores del estad#stico de contraste pró)imos a la a(irmación establecida

en H0. &s lostanto valores del estad#stico de contraste %ue nosdel conducen a de decidir H0decir . &s por el 0rea correspondiente a los valores estad#stico contraste %ue es probable %ue ocurran si H0 es verdadera. :u probabilidad se denomina nive! de con)iana y se representa por . / $ & !egión de recha#o o región crítica. &s el 0rea de distribución muestral %ue corresponde a los valores del estad#stico de contraste %ue se encuentran tan alejados de la a(irmación establecida en H0 %ue es muy poco probable %ue ocurran si H0 es verdadera. :u probabilidad se denomina nive! de si"ni)icaci$n o nive! de ries"o y se representa con la letra 0 .

;a de(inidas las dos zonas la re$la de decisión consiste en rechazar H0 si el estad#stico de contraste toma un valor perteneciente a la zona de rechazo o mantener H0 si el estad#stico de contraste toma un valor perteneciente a la zona de no-rechazo. E! ta%a1o de !as onas de rechao 2 no/rechao se determina (ijando el valor

de < es decir (ijando el nivel de si$ni(icación con el %ue se desea trabajar. :e suele tomar un 1= o un 5=. a (orma de dividir la distribución muestral en zona de rechazo y de no-rechazo depende de si el contraste es bilateral o unilateral. a zona cr#tica debe situarse donde puedan aparecer los valores muestrales incompatibles con H0. Estadístico de contraste. "n estad#stico de contraste es un resultado muestral %ue cumple la doble condición de* 



6roporcionar in(ormación emp#rica relevante sobre la a(irmación propuesta en la H0. 6oseer una distribución muestral conocida

%ipos de contrastes. Contrastes para%,tricos3 /onocida una v.a. con una determinada distribución

se establecen a(irmaciones sobre los par0metros de dicha distribución. Contrastes no para%,tricos* as a(irmaciones establecidas no se hacen en base a la distribución de las observaciones %ue a priori es desconocida &

%ipos de hipótesis de contraste. Hip$tesis si%p!es3 a hipótesis asi$na un >nico valor al par0metro desconocido H: θ = θ0 Hip$tesis co%puestas* a hipótesis asi$na varios valores posibles al par0 metro desconocido H: θ ∈ , θ1  θ2 )

H0 ? θ ? θ0 H1 ? θ @ θ0

:imple - /ompuesta

H0 ? θ A θ0 H1 ?θ B θ0

/ompuesta - /ompuesta

H0 ? θ C θ0 H1 ? θ D θ0

/ompuesta - /ompuesta

La !egas de decisión.

a. Contrastes &iateraes' :i la hipótesis alternativa da lu$ar a una re"i$n cr+tica 'a a%bos !ados( del valor del par0metro diremos %ue el test es &iatera o de dos coas . :e rechaza H0 si el estad#stico de contraste cae en la zona cr#tica es decir si el estad#stico de contraste toma un valor tan $rande o tan pe%ue7o %ue la probabilidad de obtener un valor tan e)tremo o m0s %ue el encontrado es menor %ue < E2.

b.

Contraste uni!atera!3 :i la hipótesis alternativa da lu$ar a una re"i$n cr+tica 'a un so!o !ado de! va!or de! pará%etro(- diremos %ue el test es uniatera o de una soa coa

:e rechaza H0 si el estad#stico de contraste cae en la zona cr#tica es decir si toma un valor tan $rande %ue la probabilidad de obtener un valor como ese o mayor es menor %ue < .

Contraste bi!atera!

Contraste uni!atera!3 Co!a a Contraste uni!atera!3 Co!a a !a derecha

!a i#uierda

H0 ? θ A θ0

H 0 ? θ C θ0

H1 ?θ B θ0

H1 ? θ D θ0

H0 ? θ ? θ 0 H1 ? θ @ θ0

La decisión'

6lanteada la hipótesis (ormulados los supuestos de(inido el estad#stico de contraste y su distribución muestral y establecida la re$la de decisión el paso si$uiente es obtener una muestra aleatoria de tama7o n calcular el estad#stico de contraste y tomar una decisión* 



:i es estad#stico de contraste cae en la zona cr#tica se rechaza H0. :i es estad#stico cae en la zona de no rechazo se mantiene H0.

Si rechaa%os Ho a)ir%a%os #ue !a hip$tesis es )a!sa  es decir %ue a(irmamos

con una probabilidad e%uivocarnos %ue hemos conse$uido probar %ue esa hipótesis es (alsa. 6or
Errores de %ipo ( y ((.



Error de tipo I3 :e comete cuando se decide rechazar la hipótesis

nula H0 %ue en realidad es verdadera. a probabilidad de cometer ese error es 0. )4 Rechaar H0 5 H0 es verdadera 6 7 0 

Error de tipo II3 :e comete cuando se decide no rechazar la hipótesis

nula H0 %ue en realidad es (alsa. a probabilidad de cometer ese error es 8 . )4 9o rechaar H0 5 H0 es )a!sa 6 7 8

6or tanto 



. / 0 es !a probabi!idad de to%ar una decisi$n correcta cuando H0 es verdadera. . / 8 es !a probabi!idad de to%ar una decisi$n correcta cuando H0 es )a!sa&

E! si"uiente cuadro resu%e !as ideas3 9atura!ea de H0 :erdadera

;a!sa

Error de tipo I

Decisi$n correcta

)*$

)*1+

Decisi$n correcta

Error de tipo II

)*1$

)*+

Rechaar H0 Decisi$n 9o rechaar H0 





a di(icultad al usar un procedimiento basado en datos muestrales es %ue debido a la variabilidad de muestreo puede resultar una muestra no representativa y por tanto resultar#a un rechazo erróneo de H0. a probabilidad de cometer un error de tipo 9 con nuestra decisión es una probabilidad conocida pues el valor de < lo (ija el propio investi$ador. :in embar$o la probabilidad de cometer un error de tipo 99 F  es un valor desconocido %ue depende de tres (actores* 

a hipótesis H1 %ue consideremos verdadera.



&l valor de < .



&l tama7o del error t#pico ,desviación t#pica de la distribución muestral utilizada para e(ectuar el contraste.

!eaciones entre os errores de %ipo ( y ((. &l estudio de las relaciones entre los errores lo realizamos mediante el contraste de hipótesis*

6ara ello utilizamos la in(ormación muestral proporcionada por el estad#stico media muestral 

/ual%uier valor atribuido a G 1 en H1 ,siempre mayor a GH $enerar0 distribuciones muestrales distintas para la media muestral. Iun%ue todas tendr0n la misma (orma unas estar0n m0s alejadas %ue otras de la curva de H0 es decir unas ser0n distintas de otras >nicamente en el valor asi$nado a G1 .

/uanto m0s se aleje el valor G1 de GH  m0s hacia la derecha se desplazar0 la curva H1  y en consecuencia m0s pe%ue7a se har0 el 0rea F . 6or lo tanto e! va!or de 8 depende de! va!or concreto de < . #ue considere%os verdadero dentro de todos !os a)ir%ados por H1 & 



Cuanto %a2or es 0 - %enor es 8 . :e relacionan de (orma inversa. 6ara una distancia dada entre G H y G1  el solapamiento entre las curvas correspondientes a uno y otro par0metro ser0 tanto mayor cuanto mayor sea el error t#pico de la distribución muestral representada por esas curvas ,cuanto mayor es el error t#pico de una distribución m0s ancha es esa distribución. ; cuanto mayor sea el solapamiento mayor ser0 el valor de F.

RelacionesJentreJlosJerroresJdeJtipoJ9JyJtipoJ99

&n lu$ar de buscar procedimientos libres de error debemos buscar procedimientos para los %ue no sea probable %ue ocurran nin$>n tipo de estos errores. &sto es un buen procedimiento es a%uel para el %ue es pe%ue7a la probabilidad de cometer cual%uier tipo de error. a elección de un valor particular de corte de la re$ión de rechazo (ija las probabilidades de errores tipo 9 y tipo 99. 8ebido a %ue H0 especi(ica un valor >nico del par0metro ha2 un so!o va!or de 0 & :in embar$o hay un valor di(erente de 8 por cada va!or de! pará%etro reco"ido en H1 & &n $eneral un buen contraste o buena re$la de decisión debe tender a %ini%iar !os dos tipos de error inherentes a toda decisión. /omo 0 #ueda )ijado por e! investi"ador- tratare%os de e!e"ir una re"i$n donde !a probabi!idad de co%eter e! error de tipo II sea !a %enor .

"sualmente se dise7an los contrastes de tal manera %ue la probabilidad a sea el 5= ,HH5 aun%ue a veces se usan el 1H= ,H1 o 1= ,HH1 para adoptar condiciones m0s relajadas o m0s estrictas. )otencia de un contraste. &s la probabilidad de decidir H1 cuando ésta es cierta )4 decidir H1 5 H1 es verdadera 6 7 . / 8

&l concepto de potencia se utiliza para medir la bondad de un contraste de hipótesis. /uanto m0s lejana se encuentra la hipótesis H1 de H0 menor es la probabilidad de incurrir en un error tipo 99 y por consi$uiente la potencia tomar0 valores m0s pró)imos a 1. :i la potencia en un contraste es siempre muy pró)ima a 1 entonces se dice %ue el estad#stico de contraste es muy potente para contrastar H0 ya %ue en ese caso las 0 1 muestras cierta. ser0n con alta probabilidad incompatibles con H cuando H sea

6or tanto puede interpretarse la potencia de un contraste como su sensibilidad o capacidad para detectar una hipótesis alternativa. a potencia de un contraste cuanti(ica la capacidad del criterio utilizado para rechazar H0 cuando esta hipótesis sea (alsa &s deseable en un contraste de hipótesis %ue las probabilidades de ambos tipos de error (ueran tan pe%ue7as como (uera posible. :in embar$o con una muestra de tama7o pre(ijado disminuir la probabilidad del error de tipo 9 < conduce a

incrementar la probabilidad del error de tipo 99 F. &l recurso para aumentar la potencia del contraste esto es disminuir la probabilidad de error de tipo 99 es aumentar el tama7o muestral lo %ue en la pr0ctica conlleva un incremento de los costes del estudio %ue se %uiere realizar &l concepto de potencia nos permite valorar cual entre dos contrastes con la misma probabilidad de error de tipo 9 < es pre(erible. :e trata de esco$er entre todos los contrastes posibles con < pre(ijado a%uel %ue tiene mayor potencia esto es menor probabilidad F de incurrir en el error de tipo 99. &n este caso el ema de Keyman-6earson $arantiza la e)istencia de un contraste de m0)ima potencia y determina cómo construirlo. 6otencia de un contraste de hipótesis

Contrastes de hip$tesis para%,tricos &l propósito de los contrastes de hipótesis es determinar si un valor propuesto ,hipotético para un par0metro u otra caracter#stica de la población debe aceptarse como plausible con base en la evidencia muestral. 6odemos considerar las si$uientes etapas en la realización de un contraste* 1. &l investi$ador (ormula una hipótesis sobre un par0metro poblacional por ejemplo %ue toma un determinado valor 2. :elecciona una muestra de la población 3. /omprueba si los datos est0n o no de acuerdo con la hipótesis planteada es decir compara la observación con la teor#a a. :i lo observado es incompatible con lo teórico entonces el investi$ador puede rechazar la hipótesis planteada y proponer una nueva teor#a b. :i lo observado es compatible con lo teórico entonces el investi$ador puede continuar como si la hipótesis (uera cierta. os contrastes de hipótesis %ue construye :6:: son los proporcionados por las Pruebas T estas son de tres tipos* Prueba T para una muestra, Prueba T para muestras independientes y Prueba T para muestras relacionadas

Contrastes de hip$tesis para !a %edia de una pob!aci$n nor%a!

&l procedimiento Prueba T para una muestra mediante SPSS contrasta si la media de una población di(iere de una constante especi(icada. 6ara obtener una 6rueba ' para una muestra se eli$e en el men> principal Ana!iar5Co%parar %edias5Prueba T para una %uestra&&&

&n la salida correspondiente se selecciona una o m0s variables cuantitativas para contrastarlas con el mismo valor supuesto. 6or ejemplo en la si$uiente salida se muestra un contraste para el caso en %ue la media de la variable !on"itud sea i$ual a 2H , :a!or de prueba3 2H

6ulsando Opciones&&& se puede ele$ir el nivel de con(ianza.

:e pulsa Continuar 2 Aceptar. :e obtiene un resumen estad#stico para la muestra y la salida del procedimiento.

&sta salida muestra el tama7o muestral la media la desviación t#pica y error t#pico de la media.

&sta salida muestra los resultados del contraste de la t de Student con un intervalo de con(ianza para la di(erencia entre el valor observado y el valor teórico ,contrastado. /ada una de las columnas de la tabla muestra* 









t ? LL!L* &l valor e)perimental del estad#stico de contraste $l ? 14* os $rados de libertad :i$.? HHHH* &l p-valor o nivel cr#tico del contraste 8i(erencia de medias ? M.312!* &s la di(erencia entre la media teórica ,2H y la media observada ,2M.312! M5= 9ntervalo de con(ianza ? ,!.H3 11.524* &s el intervalo de con(ianza para la di(erencia entre la media teórica y la media observada al nivel de con(ianza del M5=.

Contrastes de hip$tesis para dos %uestras independientes

8e un modo $eneral dos muestras se dice %ue son independientes cuando las observaciones de una de ellas no condicionan para nada a las observaciones de la otra siendo dependientes en caso contrario. &n realidad el tipo de dependencia %ue se considera a estos e(ectos es muy especial* cada dato de una muestra tiene un homónimo en la otra con el %ue est0 relacionada de ah# el nombre alternativo de muestras apareadas. 6or ejemplo supon$amos %ue se %uiere estudiar el e(ecto de un medicamento sobre la hipertensión a un $rupo de 2H individuos. &l e)perimento se podr#a plani(icar de dos (ormas* a.

Iplicando el medicamento a 1H de estos individuos y dejando sin tratamiento al resto. 'ranscurrido un tiempo se miden las presiones san$u#neas de ambos $rupos y se contrasta la hipótesis +H* N1 ? N2 vs +1* N1 DBN2 para evaluar si las medias son i$uales o no. /omo las muestras est0n (ormadas por individuos distintos sin relación entre s# se dir0 %ue son muestras independientes.

b.

Iplicando el medicamento a los 2H individuos disponibles y anotando su presión san$u#nea antes y después de la administración del mismo. &n este caso los datos vienen dados por parejas presión antes y después y tales datos est0n relacionados entre s#. as muestras son apareadas.

&l pa%uete estad#stico :6:: realiza el procedimiento Prueba T para muestras independientes en este procedimiento se compara la media de dos poblaciones normales e independientes. 6ara realizar dicho contraste los sujetos deben asi$narse aleatoriamente a las dos poblaciones de (orma %ue cual%uier di(erencia en la respuesta sea debida al tratamiento ,o (alta de tratamiento y no a otros (actores. &l procedimiento Pruebade T las para muestras independientes contrasta si la di(erencia medias de dos poblaciones mediante normales :6:: e independientes di(iere de una constante especi(icada. 6ara obtener una 6rueba ' para muestras independiente se selecciona en el men> principal Ana!iar5Co%parar %edias5Prueba T para %uestras independientes&&&

:e accede a la si$uiente ventana

donde se puede seleccionar una o m0s variables cuantitativas y se calcula una Prueba T di(erente para cada variable. 6or ejemplo en esta salida se selecciona la variable asimetría. I continuación se selecciona una sola variable de a$rupación en nuestro caso la variable )arte y se pulsa De)inir =rupos para especi(icar los códi$os de los $rupos %ue se %uieran comparar. Oamos a contrastar la i$ualdad de medias de la variable asimetría se$>n la variable )arte ,/anopy :prouts

6ulsando De)inir =rupos... se muestra la si$uiente pantalla

donde se especi(ican el n>mero de $rupos %ue se %uieren comparar. :e pulsa Continuar y después Aceptar y se obtienen las si$uientes pantallas %ue muestran un resumen estad#stico para las dos muestras y la salida del procedimiento.

6ara realizar un contraste de di(erencia de medias de dos poblaciones independientes hay %ue contrastar previamente las varianzas de dichas poblaciones. &sta salida nos muestra el valor e)perimental del estad#stico de contraste ,Pe)p ? 2.H45 este valor deja a la derecha un 0rea i$ual a H.1! ,:i$.? H.1! por lo tanto no se puede rechazar la hipótesis nula de i$ualdad de varianzas. I continuación se realiza el contraste para la di(erencia de medias suponiendo %ue las varianzas son i$uales. a tabla nos muestra el valor e)perimental del estad#stico de contraste ,te)p ? 1.233 y el p-valor ? H.24H ,:i$.? H.24H por lo tanto no se puede rechazar la hipótesis nula de i$ualdad de medias. 'ambién se puede concluir el contraste observando %ue el intervalo de con(ianza para la di(erencia de medias ,-H.H525 H.1M224 contiene al cero.

Contrastes de hip$tesis para %uestras apareadas

&l pa%uete estad#stico :6:: realiza el procedimiento Prueba T para muestras apareadas en este procedimiento se comparan las medias de dos variables de un solo $rupo. /alcula las di(erencias entre los valores de cada caso y contrasta si la media di(iere de cero. 6ara obtener una Prueba T para muestras relacionadas se eli$e en los men>s Ana!iar5Co%parar %edias5Prueba T para %uestras re!acionadas&&&

:e accede a la si$uiente ventana

donde se selecciona un par de variables pulsando en cada una de ellas. a primera variable aparecer0 en la sección Se!ecciones actua!es como ,aria&e 1 y la se$unda aparecer0 como ,aria&e -. "na vez seleccionado el par de variables en nuestro caso sim/ y sim/ se pulsa el botón de (lecha para moverlas a la ventana de :ariab!es re!acionadas. :e puede realizar el contraste para m0s de una pareja de variables simult0neamente.

Il pulsar Continuar y después Aceptar se obtiene un resumen estad#stico para las dos muestras y la salida del procedimiento.

6ara cada variable se presenta la media tama7o de la muestra desviación t#pica y error t#pico de la media.

&sta salida muestra para cada pareja de variables* el n>mero de datos el coe(iciente de correlación y el p-valor asociado al contraste + H* r ? H (rente a + 1* r DB H. &l coe(iciente de correlación es i$ual a -H.L1 por lo tanto las variables est0n relacionadas en sentido inverso cuando una crece la otra decrece. Qbservando el p-valor ,H.2H deducimos %ue no se puede rechazar la hipótesis nula ,+H* r ? H por lo tanto no e)iste correlación entre las variables. ,a correlación no es si$ni(icativa.

&sta salida muestra el valor e)perimental del estad#stico de contraste ,t ? 3.MHL y el p-valor i$ual a H.H1! por lo tanto se debe rechazar la hipótesis nula de i$ualdad de medias.

Contrastes de hip$tesis para dos proporciones independientes& >uestras "randes

&l contraste de hipótesis para la comparación de dos proporciones independientes se basa en la distribución apro)imada de un estad#stico muestral %ue re%uiere muestras $randes. &l pa%uete estad#stico :6:: no incluye el c0lculo de dicho estad#stico permitee)acto el c0lculo de otros cuatro estad#sticos para muestras $randes y elpero estad#stico de Pisher para muestras pe%ue7as. &l contraste de comparación de dos proporciones es un caso particular del contraste de homo$eneidad de dos muestras de una variable cualitativa cuando ésta sólo presenta dos modalidades. 6or ello el procedimiento %ue vamos a realizar es el an0lisis de una tabla de contin$encia 2)2. 6ara obtener el procedimiento Tablas de continencia se eli$e en los men>s Ana!iar5Estad+sticos descriptivos5Tab!as de contin"encia&&&

&n la ventana emer$ente se seleccionan las variables dicotómicas %ue se van a contrastar. 6or ejemplo en la si$uiente salida se muestra el procedimiento de 'ablas de contin$encia en el %ue se comparan las variables 2e3o y 4umador para ello se han seleccionado la variable Se?o y mediante el botón de (lecha se ha pasado al campo ;i!as* y la variable 4umador %ue se ha pasado al campo Co!u%nas* ,:e desea comparar la proporción de (umadores en los $rupos ,hombres y mujeres.

:e pulsa el botón Casi!!as&&& y se selecciona en ;recuencias @Observadas y en Porcentajes @;i!a

:e pulsa Continuar y en la pantalla correspondiente se pulsa el botón Estad+sticos&&& y se selecciona Chi/cuadrado

:e pulsa Continuar y Aceptar. :e muestran la Tabla de continencia y los contrastes !hicuadrado

/ada casilla de esta tabla muestra la (recuencia observada y el porcentaje %ue ésta representa sobre el total de la (ila la tabla de contin$encia :e)o  Pumador. as proporciones muestrales %ue vamos a comparar son 1HE2 y 14E24 . 6ara ello se realiza un contraste bilateral para evaluar si e)isten di(erencias si$ni(icativas entre ambas proporciones muestrales ,+ H* p1 - p2?H (rente a +1* p1 - p2 DBH

&sta tabla muestra los resultados de cinco estad#sticos para la comparación de ambas proporciones. Seneralmente en el caso de muestras $randes se eli$e el estad#stico Correcci$n por continuidad. 8icho estad#stico calcula el estad#stico /hi-cuadrado con la corrección por continuidad de ;ates. &n nuestro caso el valor de dicho estad#stico es 1.25M y el p-valor asociado es H.22 ,:i$. asintótica bilateral por lo tanto no se debe rechazar la +ipótesis nula es decir las di(erencias observadas entre las proporciones de (umadores en los dos $rupos no son estad#sticamente si$ni(icativas. &n el caso de muestras pe%ue7as se decide a partir del Estad+stico e?acto de ;isher&

Contrastes de hip$tesis no para%,tricos &n la sesión anterior hemos estudiado contrastes de hipótesis acerca de par0metros poblacionales tales como la media y la varianza de ah# el nombre de contrastes paramétricos. &n estad#stica paramétrica se trabaja bajo el supuesto de %ue las poblaciones poseen distribuciones conocidas donde cada (unción de distribución teórica depende de uno o m0s par0metros poblacionales. :in embar$o en muchas situaciones es imposible especi(icar la (orma de la distribución poblacional. &l proceso de obtener conclusiones directamente de las observaciones muestrales sin (ormar los supuestos con respecto a la (orma matem0tica de la distribución poblacional se llama teor+a no para%,trica. &n esta sesión vamos a realizar procedimientos %ue no e)i$en nin$>n supuesto o muy pocos acerca de la (amilia de distribuciones a la %ue pertenece la población

y cuyas observaciones pueden ser cualitativas o bien se re(ieren a al$una caracter#stica ordenable. &stos procedimientos reciben el nombre de Contrastes de hip$tesis no para%,tricos&

Is# uno de los objetivos de esta sesión es el estudio de contrates de hipótesis para determinar si una población tiene una distribución teórica espec#(ica. a técnica %ue nos introduce a estudiar esas cuestiones se llama Contraste de !a Chi/cuadrado para !a Bondad de Ajuste. "na variación de este contraste se emplea para resolver los Contrastes de Independencia. 'ales contrastes pueden utilizarse para determinar si dos caracter#sticas ,por ejemplo pre(erencia pol#tica e in$resos est0n relacionadas o son independientes. ; por >ltimo estudiaremos otra variación del contraste de la bondad de ajuste llamado Contraste de Ho%o"eneidad. 'al contraste se utiliza para estudiar si di(erentes poblaciones son similares ,u homo$éneas con respecto a al$una caracter#stica. 6or ejemplo %ueremos saber si las proporciones de votantes %ue (avorecen al candidato I al candidato T o los %ue se abstuvieron son las mismas en dos ciudades.

E! procedi%iento Prueba de !a Chi/cuadrado

+emos a$rupado los procedimientos en los %ue el denominador com>n a todos ellos es %ue su tratamiento estad#stico se aborda mediante la distribución !hi cuadrado. &l procedimiento Prueba de !hicuadrado tabula una variable en cate$or#as y calcula un estad#stico de !hicuadrado. &sta prueba compara las (recuencias observadas y esperadas en cada cate$or#a para contrastar si todas las cate$or#as contienen la misma proporción de valores o si cada cate$or#a contiene una proporción de valores especi(icada por el usuario. 6ara obtener una prueba de !hicuadrado se eli$en en los men>s Ana!iar5Pruebas no para%,tricas5Cuadros de diáo!o"o anti"uos5Chi/ cuadrado&&&

&n la salida correspondiente se selecciona una o m0s variables de contraste. /ada variable $enera una prueba independiente.

6or ejemplo en la si$uiente salida se muestra una Prueba de !hicuadrado en la %ue la variable a contrastar es 5ía de a semana ,:e desea saber si el n>mero de altas diarias de un hospital di(iere dependiendo del d#a de la semana

:e pulsa Opciones&&& para obtener estad#sticos descriptivos cuartiles y controlar el tratamiento de los datos perdidos

Il pulsar Continuar y Aceptar se muestran las si$uientes salidas

&n esta salida se muestra* 9 observado* Uuestra la (recuencia observada para cada (ila ,d#a. :e observa en esta tabla %ue el n>mero de altas diarias de un total de 5LM altas por semana es* 44 el domin$o !L el lunes etc. 9 esperado* Uuestra el valor esperado para cada (ila ,suma de las (recuencias observadas dividida por el n>mero de (ilas. &n este ejemplo hay 5LM altas

observadas por semana resultando alrededor de L4 altas por d#a. Residua!* Uuestra el residuo ,(recuencia observada menos el valor esperado. a

tabla muestra %ue el domin$o hay muchas menos altas de pacientes %ue el viernes. 8e lo %ue parece deducirse %ue todos los d#as de la semana no tienen la misma proporción de altas de pacientes. 6or >ltimo la si$uiente salida muestra el resultado del contraste !hicuadrado

&l valor e)perimental del estad#stico de contraste de !hicuadrado es i$ual a 2M.3LM y el p-valor asociado es menor %ue H.HH1 ,:i$ ? H.HHH por lo tanto se rechaza la hipótesis nula. &n consecuencia el n>mero de altas en los pacientes di(iere dependiendo del d#a de la semana.

Contrastes de Independencia3 Procedi%iento Tab!as de contin"encia

&l procedimiento Tablas de continencia proporciona una serie de pruebas y medidas de asociación para tablas de doble clasi(icación. 6ara obtener tablas de contin$encia se selecciona en el men> principal Ana!iar5Estad+sticos descriptivos5Tab!as de contin"encia&&&

&n el cuadro de di0lo$o resultante se especi(ican las variables %ue (orman la tabla. "na de las variables se introduce en ;i!as* y la otra variable se introduce en Co!u%nas*

Estad+sticos&&& &n este cuadro de especi(ican di0lo$o se pulsa el botón se accede a otra ventana donde se los valores numéricos %ue se y desea obtener. :e selecciona Chi/cuadrado

:e pulsa Continuar y se selecciona Casi!!as&&& para obtener (recuencias observadas y esperadas porcentajes y residuos

:e pulsa Continuar y se selecciona ;or%ato para especi(icar el orden de las cate$or#as ,ascendente o descendente

:e pulsa Continuar y Aceptar. :e muestran las si$uientes salidas

donde* 



* K>mero de datos v0lidos con los %ue se trabaja es el 1HH= de los datos * n>mero de datos no v0lidos

a si$uiente salida nos muestra la 'abla de /ontin$encia de las variables seleccionadas

6or >ltimo muestra el resultado del contraste de hipótesis.

&l p-valor ,:i$ ? H.25 indica %ue no debe rechazarse la hipótesis de independencia.

Otros contrastes no para%,tricos

E! procedi%iento Prueba bino%ia!

&l procedimiento Prueba binomial compara las (recuencias observadas de las dos cate$or#as de una variable dicotómica con las (recuencias esperadas en una distribución binomial con un par0metro de probabilidad especi(icado. 6or de(ecto el par0metro de probabilidad para ambos $rupos es H.5. :e puede cambiar el par0metro de probabilidad en el primer $rupo. :iendo la probabilidad en el se$undo $rupo i$ual a uno menos la probabilidad del primer $rupo. :i las variables no son dicotómicas se debe especi(icar un punto de corte. Uediante el punto de corte se divide la variable en dos $rupos el (ormado por los casos mayores o i$uales %ue el punto de corte y el (ormado por los casos menores %ue el punto de corte. 6ara obtener una Prueba binomial se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5Bino%ia!&&&

&n la salida correspondiente se selecciona una o m0s variables de contraste numéricas.

:e deja la opción por de(ecto Contrastar proporci$n* H.5H. ,Vueremos ver si el porcentaje de mujeres en un determinado estudio es del 5H= es decir %ueremos contrastar +H* p ? H.5 (rente a + 1* p DB H.5. &n esta ventana se pulsa el botón Opciones&&& y se accede a otra ventana para obtener estad#sticos descriptivos cuartiles y controlar el tratamiento de los datos perdidos. :e pulsa Aceptar y se muestra la si$uiente salida

:6:: realiza un contraste bilateral. 8e un total de 4!4 personas se observa %ue el 54 = son hombres y el 4= son mujeres. &l p-valor del contraste ,:i$. asintót. bilateral es H.H nos indica %ue no debe rechazarse la hipótesis nula. &ste procedimiento permite dicotomizar una variable continua. 6or ejemplo %ueremos saber si el 3H= de las personas de un estudio son menores de 25 a7os. 6ara resolverlo en el campo De)inir !a dicoto%+a pondr#amos en el Punto de corte* el valor de 25 y en el campo Contrastar proporci$n* pondr#amos H.3H. Contraste de a!eatoriedad& Test de Rachas

&l procedimiento Prueba de #achas contrasta si es aleatorio el orden de aparición de los valores de una variable. :e puede utilizar para determinar si la muestra (ue e)tra#da de manera aleatoria. "na racha es una secuencia de observaciones similares una sucesión de s#mbolos idénticos consecutivos. &jemplo* W W - - - W - - W W W W - - - , rachas. "na muestra con un n>mero e)cesivamente $rande o e)cesivamente pe%ue7o de rachas su$iere %ue la muestra no es aleatoria. 6ara obtener una Prueba de #achas se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5Cuadros de diáo!o"o anti"uos5Rachas&&&

&n la salida correspondiente se selecciona una o m0s variables de contraste numéricas.

&n el campo Punto de corte se especi(ica un punto de corte para dicotomizar las variables seleccionadas. :e puede utilizar como punto de corte los valores observados para la media la mediana o la moda o bien un valor especi(icado. os casos con valores menores %ue el punto de corte se asi$nar0n a un $rupo y los casos con valores mayores o i$uales %ue el punto de corte se asi$nar0n a otro $rupo. :e lleva a cabo una prueba para cada punto de corte seleccionado. &n esta ventana se pulsa el botón Opciones&&& y se accede a otra ventana para obtener estad#sticos descriptivos cuartiles y controlar el tratamiento de los datos perdidos. :e pulsa Aceptar y se obtiene la salida del procedimiento

&n esta salida se muestran los si$uientes valores* 

:a!or de !a prueba 7 .&FG* &s el punto de corte para dicotomizar la

variable seleccionada. &n esta tabla el punto de corte es la media muestral



Casos  :a!or de prueba 7 .* 8e los 5H casos contrastados 21 de ellos

tienen valores menores %ue la media. os consideramos los casos ne$ativos 

Casos  :a!or de prueba 7 J* 8e los 5H casos contrastados 2M de ellos

tienen valores mayores %ue la media. os consideramos los casos positivos 

9K%ero de rachas 7 F* "na racha se de(ine como una secuencias de

casos al mismo lado del punto de corte ,sucesión de s#mbolos idénticos consecutivos 



L 7 &GJ* Oalor e)perimental del estad#stico de contraste Si"& Asint$t @bi!atera! 7 &F* &l p-valor o nivel cr#tico del contraste %ue nos indica el rechazo de la hipótesis de aleatoriedad

Contraste sobre bondad de ajuste3 Procedi%iento Prueba de Mo!%o"orov/ S%irnov

&l procedimiento Prueba de $olmooro%Smirno% para una muestra compara la (unción de distribución acumulada observada de una variable con una distribución teórica determinada %ue puede ser la distribución Kormal la "ni(orme la de 6oisson o la &)ponencial. a & de $olmooro%Smirno% se calcula a partir de la di(erencia mayor ,en valor absoluto entre las (unciones de distribución acumulada teórica y observada. &sta prueba de bondad de ajuste contrasta si las observaciones podr#an razonablemente proceder de la distribución especi(icada. 6ara obtener una Prueba de $olmooro%Smirno% se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5Cuadros de diá!o"o anti"uos5M/ S de . %uestra&&&

:e muestra la si$uiente ventana

&n esta salida se puede ele$ir una o m0s variables de contraste numéricas cada variable $enera una prueba independiente. &le$iremos la variable Crecimiento una vez seleccionada la variable se pasa al campo Contrastar variab!e* mediante el botón de (lecha o pulsando dos veces en la variable

:e selecciona la distribución a la %ue %ueremos ajustar los datos en el campo Distribuci$n de contraste. &n esta ventana se pulsa el botón Opciones&&& y se accede a otra ventana para obtener estad#sticos descriptivos cuartiles y controlar el tratamiento de los datos perdidos :e pulsa Aceptar y se obtiene la salida del procedimiento

&n esta salida se muestran los si$uientes valores* 









.N* K>mero de observaciones del (ichero de datos &* K>mero medio de plantas .&NF* 8esviación t#pica del n>mero de plantas &.G* 8i(erencia mayor encontrada entre el valor teórico de la distribución normal y el valor observado &.* 8i(erencia positiva mayor encontrada entre la distribución teórica y

la distribución emp#rica 

/&.G* 8i(erencia ne$ativa mayor encontrada entre la distribución teórica y la distribución emp#rica



.&G.* Oalor e)perimental del estad#stico de contraste



&* p-valor asociado al contraste

&l p-valor+,:i$. Isintót ,bilateral ? H.HH2 indica %ue debe rechazarse la hipótesis H de normalidad de (orma %ue no se admite %ue la distribución de los datos sea de tipo Kormal. Pruebas para dos %uestras independientes

&l procedimiento Pruebas para dos muestras independientes compara dos $rupos de casos e)istentes en una variable y comprueba si provienen de la misma población ,homo$eneidad. &stos contrastes son la alternativa no paramétrica de los tests basados en el t de :tudent sirven para comparar dos poblaciones independientes. :6:: dispone de cuatro pruebas para realizar este contraste.

*a prueba U de >ann/hitne2 es la m0s conocida de la pruebas para dos

muestras independientes. &s e%uivalente a la prueba de la suma de ran$os de Xilco)on y a la prueba de YrusZal-Xallis para dos $rupos. Re%uiere %ue las dos muestras probadas sean similares en la (orma y contrasta si dos poblaciones muestreadas son e%uivalentes en su posición. *a prueba L de Mo!%o"orov/S%irnov 2 !a prueba de rachas de a!d/ o!)oQit son pruebas m0s $enerales %ue detectan las di(erencias entre las posiciones y las (ormas de las distribuciones. *a prueba de Mo!%o"orov/ S%irnov se basa en la di(erencia m0)ima absoluta entre las (unciones de distribución acumulada observadas para ambas muestras. /uando esta di(erencia es si$ni(icativamente $rande se consideran di(erentes las dos distribuciones. *a prueba de rachas de a!d/o!)oQitcombina y ordena las observaciones de ambos $rupos. :i las dos muestras proceden de una misma población los dos $rupos deben dispersarse aleatoriamente en la ordenación de los ran$os. *a prueba de reacciones e?tre%as de >oses presupone %ue la variable

e)perimental a(ectar0 a al$unos sujetos en una dirección y a otros en dirección opuesta. a prueba contrasta las respuestas e)tremas compar0ndolas con un $rupo control. 6ara obtener Pruebas para dos muestras independientes se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5Cuadros de diá!o"o anti"uos5 %uestras independientes&&&


&n esta salida se puede ele$ir una o m0s variables de contraste numéricas. :e eli$e la variable %iempo una vez seleccionada la variable se pasa al campo Contrastar variab!e* mediante el botón de (lecha o pulsando dos veces en la variable. :e selecciona de a$rupación en nuestro casotiempo la variable es 6rupo ,:e desea una sabervariable si las persona (umadoras tardan m0s en dormirse %ue las no (umadoras

:e pulsa De)inir "rupos&&& para dividir el archivo en dos $rupos o muestras y emer$e la si$uiente ventana

6ara se$mentar el archivo en dos $rupos o muestras se introduce un valor entero para el =rupo . y un valor entero para el =rupo . Is# en los campos =rupo . y =rupo  se ponen los valores con los %ue est0n codi(icados ;u%ador ,con 1 y 9o;u%ador ,con 2 respectivamente. /omo indica la si$uiente salida

Continuar :e pulsa se y como est0 marcado de(ectosalidas el test ' de (ann )hitne* pulsa Aceptar y se obtiene las por si$uientes

as observaciones de ambos $rupos se combinan para (ormar una sola muestra se ordenan linealmente y se les asi$na un ran$o asi$n0ndose el ran$o promedio en caso de producirse empate conservando su identidad como $rupo. &l estad#stico ) de )ilco+on )m- es la suma de los ran$os asociados con las observaciones %ue ori$inariamente constituyen la muestra menor ,Pumadores. :e realiza est0 elección ya %ue se piensa %ue si la población de Pumadores est0 situada por debajo de la población de KoPumadores entonces los ran$os menores tender0n a asociarse con los valores de los Pumadores. &llo producir0 un valor pe%ue7o para el estad#stico )m. :i es cierto lo contrario ,la población de Pumadores est0 situada por encima de la población de KoPumadores entonces los ran$os mayores se encontrar0n entre los Pumadores dando lu$ar a un valor $rande del estad#stico )m. 8e esta (orma se rechaza + H si el valor

observado )m(uera demasiado pe%ue7o o demasiado $rande para %ue se debiera al azar. :i las di(erencias entre los $rupos se deben al azar el ran$o promedio de los dos $rupos deber#a ser apro)imadamente i$ual. &n la salida anterior se observa %ue hay una di(erencia de alrededor de siete minutos ,Ran$o promedio de Pumadores es 1!.! el de los KoPumadores es 11.H!. :iendo mayor el tiempo %ue tarda en dormirse los Pumadores. &n la si$uiente salida se muestran los valores e)perimentales de los estad#sticos de contrastes y el p-valor asociado

:6:: calcula dos estad#sticos* U de >ann/hitne2 y  de i!co?on como ambos estad#sticos son e%uivalentes :6:: muestra un >nico valor de p-valor ,:i$. Idem0s en el c0lculo de dicho p-valor aplica una apro)imación a la distribución normal la cual sólo es v0lida para muestras $randes. &l estad#stico ' de (ann)hitne* como el de ) de )ilco+on dependen de las observaciones de los dos $rupos linealmente ordenadas. &l estad#stico ' es el n>mero de veces %ue un valor de los Pumadores precede al de los KoPumadores. &l &stad#stico ' ser0 $rande si la población de los Pumadores est0 situada por encima de la población de los KoPumadores y ser0 pe%ue7o si sucede lo contario. &l estad#stico de contraste )m es la suma de los ran$os asociados a los Pumadores. /omo sospechamos %ue los Pumadores tardan m0s tiempo en %uedarse dormidos %ue los KoPumadores se rechaza la +ipótesis nula de %ue no e)isten di(erencias entre los dos $rupos si el valor de )m es demasiado pe%ue7o para %ue se deba al azar. &l p-valor asociado al contraste H.H32 nos conduce a rechazar la hipótesis nula de %ue no e)iste di(erencias entre los dos $rupos y concluimos %ue los

Pumadores tienden a tardar m0s tiempo en %uedarse dormidos %ue los KoPumadores. Procedi%iento Pruebas para dos %uestras re!acionadas

&stas pruebas comparan las distribuciones de dos poblaciones relacionadas. :e supone %ue la distribución de población de las di(erencias emparejadas es simétrica. SPSS dispone de cuatro pruebas para realizar este contraste !a prueba de si"nos- !a prueba de i!co?on de !os ran"os con si"no- !a prueba de >c9e%ar y !a prueba de ho%o"eneidad %ar"ina!& a prueba apropiada

depende del tipo de datos* 

8atos continuos se utiliza la prueba de si"nos o la prueba de i!co?on de !os ran"os con si"no. a prueba de !os si"nos calcula las di(erencias entre las dos variable y clasi(ica las di(erencias como positivas ne$ativas o empatadas. :i las dos variables tienen una distribución similar el n>mero de di(erencias positivas y ne$ativas no di(iere de (orma si$ni(icativa. a prueba de i!co?on de !os ran"os con si"no tiene en cuenta la in(ormación del si$no de las di(erencias y de la ma$nitud de las di(erencias entre los pares. 8ado %ue esta prueba incorpora m0s in(ormación acerca de los datos es m0s potente %ue la prueba de los si$nos.



8atos binarios se utiliza la prueba de >c9e%ar dicha prueba se usa normalmente cuando las medidas est0n repetidas es decir la respuesta de cada sujeto se obtiene dos veces una antes y otra después de %ue ocurra un evento especi(icado. &sta prueba determina si la tasa de respuesta inicial ,antes del evento es i$ual a la tasa de respuesta (inal ,después del evento. &s >til para detectar cambios en la respuesta en los dise7os del tipo antesdespués.



8atos cate"$ricos se utiliza la prueba de ho%o"eneidad %ar"ina! . &s una e)tensión de la prueba de UcKemar a partir de la respuesta binaria a la respuesta multinomial. /ontrasta los cambios de respuesta utilizando la distribución de /hi-cuadrado y es >til para detectar cambios de respuesta en dise7os antes-después.

6ara obtener pruebas para dos muestras relacionadas se selecciona en el men> principal Ana!iar5Pruebas no para%,tricas5 Cuadros de diá!o"o anti"uos5 %uestras re!acionadas&&&


&n esta salida se puede ele$ir una o m0s variables de contraste numéricas. 6ara ello se pulsa en cada una de las variables. a primera de ellas aparecer0 en la sección Se!ecciones actua!es como :ariab!e. se pulsa en la variable Crudo la se$unda variable aparecer0 como :ariab!e se pulsa en la variable Cocido. I continuación se pulsa en el botón de (lecha para incluir las variables en la campo Contrastar pares* :e pulsa Aceptar y se muestra la si$uiente salida

&n el te)t de )ilco+on los ran$os est0n basados en el valor absoluto de la di(erencia entre las dos variables contrastadas. &l si$no de la di(erencia es usado para clasi(icar los casos en uno o tres $rupos* di(erencia menor %ue H ,ran$os ne$ativos mayor %ue cero ,ran$os positivos o i$ual a cero ,empates. os casos de empates son i$norados

&l p-valor asi$nado al contraste H.H21 ,:i$ asintótica bilateral nos indica %ue se debe rechazar la hipótesis nula de %ue no e)isten di(erencias entre los dos $rupos

Prueba de Hipotesis de Chi Cuadrado

Recommend Documents