Regresion lineal Problema 1 Los datos datos de la la tabla tabla adjun adjunta ta muestr muestran an el el tiempo tiempo de impre impresión sión de traba trabajos jos que que se han imprimido en impresoras de la marca PR. Se está interesado en estudiar la relación existente entre la variable de interés “ tiempo de impresión de un trabajo ! la variable variable explicativ explicativa a “número de páginas del trabajo” ."acer ."acer el estudio en base a los datos obtenidos en el muestreo ! que son los de la tabla adjunta.
Problema 2. #n la tabla adjunta se presentan el n$mero de páginas ! el precio de doce libros técnicos%
páginas
precio
páginas
precio
páginas
precio
&'(
&)*(
+((
,)((
+-(
-)*(
&((
&)*(
'(
'),(
/'(
*)((
-,(
&)*(
+&(
)((
+-(
*)+(
&'(
)&(
-&(
&)-(
+*(
&)(
'. 0justar 0justar una una recta recta de regresi regresión ón por por m1nimos m1nimos cuadr cuadrados ados.. Problema 3. La resiste resistencia ncia del del cemento cemento depende depende22 entre entre otras otras cosas2 cosas2 del tiempo tiempo de de secado secado del cement cemento o . #n un experimento se obtuvo la resistencia de bloques de cemento con di3erente tiempo de secado los resultados 3ueron los siguientes%
Resistencia (kg/cm 2)
Tiempo (días)
'
'&)(
'&)&
''),
-
-')4
-+)*
-+)
&
-4),
-,)(
-+)'
-+)-
-/)-
&-)+
&()+
&+)*
&&)'
&*)
-,
+'),
+-)/
+()&
&*)
&)&
'. 0nali5ar la posible existencia de una relación entre estas dos variables. -. Si se utili5ase un ajuste cuadrático 6se obtienen mejores resultados7 Problema 4 La variable representa en miles2 el n$mero de asnos en #spa8a ! la del presupuesto del #stado dedicado a #ducación.
a8o
Y
X
a8o
Y
X
a8o
Y
X
'4( '4* '4& ( '4& * '4+ (
'.(( / '.'/ '.+ 4 ,(*
*)*
+
4)
+/
'-)
&-
4)/
&,/
'')*
/,&
,)4
'4 ( '4 * '4, (
&/,
'')+
,)-
/,/
'')+
4*
,)/
'4+ * '4* ( '4* * '4/ ( '4/ *
+4&
'()/
+), ),
el tanto por ciento
'. Representar grá3icamente estos datos. -.
9onstruir la recta de regresión que explique el comportamiento de la variable “tanto por ciento del presupuesto del #stado dedicado a #ducación en 3unción de la variable “el n$mero de asnos en #spa8a e interpretar los resultados
&. Representar las variables X e Y 3rente al tiempo. Problema 5
Se llevó a cabo un estudio para determinar la relación entre el n$mero de a8os de experiencia ! el salario mensual2 en miles de pesetas2 entre los in3ormáticos de una región espa8ola. Para ello2 se tomó una muestra aleatoria de ' in3ormáticos ! se obtuvieron los siguientes datos
Eper.
!alario
Eper.
!alario
Eper.
!alario
'& '/ &( , /
-/)' &&)&/)' '/)* -/)+ '4)'
&' '4 -( ' + '(
&/)+ &&), &/)* '/)4 '4), -+)/
- -* '* '&
&/)( &/)* -')+ &')( &')+
'.
9alcular la regresión lineal de la variable salario 3rente a a8os de experiencia.
Problema " #l siguiente conjunto de datos era tomado sobre grupos de trabajadoras de :nglaterra ! ;alés en el per1odo de '4(<-. 9ada grupo está 3ormado por trabajadores de la misma pro3esión =médicos2 trabajadores textiles2 decoradores2...etc2> ! en cada uno de los veinticinco grupos muestreados se han observado dos variables% el 1ndice de estandari5ado de consumo de cigarrillos =variable regresora2 x > ! el 1ndice de muertes por cáncer de pulmón =variable dependiente2 y >. '. #studiar el modelo de regresión lineal del 1ndice de mortalidad 3rente al 1ndice de 3umadores.
x
y
x
y
x
y
'& '' 4+ ''/ '(''' 4& ,,
,+ ''/ '-& '-, '** '(' '', ''& '(+
'(4' '(+ '( ''''& ''( '-*
,, '(+ '-4 ,/ 4/ '++ '&4 ''&
'&& ''* '(* , 4' '(( / //
'+/ '-, ''* 4 ,* '-( /( *'
Problema # 0nscombe utili5ó el siguiente conjunto de datos para demostrar la importancia de los grá3icos en el análisis de regresión ! correlación. "a! cuatro conjuntos de datos bidimensionales 2 el vector X es el mismo para los tres primeros conjuntos.
X ' ? X - ? X &
Y'
Y-
Y &
X +
Y+
'(
,)(+
4)'+
)+/
,
/)*,
,
/)4*
,)'+
/)
,
*)/
'&
)*,
,)+
'-)+
,
)'
4
,),'
,)
)''
,
,),+
''
,)&&
4)-/
),'
,
,)+
'+
4)4/
,)'(
,),+
,
)(+
/
)-+
/)'&
/)(,
,
*)-*
+
+)-/
&)'(
*)&4
,
*)*/
'-
'(),+
4)'&
,)'*
,
)4'
+),-
)-/
/)+-
,
/),4
*
*)/,
+)+
*)&
'4
'-)*(
'. 9alcular la recta de regresión de Y 3rente a X en estos cuatro conjuntos de datos. -. @ibujar la grá3ica de Y 3rente a X, 6qué conclusiones se deducen7
Problema $ #n &+ lotes de '-( libras de cacahuetes se observó el nivel medio de a3latoxin =partes por billón>
! el porcentaje de cacahuetes no contaminados en cada lote
.
X
Y
X
Y
X
Y
X
Y
X
Y
&)(
44)4 ' 44)4 4 44)4, 44)4 ' 44)4* 44)4/ ' 44),& (
',),
44)4+ 44)4& 44)4( , 44)4 ( 44)4, * 44)4& & 44)' ,
+/),
44),/ & 44),' ' 44), 44)4 , 44),* * 44), , 44)/+ -
'-)&
44)4* / 44),' 44)4 44),, 4 44)4/ ' 44)4, 44)/* ,
-*),
44),* , 44)4 * 44)4, 44)4* , 44)4( 4 44),* 4
+) ,)& 4)& 4)4 '')( ,&)-
',)4 -') -')4 --), -+),&)/
+/), *,)' /-)& ()/ ')' 44)*
')& '-)* '-)/ '*)4 '/) ''')-
',), &()/ &/)&4), ++)&
'. 0nali5ar estos datos e investigar la relación entre estas dos variables para predecir Y en 3unción de X . 6#s adecuado el ajuste lineal7 Problema % #n quince casas de la ciudad de Ailton Be!nes se observó durante un per1odo de tiempo la di3erencia de temperatura promedio =en grados cent1grados> entre la temperatura en la calle ! la temperatura en casa2 ! el consumo de gas diario en CDh.
&i'. temp
onsm o
&i'. temp
onsm o
&i'. temp
onsm o
'()& '')+ '')* '-)* '&)'
/4),' ,-)* ,')* ,()&, ,*),4
'&)+ '&)/ '*)( '*)'*)&
*)&/4),' ,)*+ ,')-4 44)-(
'*)/ '/)+ '/)* ')( ')'
,/)&* ''()-& '(/)** ,*)*( 4()(-
'. "acer una grá3ica de los datos. 6#xiste relación entre estas dos variables7 -. 6Se puede explicar el consumo de gas por una relación lineal con la di3erencia de temperatura7 Problema 1* Se midió la altura =en cent1metros> ! el peso =en Cilogramos> de treinta chicas de once a8os del "eaton Aeiddle School de Erad3ord. #studiar estos datos ! la relación entre ambas variables.
0ltura
Peso
0ltura
Peso
0ltura
Peso
0ltura
Peso
0ltura
Peso
'&* '+/ '*& '*+ '&4 '&' '+4
-/ && ** *( &-* ++
'+' '&/ '*+ '*' '** '& '+&
-, -, &/ +, &/ &' &/
'+4 '+ '*'+( '+& '+/ '&&
+/ &/ + && +&* &'
'+, '+4 '+' '/+ '+/ '& '&*
&&+ -4 + & &+ &(
'+4 '+'
&&-
'.
@ibujar la grá3ica de estas observaciones ! calcular la recta de regresión de peso 3rente a la altura ! la de altura 3rente a peso.
-.
#n la regresión lineal de peso 3rente a altura2 6se observa alguna observación at1pica7.
Problema 11 #l contenido en hierro de las escorias de los altos hornos puede ser determinada por una prueba qu1mica en laboratorio o2 de 3orma más barata ! más rápida2 por un test magnético. Se está interesado en estudiar la relación entre los resultados del test qu1mico ! del test magnético. #n particular2 se desea saber si a partir de los resultados del test magnético se
pueden estimar los resultados del test qu1mico sobre el contenido del hierro. Para ello2 se han reali5ado los dos test a un conjunto de lotes recogidos secuencialmente en el tiempo. Los resultados obtenidos los de la tabla adjunta. '. 0nali5ar estos datos. "acer un estudio descrptivo ! grá3ico de los mismos. -. #studiar la relación entre los tests.
Fui
Aag
Fui
Aag
Fui
Aag
Fui
Aag
Fui
Aag
Fui
Aag
-+ '/ -+ ', ', '( '+ '/ -*
-* -' -' -( '& '/ '+ -,
', -( -' -( -' '* '/ '* -*
'4 '( -& -( '4 '* '/ '/ &/
' '4 '/ '* '* '& -+ -&-
''* '* '* '* ' ', '/ +(
-' -+ '* -( -( -* - --,
', --( -' -' -* -', &&
-( -+ -+ -& -4 - -& '4 -*
-' ', -( -* -( ', '4 '/ &&
-* '* '/ - - &( -4 -/
'/ '/ -/ -, -, &( &-,
Problema 12 Los siguientes datos representan el Producto Gacional Eruto de HS0 consumo en miles de millones de dólares de '4-2 entre los a8os '4/(<'4,(
! los gastos de
+,o
1%"*
1%"1
1%"2
1%"3
1%"4
1%"5
1%""
PNB
&)-
*/)/
,(()&
,&-)*
,/)+
4-4)&
4,+),
G
+*-)(
+/')+
+,-)(
*(()*
*-,)(
**)*
*,*)
+,o
1%"#
1%"$
1%"%
1%#*
1%#1
1%#2
1%#3
PNB
'.('')+
'.(*,)'
'.(,)/
'.(,*)/
'.'--)+
'.',*)4
'.-**)(
G
/(-)
/&+)+
/*)4
/-)'
/4/),
&)'
/,)*
+,o
1%#4
1%#5
1%#"
1%##
1%#$
1%#%
1%$*
PNB
'.-+,)(
'.-&&)4
'.&(()+
'.&')
'.+&/)4
'.+,&)(
'.+,()
G
/&)/
,()-
,-&)
,/&)4
4(+),
4&()4
4&*)'
'.
0justar un modelo lineal e interpretar los coe3icientes de regresión simple.
-. "acer la grá3ica de los residuos estandari5ados 3rente al tiempo. Problema 13
Los datos de la tabla adjunta son el conjunto clásico de datos del test psicológico de Strong sobre retención de memoria. Los datos se tomaban de la siguiente manera% un conjunto de individuos memori5aban una lista de objetos inconexos ! pasado un tiempo la recordaban. La variable p indicael por!entage de reten!ión de memoria en promedio ! la variable t es el tiempo transcurrido. #l objetivo del estudio era explicar la variable pen 3unción de t.
t
p
t
p
t
p
t
p
'
(),+
/(
()*+
-(
()&/
'(( ,(
()(,
*
()'
'-(
( )+
()-/
'*
()/'
-+(
( )+*
&(
()*/
+,(
( )&,
'++ ( -,, ( */ (
()-( ()'/
'. 0nali5ar este conjunto de datos ! estudiar la relación de la variable p respecto a t. Problema 14 La dure5a de los árboles es di31cil de medir directamente2 sin embargo la densidad si es relativamente 3ácil de medir. Por ello es de gran interés disponer de un modelo que permita predecir la dure5a de un árbol a partir de su densidad. Por este motivo se ha tomado una muestra de &/ eucaliptos australianos ! se les midió su densidad = X > ! su dure5a =Y >. Los resultados obtenidos son los de la tabla adjunta.
&ensidad
&re-a
&ensidad
&re-a
&ensidad
&re-a
-+) -+), -)& -,)+ -,)+ -4)( &()& &-) &*)/ &,)* &,), &4)&
+,+ +- +'& *' *+4 /+, *, (+ 44 4'+ '(( '(-(
&4)+ &4)4 +()& +()/ +() +() +-)4 +*), +/)4 +,)*')* *')*
'-'( 4,4 ''/( '('( ''(( ''&( '-( '',( '+(( '/( ''( -('(
*&)+ */)( */)* *)& *)/ *4)*4), //)( /)+ /,), /4)' /4)'
',,( '4,( ',-( -(-( '4,( -&'( '4+( &-/( -(( -,4( -+( &'+(
#n base a estos datos2 '. #studiar el modelo de regresión lineal de Y respecto a X. "# $andboo% o& small data sets” 2 editado por @.I. "and2 J. @al!2 0.@. Lunn2 B.I. Ac9onKa! ! # stroKsC!. 9hapman M "all.