ANALISIS REGRESI MODEL KUADRATIK MAKALAH Disusun untuk memenuhi tugas mata kuliah Analisis Regresi yang dibina oleh Ir. Hendro Permadi, M.Si
Oleh Miftahur Rohmah ( 408312408015 ) Nindy Sagita ( 408312409123 ) Dyah Ayu Puspitasri ( 408312409601 )
UNIVERSITAS NEGERI MALANG FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI MATEMATIKA September 2010
PENDAHULUAN
Latar belakang
Analisis regresi merupakan salah satu uji statistika yang memiliki dua jenis pilihan model yaitu linear dan dan non linear dalam parameternya. Keliniearan analisis regresi dapat diuji melalui suatu pengujian hipotesis, dimana jika hipotesis nol itu diterima maka disimpulkan bahwa pendekatan regresi linear sederhana yang dilakukan sudah mendekati pola data yang dibentuk pasangan data x dan y, atau dikatakan model yang diperoleh sudah mendekati pola data asli. Akan tetapi jika hipotesis nol ditolak maka pendekatan analisis regresi linear sederhana tidak dapat dilakukan untuk menarik kesimpulan dari pasangan data x dan y, dan sebagai gantinya digunakanlah analisis regresi non-linear yang parameternya bersifat kuadratik dan kubik dengan kurva yang dihasillkan membentuk garis lengkung .
Rumusan Masalah
1. Apakah yang dimaksud dengan regresi non linear model kuadratik? 2. Bagaimanakah aplikasi dari regresi non linear model kuadratik ke dalam soal? 3. Bagaimana anova yang diperoleh dari data yang diolah?
Tujuan
1. Untuk mengetahui pengertian dari regresi non linear model kuadratik. 2. Untuk mengetahui aplikasi dari regresi non linear model kuadratik dalam soal. 3. Mengetahui anova yang diperoleh dari data yang diolah.
PEMBAHASAN
Regresi non linear model kuadratik merupakan hubungan antara dua peubah yang terdiri dari variabel dependen ( Y ) dan variabel independen ( X ) sehingga akan diperoleh suatu kurva yang membentuk garis lengk ung lengk ung menaik (β2>0) atau menurun (β2<0). Bentuk persamaan matematis model kuadratik secara umum menurut Steel dan Torrie (1980) adalah : 2
(a). Polynomial : E(Y) = β0 + β1X + β2X x
(b). Exponensial : E(Y) = β0β1
(c). Logaritma Logaritma : Log E(Y) = β’0β’1X Untuk mengaplikasikan analisis regresi non linear dalam makalah ini yaitu dengan membahas model polynomial kuadratik dengan rumus matematis adalah sebagai berikut : 2
y = a0 + a1x + a2 x Untuk menduga koefisien
,
dan
dapat menggunakan metode kuadrat terkecil
yang dibantu dengan bentuk catatan matrik. Langkah awal menggunakan metode kuadrat terkecil dengan meminimumkan:
yaitu dengan mengenolkan turunan sebagian dari persamaan di atas yang diturunkan terhadap ,
dan
, diperoleh:
Sehingga diperoleh system persamaan linear dalam
,
dan
, sebagai berikut:
Dari persamaan diatas dapat diperoleh persamaan normal matriknya :
=
A ( X’X )
b
=
b
=
g ( X’Y )
Contoh soal:
1. Seorang dosen olahraga ingin melakukan penelitian terhadap hasil loncat jauh mahasiswanya (y) yang dikaitkan dengan lamanya melakukan pemanasan (x). Dari hasil pengumpulan data yang berkaitan dengan lama pemanasan dan hasil loncatan atas sampel 10 mahasiswa yang diambil secara random, sebagai berikut: Lama pemanasan (menit) (X)
Hasil loncat jauh (meter) (Y)
5,0
3,00
7,5
3,15
10,0
3,50
12,5
3,70
15,0
3,90
17,5
3,85
20,0
3,80
20,5
3,75
21,0
3,65
22,0
3,60
Mengerjakan menggunakan minitab x
y
COEF1 FITS1
RESI1 RESI1
SRES1
5,0
3,00
3,02991 3,21537
-0,215371
-1,35571
7,5
3,15
0,03709 3,30810
-0,158101
-0,89994
10,0
3,50
3,40083 0,099169 0,53084
12,5
3,70
3,49356 0,206439 1,06822
15,0
3,90
3,58629 0,313709 1,60496
17,5
3,85
3,67902 0,170979 0,88323
20,0
3,80
3,77175 0,028249
20,5
3,75
3,79030 -0,040296 -0,21695
21,0
3,65
3,80884 -0,158842 -0,86423
22,0
3,60
3,84593 -0,245934 -1,37153
0,15067
Worksheet size: 100000 cells
Regression Analysis
The regression equation is y = 3,03 + 0,0371 x
Predictor
Coef
Constant
3,0299
0,1823
16,62
0,000
0,03709
0,01128
3,29
0,011
x
S = 0,2060
StDev
R-Sq = 57,5%
T
P
R-Sq(adj) = 52,2%
Analysis of Variance
Source
DF
Regression
1
Residual Error Total
SS
MS
F
0,45938
0,45938
10,82
8
0,33962
0,04245
9
0,79900
P 0,011
Normal Normal Probability Plot of the Residuals Residuals (response is y)
1
0
-1
- 0,3
-0,2
-0,1
0,0
0,1
0,2
Residual
Gambar di atas menunjukkan hubungan antara x (variable terikat ) dan y (variable bebas)
uji linier Y = 3,02991 + 3,71E-02X R-Sq = 57,5 %
3,9 3,8 3,7 3,6 3,5
y
3,4 3,3 3,2 3,1 3,0 5
10
15
x
20
0,3
Untuk mengetahui bahwa data yang kita olah merupakan model kuadratik, terlebih dahulu kita uji dengan uji linear. Dari gambar di atas kita mengetahui bahwa R-Sq=57,5%, sedangkan apabila data tersebut merupakan model liniear seharusnya R-Sq mendekati 95%. Jadi dari uji linear ini kita mengetahui bahwa data yang kita peroleh tidak cocok menggunakan model liniear. Sehingga kita mencoba menguji data yang kita peroleh menggunakan uji kuadratik dan kita peroleh gambar seperti di bawah ini.
uji kudratik Y = 1,93469 + 0,229174X - 6,91E-03X**2 R-Sq = 95,4 % 4,0
3,5
y
3,0
5
10
15
20
x
Dari gambar diatas kita dapat melihat bahwa data yang kita peroleh lebih cocok untuk model kuadratik karena R-Sq=95,4% yaitu memenuhi R-Sq=95%.
model kuadratik I Chart of Residuals
Normal Plot of Residuals 2
2
l a u d i s e R
1
1
l a u d i s e R
0
3,0SL=1,707
0
X=-0,04704
-1
-1 -3,0SL=-1,802
-2 -1
0
1
0
2
3
4
5
6
7
8
Observation Observation Num ber
Histogram Hi stogram of Residuals
Residuals vs. Fits
9
10 10
2
2
y c n e u q e r F
1
Normal Score
1
l a u d i s e R
1
0
-1 0 -1,5
-1,0
-0 ,5
0,0
0 ,5
1 ,0
1,5
3,0
Residual
3,4
Fit
Polynomial Regression
Y = 1,93469 + 0,229174X - 6,91E-03X**2 R-Sq = 95,4 %
Analysis of Variance SOURCE
DF
SS
Regression
2
0,762375
0,381188 72,8555 2,06E-05
Error
7
0,036625
0,005232
Total
9
0,799000
SOURCE
3, 2
MS
F
DF
Seq SS
F
P
Linear
1
0,459384
10,8212
1,10E-02
Quadratic
1
0,302992
57,9101
1,25E-04
P
3 ,6
3,8
Model Kuadratik Y = 1,93469 + 0,229174X - 6,91E-03X**2 R-Sq = 95,4 %
4,0
3,5
y
3,0
Regression 95% CI 95% PI
5
10
15
20
x
Memeriksa mean square
R-Sq
atau koefisien determinasi menyatakan seberapa besar keragaman variable variable X
mempengaruhi Y. Berdasarkan perhitungan minitab diperoleh R-Sq sebesar 95,4 . R-Sq berkisar antara 0 sampai 1, dengan catatan semakin kecil nilai R-Sq, semakin lemah hubungan antara kedua variabel(begitu juga sebaliknya). Pengujian koefisien regresi
Hipotesis : artinya tidak ada pengaruh waktu pemanasan terhadap jauhnya loncatan. H 1 : b1
0
artinya ada pengaruh waktu pemanasan terhadap jauhnya loncatan.
Menggunakan Menggunakan uji T: Ttabel dengan
0.05
diperoleh hasil 2,1098.
Thitung dari hasil minitab sebesar 29,48. Karena T hit>Ttabel sehingga menolak H 0. Hal ini berarti ada pengaruh waktu pemanasan terhadap jauhnya loncatan.
Pengujian model regresi
Hipotesis: H0: model yang diperoleh tidak berarti. H1: model yang diperoleh berarti. Menggunakan Menggunakan uji F: F: Ftabel dengan derajat bebas (2) dengan
0.05
sebesar 1. sedangkan F hitung dari
minitab 72,8555. Karena Fhit>Ftabel maka menolak H 0 dengan kata lain model yang diperoleh berarti. Pengujian asumsi 1. Uji Kebebasan Uji Uji Kebebasan Kebebas an 1,0 0,8 0,6 0,4 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -1,0
1,0
1,5
2,0
Lag
Corr
T
LBQ
1
-0,09
-0,29
0,11
2
-0,09
-0,28
0,23
Dari gambar di atas grafik tidak membentuk garis corong atau membentuk garis horizontal dan plot autokorelasi dari nilai sisaannya tidak membentuk pola acak yang berarti bahwa dapat dikatakan tidak ada autokorelasi antarsisaan atau saling bebas.
2. Uji Normalitas Uji Normalitas
,999 ,99 ,95 ,80 ,50 ,20 ,05 ,01 ,001
-0,1
0,0
0,1
RESI2 Average: -0,0000000 -0,0000000 StDev: 0,0637920
Anderson-Darling ing Normality ormality Test A-Squared: 0,205 0,205
N: 10
P-Value: 0,821
Tampak titik-titik plot tidak jauh dari garis merah dan karena P-value (0.821) > α(0,05) maka memenuhi asumsi kenormalan sisaan. Selain itu, dari gambar di atas dapat kita lihat bahwa plot yang terbentuk membentuk suatu garis lurus, maka dapat dikatakan sisaan mengikuti sebaran normal. 3. Uji kehomogenitasan
I Chart for RESI1 RES I1 0,4 3,0SL=0,3217
0,3 0,2 0,1 0,0
X=-1,3E-16
-0,1 -0,2 -0,3
-3,0SL=-0,3217
-0,4 0
1
2
3
4
5
6
Observation Observation Num ber
7
8
9
10 10
Dari grafik diatas dapat kita simpulkan bahwa antara variable terikat dengan variable bebas mempunyai keragaman yang homogen, dengan melihat titik-titik plotnya saling menyebar dan tidak ada titik plot yang melewati 2 garis merah itu berarti tidak ada data pencilan.
Mengerjakan menggunakan SPSS
MODEL: MOD_1. Dependent variable.. X
Method.. LINEAR
Listwise Deletion of Missing Data
Multiple R
,75825
R Square
,57495
Adjusted R Square
,52182
Standard Error
42,11958
Analysis of Variance:
DF Sum of Squares
Mean Square
Regression
1
19197,525
19197,525
Residuals
8
14192,475
1774,059
F = 10,82124
Signif F = ,0110
-------------------- Variables in the Equation --------------------
Variable
Y (Constant)
B
SE B
Beta
T
Sig T
1,550063
,471206
,758253
3,290
,0110
-405,472466
169,686459
-2,390
,0439
Dependent variable.. X
Method.. QUADRATIC
Listwise Deletion of Missing Data
Multiple R
,79868
R Square
,63789
Adjusted R Square
,53443
Standard Error
41,56033
Analysis of Variance:
DF Sum of Squares
Mean Square
Regression
2
21299,171
10649,586
Residuals
7
12090,829
1727,261
F = 6,16559
Signif F = ,0286
-------------------- Variables in the Equation --------------------
Variable
Y Y**2 (Constant)
B
16,316618 -,021421 -2928,738899
SE B
Beta
T
Sig T
13,394922
7,981699
1,218
,2626
-7,227801
-1,103
,3065
,019420 2293,625818
-1,277
,2424
X 300
200
100 Observed Linear 0
Quadratic
280
300
320
340
360
380
400
Y
1. Uji F
Dari table ANOVA diatas diperoleh
sebesar 6,16559 dengan tingkat signifikansi
sebesar 0,0286. Oleh karena probabilitas (0,0286) < 0,05(dalam kasus ini menggunakan taraf signifikansi atau
=5%), maka model regresi nonlinier quadratik ini dapat digunakan
untuk memprediksi jauhnya loncatan. Biasanya output ini digunakan untuk menguji hipotesis. Hipotesisnya yaitu : H0 : tidak ada hubungan antara waktu pemanasan terhadap jauhnya loncatan. H1 : ada hubungan antara waktu pemanasan terhadap jauhnya loncatan. Ftabel = 1 Karena statistik hitung (F hitung ) = 6,16559 > statistik tabel(F tabel) = 1, maka menolak H0, dan probabilitas (0,0286) jauh lebih kecil dari 0.05 maka model regresi dapat dipakai untuk memprediksi jauhnya loncatan.
2. Uji T
Uji t digunakan untuk menguji signifikansi konstanta dan variabel independen (pengamatan).
Menguji signifikan konstanta pada model.
Hipotesis: H0 : koefisien regresi a tidak signifikan. H1 : koefisien regresi a signifikan. Dalam tabel koefisien diperoleh nilai signifikan sebesar 0,0286 dibandingkan dengan taraf signifikan ( =5%) 0,05 maka : Sig = 0,0286 <
= 0,05, maka disimpulkan bahwa menolak H 0, yang berarti koefisien
regresi a signifikan.
3. Kesimpulan dari jawaban mengenai analisis data diatas kita memperoleh : Pada kasus ini, seluruh responden mempunyai kemampuan yang hampir sama, sehingga perbedaan jauh loncatan memang dipengaruhi oleh lamanya melakukan pemanasan. Secara teoritis dosen tersebut telah menemukan bahwa semakin lama melakukan pemanasan akan menurunkan kemampuan loncatan. Dengan demikian dosen tersebut mempunyai praduga bahwa hubungan antara lama melakukan pemanasan dan jauh loncatan tidak berbentuk garis linear tapi berbentuk parabola.
KESIMPULAN
Analisis regresi memiliki dua sifat analisis yaitu bersifat linear dan non linear. Pada sifat linear, maka kurva akan membentuk arah menaik atau menurun dengan dengan garis lurus tergantung pada hubungan antara variabel dependen dan variabel independen baik sederhana maupun berganda. Sedangkan non linear memiliki dua model yaitu model kuadratik dan kubik dengan kurva membentuk garis lengkung. Dalam analisis regresi non linear pada program statistik SPSS, maka pokok utama adalah terlebih dahulu ditentukannya "nilai" pada parms untuk masing-masing parameter, kemudian menentukan model analisis, dan derivative (DER.) pada setiap parameter. Persamaan regresi non linear model polynomial kuadratik pada analisis data hubungan antara lamanya pemanasan terhadap jauhnya loncatan adalah Y = 1,93469 + 0,229174X - 6,91E03X**2. Dengan demikian pendekatan analisis regresi non linear model polynomial kuadratik dapat diaplikasikan pada hubungan antara lamanya pemanasan terhadap jauhnya loncatan.