By : Anita Eka Putri, staf sainstek Fisika’12
1. Pengenalan Analisis Data dan Statistik Statistika merupakan suatu cabang ilmu yang mempelajari berbagai teknik perancangan, pengumpulan data, pengolahan data, penyajian data, dan pembuatan kesimpulan berdasarkan data yang dimiliki .Dalam penggunaan metode ini melibatkan pengumpulan informasi dan data ilmiah. Model probabilitas didasarkan pada eksperimen – eksperimen yang nanti akan diperoleh hasil yang mungkin namun tidak dapat dikatakan sebelum kejadian itu terjadi. Eksperimen statistik Proses pengamatan yang mengiringi sati tujuan tunggal yang tidak dapat di prediksi sebelumnya. Himpunan dari semua hasil Ruang Sample. Sample. Hasil suatu ruang saple elemen dari ruang sample sedangkan suatu subset dari ruang sample Kejadian Kejadian / / event. Berdasarkan cara pengolahan datanya, statistika dibagi ke dalam dua kelompok besar, yaitu statistika deskriptif dan statistika inferensia. Statistika deskriptif
bidang statistika yang
mempelajari cara atau metode mengumpulkan, menyederhanakan dan menyajikan data serta meringkas data sehingga bisa memberikan informasi yang jelas dan mudah dipahami. Dalam statistika deskripsi belum sampai pada upaya menarik suatu kesimpulan, tetapi baru sampai pada tingkat memberikan suatu bentuk ringkasan data sehingga khalayak/masyarakat awam statistika pun dapat memahami informasi yang terkandung dalam data. Beberapa teknik statistika yang termasuk dalam kelompok ini seperti seperti distribusi frekuensi, ukuran pemusatan dan penyebaran data.
Sedangkan
statistika inferensia inferensia merupakan bidang statistika yang mempelajari cara atau metode penarikan kesimpulan berdasarkan data yang diperoleh dari sampel untuk menggambarkan karakteristik atau ciri dari suatu populasi.
2. Probabilitas ( Peluang ) 2.1 Ruang Contoh dan Kejadian Untuk mempelajari peluang, kita membutuhkan konsep percobaan acak. Percobaan diartikan sebagai suatu tindakan yang dapat diulang-ulang di bawah kondisi tertentu. Perhatikan sebuah percobaan acak sederhana berupa pelemparan sebuah dadu bersisi enam yang seimbang. Hasil yang mungkin diperoleh dari percobaan ini ialah munculnya sisi 1, 2, 3, 4, 5, atau 6. Percobaan ini termasuk acak karena kita tidak bisa memastikan sisi apa yang akan muncul. Dengan menggunakan konsep himpunan, suatu himpunan/gugus yang memuat semua hasil yang berbeda, yang mungkin terjadi dari suatu percobaan dinamakan ruang sampel (sample ( sample space). space). Sedangkan unsur-unsur dari dari suatu ruang ruang sampel disebut titik sampel. Ruang sampel dapat dipandang sebagai himpunan semesta bagi permasalahan yang dihadapi.
Ruang sampel dilambangkan dengan S. Dengan demikian, ruang sampel dari percobaan di atas ialah S={1, 2, 3, 4, 5, 6}. Ruang kejadian adalah himpunan bagian (anak gugus) dari ruang sampel, yang memiliki karakteristik tertentu. Ada dua jenis kejadian, yaitu kejadian dasar dan kejadian majemuk. Contoh, kejadian terambilnya kartu hati dari seperangkat (52 helai) kartu bridge dapat dinyatakan sebagai A = {hati} yang merupakan himpunan bagian dari ruang contoh S={hati, sekop, klaver, wajik}. Jadi A adalah kejadian sederhana. Kejadian B yaitu terambilnya kartu merh merupakan kejadian majemuk, karena B = {hati
wajik} = {hati, wajik}.
Perhatikan bahwa gabungan atau paduan beberapa kejadian kejadian
sederhana menghasilkan kejadian majemuk yang tetap menjadi himpunan bagian ruang contohnya. Suatu kejadian dapat berbentuk himpunan bagian dari S yang tidak mengandung satu pun anggota yang disebut dengan ruang nol atau himpunan kosong dan biasanya dilambangkan dengan . Sebagai contoh, bila A menyatakan kejadian menemukan suatu organisme mikroskopis dengan mata telanjang dalam suatu percobaan biologi maka A =
.
Operasi Kejadian
Komplemen suatu kejadian A terhadap S adalah himpunan semua unsur S yang tidak termasuk A, biasanya dinotasikan dengan lambang Ac. Contoh :
-
Ruang contoh melempar sebuah dadu : S= {1,2,3,4,5,6}
-
Jika A = {1,3,5}, maka A c = {2,4,6}
Irisan dua kejadian A dan B adalah kejadian yang unsurnya termasuk dalam A dan B, dinotasikan dengan lambang A
B. Contoh:
-
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
-
Jika A = {1,2,3} dan B = {2,4,6}, maka A
B = {2}
Gabungan dua kejadian A dan B adalah kejadian yang mengandung semua unsur yang termasuk A atau B atau keduanya, yang dinotasikan dengan lambang A B. Contoh :
-
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
-
Jika A = {1,2,3} dan B = {2,4,6}, maka A
Kejadian A dan B dikatakan saling terpisah (mutually exclusive) unsur persekutuan (bila A
B ={1,2,3,4,6}. bila A dan B tidak memiliki
B =), Contoh:
-
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
-
Jika A = {1,3,5} dan B = {2,4,6}, maka A dan B saling terpisah, karena A
B =.
Kejadian A dan B dikatakan saling bebas bila A dan B tidak saling mempengaruhi, Contoh: Pada pelemparan dua uang logam, kejadian munculnya sisi muka dari uang logam pertama dan uang logam kedua saling bebas
Ruang sampel dilambangkan dengan S. Dengan demikian, ruang sampel dari percobaan di atas ialah S={1, 2, 3, 4, 5, 6}. Ruang kejadian adalah himpunan bagian (anak gugus) dari ruang sampel, yang memiliki karakteristik tertentu. Ada dua jenis kejadian, yaitu kejadian dasar dan kejadian majemuk. Contoh, kejadian terambilnya kartu hati dari seperangkat (52 helai) kartu bridge dapat dinyatakan sebagai A = {hati} yang merupakan himpunan bagian dari ruang contoh S={hati, sekop, klaver, wajik}. Jadi A adalah kejadian sederhana. Kejadian B yaitu terambilnya kartu merh merupakan kejadian majemuk, karena B = {hati
wajik} = {hati, wajik}.
Perhatikan bahwa gabungan atau paduan beberapa kejadian kejadian
sederhana menghasilkan kejadian majemuk yang tetap menjadi himpunan bagian ruang contohnya. Suatu kejadian dapat berbentuk himpunan bagian dari S yang tidak mengandung satu pun anggota yang disebut dengan ruang nol atau himpunan kosong dan biasanya dilambangkan dengan . Sebagai contoh, bila A menyatakan kejadian menemukan suatu organisme mikroskopis dengan mata telanjang dalam suatu percobaan biologi maka A =
.
Operasi Kejadian
Komplemen suatu kejadian A terhadap S adalah himpunan semua unsur S yang tidak termasuk A, biasanya dinotasikan dengan lambang Ac. Contoh :
-
Ruang contoh melempar sebuah dadu : S= {1,2,3,4,5,6}
-
Jika A = {1,3,5}, maka A c = {2,4,6}
Irisan dua kejadian A dan B adalah kejadian yang unsurnya termasuk dalam A dan B, dinotasikan dengan lambang A
B. Contoh:
-
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
-
Jika A = {1,2,3} dan B = {2,4,6}, maka A
B = {2}
Gabungan dua kejadian A dan B adalah kejadian yang mengandung semua unsur yang termasuk A atau B atau keduanya, yang dinotasikan dengan lambang A B. Contoh :
-
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
-
Jika A = {1,2,3} dan B = {2,4,6}, maka A
Kejadian A dan B dikatakan saling terpisah (mutually exclusive) unsur persekutuan (bila A
B ={1,2,3,4,6}. bila A dan B tidak memiliki
B =), Contoh:
-
Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}
-
Jika A = {1,3,5} dan B = {2,4,6}, maka A dan B saling terpisah, karena A
B =.
Kejadian A dan B dikatakan saling bebas bila A dan B tidak saling mempengaruhi, Contoh: Pada pelemparan dua uang logam, kejadian munculnya sisi muka dari uang logam pertama dan uang logam kedua saling bebas
Cara Menghitung Ukuran Ruang Contoh Dalam menghitung peluang suatu kejadian cukup dengan menghitung banyaknya titik sampel suatu kejadian dan ruang sampel tersebut. Berdasarkan banyaknya unsur suatu ruang sampel, ruang sampel dapat dibedakan menjadi dua jenis yaitu ruang sampel diskret dan ruang sampel sampel kontinu. Suatu ruang sampel dikatakan diskret jika banyaknya unsur dari ruang sampel tersebut berhingga atau tidak berhingga terhitung (countable). Sedangkan ruang sampel dikatakan kontinu jika ruang sampel memuat semua bilangan dalam suatu interval tertentu. Jika ruang contoh suatu percobaan terdiri atas kejadian dasar yang diskret terhingga, ada tiga kaidah dasar cara menghitung banyaknya ukuran ruang contoh, yaitu:
1. Pengisian tempat yang tersedia
ada dua kaidah yang dapat digunakan untuk pengisian tempat yang tersedia, yaitu kaidah penggandaan dan kaidah penjumlahan. Pada kaidah penggandaan, misalnya n1 adalah banyaknya cara mengisi tempat pertama, n2 adalah banyaknya cara mengisi tempat kedua setelah tempat pertama terisi dan nk adalah banyaknya cara mengisi tempat ke-k setelah (k-1) tempat-tempat sebelumnya terisi, maka banyaknya cara mengisi k tempat yang tersedia adalah: n1.n2. ... .nk
Contoh : Pada sebuah dealer motor tersedia 4 merk sepeda motor. Masing-masing merk menyediakan 3 jenis kapasitas silinder. Masing-masing sepeda motor dikeluarkan dengan 2 macam warna. Jika seorang pengojek hendak membeli sepeda motor baru, berapa macam pilihan yang dapat dilakukan olehnya? Pikiran pengojek sewaktu memilih merk bercabang empat, sewaktu memilih kapasitas silinder bercabang tiga dan sewaktu memilih warna bercabang dua. Jadi , pilihannya ada 4 x 3 x 2 = 24 macam Kaidah penjumlahan digunakan jika dalam mengisi tempat kedua setelah tempat pertama terisi tidak dapat dilakukan menggunakan benda-benda yang digunakan sebagai pilihan untuk mengisi tempat pertama. Jadi, misalnya n1 adalah banyaknya cara mengisi tempat pertama, n2 adalah banyaknya cara mengisi tempat kedua dan nk adalah banyaknya cara mengisi tempat ke-k, maka banyaknya cara mengisi k tempat yang tersedia adalah: n1 + n2 + ... + nk
Contoh : Dari Jakarta kita dapat pergi ke Bogor menggunakan kendaraan bermotor melalui (1) Parung, (2) jalan lama Cibinong, atau (3) jalan tol Jagorawi. Dari Bogor kita dapat ke Bandung melalui (1) Sukabumi atau (2) Cianjur. Dari Jakarta kita juga dapat ke Bandung melalui (1) jalan tol Cikampek atau (2) jalan lama
Bekasi lewat Purwakarta. Hanya ada satu jalan raya dari Purwakarta menuju Bandung. Ada berapa pilihan untuk pergi ke Bandung dari Jakarta? Jika melalui Bogor ada 3x2 pilihan dan jika melalui Purwakarta ada 2x1 pilihan. Jadi, banyaknya pilihan ada 3x2 + 2x1 = 8 macam
2. Permutasi Pemilihan benda-benda dari suatu gugus benda-benda
S = {e1, e2,
…, en}
dapat dilakukan dengan
permutasi. Permutasi merupakan kejadian dimana susunan objek yang terpilih diperhatikan. Misalkan memilih orang untuk membentuk kepengurusan suatu organisasi, dimana jika Si A terpilih menempati posisi ketua berbeda maknanya dengan Si A terpilih menempati posisi wakil ketua.
Banyaknya permutasi n benda yang berlainan adalah n!
Contoh : Banyaknya permutasi yang berbeda yang dapat disusun dari huruf-huruf dalam kata “LATIH” adalah 5!
= 120
Banyaknya permutasi n benda berlainan jika diambil r benda sekaligus (r
N(S) = P nr
Contoh : Dari 5 orang kandidat akan dibentuk susunan pengurus (Ketua, Wakil, Bendahara) N(S) = P53 = 5!/(5-3)! = 60
Banyaknya permutasi n benda berlainan yang disusun melingkar adalah (n – 1)!
Contoh : Dalam suatu ruangan diskusi dengan bentuk meja melingkar, akan berlangsung diskusi yang akan diikuti 6 peserta. Banyaknya cara keenam orang tersebut duduk pada 6 kursi yang disusun melingkar adalah (6 – 1)! = 5! = 120 cara.
Banyaknya permutasi yang berlainan dari n benda jika n1 diantaranya berjenis pertama, n2 berjenis kedua, …, nk berjenis ke k adalah:
n! n1! n2! ... nk! Contoh :Banyaknya permutasi yang berbeda yang dapat disusun dari huruf-huruf dalam kata “CACAH” adalah 5!/(2!2!1!) = 30
Banyaknya cara menyekat suatu himpunan n benda dalam r sel, masing-masing berisi n 1 unsur dalam sel pertama, n2 dalam sel kedua, …, adalah: n
n!
n1 , n2 , … , nr
,
=
dengan n1+n2+…+nr = n
n1! n2! … nr ! Contoh : Ada suatu kelas yang terdiri atas 12 orang. Banyaknya cara untuk membagi kelas tersebut dalam tiga kelompok yang terdiri atas 5, 4, dan 3 orang adalah 12!/(5!4!3!)=27720 cara
3. Kombinasi Selain permutasi, Pemilihan benda-benda dari suatu gugus benda-benda juga dapat dilakukan dengan cara kombinasi .
S = {e1, e2,
…, en}
Kombinasi merupakan kejadian dimana susunan objek
yang terpilih tidak diperhatikan. Misalkan memilih sejumlah orang untuk menempati suatu sejumlah kursi tempat duduk, dimana susunan tempat duduk tidak menjadi perhatian. Kombinasi tingkat r dari n unsur/objek dapat dirumuskan sebagai berikut:
n! n
C r=
r! (n – r )!
Contoh :Dari 5 orang akan dibentuk tim cepat tepat yang beranggotakan 3 orang. N(S) = C53 = 5!/(5-3)!3! = 10
2.2 Probabilitas Suatu Kejadian Ada tiga pendekatan yang dapat dilakukan untuk menentukan peluang suatu kejadian. Pendekatan tersebut adalah:
1. Secara intuitif kita mungkin merasa, atau didukung oleh percobaan, bahwa dari k hasil percobaan mempunyai kemungkinan sama untuk muncul
2. Peluang suatu kejadian dapat dihitung berdasarkan kepada frekuensi relatif yang teramati dari serangkaian percobaan
3. Peluang suatu kejadian ditentukan secara subyektif berdasarkan pandangan pribadi. Jika A adalah suatu kejadian sembarang, terdapat tiga aksioma peluang: 1.
0 P(A) 1
2.
P(S) = 1
3.
P(Ai
Aj) = P(Ai) + P(Aj), asalkan Ai Aj =
Berdasarkan aksioma (3), misalnya, kita dapat menentukan peluang suatu kejadian sebagai jumlah peluang masing-masing titik sampel yang menjadi anggota kejadian tersebut. Beberapa sifat peluang: 1) untuk sembarang dua kejadian A dan B yang merupakan himpunan bagian S, maka peluang paduan dua kejadian tersebut adalah: P(AB)= P(A) + P(B) – P(AB) 2) untuk sembarang dua kejadian A dan B yang merupakan himpunan bagian S berlaku: P(B) = P(BA) + P(BAc) 3) untuk setiap kejadian A berlaku: P(A) = 1 - P(Ac) 4) Jika A dan B saling bebas, maka P(AB) = P(A) + P(B) 5) Jika A1, A2, ..., An saling bebas, maka P(A1A2...An)= P(A1) + P(A2) + ... + P(A n)
2.3 Peluang Bersyarat / Konditional Peluang bersyarat (conditional probability ) dikatakan bersyarat karena eventnya sudah dibatasi. Jika event pembatas itu A dan event yang probabilitasnya ingin dihitung adalah B, maka peluang bersyaratnya adalah:
P(BǀA) = P (AB) P(A)
Dalam P(B|A), event A adalah kejadian yang terjadi terlebih dahulu atau yang diamati lebih dulu, baru kemudian B. Jika A dan B adalah dua kejadian yang saling bebas, maka P(B|A) = P(B)
2.4 Kejadian Saling Bebas dan Saling Lepas 20 Dua kejadian E dan F dikatakan saling bebas (independent) jika berlaku: P ( AB) = P ( A).P (B) Dua kejadian A dan B dikatakan salinglepas jika berlaku: P (EF ) = 0
2.5 Aturan Bayes
3. KONSEP DASAR PEUBAH ACAK Pengertian Peubah Acak Istilah percobaan atau percobaan statistik telah digunakan untuk menjelaskan sembarang proses yang menghasilkan satu atau lebih ukuran bagi factor kebetulan. Sering kali kita tidak tertarik pada keterangan rinci setiap titik contoh, namun hanya pada suatu keterangan numeric hasil percobaan. Misalnya, ruang contoh yang rinci bagi percobaan pelemparan uang logam sebanyak tiga kali dapat dituliskan sebagai : S = {GGG, GGA, GAG, AGG, GAA, AGA, AAG, AAA}. Bila kita hanya tertarik pada berapa kali sisi gambar muncul, maka nilai numeric 0, 1, 2, atau 3, dapat diberikan pada setiap titik contoh. Bilangan-bilangan 0, 1, 2, dan 3 merupakan besaran acak yang nilainya ditentukan oleh hasil percobaan. Nilai-nilai itu dapat dipandang sebagai nilai-nilai yang dapat diambil oleh suatu peubah acak atau variable acak X tertentu, yang dalam hal ini menyatakan berapa kali sisi gambar muncul bila sekeping uang logam dilempar tiga kali. Dari uraian di atas dapat disimpulkan bahwa peubah acak adalah suatu fungsi yang nilainya berupa bilangan nyata yang ditentukan oleh setiap unsur dalam ruang contoh. Kita dapat menggunakan huruf kapital, misalnya X, untuk melambangkan suatu peubah acak, dan huruf kecil, dalam hal ini x, untuk menyatakan salah satu di antara nilai-nilainya. Dari ilustrasi pelemparan uang logam di atas, kita lihat bahwa peubah acak X bernilai 2 untuk semua unsure dalam himpunan bagian
E = {GGA, GAG, AGG} ruang contoh S. Jadi setiap kemungkinan nilai X menyatakan kejadian yang merupakan himpunan bagian ruang contoh S bagi percobaannya. Ada 2 macam ruang contoh : 1. Ruang Contoh Diskret Bila suatu ruang contoh mengandung jumlah titik contoh yang terhingga banyaknya. 2. Ruang Contoh Kontinu Bila suatu ruang contoh mengandung jumlah titik contoh yang tak terhingga banyaknya Sehingga peubah acak pun ada 2, yaitu peubah acak diskret (peubah acak yang didefinisikan di atas ruang contoh dikret) dan peubah acak kontinu (peubah acak yang didefinisikan di atas ruang contoh kontinu. Dalam prakteknya peubah acak kontinu digunakan untuk data yang diukur . Misalnya tinggi, bobot, suhu, jarak, atau umur. Sedangkan peubah acak diskret digunakan untuk data yang berupa hitungan atau cacahan. Contohnya banyaknya produk yang cacat, banyaknya kecelakaan pertahun di suatu kota dan banyaknya kelereng merah yang diambil pada suatu percobaan . Contoh 5.1 Pada pelemparan tiga uang logam, bila X menyatakan banyaknya muncul sisi angka, tentukan : a. nilai-nilai peubah acak X b. Sebaran peluang X Penyelesaian : Pelemparan tiga uang logam mempunyai ruang contoh : S={(AAA), (AAG),(AGA),(GAA),(GGA),(GAG),(AGG),(GGG)} a. Karena X menyatakan banyaknya muncul sisi angka, pada S, maka nilai-nilai dari X adalah : X={0, 1, 2, 3} X=0, artinya tidak ada sisi angka yang muncul X=1, artinya ada satu sisi angka yang muncul
X=2, artinya ada dua sisi angka yang muncul X=3, artinya ketiganya muncul sisi angka b. Peluang dari nilai-nilai X adalah : P(X=0)=P(GGG)=1/8 P(X=1)=P(GGA)+P(GAG)+P(AGG)=1/8+1/8+1/8=3/8 P(X=2)=P(AAG)+P(AGA)+P(GAA)=1/8+1/8+1/8=3/8 P(X=3)=P(AAA)=1/8 Sehingga sebaran peluang X adalah : X=x
0
1
2
3
P(X=x)
1/8
3/8
3/8
1/8
Sebaran Peluang Diskret Yaitu sebuah table atau rumus yang mencamtumkan semua kemungkinan nilai suatu peubah acak diskret beserta peluangnya. Pada peubah acak diskret, setiap nilainya dikaitkan dengan peluang tertentu. Misalnya pelemparan uang logam sebanyak 3 kali. Peubah acak X menyatakan banyaknya sisi gambar yang muncul. Dengan mengasumsikan peluang yang sama untuk setiap kejadian sederhana, maka semua kemungkinan nilai X berikut peluangnya adalah
x
0
1
2
3
P(X=x)
1/8
3/8
3/8
1/8
Perhatikan bahwa nilai-nilai X mencakup semua kemungkinan sehingga total peluangnya sama dengan 1 Seringkali, suatu peluang peubah acak dinyatakan dalam sebuah rumus, yang merupakan fungsi nilai-nilai x. Biasanya dilambangkan dengan f(x), g(x), r(x) dan sebagainya. Himpunan semua pasangan berurutan (x,f(x)) disebut fungsi peluang atau sebaran peluang bagi peubah acak X. Sifat-sifat peubah acak diskret :
1) f(x)=P(X=x)
2) f(x)
0
Sebaran Peluang Kontinu Untuk memahami pengertian sebaran peluang kontinu, perhatikan ilustrasi berikut: Suatu peubah acak menyatakan tinggi badan semua orang yang berusia di atas 21 tahun. Antara 2 nilai sembarang, misalnya 163.5 dan 164.5, terdapat tak terhingga banyaknya tinggi badan. Dan sangat sulit sekali untuk mencari tinggi badan yang tepat 164 cm.Tetapi tidak demikian, bila kita membicarakan peluang terambilnya seseorang yang tingginya antara 163 sampai 165. Dalam hal ini kita berhadapan dengan sebuah selang nilai peubah acak, dan bukan tepat satu nilai peubah acak. Sehingga sebaran peluang peubah acak kontinu tidak dapat disajikan dalam bentuk tabel, tetapi sebaran ini dapat disajikan dalam bentuk rumus. Rumus ini merupakan fungsi nilai-nilai peubah acak kontinu X, sehingga dapat digambarkan sebagai kurva kontinu. Fungsi peluang yang digambarkan dengan kurva disebut fungsi kepekatan peluang atau fungsi kepekatan. Kebanyakan fungsi kepekatan dalam analisis satistika bersifat kontinu untuk semua nilai X, dan luas daerah menyatakan besarnya peluang.Karena nilai peluang positif, maka fungsi kepekatan seluruhnya terletak di atas sumbu x. Fungsi kepekatan peluang dibuat sedemikian rupa sehingga luas daerah di bawah kurva dan di atas sumbu x sama dengan 1.Sehingga dapat disimpulkan bahwa Fungsi Kepekatan Peluang peubah acak kontinu X adalah fungsi peluang yang digambarkan dengan sebuah kurva, dengan luas daerah di bawah kurva dan di atas sumbu x sama dengan 1, dan bila luas daerah di bawah kurva antara x=a dan x=b, menyatakan peluang X terletak antara a dan b, P(a
1) P(a
f(x)
0
4.
Nilai Harapan Peubah Acak Nilai harapan dari peubah acak adalah pemusatan dari nilai peubah acak jika percobaannya dilakukan secara berulang-ulang sampai tak berhingga kali.
Secara matematis nilai harapan dapat dirumuskan sebagai berikut:
n x x p( xi ), jika X p.a diskret i 1 Ε( X ) x f ( x )dx, jika X p.a kontinu i i
Contoh 5.2 Jika diketahui distribusi peluang dari peubah acak X sebagai berikut:
Nilai peubah Acak X X
0
1
2
3
4
5
P(X=xI)
1/6
1/6
1/6
1/6
1/6
1/6
Xip(xi)
0
1/6
2/6
3/6
4/6
5/6
Dengan demikian nilai harapan p.a X adalah: E(X) = 0 + 1/6 + 2/6 + 3/6 + 4/6 + 5/6 = 15/6 E(3X) = 3 E(X) = 45/6
Contoh 5.3 Ruang contoh untuk percobaan dua buah uang logam adalah S = {GG, GA, AG, AA} Karena keempat titik contoh berpeluang sama untuk terjadi, peluang-peluang tersebut dapat dipandang sebagai frekuensi relatif bagi kejadian-kejadian itu dalam jangka panjang. Sehingga jika seseorang melemparkan dua uang logam yang setimbang berulang-ulang kali, maka rata-rata ia akan memperoleh 1 sisi gambar perlemparan adalah 1, yang didapat dari
= E(Y) = 0.1/4 + 1.1/2 + 2.1/4 = 1
Misalkan X adalah suatu peubah acak diskret dengan sebaran peluang
X X1 P(X=x)
F(x1)
X2
…….
Xn
F(x2)
…….
F(xn)
Maka nilai tengah atau nilai harapan peubah acak g(X) adalah
g ( x ) E ( g ( X ))
n
g ( x ) f ( x ) i
i
i 1
Ragam Peubah Acak Ragam dari peubah acak X didefinisikan sebagai berikut: V(X)
= E(X-E(X))2 = E(X2) – [E(X)]2
Contoh 5.4 Untuk contoh sebelumnya, ragam dari peubah acak X adalah: V(X)
= (0+1/6+4/6+9/6+16/6+25/6) - (15/6) 2 = 55/6 - 225/36 = 105/36
Sifat Nilai harapan Dan Ragam 1.
Bila a dan b konstanta, maka
aX b a x b a b
2.
Nilai harapan jumlah atau selisih dua atau lebih peubah acak sama dengan jumlah atau selisih nilai harapan masing-masing peubah.
X Y X Y dan X Y X Y 3.
Nilai harapan hasilkali dua atau lebih peubah acak yang bebas satu sama lain sama dengan hasilkali nilai harapan masing-masing peubah acak. Jadi jika X dan Y bebas, maka
XY 4.
X Y
Bila X suatu peubah acak dan b konstanta, maka 2 2 2 X b X
5.
Bila X peubah acak dan a adalah konstanta, maka 2 aX a 2 X 2 a 2 2
6.
Ragam jumlah atau selisih dua atau lebih peubah acak yang bebas sama dengan jumlah ragam masing-masing peubah acak. Jadi bila X dan Y bebas, maka
X 2 Y X 2 Y 2 dan X 2 Y X 2 Y 2
SEBARAN PELUANG TEORITIS
Secara garis besar, sebaran peluang teoritis dapat dibedakan atas sebaran diskret dan sebaran kontinu. Sebaran diskret adalah fungsi peluang dari peubah-peubah acak diskret, seperti Bernoulli, Binomial, Hipergeometrik, Poisson, dan lain-lain. Sedangkan sebaran kontinu adalah fungsi peluang peubah-peubah acak kontinu, antar lain Seragam , Normal, dan lain-lain. Berikut ini akan diuraikan beberapa jenis sebaran peluang diskret dan sebaran peluang kontinu.
Sebaran Binom Peubah X yang menyatakan banyaknya kesuksesan dalam n ulangan suatu percobaan binom disebut peubah acak binom, dan sebaran peluang bagi peubah acak binom disebut sebaran binom. Ciri-ciri percobaan binom :
7.
percobaannya terdiri atas n ulangan
8.
dalam setiap ulangan, hasil percobaannya hanya ada 2, yaitu sukses atau gagal
9.
peluang sukses, dilambangkan dengan p, dan untuk setiap ulangan besarnya peluang sama, tidak berubah-ubah
10.
ulangan-ulangan tersebut bersifat bebas satu sama lain
Bila suatu ulangan binom mempunyai peluang sukses p dan peluang gagal q = 1-p, maka sebaran peluang bagi peubah acak binom X, yaitu banyaknya kesuksesan dalam n ulangan yang bebas, adalah
n b( x; n, p) p x q n x , untuk x = 0, 1, 2,…….,n x Nilai sebaran di atas diperoleh dari uraian berikut ini : 11.
pandang peluang sukses x dan gagal n-x dalam suatu urutan tertentu. Karena ulangan semuanya bebas, maka peluang tiap hasil yang berbeda dapat digandakan. Tiap sukses terjadi dengan peluang p dan gagal dengan peluang q=1 – p. jadi peluang untuk urutan tersebut adalah p x qn-x .
12.
tentukan banyaknya semua titik contoh dalam percobaan tersebut yang menghasilkan x yang sukses dan n-x yang gagal. Banyaknya ini sama dengan banyaknya cara memisahkan n hasil menjadi dua kelompok sehingga x hasil berada pada kelompok pertama dan sisanya, n-x hasil, pada kelompok kedua. Banyaknya x hasil yang sukses dapat dinyatakan dengan n . x
13.
karena pembagian kelompok pada (2) saling terpisah, maka peluang x sukses diperoleh dari hasil penggandaan n dengan p x qn-x . x
Nilai tengah dan ragam bagi sebaran binom b(x;n,p) adalah np
dan 2 npq
Sebaran Binomial Kumulatif Ada kalanya perhitungan peluang sebaran binomial lebih mudah dilakukan dengan memakai sebaran kumulatif. Bila pada n percobaan terdapat paling tidak sebanyak r sukses, maka sebaran binomial kumulatif yang ditulis P(Xr), dengan r
P ( X r ) b(r , n, p) b(r 1, n, p) b(n, n, p) n
b( x, n, p) x r
Untuk memperoleh nilai peluang binomial kumulatif dapat menggunakan tabel sebaran binomial.
Contoh 6.1 Dari hasil kajian akademik diperoleh bahwa peluang dosen hadir dalam kegiatan belajar mengajar sebesar 90%. Jika proses belajar mengajar per semester dilakukan sebanyak 14 kali, hitunglah : 14.
peluang dosen hadir dalam kegiatan belajar mengajar sebanyak 10 kali !
15.
peluang dosen hanya tidak hadir satu kali !
16.
peluang dosen hanya tidak hadir pada pertemuan ke 14 !
17.
peluang dosen hanya hadir pada pertemuan pertama !
Penyelesaian : X = banyaknya dosen mengajar dalam satu semester p = 0.9, n = 14
sehingga
18. P(X=10)=
x=0, 1, 2, …, 14
14 14! 0.910 0.11410 0.910 0.14 (1001)3.495 0.035 10!(14 10) ! 10
Atau dengan melihat tabel binom : P(X=10) = P(X10) – P(X9)
=
19.
= 0.0441- 0.0092 = 0.0349
Jika dosen tidak hadir sekali, maka ada 14 kemungkinan dosen tersebut tidak hadir dari 14 pertemuan. Dengan demikian peluangnya :
20.
Karena sudah ditentukan bahwa dosen tidak hadir pada pertemuan ke 14, maka peluangnya :
21.
Karena sudah ditentukan bahwa dosen hanya hadir pada pertemuan pertama, maka peluangnya :
Contoh 6.2 Seorang penjual mengatakan bahwa 25% dari seluruh dagangannya rusak akibat truk yang membawa barang itu mengalami kecelakaan. Jika seseorang membeli barang dagangan itu sebanyak 10 buah, tentukan : 1.
peluang orang itu akan mendapat 5 barang yang rusak
2.
peluang orang tersebut memperoleh minimal 3 tetapi kurang dari 7 barang yang rusak
3.
rata-rata dan simpangan baku barang yang rusak penyelesaian Misalkan X = banyaknya barang yang rusak p = 0.25, n = 10
22.
P(X =5) =P(X5) – P(X4) = 0.9803 – 0.9219 = 0.0584
23.
P(3X<7)=P(3X6) = P(X6) – P(X2) =0.9991-0.6778 = 0.3213
24.
µ = n.p = 10x0.25 = 2.5,
2 = n.p.(1-p) = 10x0.25x0.75 = 1.875
Sebaran Hipergeometrik Ciri-ciri percobaan hipergeometrik :
25.
suatu contoh acak berukuran n diambil dari populasi yang berukuran N
26.
k dari N benda diklasifikasikan sebagai sukses dan N-k benda diklasifikasikan sebagai gagal
Banyaknya
kesuksesan
hipergeometrik,dan
X
dalam
sebaran
suatu
peluang
bagi
percobaan peubah
hipergeometrik acak
disebut peubah
hipergeometrik
disebut
acak
sebaran
hipergeometrik. Bila dalam populasi N benda, k benda diantaranya diberi label sukses dan N-k benda lainnya diberi label gagal maka sebaran peluang bagi peubah acak hipergeometrik X, yang menyatakan banyaknya kesuksesan dalam contoh acak berukuran n, adalah
untuk x = 0,1,2,…..,k
Nilaitengah dan ragam bagi sebaran hipergeometrik h(x;N,n,k) adalah
nk N
dan 2
N n N 1
.n.
k k 1 N N
Contoh 6.3 Dalam suatu kantong terdapat 10 bola merah dan 5 bola putih. Bila diambil 3 bola secara acak, tentukan peluang untuk memperoleh 0, 1, 2, dan 3 bola merah! Penyelesaian : Misalkan : N1
: banyaknya bola merah =10
N2
: banyaknya bola putih=5
N
: banyaknya bola = N1 + N2 = 10+5=15
n
: banyaknya sampel yang diambil
X
: banyaknya bola merah yang diperoleh
Kombinasi bola merah yang diperoleh adalah
Kombinasi bola putih yang diperoleh adalah
10 k
5 3 k
Kombinasi semua sampel yang diperoleh adalah
15 3
Maka peluang untuk memperoleh banyaknya bola merah X=k dalam sampel tersebut adalah :
10 5 k 3 k , k=0, 1, 2, 3 P ( X k ) 15 3
Dengan demikian :
10 5 0 3 10 , P ( X 1) P ( X 0) 455 15 3
10 5 1 2 100 455 15 3
10 5 2 1 225 , P ( X 3) P ( X 2) 455 15 3
10 5 3 0 120 455 15 3
Perhatikan bahwa P(X=0)+ P(X=1)+ P(X=1)+ P(X=2)+ P(X=3)=1
Sebaran Poisson Percobaan yang menghasilkan nilai-nilai bagi suatu peubah acak X, yaitu banyaknya hasil percobaan yang terjadi selama suatu selang waktu tertentu atau di suatu daerah tertentu disebut percobaan poisson. poisson. Bilangan X yang menyatakan banyaknya hasil percobaan dalam suatu percobaan poisson disebut peubah disebut peubah acak poisson, poisson, dan sebaran peluangnya disebut sebaran poisson. poisson.
Sebaran peluang bagi peubah acak poisson X, yang menyatakan banyaknya hasil percobaan yang terjadi selama suatu selang waktu atau daerah tertentu adalah
untuk x = 1, 2, …..
sedangkan dalam hal ini adalah rata-rata hasil percobaan yang terjadi selama selang waktu atau dalam daerah yang dinyatakan, dan e = 2.71828…. Sebaran poisson cocok digunakan untuk n besar dan p kecil sekali, sedangkan binom cocok untuk n kecil dan p besar.
Contoh 6.4 Bila variabel acak X mempunyai sebaran binom denagn n=100, p=0.005, hitunglah P(X=15)! Jawab :
f(x)=P(X=x)=
, x= 0, 1, 2, ……, 100
maka :
f(15)=P(X=15)=
Peluang ini sulit dihitung karena n=100 adalah besar dan p=0.005 adalah kecil. Oleh karena itu kita pakai pendekatan sebaran poisson, yaitu : =100(0.005)=0.5
, x= 0, 1, 2, ……, 100
Maka
Sebaran Normal Suatu peubah acak kontinu X yang memiliki sebaran berbentuk genta disebut peubah disebut peubah acak normal. Bila X adalah suatu peubah acak normal dengan nilaitengah dan ragam
, maka persamaan kurva
normalnya adalah
, untuk - < x <
sedangkan dalam hal ini = 3.14159…. dan e = 2.71828…. Bila nilai-nilai dan diketahui, maka kurva normal itu telah tertentu dengan pasti. Misalkan bila = 50 dan =5, maka ordinal-ordinat n(x;50,5) dengan mudah dapat dihitung untuk berbagai nilai x, dan kemudian kurvanya dapat digambar. Sifat-sifat kurva normal : 27.
Modusnya hanya satu dan terletak di x =
28.
Kurvanya simetris/setangkup terhadap garis tegak x =
29.
Grafik selalu berada di atas sumbu x atau f(x)>0
30.
Kurvanya mendekati sumbu x secara asimtotik dalam dua arah, jika semakin menjauhi nilaitengahnya
31.
Luas daerah di bawah kurva dan di atas sumbu x sama dengan 1
Kurva sembarang sebaran peluang kontinu atau fungsi kepekatan dibuat sedemikian rupa sehingga luas daerah di bawah kurva yang dibatasi oleh x = x1 dan dan x = x2 sama dengan peluang bahwa peubah acak X mengambil nilai antara x = x1 dan x = x2. Untuk menghitung nilai peluang sebaran normal, dari kalkulus integral sangatlah rumit. Sehingga untuk menghindari hal itu digunakan table kenormalan atau table normal baku, yaitu dengan mentransformasikan setiap pengamatan dari peubah acak normal X menjadi suatu nilai peubah acak normal Z dengan nilaitengah nol dan ragam satu. Transformasi normal baku atau transformasi Z yang dimaksud adalah
Nilaitengah Z adalah nol, karena
sedangkan ragamnya adalah
Sehingga sebaran normal baku adalah sebaran peubah acak normal dengan nilaitengah nol dan simpangan baku 1. Bila X berada di antara x = x1 dan x = x2 maka peubah acak Z akan berada di antara nilai-nilai padanannya.
,
dan
Karena semua nilai X yang jatuh antara x1 dan x2 mempunyai nilai z padanannya antara z1 dan z2, maka luas daerah di bawah kurva X sama dengan luas daerah di bawah kurva Z. Dengan demikian P(x1
Contoh 6.5 Untuk sebaran normal dengan = 50 dan = 10, hitunglah peluang bahawa X mengambil sebuah nilai antara 45 dan 62.
Jawab : Diketahui x1 = 45 dan x2 = 62
= 50 dan = 10 Ditanyakan P(45
dan
dan
Dengan demikian P(45
Contoh 6.6 Untuk sebaran normal dengan = 300 dan = 50, hitunglah peluang peubah acak X mengambil nilai yang lebih besar dari 362. Jawab : Diketahui
= 300 dan = 50 Ditanyakan P(X>362) = …..?
= 1.24
P(X>362) = P(Z>1.24) = 1 – P(Z<1.24) = 1 – 0.8925 = 0.1075
Contoh 6.7 Suatu penelitian yang dilakukan oleh seorang mahasiswa menyebutkan bahwa secara rata-rata seorang pengunjung mengeluarkan uang belanja di suatu pusat perbelanjaan adalah Rp 247.000,00 dengan simpangan baku Rp 84.600,00. Jika diasumsikan sebaran normal, berapakah : 32.
peluang orang itu mengeluarkan uang belanja paling sedikit Rp 300.000,00
33.
peluang orang itu mengeluarkan uang belanja antara Rp 200.000,00 sampai Rp 400.000,00
34.
jika diasumsikan banyaknya pengunjung mencapai 200 orang setiap hari, berapa banyaknya orang yang diperkirakan mengeluarkan uangnya untuk berbelanja sebanyak-banyaknya Rp 150.000,00 penyelesaian Misalkan X = besarnya pengeluaran uang belanjaan setiap pengunjung suatu pusat perbelanjaan dalam ribuan rupiah. ,
n = 200
a. P(X300) = ….? Nilai X harus ditransformasi ke nilai Z, yaitu
dengan demikian P(X300) = P(Z0.63) = 1 – P(Z<0.63) = 1 – 0.7357 = 0.2643
b. P(200X400) = ….?
P(200X400) = P(-0,56 Z 1,81) = P(Z1,81) – P(Z-0,56) = 0.9649 – 0.2877 = 0.6722
c. misalkan m =banyaknya pengunjung yang mengeluarkan uang paling banyak Rp 150.000,00 m = nP(X150) P(X150) = P(Z -1,15) = 0.1251 Jadi m = 200(0.1251) = 25 orang
Contoh 6.7 Nilai ujian statistika sebagian besar mahasiswa mempunyai sebaran normal dengan rata-rata =34 dan simpangan baku =4. Jika X menyatakan nilai-nilai mahasiswa tersebut, berapakah batas nilai Xo agar 10% dari kelompok nilai terendah berada di bawah Xo ? Penyelesaian : Diketahui = 34 dan = 4
P(XXo)=0.1
P(ZZo) = 0.1
Dari tabel sebaran normal kumulatif diperoleh Zo=-1.282 Maka Xo=34+(-1.282)4=28.87 Jadi batas atas nilai untuk 10% kelompok mahasiswa yang mendapat nilai terendah adalah 28.87
Latihan Soal 35.
Peluang seseorang sembuh dari suatu penyakit darah adalah 0.4. Bila 15 orang diketahui menderita penyakit ini, berapa peluang bahwa
36.
1.
sekurang-kurangnya 10 orang dapat sembuh
2.
ada 3 sampai 8 orang yang sembuh
3.
5 orang yang sembuh Pupuk urea yang ditawarkan kepada petani ada dua jenis yaitu urea tablet dan urea biasa. Dari hasil survey diketahui 3/5 petani menggunakan pupuk urea tablet dan 2/5 petani menggunakan pupuk urea biasa. Jika empat petani dikunjungi ke lapangan, hitunglah : a. peluang tidak ada petani yang menggunakan pupuk urea tablet. b. peluang tiga petani menggunakan pupuk urea tablet. c. paling banyak dua petani menggunakan urea tablet.
37.
Menurut teori genetika, suatu persilangan kelinci percobaan akan menghasilkan keturunan warna merah, hitam, dan putih dalam perbandingan 8:4:4. Hitunglah peluang bahwa diantara 8 keturunan ada 5 yang berwarna merah, 2 hitam, dan 1 putih.
38.
Bila 5 kartu diambil secara acak dari seperangkat kartu brigde, berapa peluang diperoleh 3 kartu hati
39.
Putri hendak menanami halaman depan dan samping rumahnya dengan tanaman bunga. Dari sebuah kotak yang berisi 3 umbi tulip, 4 umbi daffodil, dan 3 umbi hyacinth, ia mengambil 5 umbi secara acak untuk ditanam di halaman depan dan 5 umbi sisanya di halaman samping. Berapa peluang ketika musim bunga tiba di halaman depan berbunga tulip, 2 daffodil dan 2 hyacinth
40.
Misalkan bahwa secara rata-rata 1 orang di antara 1000 orang adalah pecandu alcohol. Hitung peluang bahawa dalam suatu contoh acak 8000 orang terdapat kurang dari 7 pecandu alcohol.
41.
Sebuah restoran menyediakan salad yang rata-rata mengandung 5 macam sayuran. Hitunglah peluang bahwa salad yang disediakan mengandung lebih dari 5 macam sayuran 1.
pada suatu hari tertentu
2. 3. 42.
pada 3 diantara 4 hari berikutnya pertama kali dalam bulan April pada tanggal 5 April
Misalkan secara rata-rata 1 di antara 1000 orang membuat kesalahan angka dalam melaporkan pajak pendapatannya. Bila 10000 formulir diambil secara acak dan diperiksa, berapa peluang ada 6, 7, atau 8 formulir yang mengandung kesalahan
43.
Pada ujian statistika, nilai rata-ratanya adalah 74 dan simpangan bakunya 7. Bila 12% diantara peserta ujian akan diberi nilai A, dan nilai itu mengikuti sebaran normal, berapakah batas terendah bagi A dan batas nilai tertinggi bagi nilai B
44.
Rata-rata tinggi anjing pudel jenis tertentu adalah 30 cm, dan simpangan bakunya 4.1 cm. Berapa persentase banyaknya anjing pudel jenis tersebut yang tingginya lebih dari 35 cm, bila tinggi menyebar normal dan dapat diukur sampai ketelitian berapapun.
45.
46.
untuk soal nomor 9, hitunglah 1.
nilai tertinggi D, bila 10% nilai terendah mendapat nilai E
2.
nilai tertinggi B bila 5% mahasiswa mendapat nilai A
3.
nilai terendah B bila 10% mendapat nilai B, dan 25% mendapat nilai C
Di suatu daerah diketahui 10% penduduknya tergolong kaya. Suatu sampel acak terdiri dari 400 penduduk telah diambil. Tentukan peluang :
47.
1.
paling banyak 30 orang yang tergolong kaya
2.
antara 30 sampai 50 orang yang tergolong kaya
3.
55 orang atau lebih yang tergolong kaya
Krisis moneter menyebabkan tingkat penjualan rumah mengalami penurunan. Dari seluruh developer di Kota Kendari diketahui tingkat penjualan rata-rata 1 milyar dengan simpangan baku 0.2 milyar. Jika diasumsikan tingkat penjualan menyebar normal : 1.
hitunglah peluang sebuah developer mempunyai tingkat penjualan minimal 1.2 milyar
2.
Jika di daerah tersebut terdapat 50 developer, estimasikan jumlah developer yang mempunyai tingkat penjualan 0.5 sampai 1 milyar.
SEBARAN PERCONTOHAN
Contoh Acak
Hasil suatu percobaan statistika dapat dicatat dalam bentuk numerik ataupun huruf.
Bila
sepasang dadu dilantumkan dan jumlah mata dadu yang terjadi merupakan hal yang ingin diselidiki, sehingga hasilnya dicatat dalam bentuk numerik. Suatu POPULASI terdiri atas keseluruhan pengamatan yang menjadi pusat perhatian. Banyaknya pengamatan dalam populasi dinamakan UKURAN populasi. Tiap pengamatan dalam populasi merupakan satu nilai dari suatu peubah acak (X) dengan suatu sebaran peluang f(x). Oleh karena itu, sering kita mendengar tentang istilah populasi binomial, populasi normal, atau secara umum disebut sebagai populasi f(x). Istilah tersebut sebenarnya mengacu pada harga peubah acak X yang memiliki sebaran binomial, normal atau sebaran peluang f(x). Hal pokok yang menjadi pusat perhatian seorang statistikawan adalah menarik kesimpulan tentang parameter populasi yang tidak diketahui. Pada populasi normal, misalnya, parameter µ dan 2 mungkin tidak diketahui dan hendaknya ditaksir berdasarkan keterangan yang diperoleh dari contoh yang mewakili suatu populasi.
Contoh yang mewakili suatu populasi disebut contoh acak, apabila
setiap anggota populasi mempunyai peluang yang sama untuk dipilih sebagai contoh. Dengan demikian dasar teori pengambilan contoh perlu dipelajari dengan baik. Misalkanlah x1, x2, x3, ...., xn merupakan n peubah acak bebas yang masing-masing memiliki sebaran peluang f(x). Gugus x1, x 2, x 3, ..., xn didefinisikan sebagai contoh acak berukuran n dari populasi f(x) dan sebaran peluang gabungannya ditulis sebagai: f(x1,x2,x3,...,xn) = f(x 1)f(x2)f(x3)...f(xn).
Teori Pengambilan Contoh Tujuan utama menarik contoh adalah untuk mendapatkan keterangan mengenai parameter populasi yang tidak diketahui. Misalkan kita ingin menarik kesimpulan mengenai proporsi penduduk Indonesia yang menyukai kopi robusta. Sangatlah tidak efesien jika kita menanyai seluruh penduduk Indonesia dan kemudian menghitung parameter yang menggambarkan proporsi sebenarnya.
Tetapi
sebagai pendekatannya akan diambil contoh acak yang cukup besar dan kemudian dihitung proporsi
yang menyukai kopi robusta. Nilai ini kemudian dipakai untuk menarik kesimpulan mengenai proporsi sesungguhnya. Suatu nilai yang dihitung dari contoh disebut statistik.
Karena banyak contoh acak yang
mungkin diambil dari suatu populasi yang sama maka statistik yang diperoleh akan berlainan dari contoh ke contoh. Karena itu, statistik merupakan peubah acak yang hanya tergantung pada contoh acak yang diamati.
Sebaran Contoh dari Rataan (Mean) Sebaran contoh yang penting untuk dibahas adalah rataan (
).
Misalkan contoh acak
berukuran n pengamatan diambil dari populasi normal dengan rataan µ dan simpangan baku ( ). Tiap pengamatan xi, i=1,2,...,n adalah contoh acak yang memiliki sebaran normal yang sama dengan populasi yang menjadi pusat pengambilan contoh. Rataan contoh mengikuti sebaran normal dengan rataan dan ragam adalah sebagai berikut:
Teorema Limit Pusat: Jika contoh acak diambil dari populasi sembarang dengan rataan µ dan simpangan baku maka sebaran dari rataan (
,
) dapat dihampiri normal jika n cukup besar, dengan rataan µ dan
galat baku / n. Dengan kata lain,
Pertanyaan yang sering muncul akibat teorema di atas adalah seberapa banyak n yang harus diambil dan berapa batasan n yang dapat dikatakan cukup besar ? Untuk menjawab pertanyaan ini tentunya diperlukan hampiran n yang cukup baik. Berdasarkan pengalaman diketahui bahwa jika n>30 maka sudah cukup digunakan sebagai pendekatan teorema limit pusat. Untuk data pengamatan yang mengikuti sebaran Binomial juga dapat dihampiri dengan sebaran normal dan tidak bertentangan dengan teorema limit pusat. Untuk memahami permasalahan ini, kita kembalikan lagi pada sebaran Bernoulli: xi=1, jika percobaan sukses
xi=0, jika percobaan gagal Peubah acak x1, x2, ..., xn adalah saling bebas, dan setiap pengamatan memiliki sebaran peluang sebagai berikut: x
0
1
---------------------------------f(x)
(1-p)
p
dengan rata-rata p dan ragam p(1-p). Akibat dari teorema limit pusat maka sebaran contoh dari rataan adalah mendekati normal dengan rataan p dan ragam p(1-p)/n jika n besar. Dengan demikian proporsi contoh dari kejadian sukses dalam percobaan Bernoulli mengikuti sebaran;
Sebaran contoh dari (n-1)S2/ 2 Bila contoh acak berukuran n diambil dari populasi normal dengan rataan µ dan simpangan baku
, maka diperoleh suatu nilai statistik S yang merupakan simpangan baku contoh. Sebaran contoh S2 hanya sedikit kegunaannya dalam praktek, oleh karena itu akan dibahas sebaran dari peubah acak (n1)S2/ 2.
Dengan menjumlahkan semua kuadrat dari pengamatan dikurangi rataan contoh mudah
terlihat bahwa:
dengan demikian diperoleh bahwa
2
2
(n-1)S / menyebar khi-kuadrat dengan derajat bebas n-1.
Teorema berikut tidak ditunjukkan dengan bukti yang lengkap.
Teorema :
Bila S2 ragam contoh acak berukuran n diambil dari populasi normal dengan ragam 2, maka peubah acak,
2 = (n-1)S2/ 2 menyebar khi-kuadrat dengan derajat bebas n-1.
Sebaran t-student Dalam prakteknya jarang sekali orang begitu beruntung mengetahui ragam populasi yang digunakan sebagai acuan dalam pengambilan contoh acak.
Untuk contoh acak berukuran n 30,
taksiran 2 yang baik adalah statistik S2. Apa yang terjadi dengan
(
-µ)/( / n) bila diganti
dengan S ? Selama S2 merupakan taksiran yang baik bagi 2 dan tidak berubah dari contoh ke contoh dan untuk n 30 maka nilai tersebut masih baik dihampiri dengan normal baku Z.
Tetapi bila ukuran
contoh kecil (n<30), nilai S berubah cukup besar dari contoh ke contoh dan nilai tersebut tidak lagi menyebar normal baku. Dalam hal ini kita menghadapi sebaran statistik yang akan disebut dengan tstudent.
dimana nilai ini adalah peubah acak yang menyebar t-student dengan derajat bebas n-1.
Sebaran F Salah satu sebaran yang terpenting dalam statistika terapan adalah sebaran F.
Statistik F
didefinisikan sebagai nisbah dua peubah acak khi-kuadrat yang saling bebas, masing-masing dibagi dengan derajat bebasnya. Misal peubah acak U dan V menyebar khi-kuadrat dengan derajat bebas v1 dan v2 dimana U>V maka sebaran F dapat ditulis sebagai berikut:
F = (U/v1) / (V/v2),
Teorema :
Bila S12 dan S22 adalah ragam contoh acak berukuran n1 dan n2 yang diambil dari populasi normal masing-masing dengan 12 dan 22, bila S12 S22 maka,
menyebar F dengan derajat bebas v1=n1-1 dan v2=n2-1
Sebaran Contoh Bagi Beda Dua Nilaitengah Bila contoh-contoh bebas berukuran n1 dan n2 diambil dari dua populasi yang besar atau takhingga, masing-masing dengan nilaitengah 1 dan 2 ragam nialitengah contoh,
dan
, maka beda kedua
, akan menyebar menghampiri sebaran normal dengan nilaitengah dan
simpangan baku
Dengan demikian
merupakan nilai normal baku Z
Bila dua peubah acak X dan Y bebas dan masing-masing menyebar normal dengan nilaitengah
x dan y dan ragam dan ragam
dan
maka beda X-Y menyebar normal dengan nilaitengah .
Latihan Soal
48.
Sejenis tambang dibuat dengan kekuatan regangan rata-rata 70 kg dan
simpangan baku 5 kg.
Dengan mengasumsikan populasinya takhingga, bagaimana galat baku nilatengahcontoh itu berubah bila ukuran contohnya
49.
1.
dinaikkan dari 64 menjadi 196
2.
diturunkan dari 784 menjadi 49
Tinggi 1000 mahasiswa menghampiri sebaran normal dengan nilaitengah 160 cm dan simpangan baku 5 cm. Bila 200 contoh acak masing-masing berukuran 25 ditarik dari populasi ini, dan nilai tengah contohnya diukur sampai satuan sentimeter terdekat, tentukan :
50.
1.
nilaitengah dan simpangan baku sebaran pe narikan contoh bagi
2.
banyaknya nilaitengah contoh yang jatuh antara 158 dan 162 cm
3.
banyaknya nilaitengah contoh yang jatuh di bawah 158 cm
Hitunglah : a.
b. c. P(T<2.365) bila v = 7 d. P(-1.356
-2.567) bila v = 17 f. P(
g. P( 51.
Diberikan sebuah contoh acak berukuran 24 yang ditarik dari suatu populasi normal, tentukan k bila 1.
P(-2.069
2.
P(k
3. 52.
P(-k
Sebuah perusahaan menyatakan bahwa rokok yang diproduksinya mempunyai kandungan nikotin rata-rata sebesra 1.83 mg perbatang. Bila diambil contoh acak 8 batang rokok jenis tersebut, dengan kandungan nikotin 2.0, 1.7, 2.1, 1.9, 2.2, 2.1, 2.0, dan 1.6 mg, apakah Anda setuju dengan pernyataan perusahaan tersebut ?
PENDUGAAN PARAMETER
Penduga Paramater Dalam Statistika dikenal adanya istilah parameter dan statistik. Parameter adalah nilai penciri dari suatu data populasi, diantaranya nilai tengah populasi ( ), ragam populasi (2), proporsi populasi (P) dan lain-lain. Sedangkan statistik adalah nilai penciri dari suatu data contoh, diantaranya nilai tengah contoh (
), ragam populasi (s2), proporsi populasi (p) dan lain-lain.
Untuk memperoleh gambaran yang baik mengenai populasi, maka statistik
yang dipakai
untuk menduga parameter haruslah merupakan penduga yang baik, yaitu penduga yang mempunyai tiga ciri :
a.
merupakan penduga tak bias dari , yaitu E(
) = , artinya harapan penduga
, sama dengan .
b.
merupakan penduga yang efisien, artinya bila ada lebih dari satu penduga, maka penduga yang efisien adalah penduga yang mempunyai variansi paling kecil
c.
merupakan penduga yang konsisten, artinya bila sampel yang diambil makin besar, maka nilai akan semakin mendekati nilai . Sebuah nilai
Misalnya nilai
bagi suatu statistik
bagi statistik
disebut suatu nilai dugaan bagi parameter populasi
.
, yang dihitung dari suatu contoh berukuran n, merupakan nilai
dugaan bagi parameter populasi . Begitu pula
merupakan suatu nilai dugaan bagi proporsi
sebenarnya p dalam suatu percobaan binom. Ada dua jenis penduga parameter yaitu: a. Penduga titik Bila nilai parameter dari populasi hanya diduga dengan memakai satu nilai statistik sampel yang diambil dari populasi tersebut, maka statistik Contoh : a.
merupakan penduga titik bagi parameter populasi .
disebut pendugaan titik.
dari
b.
merupakan penduga titik bagi
c.
merupakan penduga titik bagi proporsi sebenarnya p
b. Pendugaan selang Suatu dugaan selang bagi parameter populasi adalah suatu selang yang berbentuk , dengan
bergantung pada nilai statistik
dan juga pada sebaran penarikan contoh bagi Bila P( 1 ˆ
2 ) ˆ
untuk suatu contoh tertentu
.
= 1 - , untuk 0<<1, maka kita mempunyai peluang 1- untuk
memperoleh suatu contoh acak yang menghasilkan suatu selang yang mengandung . Selang , yang dihitung dari contoh yang terpilih, disebut selang kepercayaan (1- )100%, nilai 1- , disebut koefisien kepercayaan atau derajat kepercayaan , dan kedua titik ujungnya, , masing-masing disebut batas kepercayaan sebelah atas dan sebelah bawah.
Pendugaan Nilai tengah Bila ragam
adalah nilai tengah contoh acak berukuran n yang diambil dari suatu populasi dengan
diketahui, maka selang kepercayaan (1-)100%, bagi adalah
x z / 2
sedangkan z
n
x z / 2
/ 2 adalah
n
,
nilai z yang luas daerah di sebelah kanan di bawah kurva normal baku adalah
/2. Galat baku pendugaan , bila galatnya tidak melebihi z / 2
n
digunakan untuk menduga , kita percaya (1-)100%, bahwa
. Ukuran Contoh bagi pendugaan , bila
digunakan untuk menduga
, kita boleh percaya (1-)100%, bahwa galatnya tidak melebihi suatu niali tertentu e bila ukuran contohnya diambil sebesar n =
Bila
z / 2 e
2
dan s adalah nilaitengah dan simpangan baku contoh acak berukuran n<30, yang diambil
dari suatu populasi berbentuk genta dengan ragam
tidak diketahui, maka selang kepercayaan (1-
)100%, bagi adalah x t / 2
sedangkan t
s n
x t / 2
/ 2 adalah
s n
,
nilai t dengan v = n – 1 derajat bebas yang di sebelah kanannya terdapat
daerah seluas /2.
Contoh 8.1
Dari data contoh berukuran 15 diperoleh nilai tengah contoh dan ragam contoh sebagai berikut: = 10.366 s2 = 1.946 Penduga bagi parameter nilai tengah populasi adalah sebagai berikut:
x
s x
10.366 s 2 / n
1.395 /
15
.....
Sedangkan penduga selang untuk nilai tengah populasi dengan tingkat kepercayaan 95 % adalah:
x – t(0.025;db=14) s/n x + t(0.025;db=14) s/n 10.366 – 2.145 x 1.395/ 15 10.366 + 2.145x 1.395/ 15 10.366 – 0.773 10.366 + 0.773 9.593 11.139
Pendugaan Beda Dua Nilai Tengah Populasi Bila x1 dan x 2 masing-masing adalah nilaitengah contoh acak bebas berukuran n1 dan n2 yang 2
dan 22 yang diketahui, maka selang kepercayaan (1-
diambil dari populasi dengan ragam 1
)100%, bagi 1 2 adalah :
( x1 x 2 ) z / 2
12 n1
sedangkan dalam hal ini z
22 n2
2 < ( x1 x 2 ) z / 2
< 1
/ 2 adalah
12
n1
22
,
n2
nilai peubah normal baku z yang luas daerah di sebelah kanannya
sebesar /2. Bila x1 dan x 2 masing-masing adalah nilaitengah contoh acak bebas berukuran kecil n1 dan n2 2
yang diambil dari dua populasi yang hampir normal dengan ragam sama 1 nilainya, maka selang kepercayaan (1-)100%, bagi 1
( x1 x2 ) t / 2 s p
1 n1
1 n2
< 1
22 yang tidak diketahui
2 adalah :
2 < ( x1 x2 ) t / 2 s p
1 n1
1 n2
,
sedangkan dalam hal ini sp adalah nilai dugaan gabungan bagi simpangan baku populasi, dan t
/2
adalah nilai t dengan v = n1+n2-2 derajat bebas yang luas daerah di sebelah kanannya sebesar /2.
s 2 p
(n1 1) s12 (n2 1) s 22 n1 n2 2
Contoh 8.2 Dua buah perusahaan yang saling bersaing dalam industri kertas karton saling mengklaim bahwa produknya yang lebih baik, dalam artian lebih kuat menahan beban. Untuk mengetahui produk mana yang sebenarnya lebih baik, dilakukan pengambilan data masing-masing sebanyak 10 lembar, dan diukur berapa beban yang mampu ditanggung tanpa merusak karton. Datanya adalah :
1.
Perusahaan A
30
35
50
45
60
25
45
45
50
40
Perusahaan B
50
60
55
40
65
60
65
65
50
55
Hitunglah rataan dan ragam dari kedua data perusahaan tersebut.
Jawab
x1 x 2 2.
30 35 40 10 50 60 55 10
42,5
s
56,5
s
2 1
2 2
n
x12
xi
2
n(n 1) n
x x
2
2 2
i
n(n 1)
10(19025) - (425)2 10(9) 10(32525) - (565)2 10(9)
106.94 66.94
Buatlah selang kepercayaan 90% bagi selisih rataan perusahaan B dengan perusahaan A, dengan mengasumsikan ragam kedua populasi sama.
Jawab
( x 2 x1 ) t (
s
2
, db ) p
(1 / n2 ) (1 / n1 ) 2 1 ( x 2 x1 ) t (
s
2
, db ) p
(1 / n2 ) (1 / n1 )
(56,5 42,5) t ( 0,05;18) 9,32 1 / 10 1 / 10 2 1 (56,5 42,5) t ( 0,05;18) 9,32 1 / 10 1 / 10 14 1,734(4,17) 2 1 14 1,734(4,17) 6,77 2 1 21,23 catatan : karena ragam sama, maka : 1) db = n1 + n2 – 2
2 p
2) ragam gabungan : s
2
(n1 1) s12 (n2 1) s 22 n1 n2 2
9(106,94) 9(66,94) 18
86.94
2
Bila x1 dan s1 , dan x 2 dan s 2 masing-masing adalah nilaitengah dan ragam contoh acak bebas berukuran kecil n1 dan n2 yang diambil dari dua populasi yang mendekati normal dengan ragam 2
tidak sama 1 adalah :
22 yang tidak diketahui nilainya, maka selang kepercayaan (1-)100%, bagi 1 2
s12
( x1 x 2 ) t / 2
n1
s 22 n2
< 1
s12
2 < ( x1 x2 ) t / 2
n1
s 22 n2
,
sedangkan dalam hal ini t / 2 adalah nilai t dengan derajat bebas
v
( s12 / n1 s 22 / n2 ) 2 [( s12 / n1 ) 2 /(n1 1)] [( s22 / n2 ) 2 /(n2 1)]
yang luas daerah di sebelah kanannya sebesar /2.
Contoh 8.3 Jika pada contoh 8.2 ingin diduga selang kepercayaan 90% bagi selisih rataan perusahaan B dengan perusahaan A, dengan mengasumsikan ragam kedua populasi berbeda, maka dugaan selangnya adalah:
( x2 x1 ) t (
2
( s 22 / n2 ) ( s12 / n1 ) 2 1 ( x 2 x1 ) t (
, db )
2
, db )
( s 22 / n2 ) ( s12 / n1 )
(56,5 42,5) t ( 0, 05;17) 66,94 / 10 106,94 / 10 2 1 (56,5 42,5) t ( 0, 05;17) 66,94 / 10 106,94 / 10 14 1,74(4,17) 2 1 14 1,74(4,17) 6,74 2 1 21,26 ingat : karena ragam tidak sama, maka :
( s1 / n1 s2 / n2 ) 2
db
2
2
( s1 / n1 ) /(n1 1) ( s 2 / n2 ) /(n2 1) 2
2
2
2
(10.342 / 10 8.182 / 10) 2 (10.34 / 10) / 9 (8.18 / 10) / 9 2
2
2
2
17,10 17
Pendugaan Proporsi Bila p adalah proporsi keberhasilan dalam suatu contoh acak berukuran n, dan q =1- p , maka ˆ
ˆ
ˆ
selang kepercayaan (1-)100%, bagi parameter binom p adalah :
p z / 2
pq ˆ
ˆ
ˆ
n
sedangkan dalam hal ini z
sebesar /2.
pq ˆ
ˆ
ˆ
/ 2 adalah
n
,
nilai peubah normal baku z yang luas daerah di sebelah kanannya
Bila p digunakan sebagai nilai dugaan titik bagi p, maka kita dapat percaya (1- )100%, bahwa ˆ
galatnya tidak lebih besar dari z / 2
pq ˆ
ˆ
n
Bila p digunakan untuk menduga p, maka kita dapat percaya (1-)100%, bahwa galatnya tidak ˆ
melebihi suatu besaran tertentu e bila ukuran contohnya diambil sebesar n
z 2 / 2 pq ˆ
ˆ
e2
Contoh 8.4 Suatu perusahaan mempunyai 1250 karyawan. Pihak manajemen ingin mengetahui besarnya proporsi yang merasa kurang puas dengan jaminan sosial yang mereka terima. Untuk maksud itu diambil sampel sebanyak 100 orang dan dari hasil wawancara ternyata ada 10 orang yang menyatakan kurang puas dengan jaminan sosial yang diterimanya. 3.
Bila manajer perusahaan itu dalam memperkirakan menggunakan interval kepercayaan 99%, maka dugalah interval proporsi karyawan di perusahaan tersebut yang kurang puas dengan jaminan sosial yang mereka terima.
Jawab :
p x / n 10 / 100 0,1 ˆ
p z ˆ
p(1 p) / n p p z ˆ
2
ˆ
p(1 p ) / n
ˆ
ˆ
ˆ
2
0,1 z 0,005 0,1(0,9) / 100 p 0,1 z 0,005 0,1(0,9) / 100 0,1 2,565(0,03) p 0,1 2,565(0,03) 0,02 p 0,18 4.
Berapa banyak sampel yang harus diambil agar kita bisa percaya 99% bahwa proporsi dalam sampel paling jauh berjarak 0.03 dari proporsi populasinya.
n
Pendugaan Beda Dua Proporsi
z 2 / 2 4 g 2
2,5652 4(0,03) 2
1827,56 1828
Bila p1 dan p 2 masing-masing adalah proporsi keberhasilan dalam suatu contoh acak ˆ
ˆ
berukuran n1 dan n2, serta q1 =1- p1 dan q 2 =1- p 2 , maka selang kepercayaan (1-)100%, bagi selisih ˆ
ˆ
ˆ
ˆ
antara dua parameter binom p1 dan p2 adalah :
p1q1
( p1 p2 ) z / 2 ˆ
ˆ
ˆ
ˆ
n1
sedangkan dalam hal ini z
p2 q2 ˆ
ˆ
n2
/ 2 adalah
p2 ) z / 2
p1q1 ˆ
ˆ
ˆ
n1
p2 q2 ˆ
ˆ
n2
nilai peubah normal baku z yang luas daerah di sebelah kanannya
sebesar /2.
Latihan Soal
53.
Jelaskan kriteria-kriteria penduga yang baik ?
54.
Diketahui suatu populasi mahasiswa berukuran 500 orang. Dari populasi tersebut diambil sampel acak sebanyak 100 orang, kemudian diukur berat badannya. Ternyata rata-rata berat badan mahasiswa adalah 60 kg dengan simpangan baku 10 kg. 55.
buatlah interval kepercayaan 90%
56.
berapa interval kepercayaannya agar rata-rata populasi terletak antara 58< <62
57.
berapa sampel yang diperlukan agar kita percaya 90% bahwa rata-rata sampel berjarak paling banyak 5 kg dari rat-rata sebenarnya ?
58.
Untuk menduga dinamika migrasi penduduk dalam penerapan otonomi daerah, sebuah konsultan mensurvei daerah BOTABEK (Bogor, Tangerang, Bekasi) dan menemukan 12% dari sampel acak sebanyak 2300 keluarga akan keluar dari BOTABEK ke daerah asal. Jika perkiraan populasi keluarga di BOTABEK sebanyak 7.800.000 keluarga, bentuklah dugaan interval kepercayaan 95% atas jumlah keluarga yang akan keluar dari BOTABEK ke daerah asal
59.
Pada tahap pemasaran perumahan baru, sebuah developer akan memperoleh imagenya melalui perbaikan sarana umum yang ada di perumahan yang lama (seperti perbaikan jalan, taman, dst). Dari sampel 50 yang diambil secara acak sebelum ada perbaikan sarana umu diketahui ada 10 responden yang mempunyai image kurang baik terhadap developer tersebut. Setelah dilakukan
perbaikan sarana umum, ternyata masih terdapat 7 dari 48 responden yang mempunyai image kurang baik terhadap developer. Dengan tingkat kepercayaan 95%, buatlah pendugaan proporsi untuk image developer sebelum dan setelah perbaikan sarana umum. Dari pendugaan tersebut, apakah bisa dikatakan ada peningkatan image bagi developer 60.
Suatu perusahaan mempunyai 1250karyawan. Pihak manajemen ingin mengetahui besarnya proporsi yang merasa kurang puas dengan jaminan social yang mereka terima. Untuk maksud itu diambil sampel sebanyak 100 orang dan dari hasil wawancara ternyata ada 10 orang yang menyatakan kurang puas dengan jaminan social yang diterimanya. 61.
Bila manajer perusahaan itu dalam memperkirakan menggunakan interval kepercayaan 99%, maka berapa proporsi seluruh karyawan di perusahaan tersebut yang kurang puas dengan jaminan social yang mereka terima
62.
Berapa banyak sampel yang harus diambil agar kita bisa percaya 99% bahwa proporsi dalam sampel paling jauh berjarak 0.03 dari proporsi populasinya.
63.
Suatu perusahaan rokok menghasilkan dua jenis rokok, yaitu filter dan kretek. Pimpinan perusahaan itu mengatakan bahwa penjualan rokok filter lebih besar 8% daripada rokok kretek. Dari sampel diperoleh bahwa ternyata 42 diantara 200 perokok lebih menyukai filter dan 18 di antara 150 perokok lebih menyukai kretek. Buatlah interval kepercayaan 95% untuk perbedaan persentase penjualan dua jenis rokok tersebut. Simpulkan apakah selisih sebesar 8% yang dinyatakan pimpinan perusahaan tersebut bisa diterima ?
64.
Suatu sampel acak sebanyak 8 batang rokok merk tertentu mempunyai rata-rata kadar nikotin 3.5 mg dan simpangan baku 1 mg. Buatlah interval kepercayaan 99% untuk rata-rata nikotin yang sesungguhnya rokok merk itu, bilamana diasumsikan kadar nikotin tersebut menyebar normal
65.
Dari sampel acak 12 mahasiswi suatu perguruan tinggi, diperoleh bahawa rata-rata uang saku bulanannya adalah Rp 500.000,00 denag simpangan baku Rp 50.000,00. Bila diasumsikan uang saku menyebar normal, buatlah selang kepercayaan 90% untuk rata-rata uang saku mahasiswi tersebut.
66.
Data berikut menunjukkan masa putar (dalam puluhan menit) film yang diproduksi dua perusahaan Perusahaan A
11 9 10 7 15 12 8 10 13 14
Perusahaan B
10 9 12 9
8
7 9
6
8 15
Buatlah interval kepercayaan 95% untuk beda rata-rata masa putar film yang diprodukasi oleh dua perusahaan tersebut, jika di asumsikan masa putar film mempunyai sebaran normal dengan ragam tidak sama.
PENGUJIAN HIPOTESIS
Hipotesis Statistik Sering permasalahan yang kita hadapi tidak hanya menyangkut pendugaan parameter suatu populasi, tetapi juga menyangkut cara pengambilan keputusan berdasarkan data yaitu pengujian hipotesis. Hipotesis merupakan suatu asumsi atau anggapan yang bisa benar atau bisa salah mengenai suatu hal dan dibuat untuk menjelaskan suatu hal tersebut sehingga memerlukan pengecekan lebih lanjut. Bila hipotesis yang dibuat itu secara khusus berkaitan dengan parameter populasi, maka hipotesis itu disebut hipotesis statistik. Jadi hipotesis statistik adalah suatu asumsi atau anggapan atau pernyataan atau dugaan mengenai satu atau lebih populasi. Langkah-langkah atau prosedur yang dilakukan dengan tujuan untuk memutuskan apakah kita menerima atau menolak hipotesis mengenai parameter populasi disebut pengujian hipotesis. Jadi pada pengujian hipotesis kita ingin mengetahui atau menguji apakah parameter satu populasi, yaitu sama dengan nilai tertentu yaitu 0 atau tidak. Kalau kita mempunyai dua populasi masing-masing dengan parameter 1 dan 2, kita ingin menguji apakah 1 = 2, dan sebagainya. Untuk suatu hipotesis yang dibuat, hanya dua kemungkinan yang akan kita putuskan, yaitu kita akan menolak hipotesis atau kita akan menerima hipotesis, setelah kita manghitung statistik dari sampel. Menolak hipotesis artinya kita menyimpulkan bahwa hipotesis tidak benar, sedangkan menerima hipotesis artinya tidak cukup informasi/bukti dari sampel untuk menyimpulkan bahwa hipotesis harus kita tolak. Artinya walaupun hipotesis itu kita terima, tidak berarti bahwa hipotesis itu benar. Sehingga dalam membuat rumusan pengujian hipotesis, hendaknya selalu membuat pernyataan hipotesis yang diharapkan akan diputuskan untuk ditolak. Hipotesis yang dirumuskan dengan harapan untuk ditolak disebut hipotesis nol yang ditulis H0. Penolakan hipotesis nol akan menjurus pada penerimaan hipotesis alternatif atau hipotesis tandingan yang ditulis H1 atau Ha .
Contoh 9.1 67.
Pengujian hipotesis bahwa suatu jenis obat baru lebih efektif untuk menurunkan berat badan. Maka rumusan hipotesisnya adalah : H0 : obat baru = obat lama H1 : obat baru lebih baik dari obat lama
68.
Pengujian hipotesis bahwa teknologi baru dapat meningkatkan kualitas buah-buahan. H0 : teknologi baru = teknologi lama H1 : teknologi baru teknologi lama
69.
Seorang dokter menyatakan bahwa, lebih dari 60% pasien yang menderita sakit paru-paru di suatu rumah sakit adalah karena merokok. H0 : p = 0.6 H1 : p 0.6
Pengujian Hipotesis Dalam membuat rumusan pengujian hipotesis, hendaknya kita selalu membuat pernyataan hipotesis yang diharapkan akan diputuskan untuk ditolak. Hipotesis yang dirumuskan dengan harapan akan ditolak biasanya disebut sebagai hipotesis nol/awal, yang dilambangkan dengan H 0 . Ini menyatakan bahwa setiap hipotesis yang ingin diuji dinyatakan dengan H 0. Penolakan H 0 mengakibatkan penerimaan suatu hipotesis alternatif atau hipotesis tandingan yang dilambangkan dengan
H 1 . Suatu H 0 mengenai suatu parameter populasi akan selalu dinyatakan sedemikian rupa
sehingga parameter tersebut nilainya tertentu (satu nilai), sedangkan H1 memungkinkan beberapa nilai. Ada beberapa dasar yang dapat digunakan untuk merumuskan hipotesis, antara lain (1) berdasarkan pengetahuan yang diperoleh dari teori, (2) berdasarkan hasil penelitian terdahulu, (3) berdasarkan pengalaman, atau (4) berdasarkan ketajaman berpikir. Seperti telah dijelaskan sebelumnya bahwa kebenaran atau ketidakbenaran suatu hipotesis tidak pernah diketahui secara pasti. Dengan adanya faktor ketidakpastian ini mengakibatkan timbulnya suatu resiko/kesalahan yang harus ditanggung oleh pembuat keputusan itu sendiri.
Dalam
pengujian hipotesis dikenal dua jenis kesalahan, yaitu kesalahan jenis I (galat I) dan kesalahan jenis II (galat II). Galat I adalah kesalahan akibat menolak hipotesis nol, padahal hipotesis nol benar . Sedangkan galat II adalah kesalahan akibat menerima hipotesis nol padahal hipotesis nol tersebut salah. Peluang melakukan galat I disebut taraf nyata uji dilambangkan dengan , sedangkan peluang melakukan galat II dilambangkan dengan .
Hubungan antara hipotesis nol, keputusan, jenis kesalahan, dan peluang melakukan jenis kesalahan secara ringkas disajikan pada tabel berikut.
Tabel Jenis kesalahan dalam menolak dan menerima hipotesis nol
Keadaan yang sesungguhnya
Keputusan Hipotesis nol (H0) benar
Hipotesis nol (H0) salah
Menolak H0
Galat I, = P(Galat I)
Keputusan tepat, K=1-
Menerima H0
Keputusan tepat, 1 -
Galat II, =P(Galat II)
Oleh karena menyatakan peluang menolak H0 yang benar, maka kita mengharapkan nilai sekecil mungkin. Sebab tidaklah pantas sesuatu yang sesungguhnya benar kita tolak. Demikian juga dengan yang menyatakan peluang menerima H0 yang salah, kita mengharapkan nilainya juga sekecil mungkin, karena tidak pantas juga sesuatu yang salah kita terima. Namun dalam kenyataannya memperkecil atau membuat dan sekecil mungkin secara sekaligus tidaklah mungkin, karena ternyata ada hubungan antara dengan , yaitu memperkecil nilai akan mengakibatkan membesarnya nilai , demikian juga sebaliknya. Usaha untuk memperkecil nilai dan dapat dilakukan dengan memperbesar ukuran contoh. Dalam praktek pengujian hipotesis, nilai yang sering digunakan adalah 0,05 dan 0,01. Jika yang digunakan adalah 0,05, dapat diartikan bahwa kira-kira sebanyak 5 dari setiap 100 kasus bahwa kita akan menolak Ho yang benar. Dengan kata lain, ada keyakinan 95% bahwa kita telah mebuat keputusan atau kesimpulan yang benar. Untuk setiap pengujian dengan memakai nilai tertentu, kita dapat menghitung nilai . Ternyata bahwa nilai ini tergantung pada nilai parameter populasi, yaitu , sehingga dapat dinyatakan sebagai suatu fungsi, yaitu (), yang disebut fungsi ciri operasi (CO). Nilai K = 1 - disebut kuasa uji. Kuasa uji adalah peluang menolak Ho bilai suatu tandingan tertentu benar. Jika K( ) = 1 ) , maka K( ) disebut fungsi kuasa. ( Beberapa sifat penting dalam pengujian hipotesis :
1.
Galat I dan galat II saling berhubungan. Menurunnya peluang yang satu akan menaikkan peluang yang lain.
2.
Ukuran wilayah kritik, yang berarti juga peluang melakukan galat jenis I, selalu dapat diperkecil dengan mengubah nilai kritiknya.
3.
Peningkatan ukuran contoh n akan memperkecil dan secara bersama-sama.
4.
Bila hipotesis nolnya salah, nilai akan sangat besar bila nilai parameternya dekat dengan nilai yang dihipotesiskan. Semakin besar jarak antara nilai yang sesungguhnya dengan nilai yang dihipotesiskan, maka semakin kecil nilai .
Contoh 9.2
Suatu jenis deterjen baru diduga dapat mencuci bersih 70% dari bercak pada pakaian. Untuk menguji dugaan ini, deterjen ini digunakan pada 12 bercak yang dipilih secara acak. Bila kurang dari 11 bercak yang hilang maka dugaan kemampuan deterjen tersebut dalam mencuci 70% dari bercak pakaian diterima. 5.
hitunglah galat I dengan menganggap bahwa p = 0,7
6.
hitunglah galat II jika ternyata p = 0,9 Jawab Hipotesis :
Ho : p = 0,7
vs
H1 : p > 0,7
X = banyaknya bercak pakaian yang berhasil dicuci Nilai kritis : 11
a. P ( galat I ) P ( X 11 | p 0,7)
12
10
x 11
x 0
b( x;12,0.7) 1 b( x;12,0.7) 1 0.915 0.085
b. P ( galat II ) P ( X 11 | p 0,9)
10
b( x;12,0.9) 0.341 x 0
Contoh 9.3
Suatu contoh acak 400 pemilih di suatu kota ditanya apakah mereka mendukung kenaikan 4% tarip listrik untuk penerangan jalan yang amat diperlukan. Bila lebih dari 220 tapi kurang dari 260 pemilih yang mendukung kenaikan tarip maka disimpulkan bahwa 60% pemilih mendukung. 70.
cari peluang melakukan galat I bila 60% pemilih yang mendukung kenaikan tarif.
71.
Berapa peluang melakukan galat II dalam prosedur pengujian ini bila sesungguhnya hanya 48% dari pemilih yang mendukung kenaikan tarif listrik ?
Jawab Hipotesis :
Ho : p = 0,6
vs
H1 : p 0,6
Nilai kritis : 220 < X < 260 Karena n besar, maka untuk menghitung galat I dan galat II digunakan hampiran normal. a. menghitung
= np = 400(0.6) = 240 = (npq) = {400(0.6)(0.4)} = 9.80 nilai kritis menjadi : 220.5 < X < 259.5
P ( galat I ) P ( X 220 | p 0.6) P ( X 260 | p 0.6)
P ( X 219.5 | 240) P ( X 260.5 | 240) X 219.5 240 X 260.5 240 P ( ) P ( )
9.80 9.80 P ( Z 2.09) P ( Z 2.09) 2 P ( Z 2.09) 2(0.0183) 0.0366 b. menghitung
= np = 400(0.48) = 192 = (npq) = {400(0.48)(0.52)} = 9.99 P ( galat II ) P ( 220 X 260 | p 0.48) P ( 220 .5 X 259 .5 | 192 )
P (
219 .5 192
X
260 .5 192
) P ( 2.75 Z 6.86) 9.99 9.99 P ( Z 6.86) P ( Z 2.75) 1 0.997 0.003
Uji Satu Arah Dan Dua Arah Suatu uji hipotesis statistik yang alternatifnya bersifat satu-arah, seperti 1. H o : o dan H 1 : 0 atau
2. H o : o dan H 1 : o
disebut uji satu-arah. Wilayah kritik bagi bagi hipotesis alternatif > 0 terletak seluruhnya di ekor kanan sebaran tersebut, sedangkan wilayah kritik bagi hipotesis alternatif < 0 terletak seluruhnya di ekor kiri. Dalam pengertian ini, tanda ketaksamaan menunjuk ke arah wilayah kritiknya. Uji hipotesis statistik yang alternatifnya bersifat dua-arah, seperti
H o : o H 1 : o disebut uji dua arah, karena wilayah kritiknya dipisah menjadi dua bagian yang ditempatkan di masing-masing ekor sebaran statistik ujinya. Hipotesis alternatif 0 menyatakan bahwa < 0 atau > 0. Hipotesis nol, H0, akan selalu dituliskan dengan tanda kesamaan sehingga menspesifikasi suatu nilai tunggal. Dengan cara demikian, peluang melakukan galat I dapat dikendalikan. Apakah kita harus menggunakan uji satu-arah atau dua-arah, bergantung pada kesimpulan yang akan ditarik bila H0 ditolak. Sebagai contoh, sebuah peusahaan rokok menyatakan bahwa kadar nikotin rata-rata rokok yang diproduksinya tidak melebihi 2,5 miligram. Pernyataan
dari perusahaan tersebut dapat ditolak jika
rata-rata () lebih besar dari 2,5 miligram dan dapat diterima jika lebih kecil atau sama dengan 2,5 miligram. Dengan demikian kita akan menguji H0 : = 2,5 H1 : > 2,5 Meskipun kita menuliskan hipotesis nol-nya dengan tanda sama dengan, namun itu harus dipahami sebagai mencakup semua nilai yang tidak dicakup oleh hipotesis alternatifnya. Akibatnya, menerima H0 tidak boleh diimplikasikan bahwa tepat sama dengan 2,5 miligram, namun harus diartikan bahwa kita tidak mempunyai bukti yang cukup untuk mendukung H1. Beberapa langkah yang perlu diperhatikan dalam pengujian hipotesis:
72.
Tuliskan hipotesis yang akan diuji
Ada dua jenis hipotesis:
1.
Hipotesis sederhana
Hipotesis nol dan hipotesis alternatif sudah ditentukan pada nilai tertentu
2.
H0 : = 0
vs
H1 : = 1
H0 : 2 = 02
vs
H0 : 2 = 12
H0 : P = P0
vs
H0 : P = P1
Hipotesis majemuk
Hipotesis nol dan hipotesis alternatif dinyatakan dalam interval nilai tertentu
b.1. Hipotesis satu arah H0 : 0
vs
H1 : < 0
H0 : 0
vs
H1 : > 0
vs
H1 : 0
b.2. Hipotesis dua arah H0 : = 0
73.
Deskripsikan data sampel yang diperoleh (hitung rataan, ragam, standard error dll)
74.
Hitung statistik ujinya Statistik uji yang digunakan sangat tergantung pada sebaran statistik dari penduga parameter yang diuji. Misalnya
H0: = 0 maka x maka statistik ujinya bisa t-student atau normal baku (z) ˆ
t h
75.
x 0 s / n
atau z h
x 0 / n
Tentukan batas kritis atau daerah penolakan H0 Daerah penolakan H0 sangat tergantung dari bentuk hipotesis alternatif (H1). Misalnya, H1: < 0
Tolak H0 jika th < -t(; db)(tabel)
H1: > 0
Tolak H0 jika th > t(; db)(tabel)
H1: 0 Tolak H0 jika |th | > t(/2; db)(tabel)
76.
Tarik kesimpulan
Uji Rataan Populasi
Berikut ini adalah pengujian rataan populasi untuk satu populasi
No
Bentuk hipotesis
Statistik uji
Daerah kritis (Daerah penolakan H0)
1
H0 : = 0 vs
Contoh kecil & ragam pop tidak diketahui
|th | > t(/2; db=n-1)(tabel)
H1: 0
t h
x 0 s / n
Contoh besar atau ragam pop diketahui
z h
x 0 / n
|zh | > z(/2)(tabel)
2
H0 : 0 vs
Sda
th < -t(; db=n-1)(tabel)
H1 : < 0 zh < -z()(tabel)
3
H0 : 0 vs
Sda
th > t(; db=n-1)(tabel)
H1 : > 0 zh > z()(tabel)
Contoh 9.4 Pemerintah berencana untuk melaksanakan sebuah program peningkatan mutu siswa. Dari sebuah sekolah diketahui bahwa sebelum dilaksanakan program tersebut, rata-rata nilainya adalah 7,1. Untuk melaksanakan program tersebut, sebanyak 40 siswa secara acak dipilih dari sekolah tersebut. Data baru yang diperoleh memiliki rata-rata 7,3 dengan simpangan baku 0,15. Berhasilkah program tersebut (gunakan alpha 5%) ? Jawab Karena yang ingin diketahui apakah ada peningkatan mutu pendidikan setelah diadakan program tersebut, maka : -
hipotesisnya : H0 : = 7.1 vs H1 : > 7.1.
77.
titik kritis : Z0,05 = 1,645 (digunakan uji Z karena n relatif besar , n = 40)
78.
Stat. Uji : Z hitung
79.
Karena Zhitung > 1,645 maka tolak H0, artinya ada peningkatan rata-rata nilai setelah diadakan
X o s x
7,1 7,3 0,15 / 40
8,43
program peningkatan mutu siswa tersebut sehingga dapat dikatakan bahwa program tersebut berhasil dilaksanakan.
Contoh 9.5 Batasan yang ditentukan oleh pemerintah terhadap emisi gas CO kendaraan bermotor adalah 50 ppm. Sebuah perusahaan baru yang sedang mengajukan ijin pemasaran mobil, diperiksa oleh petugas
pemerintah untuk menentukan apakah layak perusahan tersebut diberikan ijin.
Sebanyak 20 mobil
diambil secara acak dan diuji emisi CO-nya. Dari data yang didapatkan, rata-ratanya adalah 55 dan ragamnya 4.2. dengan menggunakan taraf nyata 5%, layakkan perusahaan tersebut mendapat ijin ? Jawab -
Hipotesis H0 : = 50 vs H1 : > 50
80.
titik kritis : t(0,05;19) = 1,729
81.
Stat. Uji : t
82.
Karena thitung > 1,729 maka tolak H0, artinya emisi gas CO kendaraan bermotor yang akan
X s x
55 50 2,05 / 20
10,91
dipasarkan oleh perusahaan tersebut melebihi batasan yang ditentukan oleh pemerintah sehingga perusahaan tersebut tidak layak untuk memperoleh ijin untuk memasarkan mobilnya.
Contoh 9.6 Seorang pelamar untuk jabatan salesmen menyatakan bahwa dia sanggup melakukan penjualan minimal 7 unit barang sehari. Untuk membuktikan hal itu, manajer personalia memberikan waktu selama 12 hari. Hasil penjualan selama tes tersebut adalah sebagai berikut : 4, 5, 8, 3, 6, 4, 4, 8, 7, 3, 4, 5. Ujilah apakah pernyataan orang tersebut didukung oleh data (gunakan alpha 10%). Jawab Untuk menguji pernyataan salesman bahwa dia sanggup menjual minimal 7 unit barang sehari , maka : Hipotesis H0 : >= 7 vs H1 : < 7 83.
titik kritis 10% : t(0,10;11) = 1,363, gunakan titik kritis –1,363
84.
x
s
2
x
i
n
x
2 i
4 5 ... 5 12
n( x ) 2
n 1
x 0
5,08 ;
( 4 2 5 2 ... 5 2 ) 12(5,08) 2 11
5,08 7
85.
Stat. Uji : t
86.
Karena thitung < -1,363 maka tolak H 0, artinya rata-rata penjualan barang oleh salesmen tersebut
s x
3,174
1,78 / 12
3,73
tidak lebih dari 7 unit barang per hari tetapi kurang dari 7 unit.
Untuk menguji perbedaan dua nilai tengah populasi dapat dibedakan menjadi dua kasus yaitu kasus saling bebas dan kasus berpasangan.
Berikut ini uji ipotesis untuk dua contoh saling bebas.
No
Bentuk hipotesis
Statistik uji
Daerah kritis (Daerah penolakan H0)
1
H0 : 1-2 = 0 vs
Contoh kecil & ragam pop tidak diketahui
|th | > t(/2; db)(tabel)
H1: 1-2 0
t h
( x1 x 2 ) 0 s ( x1 x2 )
dimana:
n1 n2 2; 12 22 db dbefektif ; 12 22
1 1 2 2 ; 1 2 s n1 n2 2 2 s 2 s1 2 2 n n ; 1 2 2 1 g
s x x 1 2
Contoh besar atau ragam pop diketahui
z h
2
H0 : 1-2 0 vs
( x1 x 2 ) 0 ( x1 x2 ) Sda
|zh | > z(/2)(tabel)
th < -t(; db)(tabel)
H1 : 1-2 < 0 zh < -z()(tabel)
3
H0 : 1-2 0 vs
H1 : 1-2 > 0
Sda
th > t(; db)(tabel)
zh > z()(tabel)
Sedangkan berikut ini adalah uji hipotesis untuk dua contoh yang berpasangan
No
Bentuk hipotesis
Statistik uji
Daerah kritis (Daerah penolakan H0)
1
H0 : D = 0 vs
Contoh kecil & ragam pop tidak diketahui
|th | > t(/2; db=n-1)(tabel)
H1: D 0
t h
d 0 s / n
Contoh besar atau ragam pop diketahui
z h 2
H0 : D 0 vs
|zh | > z(/2)(tabel)
d 0 / n Sda
th < -t(; db=n-1)(tabel)
H1 : D < 0 zh < -z()(tabel)
3
H0 : D 0 vs
Sda
th > t(; db=n-1)(tabel)
H1 : D > 0 zh > z()(tabel)
Kedua kasus tersebut dibedakan oleh metode pengambilan contohnya. Dua contoh dikatakan saling bebas jika pemilihan unit-unit contoh pertama tidak tergantung pada bagaimana unit-unit contoh kedua dipilih dan sebaliknya. Sedangkan dua contoh dikatakan berpasangan jika pengambilan unit-unit contoh pertama memperhatikan bagaimana unit-unit contoh kedua dipilih. Keterkaitan kedua contoh
pada kasus berpasangan ditentukan oleh suatu peubah kontrol (control variable) misal lokasi, kemiringan lahan, tingkat pendidikan, kondisi sosial ekonomi dan lain-lain.
Contoh 9.7 Dua jenis program manajemen pemasaran diterapkan pada sebuah perusahaan retail untuk mengkaji program mana yang lebih efisien meningkatkan penjualan mingguan.
Kedua program tersebut
dievaluasi dengan cara mencatat penjualan selama 9 minggu. Program pertama mampu memberikan rata-rata nilai penjualan mingguan sebesar 230 juta dengan simpangan baku 10 juta, sedangkan program kedua rata-ratanya 210 juta dengan simpangan baku 9 juta. Jika diasumsikan kedua kondisi sama, ujilah apakah kedua program memberikan hasil yang berbeda ? (gunakan 5%) Jawab Untuk mengkaji program mana yang lebih efisien, Hipotesisnya : H0 : 1 - 2 = 0 vs H 1 : 1 - 2 0 89.
titik kritis untuk = 5% : t(0,025;16) = 2,120 (ingat : kondisi sama ragam sama, sehingga db = n1+n2-2)
90.
91.
92.
2 p
ragam gabungan : s
Stat. Uji : t
(n1 1) s12 (n2 1) s 22 n1 n2 2
( x1 x 2 ) d 0 s p (1 / n 1 ) (1 / n2 )
8(100) 8(81)
230 210 0 9,51 1 / 9 1 / 9
16
90,5
4,46
Karena |thitung | > 2,120 maka tolak H 0, artinya ada perbedaan dalam tingkat efesiensi peningkatan penjualan mingguan antara program pertama dan yang kedua, di mana program yang lebih efisien adalah program yang pertama.
Contoh 9.8 Seorang mahasiswa Budidaya Pertanian ingin membandingkan produksi dari dua varietas kacang tanah. Kemudian kedua varietas kacang tanah tersebut ditanam pada delapan lokasi yang berbeda tetapi setiap varietas ada pada setiap lokasi. Data produksi (ton perhektar) kedua varietas tersebut diperoleh sebagai berikut : Varietas\lokasi
1
2
3
4
5
6
7
8
Var 1
6.25
5.30
7.10
6.45
6.00
4.83
5.40
6.80
Var 2
5.50
5.80
6.00
7.50
6.25
4.85
5.00
6.50
ujilah apakah kedua varietas memberikan hasil yang berbeda, jika berbeda mana yang menurut anda lebih baik? (gunakan 5%)
Jawab Kasus di atas termasuk kasus pengamatan berpasangan, sehingga p erlu dicari beda dari varietas 1 dan varietas 2, yaitu di : 0.75, -0.5, 1.1, -1.05, -0.25, -0.02, 0.4, 0.3 -
Hipotesis H0 : d = 0 vs H1 : d 0
93.
titik kritis : t(0,025;7) = 2,365
94.
nilai statistik :
d 2 s d
95.
d
i
n
d
0.75 (0.5) .. . 0.3 8
0.091
n(d ) 2 3.4379 8(0.091) 2 0.482 s d 0.694 7 n 1
2 i
Stat. Uji : t
d d s d / n
0.091 0 0.694 / 8
0.371
Karena thitung < 2,365 maka terima H 0, artinya belum cukup bukti untuk menyimpulkan bahwa kedua varietas kacang tanah tersebut memberikan hasil produksi yang berbeda.
ANALISIS REGRESI DAN KORELASI
Dalam penelitian ada kalanya dilakukan pengamatan terhadap lebih dari satu ciri terhadap tiap-tiap anggota contoh. Hubungan antara ciri-ciri yang diamati itu sering menarik perhatian, sehingga timbullah masalah korelasi dan regresi. Pada masalah korelasi dibicarakan keeratan hubungan antara dua ciri atau lebih, sedangkan pada masalah regresi kita menduga bentuk hubungan antara ciri-ciri tersebut.
Regresi Linear Sederhana Dalam kehidupan sehari-hari seringkali kita ingin melihat hubungan antar peubah. Umumnya suatu peubah bersifat mempengaruhi peubah lainnya, peubah pertama ini disebut peubah bebas sedangkan peubah yang kedua disebut peubah tak bebas. Secara kuantitatif hubungan antara peubah bebas dengan peubah tak bebas dapat dimodelkan dalam suatu persamaan matematik, sehingga kita dapat menduga nilai suatu peubah tak bebas bila nilai peubah bebas diketahui. Persamaan matematik yang menggambarkan hubungan antara peubah bebas dengan peubah tak bebas sering disebut persamaan regresi. Regresi linear sederhana adalah persamaan regresi yang menggambarkan hubungan antara satu peubah bebas (x) dan satu peubah tak bebas (y), di mana hubungan keduanya dapat digambarkan sebagai suatu garis lurus. Sehingga hubungan kedua peubah tersebut dapat dituiskan dalam bentuk persamaan : Yi = + Xi ……………(1) dengan : Yi = peubah tak bebas Xi
= peubah bebas
96. = intersep / perpotongan dengan sumbu tegak
= kemiringan garis / gradien Dalam praktek, seringkali kita tidak dapat mengamati seluruh anggota populasi, sehingga hanya mengamati n buah contoh acak dan diperoleh pengamatan berukuran n serta dapat dilambangkan dengan {(xi, yi), I = 1, 2, …, n}. Persamaan yang kita peroleh adalah dugaan dari persamaan (1) dan dapat dituliskan :
Y i a bX i ……..(2) ˆ
dengan a adalah penduga bagi dan b adalah penduga bagi . Untuk peubah bebas xi, nilai pengamatan yi tidak akan selalu tepat berada pada garis persamaan (1) untuk garis regresi populasi atau pada persamaan (2) untuk garis regresi contoh. Dengan demikian akan terdapat simpangan sebesar i untuk populasi atau ei untuk contoh, sehingga diperoleh persamaan : Yi = + Xi + i (persamaan regresi populasi) ……..(3)
Yi = a + bXi + ei (persamaan regresi contoh)
….…(4)
Untuk melihat pola hubungan antara X dan Y pertama-tama kita plotkan nilai pengamatan (xi, yi) pada bidang kuadran dua. Jika hasil plot menunjukkan pola titik-titik yang menyerupai garis lurus, maka penggunaan regresi linear sederhana untuk melihat pola hubungan antara kedua peubah tersebut sudah tepat.
Pendugaan Koefisien Regresi Untuk menduga parameter dan terdapat bermacam-macam metode yang dapat digunakan, salah satu diantaranya adalah metode kuadrat terkecil (MKT).
Prinsip dasar dari MKT adalah
meminimumkan jumlah kuadrat galat (JKG) antara data aktual (data yang diperoleh dari hasil pengamatan) dengan data dugaan. Secara matematik dapat dijabarkan sebagai berikut : Yi = + Xi + i dan
Y i a bX i ˆ
Sehingga diperoleh dugaan galat sebesar : n
e
ei i Y i Y i dan misalkan q ˆ
ˆ
2 i
i 1
maka untuk mendapatkan penduga kuadrat terkecil dari parameter regresi adalah dengan meminimumkan nilai q, nilai q ini disebut juga JKG. Dengan menggunakan bantuan pelajaran kalkulus maka nilai dugaan parameter regresi dapat diperoleh sebagai berikut : n
( x b
i
x )( yi y )
i 1
x
n
n
i 1
n
x
2
i
n
n
x y x y i
i
i 1 n
n
i
i 1
x
i 1
xi i 1 n
2 i
i 1
2
i
dan
a y b x
besaran nilai a dan b dapat diinterpretasikan sebagai berikut : pada saat x bernilai nol maka besarny nilai dugaan y adalah sebesar a, sedangkan nilai b menunjukkan besarnya perubahan nilai y jika terjadi perubahan pada nilai x satu-satuan.
Pengujian Hipotesis Bagi Koefisien Regresi Seperti halnya dalam pendugaan nilai tengah, maka penilaian tentang tingkat keyakinan terhadap hasil dugaan b memerlukan informasi tentang ragam dari b, atau lebih tepatnya adalah
informasi tentang pola sebaran b.
Untuk dapat mengetahui informasi ini, kita terlebih dahulu
membuat beberapa asumsi mengenai model regresi. Berdasarkan persamaan (3), beberapa asumsi yang harus dipenuhi yaitu i adalah bebas terhadap sesamanya dan menyebar normal dengan nilai tengah nol dan ragam 2 [i (0, 2)]. Berdasarkan model (3) di atas, dengan konstanta dan sebagai parameter regresi dan xi bukan sebuah peubah acak, maka yi adalah suatu peubah acak yang menyebar normal dengan E(y i) = + xi dan Var(yi) = 2 untuk semua i. Nilai a dan b merupakan dugaan bagi parameter dan . Dengan pengambilan contoh acak berulangkali dapat diperoleh nilai dugaan yang berbeda bagi dan . Nilai-nilai dugan tersebut dapat dipandang sebagai nilai-nilai peubah acak A dan B.
nilai-nilai A dan B tersebut tergantung pada
keragaman nilai peubah acak Y1, Y2, …, Yn. Penduga koefisien b adalah kombinasi linear dari peub ah acak yi, yaitu berupa n
( x b
x )( y i y )
i
i 1
n
x
x
2
i
n
n
i 1
i 1
wi ( y i y ) wi yi w1 y1 w2 y 2 wn y n
i 1
dengan wi
x )
( xi n
x
n
; dan karena
i
x
w
i
0, maka
w y 0 i
i 1
i 1
2
n
i 1
dengan demikian b adalah peubah acak dengan nilai harapan
E (b) E (
n
wi y i )
i 1
wi
i 1
n
i 1
n
i 1
n
n
i 1
i 1
n
n
w x w x w x w ( x i
n
wi ( xi )
0 maka x wi wi x 0
n
sehingga
wi E ( y i )
i 1
n
karena nilai
n
i
i 1
i
i 1
i
i
i 1
i
i
x ) 1
i 1
jadi b merupakan penduga tak bias bagi karena E(b) = . Ragam dari b adalah
n
wi
i 1
n
w x
wi xi
i
i 1
i
n
Var (b) Var (
n
n
n
w y ) w Var ( y ) w i
2 i
i
i 1
2
2 i
i
i 1
( x
i 1
i
x ) 2
i 1
2
( xi x ) 2 i 1 n
2
2 n
( x
i
x ) 2
i 1
y b x kita peroleh
selanjutnya untuk nilai dugaan a
E (a) E ( y b x ) E ( y ) x E (b) x x dan
2 ( x ) 2 2 ( x ) 2 2 2 1 n n Var (a) Var ( y b x ) Var ( y ) ( x ) Var (b) n n 2 2 ( x x ) ( x x ) i i i 1 i 1 karena Y1, Y2, …, Yn bebas dan menyebar normal, maka A dan b juga menyebar normal dengan nilai tengah dan ragam seperti di atas. Karena ragam dari A dan B mengandung parameter 2 yang umumnya nilainya tidak diketahui, maka perlu dilakukan pendugaan untuk nilai tersebut. Parameter 2 merupakan ragam galat pada model yang menggambarkan keragaman acak dari keragaman galat percobaan di sekitar garis regresi. Penduga tak bias bagi 2 adalah s2, yaitu n
s 2
JKG n2
e
2 i
i 1
n2
J yy bJ xy n2
J yy b 2 J xx n2
dengan :
J xx
n
( x
n
i
x ) 2 xi2
i 1
J xy
i 1
n
( x i 1
n xi i 1
2
n
n
i
; J yy
x )( y i y ) xi y i i 1
n
n
i 1
i 1
( yi y ) 2 yi2
n yi i 1
2
n
n n xi y i i 1 i 1 n
Untuk menguji hipotesis apakah intersep bernilai tertentu (miaslnya k) dapat diuji dengan menggunakan statistik uji t, di mana hipotesisnya dapat dituliskan sebagai berikut : H0 : = k lawan H1 : k
Statistik ujinya dapat dirumuskan sebagai berikut
a k
t hitung
Var (a)
a k s a
nilai statistik uji ini mengikuti sebaran t-student dengan derajat bebas n-2. Jika |t-hitung| > t (/2, db=n2) atau
jika peluang nyata lebih k ecil dari nilai taraf nyata yang ditetapkan maka hipotesis nol ditolak. Selang kepercayaan (1 - )100% bagi parameter adalah :
a - t/2, (n-2) sa a + t/2, (n-2) sa dari selang kepercayaan ini dapat kita lihat kisaran nilai intersep yang dapat diyakini dengan tingkat keyakinan sebesar (1 - )100%. Untuk melihat apakah peubah X berpengaruh terhadap peubah Y juga dapat diuji dengan menggunakan uji t-student. Misalkan ingin diuji apakah perubahan setiap X satu-satuan akan mengakibatkan Y akan berubah sebesar k satuan, naka hipotesis dari pertanyaan ini dapat dituliskan sebagai berikut : H0 : = k H1 : k Statistik ujinya dapat dirumuskan sebagai berikut
t hitung
b k Var (b)
b k sb
nilai statistik uji ini mengikuti sebaran t-student dengan derajat bebas n-2. Jika |t-hitung| > t (/2, db=n2) atau
jika peluang nyata lebih k ecil dari nilai taraf nyata yang ditetapkan maka hipotesis nol ditolak. Selang kepercayaan (1 - )100% bagi parameter adalah :
b - t/2, (n-2) sb b + t/2, (n-2) sb
Peramalan / Pendugaan Bagi Y Dalam analisis regresi peubah X bersifat tetap. Untuk suatu contoh acak yang berukuran n pada nilai x yang sama kita mungkin mendapatkan nilai y yang bervariasi. Dengan kata lain nilai yi dalam pasangan (xi, yi) merupakan nilai suatu peubah acak Y dengan nilai tengah y dan ragam y2.
Persamaan Yi = a + bXi dapat digunakan untuk menduga y dari beberapa nilai y pada nilai x tertentu dan dapat pula digunakan untuk menduga nilai tunggal y0 bila x = x 0. Bila y0 = a + bx 0 maka y0 akan menyebar normal dengan nilai tengah y0 sama dengan y pada x = x0 dan
1 ( x0 x ) 2 1 n 2 ( xi x ) 2 , dengan s x 2 n 1 i 1 n (n 1) s x 2 y0 ˆ
2
Penduga bagi y adalah 0 ˆ
s y20 . Untuk memperoleh nilai dugaan ini 2 diduga dengan s2. Adapun ˆ
selang kepercayaan (1 - )100% bagi y untuk x = x0 adalah :
y 0 t / 2,( n2) s y20 y y0 t / 2,( n2) s y20 ˆ
ˆ
ˆ
ˆ
Untuk mendapatkan selang kepercayaan bagi sembarang nilai tunggal y0 dari peubah Y0, maka kita perlu menduga ragam selisih antara nilai y 0 yang diperoleh dari garis regresi bila pengambilan ˆ
contohnya dilakukan berulang-ulang pada x=x0 dengan y0 yang sesungguhnya. Kita dapat memandang
y 0 sebagai
y 0 ˆ
nilai peubah acak
Y 0 Y 0 , yang sebaran penarikan contohnya menyebar normal ˆ
dengan nilai tengah dan ragam sebagai berikut :
y0 y0
E (Y 0 Y 0 ) 0 ˆ
2
dan
y 0 y 0
ˆ
2
Penduga bagi y
ˆ
0 y0
2
adalah s y ˆ
0 y0
ˆ
1 ( x0 x ) 2 2 1 2 n (n 1) s x
. Agar nilai dugaan ragam ini diperoleh, maka 2 diduga dengan
ragam contoh (s2). Selang kepercayaan (1-)100% bagi nilai tunggal y 0 bila x=x0 adalah
y0 t / 2,( n2) s y20 y0 y0 y0 t / 2,( n2) s y20 y0 ˆ
ˆ
ˆ
ˆ
Kesesuaian Model Ada beberapa petunjuk yang dapat digunakan untuk melihat kesesuaian dari model yang diperoleh, diantaranya : 97.
koefisien determinasi (R2) yaitu suatu ukuran yang digunakan untuk melihat kemampuan model dalam menerangkan keragaman nilai peubah Y. Kisaran nilai R2 mulai dari 0 sampai 100%.
Semakin besar nilai R2 berarti model semakin mampu menerangkan perilaku peubah Y. Sebagai contoh, ingin diketahui pola hubungan antara biaya iklan yang dikeluarkan oleh suatu perusahaan dengan banyaknya produknya yang terjual, diperoleh nilai R 2 sebesar 80%, ini berarti bahwa model regresi yang kita peroleh menunjukkan bahwa 80% keragaman dari produk yang terjual sudah dapat diterangkan oleh faktor biaya iklan yang dikeluarkan, sedangkan 20% lainnya keragaman dari produk yang terjual dipengaruhi oleh faktor lain. Adapun rumus untuk menghitung R2 adalah
R 1 2
98.
JKG JKT
b 2 s x2 s y2
Kuadrat tengah galat (KTG). Semakin kecil nilai KTG maka model regresi yang diperoleh akan lebih baik dalam menggambarkan pola hubunagn antara peubah bebas dan peubah tak bebas. Namun penggunaan KTG sering kali menemui masalah yaitu seberapa besar nilai KTG agar model dikategorikan sebagai model yang baik. Permasalahan ini timbul karena mengingat KTG tidak memiliki batasan yang jelas. Tetapi jika terdapat beberapa model yang dibangun, maka penggunaan KTG sebagai alat untuk memilih model terbaik akan cukup efektif.
99.
membuat plot antara nilai sisaan, ei, dengan xi atau dengan y i . Perilaku ei yang dianggap layak ˆ
akan terlihat apabila nilai-nilai tersebut membentuk suatu pita yang mendatar di sekitar garis e = 0.
Jika tebaran nilai-nilainya berbentuk corong dapat memberi petunjuk adanya
keheterogenan ragam dan jika tebaran nilainya melengkung menunjukkan kekurangtepatan dari model regresinya. Berdasarkan plot sisaan kita juga dapat mendeteksi kemungkinan adanya pencilan dengan memeriksa apakah ada nilai/titik yang memencil atau jauh dari nilai-nilai sisaan yang lain.
Korelasi Ukuran korelasi linear antara dua peubah yang paling banyak digunakan adalah koefisien korelasi contoh (r). Koefisien korelasi ini menggambarkan tingkat keeratan hubungan linear antara dua peubah atau lebih. Besaran dari r tidak menggambarkan hubungan sebab akibat antar dua peubah atau lebih tetapi semata-mata menggambarkan keterkaitan linear antar peubah. Nilai dari r berkisar antara –1 sampai 1 (-1 r 1). Nilai r yang mendekati 1 atau –1 menunjukkan semakin erat hubungan linear antara kedua peubah tersebut. Sedangkan nilai r yang mendekati atau sama dengan nol menggambarkan tidak ada hubungan linear antara kedua peubah tersebut, tetapi mungkin saja mempunyai hubungan yang tidak linear. Koefisien korelasi antara peubah X dan Y dapat dirumuskan sebagai berikut :
r
J xy
J xx J yy
dengan s xy
s xy s x2 s y2
b
s x s y
J xy /(n 1), s x2 J xx /(n 1), s y2 J yy /(n 1)
Koefisien korelasi contoh, r, merupakan sebuah nilai yang dihitung dari n pengamatan contoh. Contoh acak berukuran n yang lain tetapi diambil dari populasi yang sama biasanya akan menghasilkan nilai r yang berbeda. Dengan demikian kita dapat memandang r sebagai suatu nilai dugaan bagi koefisien korelasi linear populasi, . Bila r dekat dengan nol, kita cenderung menyimpulkan = 0. Tetapi jika nilai r mendekati –1 atau 1 disarankan agar kita menyimpulkan 0. Masalahnya sekarang adalah bagaimana mendapatkan suatu uji yang akan mengatakan kepada kita kapan suatu nilai r berada cukup jauh dari suatu nilai tertentu 0, agar kita mempunyai cukup alasan untuk menolak hipotesis nol bahwa = 0 dan menerima alternatifnya. Hipotesis alternatifnya, H1, biasanya salah satu diantara < 0, > 0, atau 0. Uji terhadap hipotesis nol = 0 didasarkan pada besaran
1 r 2 1 r
1
ln
yang merupakan suatu nilai
peubah acak yang menyebar menghapiri normal dengan nilai tengah
(0,5)ln[(1+)/(1-)] dan ragam 1/(n-3). Jadi statistik ujinya adalah menghitung
Z hitung
n 3 1 2
1 0 1 r 1 ln ln 1 2 1 r 2 0
n3 2
(1 r )(1 0 ) (1 r )(1 0 )
ln
jika taraf nyata yang digunakan sebesar , maka keputusan akan menolak H0 jika: 100.
Zhitung < Z,
untuk H1 : < 0
101.
Zhitung > Z,
untuk H1 : > 0
102.
|Zhitung | > Z/2, untuk H1 : 0
Secara intuisi, koefisien korelasi dapat ditafsirkan dalam dua cara, yaitu : 103.
sebagai arah hubungan antara dua ukuran yang berarti mereka cenderung untuk meningkat atau menurun bersama-sama (berhubungan secara positif), yang satu meningkat yang lain menurun (berhubungan secara negatif), atau pergerakan mereka terpisah (tidak berkorelasi).
104.
sebagai suatu kekuatan asosiasi yang berarti bahwa jika nilai absolut korelasi bergerak menjauhi nol maka dua ukuran berasosiasi semakin kuat.
Contoh Sebuah penelitian dilakukan oleh seorang pengusaha untuk menentukan hubungan antara biaya pemasangan iklan per minggu dan hasil penjualan produknya (dalam jutaan rupiah). Data yang diperoleh adalah sebagai berikut : Biaya iklan
6
2
1
2
1
7
6
3
5
4
2
8
4
3
5
Penjualan
57
40
33
37
34
58
54
43
49
49
38
62
47
45
51
105.
Tentukan persamaan garis regresinya
106.
Benarkah pernyataan pengusaha mengatakan bahwa dengan peningkatan biaya/ iklan per juta akan meningkatkan penjualan sebesar 5 juta rupiah ?
107.
Dugalah besarnya penjualan mingguan bila pengeluaran untuk biaya iklan sebesar 4,5 juta !
108.
Buatlah selang kepercayaan 95% bagi penjualan mingguan rata-rata jika biaya iklannya sebesar 2,5 juta !
109.
Buatlah selang kepercayaan 90% bagi nilai dugaan penjualan mingguan bila biaya iklan yang dikeluarkan sebesar 3 juta.
110.
Bagaimana kesesuaian model regresi yang anda peroleh ?
111.
Hitunglah koefisien korelasinya.
Jawab: Biaya Penjualan iklan (x) (y)
No.
x2
y2
xy
1
6
57
36
3249
342
2
2
40
4
1600
80
3
1
33
1
1089
33
4
2
37
4
1369
74
5
1
34
1
1156
34
6
7
58
49
3364
406
7
6
54
36
2916
324
8
3
43
9
1849
129
9
5
49
25
2401
245
10
4
49
16
2401
196
11
2
38
4
1444
76
12
8
62
64
3844
496
13
4
47
16
2209
188
14
3
45
9
2025
135
15
5
51
25
2601
255
59
697
299
33517
3013
a. n
n b
n
n
x y x y i
i
i 1
i
i 1
i 1
n n xi2 xi i 1 i 1 n
a y b x
y n
i
2
b
i
15(3013) 59(697)
x n
15(299) (59) 2
i
697 15
4,06
59 15
4072 1004
4,06
30,50
Interpretasi : 112.
Jika tidak ada biaya yang dikeluarkan unt uk iklan, maka rata-rata hasil penjualan produk perminggu mencapai 30,5 juta rupiah.
113.
Jika biaya untuk iklan mengalami kenaikan satu juta, maka hasil penjualan akan mengalami perubahan sebesar 4,06 juta rupiah.
b. pengujian Hipotesis : H0 : = 5 vs H1 : ≠ 5 Nilai = 5%, t(0,025,13) = 2,160
t hitung
b 0
b 5
s b
s b
dimana s b
2
n
( x
i
x ) 2
i 1
J yy b J xx 2
2 s 2
n2
ˆ
J yy 33517 s 2
(697 ) 2 15
; dengan J yy
1129 ,73
13
2,04
66,93
y
2 i
n yi i 1
i 1
1129 ,73 ( 4,06 ) 2 (66,93)
Sehingga sb
n
J xx 299
2
n
(59 ) 2 15
n
dan J xx
xi2 i 1
n xi i 1
2
n
66,93
2,04
0,18
Dengan demikian
t hitung
4,06 5 0,18
5,22
karena |thitung| > 2,160 maka tolak H 0, artinya tidak benar pernyataan pengusaha yang mengatakan bahwa dengan peningkatan biaya/ iklan per juta akan meningkatkan penjualan sebesar 5 juta rupiah.
c. Penjualan = 30.5 + 4.06 Biaya iklan = 30.5 + 4.06(4.5) = 48.77
d. alpha 5% untuk x = 2.5, maka y = 30.5 + 4.06(2.5) = 40.65
y 0 t / 2,( n2) s y20 y y0 t / 2,( n2) s y20 ˆ
ˆ
ˆ
ˆ
1 ( x0 x ) 2 2 1 (2.5 3.93) 2 s 2.04 0.20 dengan s n J 15 66 . 93 xx 2 y0 ˆ
SK 5% : 40.65 -2.16(0.2) ≤ y ≤ 40.65 + 2.16(0.2) 40.22 ≤ y ≤ 41.08
e. alpha 10% untuk x = 3, maka y = 30.5 + 4.06(3) = 42.68
y0 t / 2,( n2) s y20 y0 y0 y0 t / 2,( n2) s y20 y0 ˆ
ˆ
ˆ
dengan
s
2
y0 y0 ˆ
ˆ
1 ( x0 x ) 2 2 1 (3 3.93) 2 1 s 1 2.04 2.20 n J 15 66 . 93 xx
SK 10% : 42.68 -1.771(0.2) ≤ y 0 ≤ 42.68 + 1.771(0.2) 42.33 ≤ y ≤ 43.03
f. Kesesuaian model uji apakah biaya iklan berpengaruh nyata
Keakuratan model :
R 1 2
JKG JKT
b 2 s x2 s y2
b 2 J xx J yy
(4,06) 2 (66,93) 1129,73
x100% 97,66%
g. Koefisien Korelasi
r
R 2 0,977 0,99
Dengan menggunakan tabel sidik ragam alpha=5%: