Data mahasiswa Mata Kuliah Statistika MC: 2014

Tugas Statistika BAB 9 Analisis Regresi dan Analisis Korelasi

BAB 9

ANALISIS REGRESI & ANALISIS KORELASI

A. ANALISIS REGRESI

1. PENGERTIAN

Analisis regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variabel dengan variabel(-variabel) yang lain. Variabel “penyebab” disebut dengan bermacam-macam istilah: variabel penjelas, variabel eksplanatorik, variabel independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak. Analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Hampir semua bidang ilmu yang memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis ini.

2. KEGUNAAN

Tujuan menggunakan analisis regresi ialah:

-Membuat estimasi rata-rata dan nilai variabel tergantung dengan didasarkan pada nilai variabel bebas.

-Menguji hipotesis karakteristik dependensi

-Untuk meramalkan nilai rata-rata variabel bebas dengan didasarkan pada nilai variabel bebas diluar jangkaun sample.

3. ANALISIS REGRESI

3.1 Analisis Regresi Berganda

Regresi berganda seringkali digunakan untuk mengatasi permasalahan analisis regresi yang melibatkan hubungan dari dua atau lebih variabel bebas. Pada awalnya regresi berganda dikembangkan oleh ahli ekonometri untuk membantu meramalkan akibat dari aktivitas-aktivitas ekonomi pada berbagai segmen ekonomi. Misalnya laporan tentang peramalan masa depan perekonomian di jurnal-jurnal ekonomi (Business Week, Wal Street Journal, dll), yang didasarkan pada model-model ekonometrik dengan analisis berganda sebagai alatnya. Persamaan regresi linear berganda sebagai berikut:

Y’ = a+b1X1+b2X2+….+ bnXn

Keterangan:
Y’ : variabel dependen (nilai yag diprediksikan)

X1 dan X2 : variabel independen

a : konstanta

b : koefisien regresi(nilai peningkatan/penurunan)

contoh kasus:

Seorang peneliti ingin mengetahui pengaruh dari tinggi badan terhadap berat badan. Untuk kebutuhan penelitian tersebut diambil sampel secara acak sebanyak 10 orang untuk diteliti. Hasil pengumpulan data diketahui data sebagai berikut :

Berdasarkan data tersebut di atas :

Hitunglah nilai a dan b untuk persamaan regersi linier sederhana. Jika hipotesis penelitian menyatakan bahwa “tinggi badan seseorang berpengaruh terhadap berat badan seseorang”, ujilah hipotesis tersebut dengan menggunakan Uji T dan Uji F (tingkat keyakinan sebesar 95%). Hitunglah nilai r dan koefisien determinasi. Bagaimana kesimpulannya !

Jawab :

Hipotesis penelitian : Tinggi Badan berpengaruh terhadap Berat Badan Seseorang (karena hanya dikatakan berpengaruh maka menggunakan uji dua arah).

Jika Y : Berat Badan Seseorang dan X : Tinggi Badan Seseorang, maka untuk mendapatkan nilai a dan b untuk persamaan regersi linier sederhana :

Berdasarkan hasil pengolahan data tersebut di atas maka dapat dibuat persamaan regresi linier sederhana : Y = – 73,72041 + 0,819657 X

Untuk menguji hipotesis secara parsial digunakan Uji T, yaitu :

Hipotesis Statistik adalah Ho : b = 0 dan Ha : b ≠ 0 (disebut uji dua arah)

Nilai T hitung adalah : b/Sb = 0,819657/0,05525673 = 14,833613932638 = 14,834

Nilai T tabel dengan df : 10 – 2 = 8 dan ½ α = 2,5% (uji dua arah) sebesar ± 2,306

Karena nilai T hitung lebih besar dari pada T tabel atau 14,834 > 2,306 maka Ho ditolak, Ha diterima dan hipotesis penelitian yang menyatakan bahwa Tinggi Badan berpengaruh terhadap Berat Badan Seseorang adalah dapat diterima (dapat dikatakan signifikan secara statistik).
Sedangkan untuk menguji secara serempak digunakan Uji F, yaitu diperoleh F hitung = 31.874,98 dan Untuk nilai F tabel dengan df : k – 1 ; n – k = 1 ; 8 dan α : 5% sebesar 5,32. Karena nilai F hitung lebih besar dari F tabel atau 31.874,98 > 5,32 maka Ho ditolak, Ha diterima dan hipotesis penelitian yang menyatakan bahwa Tinggi Badan berpengaruh terhadap Berat Badan Seseorang adalah dapat diterima.

3.2 Analisis Regresi Sederhana

Regresi Linier Sederhana Regresi linier sederhana bertujuan mempelajari hubungan linier antara dua variabel. Dua variabel ini dibedakan menjadi variabel bebas (X) dan variabel tak bebas (Y). Variabel bebas adalah variabel yang bisa dikontrol sedangkan variabel tak bebas adalah variabel yang mencerminkan respon dari variabel bebas.

Statistik regresi dapat didapatkan dengan berbagai cara, diantaranya ialah dengan menggunakan metode tangan bebas dan metode kuadrat terkecil. Dengan menggunakan metode kuadrat terkecil maka nilai a dan b dapat langsung dicari menggunakan rumus di bawah ini:

Contoh:
Diketahui peubah nilai skor tes masuk (X) dengan nilai ekonomi (Y) sebagai berikut:

Mahasiswa Skor tes (X) Nilai ekonomi (Y)

1 65 65

2 50 74

3 55 76

4 65 90

5 55 85

6 70 87

7 65 94

8 70 98

9 55 81

10 70 91

11 50 76

12 55 74

Berdasarkan data diatas tentukan hubungan matematis antara skor tes masuk dengan nilai ekonomi.

Jawaban:

Sehingga persamaan regresinya ialah:

Y= 30,056 + 0,897 X

B. ANALISIS KORELASI

1. PENGERTIAN KORELASI

Korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik pengukuran asosiasi / hubungan (measures of association). Pengukuran asosiasi merupakan istilah umum yang mengacu pada sekelompok teknik dalam statistik bivariat yang digunakan untuk mengukur kekuatan hubungan antara dua variabel. Diantara sekian banyak teknik-teknik pengukuran asosiasi, terdapat dua teknik korelasi yang sangat populer sampai sekarang, yaitu Korelasi Pearson Product Moment dan Korelasi Rank Spearman. Selain kedua teknik tersebut, terdapat pula teknik-teknik korelasi lain, seperti Kendal, Chi-Square, Phi Coefficient, Goodman-Kruskal, Somer, dan Wilson.

Pengukuran asosiasi mengenakan nilai numerik untuk mengetahui tingkatan asosiasi atau kekuatan hubungan antara variabel. Dua variabel dikatakan berasosiasi jika perilaku variabel yang satu mempengaruhi variabel yang lain. Jika tidak terjadi pengaruh, maka kedua variabel tersebut disebut independen.

Korelasi bermanfaat untuk mengukur kekuatan hubungan antara dua variabel (kadang lebih dari dua variabel) dengan skala-skala tertentu, misalnya Pearson data harus berskala interval atau rasio; Spearman dan Kendal menggunakan skala ordinal; Chi Square menggunakan data nominal. Kuat lemah hubungan diukur diantara jarak (range) 0 sampai dengan 1. Korelasi mempunyai kemungkinan pengujian hipotesis dua arah (two tailed). Korelasi searah jika nilai koefesien korelasi diketemukan positif; sebaliknya jika nilai koefesien korelasi negatif, korelasi disebut tidak searah. Yang dimaksud dengan koefesien korelasi ialah suatu pengukuran statistik kovariasi atau asosiasi antara dua variabel. Jika koefesien korelasi diketemukan tidak sama dengan nol (0), maka terdapat ketergantungan antara dua variabel tersebut. Jika koefesien korelasi diketemukan +1. maka hubungan tersebut disebut sebagai korelasi sempurna atau hubungan linear sempurna dengan kemiringan (slope) positif.

Jika koefesien korelasi diketemukan -1. maka hubungan tersebut disebut sebagai korelasi sempurna atau hubungan linear sempurna dengan kemiringan (slope) negatif. Dalam korelasi sempurna tidak diperlukan lagi pengujian hipotesis, karena kedua variabel mempunyai hubungan linear yang sempurna. Artinya variabel X mempengaruhi variabel Y secara sempurna. Jika korelasi sama dengan nol (0), maka tidak terdapat hubungan antara kedua variabel tersebut. Dalam korelasi sebenarnya tidak dikenal istilah variabel bebas dan variabel tergantung. Biasanya dalam penghitungan digunakan simbol X untuk variabel pertama dan Y untuk variabel kedua. Dalam contoh hubungan antara variabel remunerasi dengan kepuasan kerja, maka variabel remunerasi merupakan variabel X dan kepuasan kerja merupakan variabel Y.

2. KEGUNAAN

Pengukuran asosiasi berguna untuk mengukur kekuatan (strength) hubungan antar dua variabel atau lebih. Contoh: mengukur hubungan antara variabel:

-Motivasi kerja dengan produktivitas

-Kualitas layanan dengan kepuasan pelanggan

-Tingkat inflasi dengan IHSG

Pengukuran ini hubungan antara dua variabel untuk masing-masing kasus akan menghasilkan keputusan, diantaranya:

-Hubungan kedua variabel tidak ada

-Hubungan kedua variabel lemah

-Hubungan kedua variabel cukup kuat

-Hubungan kedua variabel kuat

-Hubungan kedua variabel sangat kuat

Penentuan tersebut didasarkan pada kriteria yang menyebutkan jika hubungan mendekati 1, maka hubungan semakin kuat; sebaliknya jika hubungan mendekati 0, maka hubungan semakin lemah.

3. ANALISIS KORELASI

3.1 Analisis Korelasi Parsial

Analisis korelasi parsial (Partial Correlation) digunakan untuk mengetahui hubungan antara dua variabel dimana variabel lainnya yang dianggap berpengaruh dikendalikan atau dibuat tetap (sebagai variabel kontrol). Nilai korelasi (r) berkisar antar 1 sampai -1, nilai semakin mendekati 1 atau -1 berarti hubungan antara dua variabel semakin kuat, dan sebaliknya. Nilai positif menunjukkan hubungan searah (X naik maka Y naik) dan nilai negatif menunjukkan hubungan terbalik (X naik maka Y turun). Data yang digunakan biasanya berskala interval atau rasio. Menurut Sugiyono (2007) pedoman untuk memberikan interpretasi koefisien korelasi sebagai berikut:

0,00 – 0,199 = sangat rendah

0,20 – 0,399 = rendah

0,40 – 0,599 = sedang

0,60 – 0,799 = kuat

0,80 – 1,000 = sangat kuat

Contoh kasus:

Kita mengambil contoh pada kasus korelasi sederhana di atas dengan menambahkan satu variabel kontrol. Seorang mahasiswa bernama Andi melakukan penelitian dengan menggunakan alat ukur skala. Andi ingin meneliti tentang hubungan antara kecerdasan dengan prestasi belajar jika terdapat faktor tingkat stress pada siswa yang diduga mempengaruhi akan dikendalikan. Dengan ini Andi membuat 2 variabel yaitu kecerdasan dan prestasi belajar dan 1 variabel kontrol yaitu tingkat stress. Tiap-tiap variabel dibuat beberapa butir pertanyaan dengan menggunakan skala Likert, yaitu angka 1=sangat tidak setuju, 2=tidak setuju, 3=setuju, dan 4=sangat setuju. Setelah membagikan skala kepada 12 responden didapatlah skor total item-item yaitu sebagai berikut:

Tabel Tabulasi Data (data fiktif)

Subjek Kecerdasan Prestasi Belajar Tingkat Stress

1 33 58 25

2 32 52 28

3 21 48 32

4 34 49 27

5 34 52 27

6 35 57 25

7 32 55 30

8 21 50 31

9 21 48 34

10 35 54 28

11 36 56 24

12 21 47 29

3.2 Analisis Korelasi Product Moment

Digunakan untuk menentukan besarnya koefisien korelasi jika data yang digunakan berskala interval atau rasio. Rumus yang digunakan:

Contoh kasus:

Seorang mahasiswa melakukan survei untuk meneliti apakah ada korelasi antara pendapatan mingguan dan besarnya tabungan mingguan di P’Qerto.

Untuk menjawab permasalahan tersebut diambil sampel sebanyak 10 kepala keluarga.
Cara melakukan perhitungan manual uji korelasi di atas adalah sebagai berikut:

Asumsi uji korelasi

Sebelum diimplementasi, uji korelasi harus memenuhi serangkaian asumsi, yaitu:

1. Normalitas, artinya sebaran variabel-variabel yang hendak dikorelasikan harus berdistribusi normal.

2. Linieritas, artinya hubungan antara dua variabel harus linier, misalnya ditunjukkan lewat straight-line.

3. Ordinal, artinya variabel harus diukur dengan minimal skala ordinal.

4. Homoskedastisitas, artinya variabilitas skor di variabel Y harus tetap konstan di semua nilai variabel X.

Kriteria Penerimaan Hipotesis

H0 : tidak terdapat korelasi positif antara tabungan dengan pendapatan

Ha : terdapat korelasi positif antara tabungan dengan pendapatan

H0 diterima jika r hitung ≤ r tabel ( , n-2) atau t hitung ≤ ttabel ( , n-2)

Ha diterima jika r hitung > r tabel ( , n-2) atau t hitung > ttabel ( , n-2)

Sampel: 10 kepala keluarga

Data yang dikumpulkan:

Tabungan 2 4 6 6 8 8 9 8 9 10

pendapatan 10 20 50 55 60 65 75 70 81 85

Analisis data:

N Xi Yi Xi^2 Yi^2 XY

1 2 10 4 100 20

2 4 20 16 400 80

3 6 50 36 2500 300

4 6 55 36 3025 330

5 8 60 64 3600 480

6 8 65 64 4225 520

7 9 75 81 5625 675

8 8 70 64 4900 560

9 9 81 81 6561 729

10 10 85 100 7225 850

jumlah 70 571 546 38161 4544

Pengujian hipotesis:

Dengan kriteria r hitung: r hitung (0,981) > r tabel (0,707)

Dengan kriteria t hitung:

t hitung (14,233) > t tabel (1,86)

kesimpulan:
karena r hitung > dari r tabel maka Ha diterima, karena t hitung > t tabel maka Ha diterima
“terdapat korelasi positif antara pendapatan dengan tabungan mingguan di P’Qerto”

Pemikiran utama korelasi product momen adalah seperti ini:

1. Jika kenaikan kuantitas dari suatu variabel diikuti dengan kenaikan kuantitas dari variabel lain, maka dapat kita katakan kedua variabel ini memiliki korelasi yang positif. Jika kenaikan kuantitas dari suatu variabel sama besar atau mendekati besarnya kenaikan kuantitas dari suatu variabel lain dalam satuan SD, maka korelasi kedua variabel akan mendekati.

2. Jika kenaikan kuantitas dari suatu variabel diikuti dengan penurunan kuantitas dari variabel lain,maka dapat kita katakan kedua variabel ini memiliki korelasi yang negatif. Jika kenaikan kuantitas dari suatu variabel sama besar atau mendekati besarnya penurunan kuantitas dari variabel lain dalam satuan SD,maka korelasi kedua variabel akan mendekati -1.

3. Jika kenaikan kuantitas dari suatu variabel diikuti oleh kenaikan dan penurunan kuantitas secara random dari variabel lain atau jika kenaikan suatu variabel tidak diikuti oleh kenaikan atau penurunan kuantitas variabel lain (nilai dari variabel lain stabil), maka dapat dikatakan kedua variabel itu tidak berkorelasi atau memiliki korelasi yang mendekati nol.

Dari pemikiran ini kemudian lahirlah Rumus Korelasi Product Momen Pearson seperti yang sering kita lihat di buku. Ada beberapa rumus yang dapat diacu. Semuanya akan memberikan hasil r yang sama, hanya saja dengan melihatnya kita akan dapat melihat pemaknaan yang berbeda-beda.

Ada beberapa hal yang dapat kita pelajari dari rumus ini :

Rumus pertama :

Jika setiap subjek yang memiliki nilai X lebih rendah dari meannya, memiliki nilai Y yang juga lebih rendah dari meannya, nilai r akan menjadi positif. Begitu juga jika setiap subjek yang memiliki nilai X lebih tinggi dari meannya, memiliki nilai Y yang lebih tinggi dari meannya. Jika setiap subjek yang memiliki nilai X yang lebih tinggi dari meannya, memiliki nilai Y yang lebih rendah dari meannya maka nilai r akan menjadi negatif. Begitu juga jika tiap subjek yang memiliki nilai X lebih rendah dari meannya memiliki nilai Y yang lebih tinggi dari meannya. Jika tiap nilai X yang lebih tinggi dari meannya terkadang diikuti oleh nilai Y yang lebih tinggi terkadang lebih rendah dari meannya maka nilai r akan cenderung mendekati 0 (nol).

Rumus kedua:

Dari rumus kedua ini dapat kita simpulkan bahwa nilai korelasi sebenarnya nilai kovarian dari dua variabel x dan y yang distandardkan dengan menggunakan standard deviasi x dan standard deviasi y sebagai denominatornya. Nilai kovarian sangat dipengaruhi oleh satuan skala yang digunakan oleh kedua variabel. Misalnya kita menghitung kovarian dari tinggi badan dengan panjang rambut , pengen tahu apakah tinggi badan berkorelasi dengan panjang rambut. Kita menghitung tinggi badan dan panjang rambut dalam satuan meter. Kemudian kita hitung kovariannya. Setelah itu kita menggunakan data yang sama, hanya mengubah satuannya menjadi centimeter, lalu menghitung kovariannya. Nah kovarian dari hasil perhitungan kedua akan terlihat lebih besar daripada yang pertama. Lebih besar? Ya karena dengan menggunakan satuan centimeter, 1.4 meter akan menjadi 140 centimeter. Jika kita hitung kovariannya, perhitungan pertama akan menghitung dalam skala satuan (1.4, 1.5, dst) sementara perhitungan kedua akan menghitung dalam skala ratusan. Oleh karena itu perlu distandardkan agar data yang sama akan menghasilkan angka yang sama meskipun diubah skalanya.

Rumus ketiga:

Zx dan Zy itu berbicara mengenai nilai X dan Y dalam satuan SD. Jika nilai X ada di bawah mean dari X maka nilai Zx akan negatif, jika nilai X ada di atas meannya maka nilai Zx akan positif. Begitu juga dengan Y. Seperti pada rumus pertama, jika Zx dan Zy sepakat (keduanya positif atau negatif) maka nilai r akan positif. Jika Zx dan Zy berlawanan (jika yang satu positif yang lain negatif) maka nilai r akan negatif. Nah misalnya ada seratus subjek memiliki nilai X dan Y. Lalu kita hitung satu-satu nilai Z dari X dan Y untuk tiap subjek. Tentu saja ada beberapa yang sangat sepakat yang lain agak sepakat yang beberapa berlawanan. Kemudian nilai-nilai Z ini dijumlahkan sehingga jika yang sepakat lebih banyak akan menghasilkan angka positif. Kalo yang berlawanan lebih banyak akan menghasilkan angka negatif. Kemudian hasil penjumlahan ini dicari rata-ratanya. Jadi bisa dibilang nilai r itu akan menggambarkan rata-rata keadaan X dan Y dari semua subjek dalam kelompok.

Kamis, 12 Juni 2014

Tugas Statistika BAB 9 Analisis Regresi dan Analisis Korelasi