Cara Menemukan Koefisien Korelasi untuk ‘R’ dalam Scatter Plot-Aljabar



Menemukan kekuatan asosiasi antara dua variabel merupakan keterampilan penting bagi semua jenis ilmuwan. Jika dua variabel berkorelasi satu sama lain, itu menunjukkan bahwa ada hubungan antara mereka. Korelasi positif berarti bahwa ketika satu variabel meningkat, yang lain juga meningkat, dan korelasi negatif berarti ketika satu variabel meningkat, yang lain menurun. Korelasi tidak membuktikan sebab-akibat, meskipun ada kemungkinan bahwa pengujian lebih lanjut akan membuktikan hubungan sebab-akibat antara variabel. Koefisien korelasi R menunjukkan kekuatan hubungan antara dua variabel, dan apakah itu korelasi positif atau negatif.

TL;DR (Terlalu Panjang; Tidak Dibaca)

Panggil satu variabel x dan satu variabel y . Hitung nilai R menggunakan rumus:

R = [n(Σxy) – (Σx) (Σy)] ÷ √{[n Σx 2 − (Σx) 2 ] [n Σy 2 − (Σy) 2 ]}

Di mana n adalah ukuran sampel Anda.

Buatlah tabel dari data Anda. Ini harus mencakup satu kolom untuk nomor peserta, satu kolom untuk variabel pertama (berlabel x ) dan satu kolom untuk variabel kedua (berlabel y ). Misalnya, jika Anda ingin melihat apakah ada korelasi antara tinggi dan ukuran sepatu, satu kolom akan mengidentifikasi setiap orang yang Anda ukur, satu kolom akan menunjukkan tinggi setiap orang dan kolom lainnya akan menunjukkan ukuran sepatu mereka. Buat tiga kolom tambahan, satu untuk xy , satu untuk x 2 dan satu untuk y 2 .

Gunakan data Anda untuk mengisi tiga kolom tambahan. Misalnya, bayangkan orang pertama Anda berukuran tinggi 75 inci dan memiliki ukuran 12 kaki. Kolom x (tinggi) akan menampilkan 75, dan kolom y (ukuran sepatu) akan menampilkan 12. Anda harus mencari xy , x 2 dan y 2 . Jadi gunakan contoh ini:

xy = 75 × 12 = 900

x 2 = 75 2 = 5.625

y 2 = 12 2 = 144

Selesaikan perhitungan ini untuk setiap orang yang datanya Anda miliki.

Buat baris baru di bagian bawah tabel Anda untuk jumlah setiap kolom. Jumlahkan semua nilai x , semua nilai y , semua nilai xy , semua nilai x 2 , dan semua nilai y 2 , lalu letakkan hasilnya di bagian bawah kolom yang sesuai di baris baru Anda . Anda dapat melabeli baris baru Anda dengan “jumlah” atau menggunakan simbol sigma (Σ).

Anda menemukan R dari data Anda menggunakan rumus:

R = [n(Σxy) – (Σx) (Σy)] ÷ √{[nΣx 2 − (Σx) 2 ] [nΣy 2 − (Î £y) 2 ]}

Ini terlihat sedikit menakutkan, jadi Anda dapat membaginya menjadi dua bagian, yang akan kita sebut s dan t .

s = n(Σxy) – (Σx) (Σy)

t = √{[n Σx 2 − (Σx) 2 ] [n Σy 2 − (Σy) 2 ]}

Dalam persamaan ini, n adalah jumlah peserta yang Anda miliki (ukuran sampel Anda). Bagian persamaan lainnya adalah jumlah yang Anda hitung pada langkah terakhir. Jadi untuk s , kalikan ukuran sampel Anda dengan jumlah kolom xy , lalu kurangi jumlah kolom x dikalikan dengan jumlah kolom y dari ini.

Untuk t , ada empat langkah utama. Pertama, hitung n dikalikan dengan jumlah kolom x 2 Anda , lalu kurangi jumlah kolom x Anda yang dikuadratkan (dikalikan dengan dirinya sendiri) dari nilai ini. Kedua, lakukan hal yang persis sama tetapi dengan jumlah kolom y 2 dan jumlah kolom y dikuadratkan menggantikan bagian x (yaitu, n × Σy 2 – [Σy × Î £y]). Ketiga, kalikan kedua hasil ini (untuk x s dan y s) bersamaan. Keempat, ambil akar kuadrat dari jawaban ini.

Jika Anda mengerjakan bagian-bagian, Anda dapat menghitung R dengan sederhana R = s ÷t . Anda akan mendapatkan jawaban antara −1 dan 1. Jawaban positif menunjukkan korelasi positif, dengan lebih dari 0,7 umumnya dianggap sebagai hubungan yang kuat. Jawaban negatif menunjukkan korelasi negatif, dengan apa pun di atas −0,7 dianggap sebagai hubungan negatif yang kuat. Demikian pula ± 0,5 dianggap sebagai hubungan yang sedang dan ±0,3 dianggap sebagai hubungan yang lemah. Apa pun yang mendekati 0 menunjukkan kurangnya korelasi.

marekuliasz/iStock/GettyImages

Related Posts

Dia