Sisa dalam Statistik- Probabilitas & Statistik

Sisa dalam Statistik- Probabilitas & Statistik

Saat membuat model dalam statistik, biasanya Anda akan mengujinya, memastikan model tersebut cocok dengan situasi dunia nyata. Sisanya adalah angka yang membantu Anda menentukan seberapa dekat model teori Anda dengan fenomena di dunia nyata. Residual tidak terlalu sulit untuk dipahami: Itu hanyalah angka yang menunjukkan seberapa jauh suatu titik data dari apa yang “seharusnya” menurut model yang diprediksi.

Definisi Matematika

Secara matematis, residu adalah perbedaan antara titik data yang diamati dan nilai yang diharapkan — atau diperkirakan — untuk titik data yang seharusnya. Rumus untuk residual adalah R = O – E, dimana “O†berarti nilai yang diamati dan “E†berarti nilai yang diharapkan . Artinya nilai R yang positif menunjukkan nilai yang lebih tinggi dari yang diharapkan, sedangkan nilai negatif menunjukkan nilai yang lebih rendah dari yang diharapkan. Misalnya, Anda mungkin memiliki model statistik yang menyatakan bahwa jika berat pria 140 pon, tinggi badannya harus 6 kaki, atau 72 inci. Saat Anda keluar dan mengumpulkan data, Anda mungkin menemukan seseorang yang beratnya 140 pound tetapi tingginya 5 kaki 9 inci, atau 69 inci. Sisanya adalah 69 inci dikurangi 72 inci, memberi Anda nilai negatif 3 inci. Dengan kata lain, titik data yang diamati adalah 3 inci di bawah nilai yang diharapkan.

Memeriksa Model

Residu sangat berguna ketika Anda ingin memeriksa apakah model teori Anda bekerja di dunia nyata. Saat Anda membuat model dan menghitung nilai yang diharapkan, Anda berteori. Namun saat Anda mengumpulkan data, Anda mungkin menemukan bahwa data tersebut tidak cocok dengan modelnya. Salah satu cara untuk menemukan ketidaksesuaian antara model Anda dan dunia nyata adalah dengan menghitung residu. Misalnya, jika Anda menemukan bahwa semua residu secara konsisten jauh dari nilai estimasi Anda, model Anda mungkin tidak memiliki teori dasar yang kuat. Cara mudah untuk menggunakan residu dengan cara ini adalah dengan memplotnya.

Merencanakan Residu

Saat Anda menghitung residu, Anda memiliki beberapa angka, yang sulit ditafsirkan oleh manusia. Merencanakan residu seringkali dapat menunjukkan pola kepada Anda. Pola-pola ini dapat mengarahkan Anda untuk menentukan apakah model tersebut cocok. Dua aspek residu dapat membantu Anda menganalisis sebidang residu. Pertama, residual untuk model yang baik harus tersebar di kedua sisi nol. Artinya, sebidang residu harus memiliki jumlah residu negatif yang kira-kira sama dengan residu positif. Kedua, residu harus tampak acak. Jika Anda melihat pola di plot sisa Anda, seperti memiliki pola linier atau melengkung yang jelas, model asli Anda mungkin memiliki kesalahan.

Residu Khusus: Outlier

Outlier, atau residual dari nilai yang sangat besar, tampak sangat jauh dari titik lain pada plot residual Anda. Ketika Anda menemukan residu yang merupakan outlier dalam kumpulan data Anda, Anda harus memikirkannya dengan hati-hati. Beberapa ilmuwan merekomendasikan untuk menghapus outlier karena itu adalah “anomali” atau kasus khusus. Yang lain merekomendasikan penyelidikan lebih lanjut mengapa Anda memiliki sisa yang begitu besar. Misalnya, Anda mungkin membuat model tentang bagaimana stres memengaruhi nilai sekolah dan berteori bahwa lebih banyak stres biasanya berarti nilai yang lebih buruk. Jika data Anda menunjukkan ini benar kecuali untuk satu orang, yang memiliki tingkat stres yang sangat rendah dan nilai yang sangat rendah, Anda mungkin bertanya pada diri sendiri mengapa. Orang seperti itu mungkin tidak peduli tentang apa pun, termasuk sekolah, menjelaskan sisa yang besar. Dalam hal ini, Anda dapat mempertimbangkan untuk mengeluarkan sisa dari kumpulan data karena Anda hanya ingin membuat model siswa yang peduli dengan sekolah.

aphrodite74/E+/GettyImages

Related Posts