Kerugian Regresi Linear- Aljabar



Regresi linier adalah metode statistik untuk memeriksa hubungan antara variabel dependen, dilambangkan dengan y, dan satu atau lebih variabel independen, dilambangkan dengan x . Variabel dependen harus kontinu, karena dapat mengambil nilai apa pun, atau setidaknya mendekati kontinu. Variabel independen dapat dari jenis apa pun. Meskipun regresi linier tidak dapat menunjukkan sebab-akibat dengan sendirinya, variabel dependen biasanya dipengaruhi oleh variabel independen.

Regresi Linier Terbatas pada Hubungan Linear

Sesuai sifatnya, regresi linier hanya melihat hubungan linier antara variabel dependen dan independen. Artinya, diasumsikan ada hubungan garis lurus di antara mereka. Terkadang ini salah. Sebagai contoh, hubungan antara pendapatan dan usia berbentuk kurva, yaitu pendapatan cenderung naik pada awal masa dewasa, mendatar pada masa dewasa selanjutnya dan menurun setelah orang pensiun. Anda dapat mengetahui apakah ini merupakan masalah dengan melihat representasi grafis dari hubungan tersebut.

Regresi Linier Hanya Melihat Mean Variabel Dependen

Regresi linier melihat hubungan antara rata-rata variabel dependen dan variabel independen. Misalnya, jika melihat hubungan antara berat lahir bayi dan karakteristik ibu seperti umur, regresi linier akan melihat berat rata-rata bayi yang lahir dari ibu yang berbeda usia. Namun, terkadang Anda perlu melihat ekstrem dari variabel dependen, misalnya, bayi berisiko ketika berat badannya rendah, jadi Anda ingin melihat ekstrem dalam contoh ini.

Sama seperti rata-rata bukan deskripsi lengkap dari satu variabel, regresi linier bukanlah deskripsi lengkap tentang hubungan antar variabel. Anda dapat mengatasi masalah ini dengan menggunakan regresi kuantil.

Regresi Linear Sensitif terhadap Outlier

Outlier adalah data yang mengejutkan. Outlier dapat berupa univariat (berdasarkan satu variabel) atau multivariat. Jika Anda melihat usia dan pendapatan, outlier univariat akan menjadi hal-hal seperti orang yang berusia 118 tahun, atau orang yang menghasilkan $12 juta tahun lalu. Outlier multivariat adalah anak berusia 18 tahun yang menghasilkan $200.000. Dalam hal ini, baik usia maupun pendapatannya tidak terlalu ekstrem, tetapi sangat sedikit orang berusia 18 tahun yang menghasilkan uang sebanyak itu.

Outlier dapat memiliki efek besar pada regresi. Anda dapat mengatasi masalah ini dengan meminta statistik pengaruh dari perangkat lunak statistik Anda.

Data Harus Independen

Regresi linier mengasumsikan bahwa datanya independen. Itu berarti bahwa skor dari satu mata pelajaran (seperti seseorang) tidak ada hubungannya dengan mata pelajaran lainnya. Ini sering, tetapi tidak selalu, masuk akal. Dua kasus umum yang tidak masuk akal adalah pengelompokan dalam ruang dan waktu.

Contoh klasik pengelompokan dalam ruang adalah nilai ujian siswa, ketika Anda memiliki siswa dari berbagai kelas, kelas, sekolah, dan distrik sekolah. Siswa di kelas yang sama cenderung memiliki kesamaan dalam banyak hal, misalnya mereka sering berasal dari lingkungan yang sama, mereka memiliki guru yang sama, dll. Dengan demikian, mereka tidak mandiri.

Contoh pengelompokan dalam waktu adalah studi di mana Anda mengukur subjek yang sama beberapa kali. Misalnya, dalam studi diet dan berat badan, Anda dapat mengukur setiap orang beberapa kali. Data ini tidak berdiri sendiri karena apa yang ditimbang seseorang pada satu kesempatan terkait dengan apa yang dia timbang pada kesempatan lain. Salah satu cara untuk mengatasinya adalah dengan model bertingkat.

utah778/iStock/GettyImages

Related Posts

Dia