Entah mengapa? fenomena regresi menuju rata-rata terasa begitu aneh untuk pikiran manusia. begitu sulit untuk dipahami. Regresi menuju rata-rata adalah konsep yang ditemukan oleh Francis Galton pada akhir abad 19 (tepatnya tahun 1886) melalui artikel yang berjudul “Regression toward Mediocrity in hereditary Stature”. Artikel tersebut mengungkap hasil pengamatan Dalton (terhadap biji-bijian) bahwa ternyata ukuran “anak” cenderung untuk tidak mendekati “induk” namun justru mendekati ukuran “rata-rata” (populasi-nya). “Induk” berukuran besar (diatas rata-rata) akan menghasilkan “anak” yang berukuran lebih kecil, sementara sebaliknya induk yang berukuran “kecil” akan menghasilkan anak yang berukuran lebih besar. Fenomena yang disebut Galton sebagai regresi menuju rata-rata tersebut ternyata proporsional dengan besaran deviasi ukuran “induk” dari rata-rata populasi-nya.
Fenomena regresi menuju rata-rata ternyata ditemukan pula pada banyak hal lainnya. Begitu umum keberadaannya sehingga seperti udara yang kita hirup, seringkali tidak kita sadari. Lebih jauh ditemukan, bahwa regresi tidak dapat dihindari keberadaannya saat korelasi diantara 2 ukuran tidaklah sempurna.
Koefisien korelasi antara dua ukuran, bervariasi antara 0 dan 1, merupakan bobot (proporsi) relatif dari faktor umum yang sama-sama mempengaruhi kedua ukuran tersebut. Sebagai contoh, kita semua adalah kombinasi dari separuh (50%) gen masing-masing orang tua kita. Dan untuk sifat-sifat di mana faktor lingkungan memiliki pengaruh yang relatif kecil, seperti tinggi badan, korelasi antara orang tua dan anak tidak akan jauh dari 0,50.
Untuk lebih memahami arti ukuran korelasi, berikut adalah beberapa contoh penerapan koefisien ini:
Korelasi antara ukuran objek yang diukur dengan presisi dalam ukuran Inggris atau dalam satuan metrik adalah 1 (sempurna). Faktor apa pun yang mempengaruhi satu ukuran juga mempengaruhi ukuran yang lainnya dengan sama besar.
Korelasi antara tinggi dan berat badan di antara pria dewasa adalah 0,41. Jika Anda memasukkan wanita dan anak-anak, korelasinya akan jauh lebih tinggi, karena jenis kelamin dan usia individu turut mempengaruhi tinggi dan berat badan, sehingga meningkatkan bobot relatif dari faktor bersama.
Korelasi antara tingkat pendapatan dan tingkat pendidikan di Amerika Serikat adalah sekitar 0,40.
Korelasi antara tingkat pendapatan keluarga dan empat digit terakhir nomor telepon mereka adalah 0 (tidak ada korelasi).
Butuh waktu beberapa tahun bagi Francis Galton untuk menyadari bahwa korelasi dan regresi bukanlah dua konsep yang berbeda- melainkan perspektif yang berbeda dari konsep yang sama.
Aturan umumnya bersifat langsung, sederhana, tetapi memiliki konsekuensi mengejutkan: setiap kali korelasi antara dua ukuran tidak sempurna, akan ada regresi menuju rata-rata. Untuk mengilustrasikan temuan Galton, coba kita amati pernyataan/proposisi berikut yang menurut kebanyakan orang cukup menarik:
Wanita cerdas cenderung menikah dengan pria yang kurang cerdas dibandingkan mereka.
Banyak orang-orang yang telah mempelajari Statistik akan secara spontan menafsirkan pernyataan diatas dalam istilah kausal. Seolah ada hubungan sebab akibat tertentu yang mendasari munculnya kebenaran atas pernyataan tersebut. Beberapa orang beralasan tentang wanita yang sangat cerdas ingin menghindari persaingan dengan pria yang sama-sama cerdas, atau alasan lain yaitu wanita cerdas dipaksa untuk berkompromi dalam memilih pasangan karena pria yang cerdas tidak ingin bersaing dengan wanita yang cerdas. Kedua penjelasan ini tentu tidak tepat.
Sekarang perhatikan pernyataan ini:
Korelasi antara skor kecerdasan diantara pasangan suami-istri kurang dari sempurna
Pernyataan ini jelas benar dan mungkin dianggap tidak menarik sama sekali. Siapa yang akan mengharapkan korelasinya sempurna? Tidak ada yang bisa dijelaskan. Tetapi pernyataan sebelumnya dengan pernyataan terakhir ini secara matematika adalah setara/sama. Jika korelasi antara tingkat intelijensia pasangan adalah kurang dari sempurna (dan jika pria dan wanita umumnya memang tidak berbeda dalam kecerdasan), maka keniscayaan matematis bahwa wanita yang sangat cerdas akan menikah dengan suami yang rata-rata kurang cerdas daripada mereka. (dan sebaliknya).
Regresi yang diamati terhadap rata-rata ternyata tidak bisa lebih menarik atau lebih dapat dijelaskan daripada korelasi yang tidak sempurna.
Galton sendiri awalnya kesulitan dengan konsep regresi. Ahli statistik David Freedman bahkan mengatakan bahwa jika topik regresi muncul dalam pengadilan (pidana ataupun perdata), pihak yang harus menjelaskan regresi kepada juri pasti akan kehilangan kasusnya (alias kalah). Mengapa begitu sulit? Alasan utama untuk kesulitan ini adalah karena pikiran kita sebagai manusia sangat bias terhadap penjelasan kausal (segala sesuatu pasti akibat dari suatu penyebab tertentu). Dan pikiran kita tidak mampu berurusan dengan baik dengan fenomena "statistik semata”.
Ketika perhatian kita tertuju pada suatu peristiwa, memori asosiatif secara otomatis akan mencari penyebabnya. lebih tepatnya, aktivasi akan secara otomatis menyebar ke faktor yang berpotensi sebagai sebab (apa pun itu) yang sudah tersimpan dalam memori. Penjelasan kausal akan selalu ditimbulkan ketika regresi terdeteksi, tetapi kita seringkali tidak sadar bahwa penjelasan tersebut akan salah karena kebenarannya adalah regresi menuju rata-rata memiliki penjelasan tetapi tidak memiliki penyebab. Hal ini tak lebih dari hukum alam yang sudah ditentukan.
Coba perhatikan acara berita bisnis/keuangan/ekonomi dan pasar modal. Penjelasan terbaik atas fenomena tertentu seperti naik-turunnya harga tidak lebih dari pergerakan menuju angka rata-rata nya, tetapi penjelasan ini tidak memiliki kekuatan sebab-akibat. yang disukai pikiran kita sebagai manusia. Dan kita membayar para pakar dengan cukup mahal hanya untuk memberikan penjelasan yang menarik tentang efek regresi. Seorang komentator bisnis yang dengan tepat mengumumkan bahwa “kinerja ekspor lebih baik tahun ini karena kinerja ekspor tahun sebelumnya relatif buruk" kemungkinan hanya memiliki masa jabatan yang pendek di pasar.
Kecenderungan atas pikiran kita untuk menuntut Interpretasi kausal yang benar dari efek regresi tidak terbatas pada masyarakat biasa. Ahli statistik, Howard Wainer, bahkan telah menyusun daftar panjang para peneliti terkemuka dunia yang juga membuat kesalahan yang sama karena bingung membedakan korelasi belaka dengan hubungan sebab-akibat. Efek regresi adalah sumber masalah yang umum dalam penelitian, dan para ilmuwan yang berpengalaman akan selalu melatih diri mereka dengan rasa takut yang sehat terhadap perangkap inferensi kausal yang tidak beralasan.
Karena itu pada studi medis/kedokteran, untuk menyimpulkan bahwa suatu jenis perawatan efektif. Studi harus membandingkan sekelompok pasien yang menerima jenis perawatan tersebut dengan "kelompok kontrol" yang tidak menerima perawatan yang sama (atau lebih bagus, hanya menerima plasebo). Kelompok kontrol diharapkan akan membaik (sembuh) karena fenomena regresi semata, dan tujuan percobaan/studi adalah untuk menentukan apakah pasien yang menjalani perawatan tertentu cenderung meningkat kesembuhannya lebih dari yang dapat dijelaskan oleh regresi semata.
Untuk menutup catatan ini, coba kita simak ontoh kesalahan prediksi intuitif yang diadaptasi dari buku karya Max Bazerman yang berjudul “Judgment in Managerial Decision Making”.
Anda diberikan tabel pencapaian penjualan tahun ini dan diminta untuk meramalkan angka penjualan untuk tahun depan. Anda diperintahkan untuk menerima ramalan pakar ekonomi bahwa penjualan akan meningkat secara keseluruhan sebesar 10% pada tahun mendatang. Lantas, Bagaimana Anda melengkapi tabel berikut?
Cabang Tahun Ini (dalam $) Tahun Depan (dalam $)
1 11.000.000 ??
2 23.000.000 ??
3 18.000.000 ??
4 29.000.000 ??
Total 81.000.000 89.100.000
Setelah membaca catatan ini, semestinya kita sadar bahwa solusi yang umum dilakukan, yaitu menambahkan 10% pada nilai penjualan setiap cabang adalah salah. Jika kita ingin perkiraan bersifat regresif, maka kita harus menambahkan lebih dari 10% ke cabang-cabang yang berkinerja rendah (dibawah rata-rata seluruh cabang) dan menambahkan lebih sedikit (atau bahkan mengurangi) nilai penjualan cabang yang berkinerja diatas rata-rata.
Tetapi jika Anda kemudian mengkonfirmasi perkiraan regresif tersebut kepada orang lain, Anda pasti akan ditanggapi dengan penuh kebingungan.
Seperti yang ditemukan Galton dengan susah payah, konsep regresi jauh dari jelas bagi pikiran manusia pada umumnya.
Catatan akhir:
Francis Galton menciptakan konsep statistik korelasi dan regresi menuju rata-rata. Dia adalah orang pertama yang menerapkan metode statistik untuk mempelajari perbedaan diantara manusia dan bagaimana kecerdasan diwariskan.
David Amiel Freedman adalah Profesor Statistik di University of California, Berkeley. Dia menerbitkan banyak artikel ilmiah di bidang inferensi kausal dan perilaku model statistik standar dalam kondisi yang tidak standar.
Howard Wainer adalah penulis dan ahli statistik dari Wharton School of the University of Pennsylvania.
Max Hal Bazerman adalah seorang penulis dan akademisi dengan spesialisasi psikologi bisnis. Dia adalah Profesor di Harvard Business School.