Confusion matrix untuk evaluasi kinerja pengklasifikasi
Penulis: Nadhira Nur Salima, Arif Wijayanto
Divalidasi: Ahmad Ilham
Penulis: Nadhira Nur Salima, Arif Wijayanto
Divalidasi: Ahmad Ilham
Salah satu alat analisis yang paling kuat dalam machine learning dan data science adalah matriks kebingungan (confusion matrix) . Mengapa? karena confusion matrix mampu memberikan informasi terperinci kepada para peneliti tentang bagaimana kinerja pengklasifikasi pembelajaran mesin sehubungan dengan kelas target dalam kumpulan data.
Confusion matrix terdiri dari empat karakteristik dasar (angka) [1] yang digunakan untuk mendefinisikan metrik pengukuran pengklasifikasi. Keempat angka tersebut adalah:
True Positive (TP) : Anda memprediksi positif dan itu benar. Anda memprediksikan bahwa seorang wanita hamil dan wanita tsb memang benar hamil;
True Negative (TN): Anda memprediksi negatif dan itu benar. Anda memprediksikan bahwa seorang pria tidak hamil dan benar ya pria kan tidak mungkin hamil
False Positive (FP): (Kesalahan Tipe 1): Anda memprediksi positif dan itu salah. Anda memprediksikan bahwa seorang pria hamil tetapi tidak mungkin pria bisa hamil;
False Negative (FN): (Kesalahan Tipe 2, kesalahan tipe 2 ini sangat berbahaya) Interpretasi: Anda memprediksi negatif dan itu salah. Anda memperkirakan bahwa seorang wanita tidak hamil tetapi sebenarnya wanita tsb hamil.
Metrik kinerja machine learning (kasus klasifikasi) adalah akurasi, presisi, recall, dan F1-score, yang dihitung berdasarkan TP, TN, FP, dan FN dari confusion matrix yang disebutkan di atas.
Akurasi algoritme direpresentasikan sebagai rasio pasien yang diklasifikasikan dengan benar (TP + TN) terhadap jumlah total pasien (TP + TN + FP + FN).
Precision /ketepatan suatu algoritme direpresentasikan sebagai rasio pasien yang diklasifikasikan dengan benar dengan penyakit (TP) terhadap total pasien yang diprediksi mengidap penyakit tersebut (TP + FP).
Recall didefinisikan sebagai rasio pasien yang diklasifikasikan dengan benar (TP) dibagi dengan jumlah total pasien yang benar-benar menderita penyakit tersebut. Persepsi di balik recall adalah berapa banyak pasien yang diklasifikasikan memiliki penyakit. Recall juga disebut sebagai sensitivitas.
F1-score juga dikenal sebagai F Measure. Skor F1 menyatakan keseimbangan antara presisi dan recall.
Referensi:
Singh, P., Singh, N., Singh, K. K., & Singh, A. (2021). Diagnosing of disease using machine learning. Machine Learning and the Internet of Medical Things in Healthcare, 89–111. https://doi.org/10.1016/B978-0-12-821229-5.00003-3
https://socs.binus.ac.id/2020/11/01/confusion-matrix/