La matriz de confusión es una herramienta utilizada en problemas de clasificación en el campo de la estadística y el aprendizaje automático. Su principal objetivo es evaluar el rendimiento de un modelo de clasificación al comparar las predicciones del modelo con las etiquetas reales de un conjunto de datos. La matriz de confusión se compone de cuatro valores clave:
Verdaderos Positivos (True Positives – TP): Representa la cantidad de instancias que fueron correctamente clasificadas como positivas por el modelo.
Falsos Positivos (False Positives – FP): Estos son los casos en los que el modelo predijo incorrectamente una instancia como positiva cuando en realidad era negativa. También se les llama errores de Tipo I.
Verdaderos Negativos (True Negatives – TN): Representa la cantidad de instancias que fueron correctamente clasificadas como negativas por el modelo.
Falsos Negativos (False Negatives – FN): Estos son los casos en los que el modelo predijo incorrectamente una instancia como negativa cuando en realidad era positiva. También se les llama errores de Tipo II.
A continuación describiremos las métricas usadas para la evaluación del rendimiento de los modelos de clasificación aplicados al conjunto de datos: