Souvent utilisée dans les études de type Learning analytics, la prédiction consiste à identifier des variables (indépendantes) permettant d’expliquer une variable cible (dépendante). Elle permet d’aboutir à une équation comme celle proposée ci-dessous.
Y correspond à la variable à prédire. X1, X2, etc... sont les variables indépendantes de la prédiction. Le βo (Bêta zéro) est la constante qui correspond à la prédiction quand X1, X2 valent zéro. Enfin, ∈ (Eta) correspond à la valeur résiduelle de la prédiction (il restera toujours une erreur irréductible dans un algorithme de ce type qui est liée à l'incertitude).
Par exemple, il peut être pertinent d'identifier les variables du processus et les caractéristiques initiales qui expliquent la progression des apprenants dans la maîtrise des compétences. Les différents β1, β2 correspondent aux coefficients de la pente. Ils expliquent la valeur de Y quand la valeur des X varient.
Cette séquence vous propose une explication complémentaire et didactique de la prédiction.
D'un point statistique, l'analyse de régression linéaire donne la possibilité d'effectuer ce type de traitement. Pour utiliser de manière appropriée cette méthode, il faut à la fois veiller à obtenir un nombre restreint de prédicteurs pertinents et significatifs tout en s’intéressant au degré de prédiction fourni par la valeur du R2 ajusté. Le logiciel Jasp (open source et gratuit) propose cette fonction d'analyse multivariée.
Les arbres de décision correspondent également à la logique de la prédiction. Elle s’appuie sur la création d’arbres de décision. Les résultats de cette analyse permettent d'aboutir à la mise en évidence d'une série de règles de type "Si..., alors..." à partir de variables discriminantes (par exemple : les caractéristiques individuelles, les variables du processus) et en fonction d’une variable de sortie (par exemple : échec ou réussite à un post-test).