Nous discutons ici deux tests basés sur la loi du khideux: le test d’ajustement et le test d’indépendance.
Ce sont des techniques utilisées souvent avec des données qualitatives: le test d’ajustement est employé pour une seule variable qualitative, alors que le test d’indépendance s’applique à la distribution conjointe de deux variables qualitatives.
1. Tests d’ajustement
Supposons qu’on prélève des données afin de déterminer si le jour de la semaine a une influence sur les accidents.
L’hypothèse nulle est que les accidents ne sont pas affectés par le jour de la semaine:
Ho: Les accidents sont également fréquents tous les jours de la semaine
On prélève un échantillon de 780 accidents, puis on les classe en 4 catégories, selon le moment de la semaine où l'accident a eu lieu: le début de la semaine (lundi), le milieu de la semaine (mardi à jeudi), la fin de la semaine (vendredi), et le week-end (samedi-dimanche).
Supposons qu’on obtienne la distribution suivante:
Tableau 1 : Effectifs observés du nombre d'accidents
Cette distribution est appelée distribution observée. Si l’hypothèse nulle est vraie, les 780 accidents devraient se répartir de façon proportionnelle au nombre de jours: 1/7 le lundi; 3/7 les mardi-jeudi; 1/7 le vendredi; et 2/7 les samedi-dimanche. Cette répartition, appelée distribution théorique, est présentée dans le tableau 2.
Tableau 2 : Effectifs théoriques du nombre d'accidents
L’écart entre les deux tableaux nous permettra de rejeter Ho ou pas. Si l’écart est important, on rejette Ho.
Écart entre les effectifs observés et théoriques
L’écart entre les deux tableaux est mesuré par une quantité dénotée par χ2 et définie par