Comparer et étudier des effectifs et proportions en langage R
L'essentiel de cette page
Lorsque je compare des effectifs ou proportions, je dispose de quelques fonctions utiles à connaître : chiq.test(), binom.test(), prop.test()...
Voici un tableau pour bien mener son étude de comparaison.
On notera que les contingents de n variables catégorielles se font avec la fonction table() et sont réorganisées pour les diagrammes en barres avec ftable(). D'autres fonctions permettent des conversions en pourcentages (prop.table()) ou l'estimation des intervalles de confiance int.prop.table() de {KefiR}.
Comparer vos résultat avec une proportion théorique
Ne peut être utilisé que pour des épreuves indépendantes comportant deux issues
binom.test()
Comparer un contingent suffisamment grand pour faire le lien entre deux variables catégorielles (Khi2 d'indépendance) ou comparer le contingent à une répartition théorique (Khi² d'homogénéité et de conformité)
Ne marche pas sur les petits contingents ou quand des catégories ont peu d'individus
chisq.test()
Généralisation du test de Khi². Comparer les fréquences observées et attendues dans un tableau de contingence.
Peut être sensible aux données déséquilibrées.
GTest() de {DescTools}
Comparer des effectifs théoriques faibles ou dont les sommes marginales sont très déséquilibrées.
Peut être coûteux en termes de temps de calcul pour les grands échantillons.
fisher.test()
Tester l’hypothèse nulle que les proportions (probabilités de succès) dans plusieurs groupes sont les mêmes, ou qu’elles sont égales à certaines valeurs données.
-
prop.test()
- Test de McNemar
Comparer des contingents appariés. Evaluer des proportions en tenant compte de l'effet Avant - Après par exemple.
-
mcnemar.test()
Je souhaite comparer plusieurs effectifs à une plusieurs effectifs théoriques : réaliser un test de khi² de conformité.
Pour ce types d'analyses, il faut des variables catégorielles, dites qualitatives. Parfois on les fait à partir de variables quantitatives comme lorsqu'on convertit des notes en mauvaises, moyennes et bonnes. Discrétiser, cela peut se faire au pif, mais il existe des méthodes pour le faire au mieux.