Comparer et étudier des effectifs et proportions en langage R

L'essentiel de cette page

Lorsque je compare des effectifs ou proportions, je dispose de quelques fonctions utiles à connaître : chiq.test(), binom.test(), prop.test()...

Voici un tableau pour bien mener son étude de comparaison.

On notera que les contingents de n variables catégorielles se font avec la fonction table() et sont réorganisées pour les diagrammes en barres avec ftable(). D'autres fonctions permettent des conversions en pourcentages (prop.table()) ou l'estimation des intervalles de confiance int.prop.table() de {KefiR}.

Comparer vos résultat avec une proportion théorique


Ne peut être utilisé que pour des épreuves indépendantes comportant deux issues

binom.test()

Comparer un contingent suffisamment grand pour faire le lien entre deux variables catégorielles (Khi2 d'indépendance) ou comparer le contingent à une répartition théorique (Khi² d'homogénéité et de conformité)

Ne marche pas sur les petits contingents ou quand des catégories ont peu d'individus

chisq.test()

Généralisation du test de Khi². Comparer les fréquences observées et attendues dans un tableau de contingence.

Peut être sensible aux données déséquilibrées.

GTest() de {DescTools}

Comparer des effectifs théoriques faibles ou dont les sommes marginales sont très déséquilibrées.

Peut être coûteux en termes de temps de calcul pour les grands échantillons.

fisher.test()

Tester l’hypothèse nulle que les proportions (probabilités de succès) dans plusieurs groupes sont les mêmes, ou qu’elles sont égales à certaines valeurs données.

-

prop.test()


Comparer des contingents appariés. Evaluer des proportions en tenant compte de l'effet Avant - Après par exemple.

-

mcnemar.test()

Je souhaite comparer plusieurs effectifs à une plusieurs effectifs théoriques : réaliser un test de khi² de conformité.

Pour ce types d'analyses, il faut des variables catégorielles, dites qualitatives. Parfois on les fait à partir de variables quantitatives comme lorsqu'on convertit des notes en mauvaises, moyennes et bonnes. Discrétiser, cela peut se faire au pif, mais il existe des méthodes pour le faire au mieux.