Depuis des années, je développe des fonctions pour les étudiants et les chercheurs. Kefi est un terme grec qui évoque une belle émotion, R le langage, et kéfir, ce mélange bien connus de microorganismes tous d'une belle utilité complémentaire, comme, je l'espère, les fonctions de ce package.
Installer KefiR avec remotes (ou devtools).
install.packages("remotes") ; require(remotes)
remotes::install_github("Antoine-Masse/KefiR",force=TRUE)
# Répondre à la question (ou CRAN (2) ou,mieux None (3)).
library("KefiR")
Les fonctions les plus utiles sont surlignées en bleu clair.
catego() sert à transformer une matrice de p-values de comparaisons par paires (issue de pairwise.t.test, Wilcoxon, Dunn, Games-Howell, DunnettT3, etc.) en groupes homogènes repérés par des lettres (type “compact letter display”).
Concrètement, la fonction :
lit la matrice de p-values (déjà ajustées ou non) et la compare à un seuil α ;
détermine quelles paires ne diffèrent pas significativement ;
construit les groupes de niveaux statistiquement équivalents et leur assigne des lettres (mêmes lettres → pas de différence) ;
renvoie un petit tableau avec la catégorie et sa/leurs lettre(s) ou étoile(s), plus éventuellement la matrice de p-values utilisée.
check_ech() — Détermine la différence de moyenne minimale détectable (MDE) pour un effectif donné, en fonction de α et (optionnellement) de la puissance cible.
cor_ech() — Estime la taille d’échantillon nécessaire pour détecter une corrélation cible (r) avec un niveau α et une puissance donnés.
m.test() compare des moyennes, rangs ou médianes et choisit automatiquement les bons tests (paramétriques / non-paramétriques / robustes), avec post-hoc adaptés et bootstrap en option.
Ce que fait m.test
Détecte : normalité, homogénéité des variances, outliers, appariement.
Choisit le test global : t-test / ANOVA / Welch, ou Wilcoxon / Kruskal-Wallis, voire méthodes robustes.
Applique les post-hoc cohérents (Tukey, Games-Howell, Dunn, Dunnett, etc.).
Valide les conclusions par bootstrap (facultatif).
int.ech() — Calcule l’intervalle de confiance d’un échantillon (généralement la moyenne).
identify_ech() — Donne la taille d’échantillon requise pour détecter une différence entre deux groupes (selon α/puissance/effet).
ind.median() — Renvoie les indices/positions autour de la médiane dans un vecteur.
ind.pop() — Calcule l’IC d’un paramètre populationnel (le plus souvent la moyenne).
ind.prop() — Calcule l’intervalle de confiance d’une proportion.
int.prop.table() — Calcule les IC des proportions dans un tableau de contingence.
jb.norm.test/jb.normtest() — Test de Jarque–Bera de normalité (skewness + kurtosis).
kurtosis.norm.test — Test d’aplatissement (kurtosis) contre la normalité.
biplt() — Biplot de PCA : visualise les individus sur deux composantes principales et les vecteurs de charges (poids des variables) ; coloration possible par catégorie.
corrigraph() — Graphe de corrélations : réseau de variables où une arête est tracée si la corrélation dépasse un seuil (signe et intensité reflétés) ; global ou centré sur une réponse y.
bootreg() — Validation par bootstrap d’une régression linéaire : stabilité des coefficients et des performances (IC/p-values bootstrappées).
dsc() — Cherche la meilleure configuration de XXX pour atteindre des objectifs sur YYY définis par un ou plusieurs modèles linéaires.
dsc2()— Vérifie la robustesse des solutions de dsc() par bootstrap (variabilité des XXX optimaux).
dvar() — Enrichit les variables (interactions, polynômes, logs…) pour élargir l’espace de modèles.
evolreg() — Sélection de modèle linéaire/logistique/mixte par approche évolutive (exploration de combinaisons et transformations).
valreg() — Valider un modèle linéaire (simple, multiple ou mixte)
Outil de contrôle complet pour éviter les sur-interprétations. Il passe en revue les hypothèses, la qualité d’ajustement et la robustesse d’un modèle linéaire simple, classique multiple (lm) ou mixte (lmer). Idéale pour la validation de modèles linéaires et la validation de modèles linéaires mixtes.
Ce que fait la fonction
Vérifie automatiquement les hypothèses clés et alerte en cas d’écarts sérieux.
Compare des spécifications candidates (termes, interactions, effets aléatoires) et signale les modèles trop complexes ou mal posés.
Propose des pistes correctives (transformations, SE robustes, simplification ou changement de famille/modèle).
exp_dyn() — Expansion dynamique d’un vecteur : déplace la moyenne sans forcément changer l’étendue.
lms_to_table() — Met en tableau les coefficients et statistiques d’une liste de modèles linéaires.
meanbp() — Moyenne mobile pondérée itérative.
Mode() — Calcule la/les modes d’un jeu de données.
pairwise() — Automatise des comparaisons par paires (moyenne, médiane, corrélation, etc.).
pairwise.boot() — Comparaisons par paires par bootstrap (moyenne/médiane), robuste sans hypothèse de normalité.
parco() — Trace des coordonnées parallèles en une seule ligne de code.
pareto() — Diagramme de Pareto (tri décroissant et cumul 80/20).
pde() — Explore deux paramètres d’une “recette” et modélise la combinaison optimale.
rr() — Étude Gage R&R : décomposition de variance (répétabilité/reproductibilité) d’un système de mesure.
skewness.norm.test() — Test d’asymétrie (skewness) pour la normalité.