Le paradoxe de Simpson / devrait nous alerter sur des facteurs de confusion, dont il résulte.Il faut redefinir les catégories étudiées, imaginer d'autres facteurs,...
[Video YT-SE(14min)] Exemple du taux de guérison d'un cancer par médicaments ou chirurgie.
Dans les statistiques, avec de mêmes chiffres, ont peut trouver par ex que les médicaments guérissent mieux que la chirurgie, mais en analysant par grosses ou petites tumeurs on trouve que c'est la chirurgie, et dans les 2 cas!
Cela vient du fait que 1)les grosses tumeurs ont un taux de guérison plus faible (car 'difficiles', pour les médicaments comme pour la chirurgie) et 2)qu'un traitement (chirurgie) est plus utilisé et plus massivement sur la population globale (car ici historique) et pour des cas plus difficile (les grosses tumeurs, plus nombreuses) (mais aussi inversement, pour d'autres raisons, les médicaments de plus en plus utilisés pour des cas faciles (petites tumeurs; des cancers légers qui auraient pu etre réprimés par les voies naturelles, voire des cas qui n'étaient pas de cancers mais préliminairement diagnostiqués ainsi) alors que les médicament ne guérissent guère plus efficacement voire un peu moins efficacement en fait !).
Un paradoxe de Simpson apparait pour certaines configurations statistiques, quand l'analyse globale devient 'fausse', ici pour le taux de guérison, par le choix global qui a été fait d'appliquer désormais les médics plus aux petites tumeurs 'faciles à guérir' qui désormais sont désormais plus nombreuses (car détectées plus précocément): le facteur externe biaisant est l'évolution du choix du traitement et/ou des données de référence (proportion des pt/gd tumeurs) qui influent à la fois sur la cause (la taille de la tumeur [ou à l'inverse la proportion des traitements]) et sur l'effet étudié (guérison). On parle de facteur de confusion. Dans l'analyse globale cache (ignore) l'interaction entre taille de tumeur et choix du traitement qui est assez forte, et fait alors ressortir abusivement (traduit) un autre effet moins significatif (et moins signifiant: un autre facteur, inconnu, ou d'incertitude purement statistique lié à la composition arbitraire de la population et du choix du traitement réalisé).
Selon les problèmes, on peut réaliser ou non qu'il faut regarder de plus près les chiffres, étudier un autre paramètre? Ce sera par ex évident dans le cas du lien entre consommation de bière et libido... qu'il faut étudier selon le sexe; c'est moins évident dans le cas du lien entre redoublement des élèves et succès au bac (car ils obtiennent encore une moins bonne note que la moyenne la 2eme année! c'est aussi car il ont un moindre niveau/capacité de compréhension et travail !) = il faut être spécialiste d'un sujet pour choisir d'étudier le paramètre le plus discriminent à analyser, ou alors il faut l'isoler par des sous populations adaptées. Si on ne sait pas, il faut casser le lien entre l'action et la cause, par d'autres échantillonnages (aléatoire), ou par l'expérimentation (aléatoire): par ex en exposant aléatoirement les 2 groupes (pt/grosse tumeurs) aux 2 actions (médic ou chirurgie), différemment de ce qui est réalisé sur les données analysées -ce qui peut poser des questions éthiques-. Ou par ex en imposant aux individus un paramètre (changer de conso de bière -> cela change t il la libido comme pour ce qui est vu en moyenne dans la population, ou ne change t elle pas-car liée au sexe-?).