TDTP3

Les premières questions sont du même style que pour le TDTP2. On calcule les moyennes et variances marginales.

1- A partir de ces données, recoder la variable "nombre de déplacements MAP" en trois modalités

=SI(C215<1;"0";SI(C215<4;"1-3";"4-12"))


2- A partir de ces données, recoder la variable "Age de la personne" en cinq modalités

=SI(C220<25;"5-25";SI(C220<35;"25-35";SI(C220<55;"35-55";SI(C220<65;"55-65";"65-85"))))


3-Avec l'assistant tableau croisé dynamique, créer le tableau croisé présentant le nombre de déplacements MAP en trois modalités, en fonction de l'âge de la personne en cinq modalités

Remarquez que les colonnes ne sont pas dans l'ordre mais vous pouvez les permuter manuellement: il suffit de "cliquer-droit" sur une cellule, par exemple "25-35" et de choisir "sort" (en anglais ou sa traduction francaise)

Il suffit de cliquer sur "More sort Options ..." et vous tomber sur un option vous permettant de permuter manuellement les labels. On obtient alors des colonnes bien rangées dans l'ordre:

Il reste maintenant a choisir la bonne façon de compter les inter-occurrences dans ce tableau car on voit que les chiffres donnés sont aberrants. Comme on l'a deja vu au TDTP2, le problème est que la colonne factice utilisée est mal mise à contribution par défaut dans excel vis à vis de notre objectif de faire un tableau de comptages de co-occurrences, puis un tableau de contingence. Il faut cliquer pour dérouler le petit menu associé à la variable qu'on a mise dans la case Valeurs "No pers.":

On choisit alors "Value field setting" et il apparait:

Le probleme venait du fait que l'option "Sum" etait selectionnee par defaut et les resultats du tableau etait des sommes de numeros de personnes, ce qui n'a pour nous aucun sens ... on choisit alors "Count" et cela va resoudre le probleme !

... et on obtient enfin un tableau de comptage des co-occurrences:

4- A partir de ce tableau, calculer les moyennes marginales, les variances marginales, puis les moyennes et les variances conditionnelles.

Reponse: pour les marginales en ligne, c'est a dire si on s'intéresse uniquement aux statistiques de la variables "nombre de déplacements", il suffit

  • de creer une nouvelle ligne contenant les valeurs des centres de classes,

puis

  • de faire la moyenne a l'aide des fonctions "SUMPRODUCT" ("SOMMEPROD" en francais):

puis la variance marginale

Pour les moyennes, on passe par un tableau de contingence pour on calcule les proportions (ou frequences des co-occurences)

et de meme pour les variances conditionnelles:

5- Calcul de la covariance

Reponse: on utilise la formule de la co-variance qui va s'implementer avec la fonction "SUMPRODUCT" comme d'habitude. On commence par faire un tableau avec les fréquences totales (et on place tous les centres de classes):

puis on utilise la formule: moyennes des produits - produit des moyennes. Pour cela,

  • on construit un tableau des produits des centres deux a deux

  • on implemente la formule de la covariance grâce à la fonction "SUMPRODUCT"

Je vous donne tout cela en une seule image cette fois:

6- Vérifier que la variance de x est égale à la moyenne des variances conditionnelles de x augmentée de la variance des moyennes

Reponse: Pas de choix, il faut calculer avec "SUMPRODUCT" en faisant bien attention que lorsqu'on parle de moyenne et de variance. Pour ce faire on peut se mettre sous les yeux les tableaux des fréquences totales et le tableau des fréquences conditionnelles. Il faut bien considérer les fréquences associées des classes respectives considérées et non pas juste prendre moyenne et variance comme define dans excel: regardez par exemple la formule tout en haut pour la variance des moyennes conditionnelles

et maintenant la formule tout en haut pour la moyenne des variances conditionnelles

Le resultat est donc

-7 Repétez les questions 3-4-5-6 en croisant les deux variables "nombre de déplacements MAP" et "nombre de déplacements VP"

Reponse: Classique maintenant, je vous laisse faire ...

-8 Tracer les courbes de regression

Reponse: Il suffit de mettre les centres de classe d'une variable sur une colonne et sur la colonne d'à côté, les moyennes conditionnelles de l'autre variable puis de sélectionner ces deux variables

Il suffit ensuite d'aller dans "insert" (ou "insérer" en francais, je suppose), puis de choisir "more charts" (voir la position de ma souris)

Selectionner ensuite "scatter" (nuage, dans la version française d'excel)

Et c'est tout bon !

Je vous laisse appliquer la meme méthode sur d'autres couples de données pour vous entrainer, comme recommande dans la question 9 et la question 10.