Sélection par condition avec python

sur des séries pandas

1- Avec pandas, on peut créer l'équivalent des listes et extraire des valeurs de ces listes en les mettant en parallèle.

Installer et importer pandas

1) J'ouvre la console windows (dos) et je tape

python -m pip install --user numpy

2) J'importe pandas dans python

import pandas as df

2- Prenons un jeu de données simulées

Voici un jeu de données qui simules les âges, poids et sexes de 8 personnes.

age = [18,19,20,18,19,20,17,23]
sx = ["M","F"]*4
from numpy import random as rd
poids = list(rd.normal(loc=65, scale=6, size=8))
for i in range(len(poids)) :
    poids[i] = int(poids[i])

Chaque liste de valeurs devra être convertie dans un format pandas permettant l'extraction conditionnelle.

age = df.Series(age) # df non donné à pandas ici lors de son importation
poids = df.Series(poids)
sx = df.Series(sx)

3- Extraction conditionnelle et multiconditionnelle

  • Voici quelques exemples d'extractions conditionnelles
print(age[poids>63]) # âges des individus de plus de 63 kg
print(poids[(sx=="F")&(poids>63)]) # poids des filles de plus de 63 kg

On notera qu'il faut utiliser les > , >= , <, <= , == et != pour comparer les listes et & "et" , | "ou" pour ajouter plusieurs critères.

Les parenthèses sont obligatoires pour ajouter plusieurs critères.