Aide à l'utilisation de python - Analyses de données et Dataviz

Dataviz adaptés aux gros jeux de données

Le Dataviz Big Data en Python

1- Croiser des variables en Parallele coordinates plot

import plotly.express as px

df = px.data.iris()

fig = px.parallel_coordinates(df, color="species_id", labels={"species_id": "Espèces",

                "sepal_width": "Largeur des sépales", "sepal_length": "Sepal Length",

                "petal_width": "Petal Width", "petal_length": "Petal Length", },

                             color_continuous_scale=px.colors.diverging.Tealrose,

                             color_continuous_midpoint=2)

fig.show()

2- Trop de points : faire un kernel density plot 2D

Lorsqu'on veut faire un scatter-plot, il peut être pertinent de faire un kernel density plot 2D ou tout simplement de dessiner les contours des nuages de points avec une simple nappe convexe (affichage rapide) ou une ellipse de confiance.

Kernel Density plot 2D

Nappes convexes

3- Données de type texte : faire un Treemap

import plotly.express as px

df = px.data.tips()

fig = px.treemap(df, path=['day', 'time', 'sex'], values='total_bill')

fig.show()

Voir la page sur les Treemap

4- Données cycliques, axe des x trop allongé : polar plot

fig = plt.figure()

ax = fig.add_subplot(111, projection='polar')

c = ax.scatter(x_c, y_c, c=cat.cat.codes, cmap="viridis",alpha=0.75)

plt.show()

Page updated

Google Sites

Report abuse