Dataviz adaptés aux gros jeux de données

Le Dataviz Big Data en Python

1- Croiser des variables en Parallele coordinates plot

import plotly.express as px
df = px.data.iris()
fig = px.parallel_coordinates(df, color="species_id", labels={"species_id": "Espèces",
                "sepal_width": "Largeur des sépales", "sepal_length": "Sepal Length",
                "petal_width": "Petal Width", "petal_length": "Petal Length", },
                             color_continuous_scale=px.colors.diverging.Tealrose,
                             color_continuous_midpoint=2)
fig.show()

2- Trop de points : faire un kernel density plot 2D

Lorsqu'on veut faire un scatter-plot, il peut être pertinent de faire un kernel density plot 2D ou tout simplement de dessiner les contours des nuages de points avec une simple nappe convexe (affichage rapide) ou une ellipse de confiance.

3- Données de type texte : faire un Treemap

import plotly.express as px
df = px.data.tips()
fig = px.treemap(df, path=['day', 'time', 'sex'], values='total_bill')
fig.show()

4- Données cycliques, axe des x trop allongé : polar plot

fig = plt.figure()
ax = fig.add_subplot(111, projection='polar')
c = ax.scatter(x_c, y_c, c=cat.cat.codes, cmap="viridis",alpha=0.75)
plt.show()