Dataviz adaptés aux gros jeux de données
Le Dataviz Big Data en Python
1- Croiser des variables en Parallele coordinates plot
1- Croiser des variables en Parallele coordinates plot
import plotly.express as px
df = px.data.iris()
fig = px.parallel_coordinates(df, color="species_id", labels={"species_id": "Espèces",
"sepal_width": "Largeur des sépales", "sepal_length": "Sepal Length",
"petal_width": "Petal Width", "petal_length": "Petal Length", },
color_continuous_scale=px.colors.diverging.Tealrose,
color_continuous_midpoint=2)
fig.show()
2- Trop de points : faire un kernel density plot 2D
2- Trop de points : faire un kernel density plot 2D
Lorsqu'on veut faire un scatter-plot, il peut être pertinent de faire un kernel density plot 2D ou tout simplement de dessiner les contours des nuages de points avec une simple nappe convexe (affichage rapide) ou une ellipse de confiance.
3- Données de type texte : faire un Treemap
3- Données de type texte : faire un Treemap
import plotly.express as px
df = px.data.tips()
fig = px.treemap(df, path=['day', 'time', 'sex'], values='total_bill')
fig.show()
4- Données cycliques, axe des x trop allongé : polar plot
4- Données cycliques, axe des x trop allongé : polar plot
fig = plt.figure()
ax = fig.add_subplot(111, projection='polar')
c = ax.scatter(x_c, y_c, c=cat.cat.codes, cmap="viridis",alpha=0.75)
plt.show()