Histogrammes avec le logiciel R

(exemple)

Voici une page d'exemples qui explique comment réaliser de deux manières différentes le même histogramme avec des annotations.


Pour retrouver la rubrique d'aide générale à la réalisation d'histogramme : cliquer ici.

Histogrammes réalisés avec le logiciel R project

Histogrammes annotés par des verticale, horizontale, point précisé ou courbe de densité

  1. Préparer une liste de valeurs x (ici le nombre d'années d'étude dans un pays X) - cf. aide à la simulation de valeurs
x <- abs(rnorm(1000,3,5)) # il s'agit ici de données simulées selon la loi normale (1000 valeurs) # pour accéder à l'aide à la simulation de valeurs
  1. Diviser la fenêtre en deux pour pouvoir tracer les deux histogrammes côte à côté (étape non obligatoire pour faire un histogramme)
  1. Tracer le premier histogramme
# Etape 1 - tracer l'histogramme
hist(x,breaks=15,col="red",density=5,xlab="Durée (années)",ylab="Occurrences",main="Durée moyenne des études dans le pays X",ylim=c(0,200),tck=0.01)
    # breaks : nombre de barres
    # density : barres vides (0) ou hachurées
    # tck = 0.01 : longueur des graduations
    # xlab & ylab : titre de l'axe des abscisses et ordonnées
    # main : titre de l'histogramme
    # col : couleur des barres - pour mettre d'autres couleurs
box() # encadre l'histogramme
# Etape 2 - annotation de l'histogramme
abline(h=80,col="green",lwd=2,lty=3) ; abline(v=6,col="blue",lwd=1.5,lty=1) # Tracer une horizontale et une verticale
points(10, 100, col='red', lwd=3) ; points(10,100, type='h', col='red',lwd=3) # Ajouter un point rouge au sommet d'un trait
# source externe   
  1. Tracer le deuxième histogramme
# Etape 1 : tracer l'histogramme 2
hist(x,breaks=15,col="#F5D0A9",xlab="Durée (années)",ylab="Fréquences",main="Durée moyenne des études dans le pays X",tck=0.01, freq=FALSE)
# Le paramètre freq = FALSE ou freq = F permet d'afficher la fréquence que représente chaque catégorie.
box()
# Etape 2 : superposer une courbe de densité
densite <- density(x) # estimer la densité que représente ces différentes valeurs
lines(densite, col = "red",lwd=3) # Superposer une ligne de densité à l'histogramme
# source externe