1. Corrélations entre les attribues
Pour découvrir la corrélation entre les attribues dans la donnée, sous R, on utilise la commande: cor( colonne 1, colonne 2,...)
> cor(pw[,3:9])
Global_active_power Global_reactive_power Voltage Global_intensity Sub_metering_1 Sub_metering_2 Sub_metering_3
Global_active_power 1.0000000 0.24701705 -0.3997616 0.9988886 0.48440128 0.43456872 0.63855542
Global_reactive_power 0.2470171 1.00000000 -0.1122456 0.2661204 0.12311057 0.13923089 0.08961653
Voltage -0.3997616 -0.11224557 1.0000000 -0.4113631 -0.19597555 -0.16740476 -0.26817208
Global_intensity 0.9988886 0.26612039 -0.4113631 1.0000000 0.48929822 0.44034654 0.62654275
Sub_metering_1 0.4844013 0.12311057 -0.1959756 0.4892982 1.00000000 0.05472086 0.10257107
Sub_metering_2 0.4345687 0.13923089 -0.1674048 0.4403465 0.05472086 1.00000000 0.08087205
Sub_metering_3 0.6385554 0.08961653 -0.2681721 0.6265427 0.10257107 0.08087205 1.00000000
2. Corrdiagram
La command pour créer la corrgram des attribues en langage R:
>corrgram(pw, lower.panel=panel.shade, upper.panel=panel.pie)
3. Analyse des résultats
On trouve une corrélation entre Global_active_power(P) et Global_intensity(I). La valeur de cor est 0.9988, ça correspond comme
dans la réalité, parce que P = U * I, c'est-à-dire quand P augmente => I augmente linéairement (supposant que
le Voltage ne change pas).
On trouve aussi la relation entre Global_active_power et Sub_metering_3: 0.6385554. Il n'est pas très fort mais c'est vrai
car Sub_metering_3 représente l'utilisation des climatiseurs et chauffeurs. Il prend une poids importante dans
la Global_active_power