Matriz de Dispersão
Matriz de dispersão
Uma das técnicas mais antigas e popular. Ela permite o analista visualizar o comportamento da relação entre os atributos, projetando os atributos em pares criando células mapeadas pelo eixo X e eixo Y.
Na linguagem R é possível utiliza-la com a função "Plot". Os parâmetros desta função são:
plot(x, col, pch, type …)
Descrição dos parametros:
x - base de dados;
col - propriedade cor para cada registro;
pch - propriedade tipo formato para cada registro;
type – tipo dos componentes utilizado na visualização, "p" pontos, "l" para linhas, "b" pontos utilizando linhas, "h" para histograma, "s" linhas verticais e horizontais ligando os pontos.
... – existência de outros parâmetros.
Se o parâmetro "x" for do tipo dataframe (onde a linha corresponde a um registro e a coluna o atributo), a função plot gera a matriz de dispersão, exemplo:
> plot(x)
Exemplos de códigos, encontra na documentação da linguagem R:
> plot(cars)
> lines(lowess(cars))
> plot(sin, -pi, 2*pi)
## Distribuição discreta
> plot(table(rpois(100,5)), type = "h", col = "red", lwd=10,main="rpois(100,lambda=5)")
Matriz de Dispersão