Matriz de Dispersão

Matriz de dispersão

Uma das técnicas mais antigas e popular. Ela permite o analista visualizar o comportamento da relação entre os atributos, projetando os atributos em pares criando células mapeadas pelo eixo X e eixo Y.

Na linguagem R é possível utiliza-la com a função "Plot". Os parâmetros desta função são:

plot(x, col, pch, type …)

Descrição dos parametros:

  • x - base de dados;

  • col - propriedade cor para cada registro;

  • pch - propriedade tipo formato para cada registro;

  • type – tipo dos componentes utilizado na visualização, "p" pontos, "l" para linhas, "b" pontos utilizando linhas, "h" para histograma, "s" linhas verticais e horizontais ligando os pontos.

  • ... – existência de outros parâmetros.

Se o parâmetro "x" for do tipo dataframe (onde a linha corresponde a um registro e a coluna o atributo), a função plot gera a matriz de dispersão, exemplo:

> plot(x)


Exemplos de códigos, encontra na documentação da linguagem R:

> plot(cars)

> lines(lowess(cars))

> plot(sin, -pi, 2*pi)

## Distribuição discreta

> plot(table(rpois(100,5)), type = "h", col = "red", lwd=10,main="rpois(100,lambda=5)")

Matriz de Dispersão