Dispersão de Dados 3D

Esta visualização consiste em projetar registros de uma base de dados representados por pontos num plano e os atributos representados por eixos. sendo a posição dos pontos dependente dos eixos que formam as dimensões da visualização (KOSARA; SAHLING; HAUSER, 2004).

Gráfico de dispersão de dados é uma visualização popular e muito conhecida utilizada para mapear dados multidimensionais utilizando coordenadas (FEKETE; PLAISANT, 2002). Esta visualização em três dimensões projeta, num espaço tridimensional, o relacionamento de três atributos da base de dados, representado pelas coordenadas X, Y e Z, conforme ilustrado na Figura 2.8. Um dos intuitos desta visualização é revelar os dados de maneira experimental a fim de determinar os pontos de concordância (KOSARA; SAHLING; HAUSER, 2004). Este método gráfico é muito eficiente para determinar se existe uma relação, padrão ou tendência entre variáveis.

Esta visualização permite a inserção de propriedades visuais (cor, tamanho, forma, orientação e etc...), aumentando desta forma o número de atributos que podem ser representados.


Utilização na linguagem R:

Pacote: scatterplot3d

Função: scatterplot3d(x, y=NULL, z=NULL, color=par("col"), pch=NULL, main=NULL, sub=NULL, xlim=NULL, ylim=NULL, zlim=NULL, xlab=NULL, ylab=NULL, zlab=NULL, scale.y=1, angle=40, axis=TRUE, tick.marks=TRUE, label.tick.marks=TRUE, grid=TRUE, box=TRUE, ...)

Parâmetros:

• x – fonte de dados, caso utilize este parâmetros somente como coordenada é necessário utilizar o parâmetro y e z; • y, z– coordenada y e z;

• color – propriedade cor;

• pch – uso de simbolos;

• main – titulo da visualização;

• sub – sub-titulo da visualização;

• xlim, ylim, zlim – limites para as coordenadas;100

• xlab, ylab, zlab – títulos para os eixos;

• scale.y – determinação escalas;

• angle – projeção em diferentes ângulos;

• axis – valor lógico que indica a remoção dos eixos;

• tick.marks – valor lógico que permite a remoção das linhas tracejadas;

• label.tick.marks – valor lógico para exibir layout dos valores das linhas tracejadas;

• grid – valor lógico que indica se as linhas devem ser visualizadas;

• Box – valor lógica que indica a presença de um cubo na visualização

Exemplos de códigos:

#fonte: documentação do R

#visualização da abaixo – Mistura de cores

> library(scatterplot3d)# carregar pacote

> cc <- colors()

> crgb <- t(col2rgb(cc))

> par(xpd = TRUE)

> rr <- scatterplot3d(crgb, color = cc, box = FALSE, angle = 24, xlim = c(-50, 300), ylim = c(-50, 300), zlim = c(-50, 300))

> cubedraw(rr) > rbc <- rainbow(201)

> Rrb <- t(col2rgb(rbc))

> rR <- scatterplot3d(Rrb, color = rbc, box = FALSE, angle = 24, xlim = c(-50, 300), ylim = c(-50, 300), zlim = c(-50, 300))

> cubedraw(rR)

> rR$points3d(Rrb, col = rbc, pch = 16)

Representando um cubo com mistura de cores- Fonte: Documentação R

Referência:

KOSARA, R.; SAHLING, G.; HAUSER, H. Linking scientific and information visualization with interactive 3D scatterplots. In: INTERNATIONAL CONFERENCE IN CENTRAL EUROPE ON COMPUTER GRAPHICS, VISUALIZATION AND COMPUTER VISION SHORT COMMUNICATION. 12., 2004, Proceedings... p. 133–140, 2004.

FEKETE, J.; PLAISANT, C. Interactive information visualization of a million items. In: IEEE SYMPOSIUM ON INFORMATION VISUALIZATION, 2., 2002, Boston. Proceedings... Boston: IEEE, 2002. p. 117.