Dispersão de Dados 3D
Esta visualização consiste em projetar registros de uma base de dados representados por pontos num plano e os atributos representados por eixos. sendo a posição dos pontos dependente dos eixos que formam as dimensões da visualização (KOSARA; SAHLING; HAUSER, 2004).
Gráfico de dispersão de dados é uma visualização popular e muito conhecida utilizada para mapear dados multidimensionais utilizando coordenadas (FEKETE; PLAISANT, 2002). Esta visualização em três dimensões projeta, num espaço tridimensional, o relacionamento de três atributos da base de dados, representado pelas coordenadas X, Y e Z, conforme ilustrado na Figura 2.8. Um dos intuitos desta visualização é revelar os dados de maneira experimental a fim de determinar os pontos de concordância (KOSARA; SAHLING; HAUSER, 2004). Este método gráfico é muito eficiente para determinar se existe uma relação, padrão ou tendência entre variáveis.
Esta visualização permite a inserção de propriedades visuais (cor, tamanho, forma, orientação e etc...), aumentando desta forma o número de atributos que podem ser representados.
Utilização na linguagem R:
Pacote: scatterplot3d
Função: scatterplot3d(x, y=NULL, z=NULL, color=par("col"), pch=NULL, main=NULL, sub=NULL, xlim=NULL, ylim=NULL, zlim=NULL, xlab=NULL, ylab=NULL, zlab=NULL, scale.y=1, angle=40, axis=TRUE, tick.marks=TRUE, label.tick.marks=TRUE, grid=TRUE, box=TRUE, ...)
Parâmetros:
• x – fonte de dados, caso utilize este parâmetros somente como coordenada é necessário utilizar o parâmetro y e z; • y, z– coordenada y e z;
• color – propriedade cor;
• pch – uso de simbolos;
• main – titulo da visualização;
• sub – sub-titulo da visualização;
• xlim, ylim, zlim – limites para as coordenadas;100
• xlab, ylab, zlab – títulos para os eixos;
• scale.y – determinação escalas;
• angle – projeção em diferentes ângulos;
• axis – valor lógico que indica a remoção dos eixos;
• tick.marks – valor lógico que permite a remoção das linhas tracejadas;
• label.tick.marks – valor lógico para exibir layout dos valores das linhas tracejadas;
• grid – valor lógico que indica se as linhas devem ser visualizadas;
• Box – valor lógica que indica a presença de um cubo na visualização
Exemplos de códigos:
#fonte: documentação do R
#visualização da abaixo – Mistura de cores
> library(scatterplot3d)# carregar pacote
> cc <- colors()
> crgb <- t(col2rgb(cc))
> par(xpd = TRUE)
> rr <- scatterplot3d(crgb, color = cc, box = FALSE, angle = 24, xlim = c(-50, 300), ylim = c(-50, 300), zlim = c(-50, 300))
> cubedraw(rr) > rbc <- rainbow(201)
> Rrb <- t(col2rgb(rbc))
> rR <- scatterplot3d(Rrb, color = rbc, box = FALSE, angle = 24, xlim = c(-50, 300), ylim = c(-50, 300), zlim = c(-50, 300))
> cubedraw(rR)
> rR$points3d(Rrb, col = rbc, pch = 16)
Representando um cubo com mistura de cores- Fonte: Documentação R
Referência:
KOSARA, R.; SAHLING, G.; HAUSER, H. Linking scientific and information visualization with interactive 3D scatterplots. In: INTERNATIONAL CONFERENCE IN CENTRAL EUROPE ON COMPUTER GRAPHICS, VISUALIZATION AND COMPUTER VISION SHORT COMMUNICATION. 12., 2004, Proceedings... p. 133–140, 2004.
FEKETE, J.; PLAISANT, C. Interactive information visualization of a million items. In: IEEE SYMPOSIUM ON INFORMATION VISUALIZATION, 2., 2002, Boston. Proceedings... Boston: IEEE, 2002. p. 117.