Visualizações

A análise e visualização dos dados foram feitas em duas perspectivas. Primeiro de forma singular, analisando características dispersas uma a uma, como as buscas mais frequentes, produtos mais relevantes, perfis dos clientes, entre outros, não levando em consideração o tempo. No segundo formato, o tempo é associado aos dados, assim períodos como dias, meses, estações do ano são considerados, provendo uma contextualização mais aprofundada, gerando hipóteses e melhorias nas ações de vendas.

Visualização dos Dados

Produtos

Na H&M Group, existem diversas coleções de produtos, várias delas utilizando o mesmo nome, apenas acrescentando algum complemento, indicando a qual coleção este produto pertence.

Ao todo existem 45.875 produtos únicos e os nomes mais frequentes dos produtos são mostrados no gráfico abaixo.

Nomes dos produtos mais relevantes

A partir de uma análise individual, podemos designar para quais esforços haverão mais recompensas. Por exemplo, existem 131 tipos de produtos e desses os mais relevantes buscados pelos clientes são as calças, vestidos, suéteres e camisetas. Assim, levar em consideração a análise destes dados para gerar novos tipos de coleções destes produtos de forma proporcional acaba sendo uma boa opção.

Tipos de produtos mais frequentes

Fazendo um agrupamento ainda mais grosseiro em 19 grupos -- separando os vestuários em parte superior, inferior, ... -- é possível refletir ainda mais sobre a relação tipos de produtos x procura. No entanto, não devemos levar em consideração apenas esta análise como parâmetro de produção.

Grupos de produtos mais frequentes

E, para finalizar a análise dos produtos, apresentamos as cores mais frequentes dos produtos.

Cores mais frequentes

Clientes

Em relação aos clientes, o grupo H&M oferece uma opção de membro (concedendo descontos e vantagens), a análise desta informação ajuda no controle de fidelidade e de evasão dos clientes, note que, é possível ver que a grande maioria pertence ao clube de membros, 92.960 não terminam o pré-cadastro, 6.062 são desconhecidos e 467 saem do clube. Além disso, com os dados dos clientes podemos identificar a faixa etária e em qual classificação de idade a maior parte dos clientes se encaixam.

Perfil do cliente

Compras

Nas transações da plataforma, os produtos mais vendidos são Jade HW Skinny Denim TRS, 7p Basic Shaftless e Tilly (1). Podemos ver a predominância de calças e de cores neutras, indicando qual seria uma boa indicação para novos clientes que ainda não se conhecem as suas preferências.

Produtos mais vendidos (em unidade)

Produtos

Wordcloud

Podemos também analisar as palavras mais comuns nas descrições dos produtos utilizando a técnica wordcloud.

O que é Wordcloud ?

A nuvem de palavras é uma maneira visual de representar palavras a partir da frequência com a qual aparecem em um texto. Esse tipo de técnica é comumente utilizada para evidenciar palavras que se repetem em textos muito grandes, ajudando o usuário a tirar insights e compreender melhor os dados que está tratando.

Inicialmente, podemos verificar quais são as palavras mais comuns entre as descrições dos produtos da rede. Verifica-se que as palavras mais comuns são, como esperado, palavras que podem designar diferentes tipos de vestimentas.

Foram então selecionados os 100 produtos mais vendidos por estação do ano e, criou-se o Wordcloud da descrição de tais produtos. Este formato de visualização é interessante quando trata-se de atributos do tipo texto, onde busca-se similaridades entre o conteúdo de cada campo.

Percebe-se que palavras como bikini, short, straps, shoulder ou jersey, referindo-se a roupas leves, aparecem frequentemente nas descrições dos produtos mais vendidos durante a primavera e o verão (estações mais quentes). Enquanto que as palavras long, sleeves ou legs, referindo-se a roupas que são mais presentes nas estações de outono e inverno.

Também, é possível criar hipóteses a serem testadas a partir do Wordcloud. Por exemplo, a palavra bikini aparece na imagem do inverno, porém não no outono. Como não é esperado que os clientes comprem roupas de calor no inverno, pode-se criar a hipótese de que roupas mais frescas podem estar em liquidação neste período ou que as pessoas comecem comprá-las no final do inverno, quando as temperaturas começam a subir novamente. Uma hipótese similar pode ser feita ao analisar as palavras short e bikini mais relevantes na primavera do que no verão. Ou seja, talvez os clientes estejam comprando roupas mais frescas ao final da primavera para se preparar para o verão.

Primavera

Verão

Outono

Inverno

Logo, pode-se dizer que de maneira fácil e rápida, o wordcloud evidencia similaridades essenciais contidas nas descrições dos produtos a serem recomendados, além de ajudar a gerar predições que podem ser testadas através dos dados.

Coordenadas paralelas

Conseguinte, analisamos diferentes idades que possuem um perfil de compra similar. A princípio utilizamos o gráfico de coordenadas paralelas, sendo cada linha um grupo de pessoas da mesma idade -- variando de 16 a 99 anos -- e as colunas representando, respectivamente, o preço mediano gasto, a quantidade mediana de produtos comprados, a quantidade mediana de dias diferentes com compras e a quantidade de compras realizadas por cada grupo. A visualização ainda apresenta muitas sobreposições de linhas, no entanto, mesmo assim já podemos identificar certos grupos com perfis similares. Para melhorar a visibilidade do gráfico, podemos definir grupos de diferentes faixas etárias e associar uma legenda a eles.

Perfil de compras por idade

Na figura abaixo, com faixas etárias legendadas já é possível identificar uma certa semelhança dentre os grupos. Observa-se, por exemplo, que clientes de 20 a 39 anos são os maiores compradores da rede, seguidos pelos clientes de 40 a 59 anos, sendo os mais jovens e os mais idosos os menores compradores. Há ainda duas exceções na faixa etária de mais de 60 anos, apresentando um elevado preço mediano em compras (0.34 e 0.33), porém comprados em apenas um dia.

Perfil de compras por faixa etária

Mas será que poderíamos melhorar ainda mais a nossa visualização? Claro! Podemos ao invés de conectar os eixos verticais por retas, ligá-los por uma função polinomial, reduzindo as sobreposições entre as retas. Como sugestão de implementações futuras, citamos a possibilidade de conectá-los, ao invés de uma função linear por partes, utilizar uma função polinomial por partes, agrupando linhas de um mesmo grupo.

Perfil de compras por faixa etária conectando eixos paralelos por função polinomial