Olá, aluno(a)! Você já ouviu falar sobre Big Data? Esse assunto se tornou tão importante que agora faz parte de qualquer roda de conversa, fazendo-se necessário em todas as áreas. Portanto, nada mais justo de também termos uma lição para tratar sobre esse tema. Afinal de contas, em todas as interações que fazemos, mesmo quando não estamos utilizando o smartphone, mas estamos com ele dentro do carro ou no bolso, estamos gerando dados que serão utilizados por alguma empresa. Assim, estamos vivemos um momento em que todos geram, utilizam e tomam decisões baseados em grandes volumes de dados. Vamos entender melhor como tudo isso acontece?
Como você poderia lançar um produto com chances dele não ter sucesso? Quem você escolheria para ser o garoto ou garota propaganda do seu produto? O que chamaria mais atenção das pessoas no lançamento de um produto? O que as pessoas estão procurando para comprar?
Entender o comportamento das pessoas sempre foi um problema, e, talvez, o maior desafio da maioria das empresas ao lançar um produto ou tentar vender mais de um produto já lançado. No entanto, com a popularização da internet, principalmente das redes sociais, bem como a grande utilização dos smartphones por meio de aplicativos, isso deixou de ser um problema difícil de resolver, ou seja, tornou-se um problema mais fácil de resolver, porém, caro.
Entender o que as pessoas querem, pelo que se interessam, quem segue, o que as agrada ou o que desejam, graças a uma nova área de conhecimento chamada Ciência Analítica, não é mais algo desafiador. Essa área é responsável por interpretar os dados e extrair valores desses dados, ou seja, a partir dos dados, gerar um conhecimento (valor) que terá impacto em seu negócio.
Assim, por meio do uso amplo de dados, de estatística e modelos explanatórios e preditivos, é possível que as empresas tomem novas decisões e realizem definições de atuação de forma mais assertiva, visto que conseguem entender o que o cliente procura.
Você gosta de jogar videogame on-line? Saiba então que todas suas atividades e ações, ou seja, o seu comportamento durante o jogo, são capturados e analisados. Um exemplo de empresa que faz isso é a EA Sports, ela desenvolve jogos de esporte e conecta milhares de pessoas, e isso permite que essa – e outras empresas do ramo – tenham maior assertividade nos novos lançamentos e funções dos futuros jogos.
O mesmo ocorre com a Netflix e outras plataformas de streaming. Se você acessa essas plataformas, já deve ter percebido que muito da sua navegação e opções que aparecem são de acordo com o seu comportamento de usuário da plataforma de filmes e séries.
Percebeu como o Big Data está em tudo que fazemos?
Então, precisamos mesmo começar a falar sobre isso, uma vez que todos nós estamos envolvidos.
Davenport (2014) explica que o termo Big Data se refere a um volume de dados muito grande, mas que não estão estruturados. Como forma de facilitar o nosso entendimento, podemos citar alguns exemplos:
30 bilhões de unidades de conteúdo são acrescentadas ao Facebook mensalmente.
A Zynga – empresa de jogos sociais – processa mais de 1 petabyte de dados por dia.
O Youtube exibe diariamente mais de 2 bilhões de vídeos.
O Twitter executa mais de 32 bilhões de buscas por mês.
São muitos dados, não é mesmo? E percebeu que, em todos eles, os usuários estão envolvidos? Na verdade, temos diante de nós um novo fenômeno que muitas pessoas ainda não se deram conta. Ele se chama ubiquidade. Você já ouviu essa palavra alguma vez? Sabe o que é?
Bom, como provavelmente você não conhece, vou te explicar! Ubiquidade quer dizer: onipresente (em toda parte). No contexto computacional, está relacionada à presença de tecnologia e sua inserção no cotidiano das pessoas, possibilitando a captura e interações constantes de dados, em qualquer lugar, o que viabiliza as realizações do Big Data.
Já estamos vivendo uma época em que os sensores e os microprocessadores estão em toda a parte (e muito em breve serão onipresentes). Todos os dispositivos mecânicos ou eletrônicos têm condições de deixar rastros que podem entregar dados, como seu desempenho, localização e sua situação. Uma vez que esses dispositivos tenham uma conexão com a Internet, está pronta a possibilidade de ser uma fonte de geração de dados.
Dessa maneira, podemos dizer que todas as empresas, em qualquer setor ou nicho de mercado, terão a possibilidade de interpretar e criar estratégias baseadas em dados. Aqui surge uma excelente notícia: será necessária a existência de pessoas com capacidade de realizar análises nessa massa gigantesca de informações.
Davenport (2014) cita alguns exemplos de decisões que alguns nichos de empresas precisam tomar e no que o Big Data poderia auxiliar:
Cadeias de fornecimento: níveis de estoque a ser mantido, onde instalar centros de distribuição, criação da rota de produtos ou veículos e o carregamento de cargas.
Recursos Humanos: quais funcionários contratar, quais funcionários tendem a deixar a empresa, nível de remuneração e o tipo de educação mais benéfica.
Não há dúvida de que, por meio de dados transformados em informação, seria possível a aplicação desses dados para gerar conhecimento útil a uma organização. Mas como isso poderia ser feito? Davenport (2014) sugere uma estrutura em etapas e passos:
Etapa 1 - Formulação do Problema
Reconhecimento do problema.
Revisão das descobertas anteriores.
Etapa 2 - Solução do Problema
Modelagem.
Coleta de dados.
Análise dos dados.
Etapa 3 - Resultados: comunicação e ação
Apresentação dos resultados e adoção de providências
Vamos abordar um pouco de cada uma dessas etapas a seguir.
Na Etapa 1 - Formulação do Problema: a ideia é conseguir uma definição de uma questão a ser respondida e que decisões serão tomadas com base nos resultados. Essa etapa é muito importante, pois se o problema não for bem definido, a conclusão não trará os possíveis resultados pretendidos. Isso acontece mesmo em casos que os dados são de boa quantidade e análise aplicada. Portanto, gastar um bom tempo entendendo o problema e buscando informações em tentativas anteriores de solucioná-lo pode garantir o sucesso posterior.
Na Etapa 2 - Solução do Problema: deve-se escolher as variáveis que o modelo vai conter. Elas serão essenciais para a coleta de dados correta e na posterior atividade de análise de dados. Dessa maneira, aqui é o momento para perguntas e ideias que poderão ser essenciais para o desenvolvimento de soluções.
Na Etapa 3 - Resultados: comunicação e ação: trata da divulgação do processo e seus resultados. Isso é importante para que todos se sintam à vontade em relação ao processo de tomada de decisão com base no processo como um todo.
Davenport (2014) ainda apresenta mais um aspecto interessante, que são os 4 estágios do raciocínio analítico criativo:
Preparação: que é a construção dos fundamentos para a solução do problema.
Imersão: trata-se de um engajamento intenso com a solução do problema e com os dados disponíveis.
Incubação: internalização do problema na mente, com a expectativa de que se desenvolvam prováveis conexões inusitadas.
Insight: grande avanço da compreensão de como o problema pode ser resolvido por meio da análise quantitativa.
Agora, é possível interligar esses estágios com as etapas que descrevemos pouco acima, conforme a Figura 1:
Quando estamos falando de Big Data, você, aluno(a), percebe que não é tanto sobre tecnologia, mas mais sobre pessoas e processos? A tecnologia a ser aplicada aqui é apenas um detalhe. Ela fará seu papel e trará o resultado esperado à medida que as pessoas apoiarem e os processos de definição do que se quer com a tecnologia forem bem construídos.
Assim, ao trabalhar com tecnologia, você sempre vai se deparar com vários tipos de dados disponíveis e caberá a você saber se a qualidade dos dados é boa, e isso vai depender de como a entrada de dados é realizada e se o usuário toma cuidado e é bem treinado para isso.
Além dos dados da própria empresa, você também precisará saber como realizar a integração dos dados. Em geral, uma empresa tem mais de um sistema que ela utiliza e vários banco de dados, que são de fontes e formatos distintos. Isso, então, gera a necessidade de definir critérios e realizar possíveis transformações nos dados para um mesmo volume ou formato. Aqui é importante destacar que você terá à disposição dados estruturados (que você sabe exatamente o formato e sua relação com o negócio) e dados não estruturados (não possuem uma regra de formato e nem mesmo especificidade, como imagens, vídeos, documentos de texto, e-mails e redes sociais). As fontes de dados estruturados ou não estruturados podem ser, portanto, de redes sociais, streaming data e fontes públicas.
O desafio e os dados são muitos, mas, ao mesmo tempo, são muitas oportunidades para atuar nesse novo mercado de dados, que é cada vez mais essencial para o sucesso das organizações.
O Big Data pode ser utilizado para vários objetivos dentro de uma organização. Entre os objetivos, podemos citar:
há vários casos em que a análise de dados auxiliou empresas a desenvolverem produtos para antecipar demandas e produzir tendências. Por exemplo, há uns anos, pelo aumento de buscas de sintomas de gripe pelo Google, o governo americano conseguiu diminuir os impactos do que seria uma epidemia.
auxilia em verificar possíveis cenários e soluções para que a organização possa melhorar a sua gestão de matéria prima ou mesmo de custos.
entender o que o cliente sente e o que ele deseja auxilia na formação da chamada fidelização.
como é possível coletar dados de equipamentos que possuem microprocessadores, é possível prevenir defeitos e planejar manutenções de acordo com a demanda de uso.
definição de padrões passou a ser uma excelente forma de evitar danos. Por exemplo, redes de cartões de crédito já possuem uma Inteligência Artificial que avalia os dados gerados e traça perfis de comportamento por usuário. Se o seu comportamento é muito diferente, a compra pode ser bloqueada.
Assim, os benefícios por meio de Big Data, como você pode observar, são inúmeros, e a cada dia são gerados mais dados que precisarão de mais análise.
DAVENPORT, T. Dados Demais: como desenvolver habilidades analíticas para resolver problemas complexos, reduzir riscos e decidir melhor. 1. ed. Rio de Janeiro: Elsevier, 2014.