Sou formado em Engenharia Mecânica pela Universidade Paulista, e Analista de Dados com mais de 7 anos de experiência.
Sou altamente capacitado e domino todas as skills que um analista de dados precisa ter para alavancar um negócio.
Minhas habilidades abrangem desde a coleta de dados de forma eficiente e segura até a implementação de soluções avançadas contendo aprendizado de máquina.
Especializado em transformar dados complexos em insights valiosos, possuo expertise nas principais linguagens do mercado como, Python, R, SQL, bem como ferramentas de visualização de dados como Power BI e Looker.
Destaco minha comunicação orientada a dados, fácil tradução de análises para meus clientes, curiosidade sobre os negócios, bem como pela minha adaptação a mudanças e ideias novas.
Por onde passei sempre fui elogiado pelo meu profissionalismo, ética e pro atividade, confira meus trabalhos e trajetória profissional.
Nessa seção apresento meus projetos de Business Intelligence utilizando a ferramenta Power BI.
Esses Projetos foram desenvolvidos para trazer informações e insights relevantes sobre os negócios, tornando a tomada de decisões das companhias mais assertivas e data driven.
Esse Dashboard tem como objetivo informar indicadores de Produção de uma Empresa fabricante de eletrônicos.
O Dashboard interativo traz as seguintes informações:
Total Produzido por mês
Tempo Médio de Produção por mês
Top 5 operadores produtivos
Top 5 produtos rejeitados
Produção do ultimo mês conta o mês anterior
Ocorrencias do ultimo mês contra o mês anterior
Taxa de rejeição do último mês contra o mês anterior
Total rejeitado
Abaixo é possível explorar o dashboard e conhecer suas funcionalidades. (em breve novos projetos)
Esse Dashboard foi construído para informar indicadores da Under Store Varejista fictícia que precisa acompanhar seus indicadores para maximizar as vendas e visualizar problemas com devoluções.
O Dashboard interativo traz as seguintes informações:
Faturamento por mês
Ticket Médio por mês
Volume Médio por mês
Faturmento, Tkm e Volume por Loja
Faturmento, Tkm e Volume por Produto, Marca e Tipo de Produto
Devoluções por Loja
Motivo de Devoluções
Variações contra Ano anterior de Faturamento, Tkm, Volume e Devoluções
Obs: Para o Ticket Médio, o Dataset traz valores lineares de Faturamento e Volume, que mantém o ticket médio constante ao longo do tempo. Porém, não há um erro de relacionamento.
Abaixo é possível explorar o dashboard e conhecer suas funcionalidades.
Esse Dashboard foi construído para informar indicadores da Under Log Transportadora fictícia que precisa acompanhar seus indicadores para maximizar seus lucros e oferecer um melhor serviço para seus clientes.
O Dashboard interativo traz as seguintes informações:
Página Geral
Lucro do Frete e Preço médio por mês
Scatter plots para mostrar as correlações entre o Valor do Frete e o Peso, Valor das mercadorias e os gastos.
Página Detalhes
Custos e Lucros por mês
Gastos por km por Tipo de veículo
Lucro por tipo de veículo
Manutenção por km por veículo
Quantidade de viagens por cidade
Abaixo é possível explorar o dashboard e conhecer suas funcionalidades.
Nessa seção apresento meus projetos de Ciência de dados, hospedados no Github.
Esses Projetos foram desenvolvidos para trazer informações, insights e previsões utilizando ferramentas de Machine Learning. As técnicas e ferramentas utilizadas podem resolver diversos problemas de negócios de diversas áreas.
Previsão de Promoção de Colaborador
Objetivo:
Analisar os dados de funcionários de uma empresa e fazer predições sobre uma possível promoção do funcionário.
Conteúdo
Análise exploratória.
Visualizações.
Criação de Pipeline de preprocessamento dos dados com sklearn.
Treinamento de modelo Support Vector Classifier com tunning de hyperparâmetros utilizando validação cruzada com sklearn.
Avaliação das métricas de Classificação.
Conclusão.
Previsão de pacientes com insônia
Objetivo:
Analisar os dados e fazer predições sobre pacientes com insônia.
Conteúdo
Análise exploratória.
Visualizações de distribuições.
Criação de Pipeline de preprocessamento dos dados com sklearn.
Treinamento de modelo Support Vector Classifier e Gradient Boost Classifier com tunning de hyperparâmetros utilizando validação cruzada com sklearn.
Comparativo entre os resultados dos modelos
Conclusão.
Previsão de preços de laptops por suas características
Objetivo:
Analisar os dados, melhora-los com engenharia de features e fazer predições sobre preços de laptops.
Conteúdo
Engenharia de Features
Análise exploratória.
Visualizações para responder perguntas sobre os dados.
Criação de Pipeline de preprocessamento dos dados com sklearn.
Treinamento de Regressão linear com cross validation, como baseline
Treinamento de Random Forest Regressor com tunning de hyperparâmetros utilizando validação cruzada com sklearn.
Validação do Modelo Random Forest Regressor em dados desconhecidos.
Comparativo entre os resultados dos modelos Linear e Random Forest
Conclusão.
Clusterização de clientes por suas características
Objetivo:
Analisar os dados, e propor uma formação de grupos de clientes baseados em suas características utilizando técnicas de aprendizado de máquina não supervisionado.
Conteúdo
Análise Exploratória dos dados
Visualizações
Exploração e avaliação de métricas de clusterização para uma melhor divisão dos clusters
Construir um banco de dados MySQL localmente, do zero, com os dados da Superstore retirados do Kaggle.
Criar o Diagrama do banco com Lucid Chart.
Criar Banco de dados com linguagem SQL.
Dividir a tabela principal em csv, em tabelas dimensões e fato, de acordo com o diagrama desenhado.
Tratar os dados e fazer a ingestão através da linguagem Python.
MYSQL Workbench
Python
SqlAlchemy
Pandas
Numpy
Mysql Connector