Ferramentas e Bibliotecas: Python (pandas, numpy, pyarrow, datetime, matplotlib, seaborn), Power BI
Descrição do Projeto:
Utilizando dados públicos de táxis de Nova York, desenvolvi um projeto completo de automação e análise de dados. Criei um processo de web scraping em Python para automatizar o download dos arquivos, seguido por um pipeline de tratamento e padronização dos dados, também em Python. Os dados foram convertidos para o formato Parquet, garantindo uma leitura mais rápida e eficiente no Power BI. A análise explora aspectos como duração das corridas, tipo de pagamento, localização de embarque e desembarque, além do comportamento de gorjetas e entre outras análises.
🔍 Valor dos insights:
Planejamento de frota e operação por região e horário
Análise de comportamento do cliente (gorjetas, frequência)
Apoio à gestão urbana e transporte
📌 Perguntas de negócio que o projeto responde:
Quais são os horários de maior movimento de corridas?
Existe sazonalidade no volume de corridas?
Quais áreas da cidade concentram mais corridas?
A gorjeta média varia por região ou horário?
Qual o ticket médio das corridas e como ele evolui com o tempo?
🎯 Impacto potencial:
Empresas de mobilidade, delivery e logística podem utilizar esse tipo de análise para otimizar rotas, turnos e campanhas locais. Gestores públicos também podem se beneficiar na avaliação de transporte urbano.
Fonte dos dados:
🔗 NYC Taxi & Limousine Commission – Public Datasets