Pipeline completo de engenharia de dados que processa informações de e-commerce brasileiro, desde a ingestão até visualizações analíticas.
Diagrama da arquitetura do projeto
Python é ideal para coletar dados de múltiplas fontes (APIs, bancos SQL, planilhas)
DuckDB é um banco leve, rápido e embutido (não requer servidor), perfeito para um Data Lakehouse simplificado.
dbt (data build tool) estrutura a modelagem dimensional (star schema) de forma modular e documentada.
Power BI consome os dados modelados pelo dbt diretamente do DuckDB (ou de arquivos Parquet).
📈Resultados
📃Linhagem de dados no dbt docs
📊Visualização analítica final
Entre em contato pelo e-mail luisadsfatec@hotmail.com para saber mais sobre o projeto