Sou Engenheira de Dados com experiência prática construindo pipelines escaláveis e otimizados para grandes volumes de dados (bilhões de eventos/mês), atuando principalmente com dados de marketing e comportamento (GA4).
Tenho forte foco em:
- 🔹 Performance e otimização de queries SQL
- 🔹 Arquitetura de dados (Data Mesh, SOR/SOT)
- 🔹 Integração entre clouds (GCP → AWS)
- 🔹 Transformar dados em valor para negócio
Acredito que dados só fazem sentido quando geram impacto real, e é nisso que eu foco todos os dias.
Atualmente atuo como Data Engineer na DP6, trabalhando com:
- ⚡ Processamento de grandes volumes de dados (Athena, EMR, Spark)
- ☁️ Arquiteturas em AWS e GCP
- 📊 Dados de comportamento (GA4, campanhas, CRM)
- 🔄 Pipelines de ingestão e transformação (Glue, Lambda, BigQuery)
- 📈 Otimização de queries com ganhos relevantes de custo e tempo
- 🚀 Redução de ~67% de custo em pipelines EMR
- ⚡ Otimização de queries com ganhos de até 80%+ de performance
- 📉 Correção de pipelines críticos que estavam com timeout em alto volume de dados
- 🔄 Reestruturação de ETLs, reduzindo dezenas de fluxos em poucos pipelines escaláveis
Cloud & Data
- AWS (Athena, S3, Glue, EMR, Lambda, Step Functions)
- GCP (BigQuery, GCS)
Processamento
- PySpark
- SQL avançado (foco em performance)
Outros
- Terraform
- GitHub Actions (CI/CD)
- Data Mesh concepts
- 🎓 Pós-graduação em Inteligência Artificial - Unimontes (Em Andamento)
- 🎓 Pós-graduação em Engenharia de Dados — PUC Minas
- 🎓 Bacharel em Ciência e Tecnologia — UFVJM
- 🎓 Engenharia Física — UFVJM
📌 Machine Learning aplicado a crédito
- Desenvolvimento de modelos para classificação de inadimplência
- Comparação de algoritmos e métricas de performance
📌 Clustering & segmentação de clientes
- Implementação de algoritmos do zero (K-Means, DBSCAN, EM, etc.)
- Uso de múltiplas métricas de distância (incluindo JSD e Mahalanobis)
Gosto de trocar ideia sobre:
- Engenharia de Dados
- Arquitetura de dados
- SQL e performance
- Carreira em dados
📩 Me chama no LinkedIn 🙂



