Skip to content
View JaneOliveira's full-sized avatar
😘
😘

Highlights

  • Pro

Block or report JaneOliveira

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
JaneOliveira/README.md

Hi 👋, I'm Jane Oliveira 👩‍💻

🚀 Data Engineer | AWS & GCP | SQL Performance | Data Architecture


🚀 Sobre mim

Sou Engenheira de Dados com experiência prática construindo pipelines escaláveis e otimizados para grandes volumes de dados (bilhões de eventos/mês), atuando principalmente com dados de marketing e comportamento (GA4).

Tenho forte foco em:

  • 🔹 Performance e otimização de queries SQL
  • 🔹 Arquitetura de dados (Data Mesh, SOR/SOT)
  • 🔹 Integração entre clouds (GCP → AWS)
  • 🔹 Transformar dados em valor para negócio

Acredito que dados só fazem sentido quando geram impacto real, e é nisso que eu foco todos os dias.


🧠 O que eu faço hoje

Atualmente atuo como Data Engineer na DP6, trabalhando com:

  • ⚡ Processamento de grandes volumes de dados (Athena, EMR, Spark)
  • ☁️ Arquiteturas em AWS e GCP
  • 📊 Dados de comportamento (GA4, campanhas, CRM)
  • 🔄 Pipelines de ingestão e transformação (Glue, Lambda, BigQuery)
  • 📈 Otimização de queries com ganhos relevantes de custo e tempo

🏆 Destaques de impacto

  • 🚀 Redução de ~67% de custo em pipelines EMR
  • ⚡ Otimização de queries com ganhos de até 80%+ de performance
  • 📉 Correção de pipelines críticos que estavam com timeout em alto volume de dados
  • 🔄 Reestruturação de ETLs, reduzindo dezenas de fluxos em poucos pipelines escaláveis

🛠️ Stack principal

Cloud & Data

  • AWS (Athena, S3, Glue, EMR, Lambda, Step Functions)
  • GCP (BigQuery, GCS)

Processamento

  • PySpark
  • SQL avançado (foco em performance)

Outros

  • Terraform
  • GitHub Actions (CI/CD)
  • Data Mesh concepts

📚 Formação

  • 🎓 Pós-graduação em Inteligência Artificial - Unimontes (Em Andamento)
  • 🎓 Pós-graduação em Engenharia de Dados — PUC Minas
  • 🎓 Bacharel em Ciência e Tecnologia — UFVJM
  • 🎓 Engenharia Física — UFVJM

🔬 Projetos & Pesquisa

📌 Machine Learning aplicado a crédito

  • Desenvolvimento de modelos para classificação de inadimplência
  • Comparação de algoritmos e métricas de performance

📌 Clustering & segmentação de clientes

  • Implementação de algoritmos do zero (K-Means, DBSCAN, EM, etc.)
  • Uso de múltiplas métricas de distância (incluindo JSD e Mahalanobis)

💬 Vamos conversar?

Gosto de trocar ideia sobre:

  • Engenharia de Dados
  • Arquitetura de dados
  • SQL e performance
  • Carreira em dados

📩 Me chama no LinkedIn 🙂

Pinned Loading

  1. mini-curso-clustering-unimontes mini-curso-clustering-unimontes Public

    Repositório criado para armazenar conteúdo ministrado no minicurso de Clustering no evento Escola de verão 2025 - Unimontes

    Jupyter Notebook

  2. ML-Perceptron ML-Perceptron Public

    O Perceptron é um algoritmo de aprendizado de máquina supervisionado que é usado para classificar dados em duas classes.

    Jupyter Notebook

  3. DataScience_BayesIngenuo DataScience_BayesIngenuo Public

    Implementação em Python do algoritmo Bayes ingênuo.

    Jupyter Notebook

  4. Exercicios_Monitoria_linguagemC_lista3 Exercicios_Monitoria_linguagemC_lista3 Public

    Exercicios iniciais da disciplina Linguagem e Programação, do curso ciência e tecnologia da UFVJM, exercicios elaborados em linguagem C

  5. BigQuery-SQL-sheet-sheet BigQuery-SQL-sheet-sheet Public

    Variados codigos, comandos sql para o Big Query (GCP)

    Python

  6. clustering-client-segmentation-tcc clustering-client-segmentation-tcc Public

    Explorar algoritmos de clusterização para agrupar clientes de forma significativa, permitindo a criação de estratégias de marketing mais assertivas e baseadas em dados reais.

    Jupyter Notebook 1