Pular para o conteúdo principal

Engenheiro(a) de Dados Júnior – Produção de Dados para projetos em saúde pública

Descrição da vaga

A equipe de Produção de Dados suporta os processos de engenharia de dados que correspondem às necessidades das pesquisas realizadas no CIDACS, mapeando os requisitos e construindo fluxos adequados, visando garantir a eficiência, desempenho e qualidade no tratamento dos dados. Os membros da equipe são responsáveis pelas atividades de transformação dos dados, realizando a manipulação, tratamento, vinculação de bases de dados, análise de acurácia e construção de datasets para uso na pesquisa. 

Responsabilidades e atribuições

 

  • Colaborar no desenvolvimento de pipeline de dados em linguagem adequada;   
  • Colaborar na elaboração e desenvolvimento de soluções relacionadas à produção de dados (ETL) e à vinculação determinística e não-determinística entre bases de dados;   
  • Auxiliar as atividades de manipulação, tratamento, transformação, vinculação entre bases de dados, análise de acurácia e construção de datasets para pesquisa;  
  • Documentar processos do pipeline de tratamento e transformação dos dados de forma clara e detalhada;  
  • Participar de reuniões e sessões técnicos-científicas;   
  • Elaborar e apresentar relatórios técnicos periódicos.   

Requisitos e qualificações

  • Graduação plena ou tecnológica em Ciência da Computação, Engenharia da Computação, Engenharia de Software ou áreas correlatas;   
  • Conhecimento na linguagem de programação Python;   
  • Conhecimento em bibliotecas de manipulação/análise de dados (ex.: Pandas, PySpark); 
  • Noções de Linux e Bash;  
  • Noções de sistemas de controle de versão (Git);  
  • Boa comunicação e capacidade de trabalho em equipe multidisciplinar; 
  • Inglês técnico para leitura de documentação. 

Informações adicionais

  • Experiência no manejo de grandes volumes de dados; 
  • Conhecimento em Apache Spark;   
  • Conhecimento em análise estatística de dados;   
  • Conhecimento em estruturas de dados (filas, pilhas, listas, grafos etc.);   
  • Noções de Paralelismo e Distribuição;   
  • Noções de linguagem SQL;   
  • Vivência com projetos na área de Engenharia de Dados;   
  • Inglês intermediário (leitura, escrita e conversação). 

*Esses são requisitos diferenciais, portanto não é preciso tê-los para se candidatar, mas é importante ter disposição para desenvolver essas habilidades durante a bolsa!

Etapas do processo

  1. Etapa 1: Cadastro
  2. Etapa 2: Adequação perfil
  3. Etapa 3: Desafio
  4. Etapa 4: Entrevista
  5. Etapa 5: Contratação

A Missão

📍O Cidacs conduz estudos e pesquisas baseados em projetos interdisciplinares originados na vinculação de grandes volumes de dados para ampliar o entendimento dos determinantes e das políticas sociais e ambientais sobre a saúde da população. 📍