Pular para o conteúdo principal

Engenheiro de Dados Sênior

Tipo de vaga: Efetivo

Modelo de trabalho: Presencial

Vaga também para PcD

Descrição da vaga

Estamos selecionando profissionais para a equipe de Produção de Dados do Centro de Integração de Dados e Conhecimentos para Saúde (CIDACS) do IGM-FIOCRUZ, no Parque Tecnológico da Bahia, para suporte às pesquisas. Os nossos novos membros participarão de atividades como: manipulação, transformação, vinculação entre bases de dados e extração de datasets para pesquisa.

Responsabilidades e atribuições

Estas serão suas atividades e desafios

  • Automação de pipelines de dados em ambiente On-Premises para Big Data;
  • Apoiar o desenvolvimento de pipelines de dados em linguagem adequada;
  • Auxiliar na elaboração e desenvolvimento de soluções relacionadas à produção de dados (ETL);
  • Realizar a integração de dados com utilização de métodos determinísticos e não determinísticos;
  • Auxiliar as atividades de manipulação, transformação, vinculação entre bases de dados e extração de datasets para pesquisa;
  • Sugerir e implementar novas tecnologias nas atividades de produção de dados;
  • Participar de reuniões e sessões técnicos-científicas;
  • Elaborar e apresentar relatórios técnicos periódicos;
  • Auxiliar a equipe em questões relacionadas à produção de dados .

Requisitos e qualificações

O que você precisa conhecer para se candidatar:

  • Graduação em Ciência da Computação, Informática, Engenharia ou áreas correlatas;
  • Experiência com ferramentas de processamento de Big Data:
  • Spark e PySpark
  • Elasticsearch
  • Experiência com linguagem de programação Python e bibliotecas de manipulação de dados;
  • Experiência com ETL de grande volume de dados (Big Data);
  • Experiência com sistema operacional Linux;
  • Proficiência em bash e shell script;
  • Sólidos conhecimento de processamento paralelo e distribuído;
  •  Sólidos conhecimento de banco de dados relacionais e SQL;
  • Proficiência em sistemas de controle de versão (Git);
  • Conhecimentos de DataOps;
  • Ter boa comunicação;
  • Capacidade de aprender e transmitir o conhecimento;
  • Capacidade em lidar com time multidisciplinar;
  •  Inglês intermediário (leitura).

O que gostaríamos que você soubesse *:

Esses são requisitos diferenciais, portanto não é preciso tê-los para se candidatar, mas é importante ter disposição para desenvolver essas habilidades.

  • Experiência com ferramentas de orquestração de processos:
  • Airflow
  • KubeFlow
  • Experiência com tecnologias de containers;
  • Experiência com banco de dados não-estruturados (NoSQL) para ambientes Big Data;
  • Experiência com ferramentas de DataOps;
  • Experiência e conhecimento de bases de dados de saúde;
  • Conhecimentos em análises estatísticas de dados;
  • Formação acadêmica e cursos de formação em Ciência de Dados;
  •  Inglês intermediário (leitura, escrita e fala).

Informações adicionais

É necessário que o profissional tenha experiência comprovada na área de Engenharia / Ciência de Dados

A Missão

📍O Cidacs conduz estudos e pesquisas baseados em projetos interdisciplinares originados na vinculação de grandes volumes de dados para ampliar o entendimento dos determinantes e das políticas sociais e ambientais sobre a saúde da população. 📍



?