Engenheiro de Dados Sênior
Tipo de vaga: Efetivo
Modelo de trabalho: Presencial
Vaga também para PcD
Descrição da vaga
Estamos selecionando profissionais para a equipe de Produção de Dados do Centro de Integração de Dados e Conhecimentos para Saúde (CIDACS) do IGM-FIOCRUZ, no Parque Tecnológico da Bahia, para suporte às pesquisas. Os nossos novos membros participarão de atividades como: manipulação, transformação, vinculação entre bases de dados e extração de datasets para pesquisa.
Responsabilidades e atribuições
Estas serão suas atividades e desafios
- Automação de pipelines de dados em ambiente On-Premises para Big Data;
- Apoiar o desenvolvimento de pipelines de dados em linguagem adequada;
- Auxiliar na elaboração e desenvolvimento de soluções relacionadas à produção de dados (ETL);
- Realizar a integração de dados com utilização de métodos determinísticos e não determinísticos;
- Auxiliar as atividades de manipulação, transformação, vinculação entre bases de dados e extração de datasets para pesquisa;
- Sugerir e implementar novas tecnologias nas atividades de produção de dados;
- Participar de reuniões e sessões técnicos-científicas;
- Elaborar e apresentar relatórios técnicos periódicos;
- Auxiliar a equipe em questões relacionadas à produção de dados .
Requisitos e qualificações
O que você precisa conhecer para se candidatar:
- Graduação em Ciência da Computação, Informática, Engenharia ou áreas correlatas;
- Experiência com ferramentas de processamento de Big Data:
- Spark e PySpark
- Elasticsearch
- Experiência com linguagem de programação Python e bibliotecas de manipulação de dados;
- Experiência com ETL de grande volume de dados (Big Data);
- Experiência com sistema operacional Linux;
- Proficiência em bash e shell script;
- Sólidos conhecimento de processamento paralelo e distribuído;
- Sólidos conhecimento de banco de dados relacionais e SQL;
- Proficiência em sistemas de controle de versão (Git);
- Conhecimentos de DataOps;
- Ter boa comunicação;
- Capacidade de aprender e transmitir o conhecimento;
- Capacidade em lidar com time multidisciplinar;
- Inglês intermediário (leitura).
O que gostaríamos que você soubesse *:
Esses são requisitos diferenciais, portanto não é preciso tê-los para se candidatar, mas é importante ter disposição para desenvolver essas habilidades.
- Experiência com ferramentas de orquestração de processos:
- Airflow
- KubeFlow
- Experiência com tecnologias de containers;
- Experiência com banco de dados não-estruturados (NoSQL) para ambientes Big Data;
- Experiência com ferramentas de DataOps;
- Experiência e conhecimento de bases de dados de saúde;
- Conhecimentos em análises estatísticas de dados;
- Formação acadêmica e cursos de formação em Ciência de Dados;
- Inglês intermediário (leitura, escrita e fala).
Informações adicionais
É necessário que o profissional tenha experiência comprovada na área de Engenharia / Ciência de Dados
Etapas do processo
- Etapa 1: Cadastro
- Etapa 2: Avaliação Técnica de Perfil
- Etapa 3: Desafio Prático
- Etapa 4: Entrevista
- Etapa 5: Contratação
A Missão
📍O Cidacs conduz estudos e pesquisas baseados em projetos interdisciplinares originados na vinculação de grandes volumes de dados para ampliar o entendimento dos determinantes e das políticas sociais e ambientais sobre a saúde da população. 📍
Esta vaga foi pausada pela empresa.
Conheça mais sobre nós