Desafio:
Será responsável pela disponibilidade, capacidade e desempenho dos nossos serviços, sistemas, aplicações e infraestrutura. Deverá combinar as melhores práticas de desenvolvimento de software e operações visando garantir a previsibilidade, confiabilidade, observabilidade e evolução de todas as plataformas críticas de TI, de forma eficaz e eficiente, para suportar o forte crescimento da organização.
O que não pode faltar:
• Gerenciar um time em constante evolução, que busca por novas tecnologias e desafios a cada novo projeto;
• Participar da criação da área de SRE, definido padrões, ferramentas, processos e skills;
• Liderar o time de engenheiros de SRE Apps;
• Garantir a implementação da estratégia de SRE;
• Ser a referência em ações de confiabilidade e disponibilidade da plataforma digital;
• Implementar ferramentas para detectar e corrigir falhas proativamente;
• Atuar como consultor para os times de desenvolvimento, fornecendo orientações e boas práticas de ambientes, configuração, deploy, monitoramento e qualidade;
• Participar das discussões de arquitetura dos sistemas, garantindo aderência aos padrões de SRE.
• Mindset de "Automatize tudo"
• Experiência com ao menos uma nuvem pública como Google Cloud, Azure ou AWS;
• Sólida experiência em automação de infraestrutura e infraestrutura como código (IaC);
• Experiência de pelo menos 3 anos com sólido conhecimento em monitoramento e operações (banco de dados, middleware, Windows, Linux, rede).
• Domínio de testes de caos e carga, disaster recovery, Observabilidade, Post Mortens
• Sólida experiência com monitoramento;
• Familiaridade com metodologias ágeis dentro de uma cultura DevOps;
• Experiência com uso de Docker e/ou Kubernetes em ambientes produtivos;
• Experiência com a criação de módulos reutilizáveis e providers em ferramentas de infraestrutura como código tais como Terraform, Packer, Ansible, RunDeck e Puppet;
• Excelente comunicação escrita e verbal, e gosto por compartilhar conhecimento;
• Capacidade de atuar de forma autônoma e proativa, e aprender de forma autodidata.
• Sólidos conhecimentos em infraestrutura: sistemas operacionais, virtualização, redes, storage e containers;
• Sólidos conhecimentos em programação: Linguagens como Javascript, Nodejs, Python
• Pipelines usando CI/CD, Jenkins, Gitlab CI, Bitbucket CI
•Arquiteturas baseada em containers: Opernshift, OKD, Kubernetes, Docker, Docker Swarm
• Experiência com a plataforma Azure DevOps Pipelines, Nexus, GitLab;
• Conhecimentos em APM Dynatrace, New Relic ou APP Dynamics;
• Experiência prévia em cenários de transformação ágil, DevOps e SRE;
• Experiência com servidores Linux e Windows;
• Experiência com gerenciamento de logs, Elastic Stack (ELK) e/ou Splunk.
• Arquiteturas baseada em microservices
• Estratégias de logging, tracing, monitoramento e alarmes;
• Senso de dono e ser colaborativo(a) são características obrigatórias
O que melhoram suas chances?
• Desejável inglês avançado/ fluente
• Desejáveis certificações ITIL, SAFe e Six Sigma
• Experiência com ambientes sujeitos a compliance PCI e/ou SOX;
• Domínio de linguagens de programação e script como C# (framework .NET), Go, Python e Powershell;
• Experiência com uso da stack ELK;
• Experiência com Grafana e Prometheus;
• Atuação em migração de sistemas on premises para cloud native;
• Conhecimento em bancos de dados (MongoDB, Postgree);
• Conhecimento em Redis e outros mecanismos de cache.
Outras informações
Local de trabalho: Centro/RJ - Atuação remota devido pandemia e pós será estabelecido um modelo híbrido.
Horário: Tempo integral - Seg/Qui - 08h/18h, Sex 08h/17h
Informar a pretensão salarial!