Se você tem paixão por inovação e busca trabalhar em um ambiente ágil, colaborativo e desafiador, esta pode ser a sua oportunidade!

O time de Cloud do Confidencial (Apenas para Cadastrados) está buscando uma pessoa para liderar o time de Site Reliability Engineering (SRE), sendo responsável por construir e evoluir a cultura de confiabilidade da nossa plataforma. Você será peça-chave na estruturação deste time, liderando especialistas em observabilidade, gerenciamento de incidentes e práticas de SRE.

Como SRE Lead, você combinará excelência técnica com liderança de pessoas, sendo responsável pela estratégia de observabilidade, definição de SLIs/SLOs, gestão de incidentes e redução de toil. Sua atuação garantirá que nossos times tenham visibilidade completa da plataforma e possam tomar decisões rápidas e assertivas.

Qualidade e confiabilidade são fundamentais para atender mais de 230 mil clientes! Se você compartilha dessa visão e quer construir um time de SRE de referência, junte-se ao nosso time!

Reside fora de Joinville? Sem problemas! Esta oportunidade está aberta para trabalho remoto/home office.

Responsabilidades e atribuições

Liderança e Gestão de Pessoas

Liderar, desenvolver e reter o time de SRE, promovendo alta performance, colaboração e aprendizado contínuo;
Conduzir contratação, onboarding, feedbacks, PDIs e avaliações de desempenho;
Definir estratégia e roadmap do time de SRE, alinhado aos objetivos de Cloud e do negócio;
Disseminar a cultura de SRE e observabilidade, atuando como referência para Engenharia;
Gerenciar prioridades, capacidade e trade-offs do time, garantindo entregas com qualidade;
Alinhar iniciativas com lideranças de Cloud Engineering, Platform Engineering e Cloud Security;
Reportar métricas, riscos e evolução do time para a liderança de Cloud.

Observabilidade e Confiabilidade

Definir e liderar a estratégia de observabilidade (métricas, logs e traces);
Evoluir a plataforma de observabilidade (Prometheus, Grafana, OpenTelemetry, Loki, Tempo);
Estabelecer e governar SLIs, SLOs e Error Budgets para serviços críticos;
Definir padrões de instrumentação para aplicações e infraestrutura, impulsionando adoção pelos times;
Implementar estratégia de alertas acionáveis, reduzindo ruído;
Planejar e executar gestão de capacidade baseada em métricas;
Otimizar custos e performance das soluções de observabilidade em escala.

Gestão de Incidentes e Melhoria Contínua

Estruturar e liderar o processo de gestão de incidentes (escalação, war room e comunicação);
Garantir post-mortems blameless e acompanhar ações corretivas;
Identificar recorrências e propor melhorias sistêmicas baseadas em dados;
Liderar redução de toil com automações operacionais;
Manter documentação operacional (runbooks, procedimentos e arquiteturas) atualizada e acessível.

Requisitos e qualificações

Experiência em liderança de times técnicos (SRE, DevOps, Cloud Engineering);
Experiência em práticas de SRE, incluindo SLIs, SLOs, Error Budgets e Toil Reduction;
Experiência com APM tools (Datadog, New Relic, Dynatrace);
Conhecimento em observabilidade e telemetria (métricas, logs, traces), com Prometheus e OpenTelemetry (Grafana);
Experiência prática com Infraestrutura como Código (AWS CDK, Terraform);
Proficiência em linguagens de scripting (Python, Bash) e pelo menos uma linguagem de programação (Go, Java);
Experiência com soluções de logging e tracing em escala (Loki, Tempo, Jaeger, ELK Stack);
Experiência com Cloud, preferencialmente AWS;
Experiência com containers (Docker) e orquestração (Kubernetes, ECS);
Experiência em gerenciamento de incidentes e post-mortem;
Entendimento de sistemas Linux e suas ferramentas de diagnóstico;
Inglês técnico (leitura e escrita).

Informações adicionais

Diferenciais

Certificações AWS (DevOps Engineer, Solutions Architect);
Experiência em fintechs ou ambientes regulados (PCI-DSS, LGPD, SOC 2);
Experiência com FinOps e otimização de custos em cloud;
Experiência com Grafana Mimir ou Thanos para métricas em escala;
Experiência com Chaos Engineering e testes de resiliência;
Conhecimento em Machine Learning aplicado a AIOps e detecção de anomalias;
Conhecimento aprofundado em redes e protocolos (TCP/IP, DNS, HTTP/S);
Proficiência com Git, GitHub e GitFlow;
Vivência prática com metodologias ágeis (Scrum, Kanban);
Experiência com bancos de dados relacionais (PostgreSQL, MySQL) e NoSQL (MongoDB, DynamoDB, Redis).

Modelo de Trabalho

Carga horária flexível de 8h por dia (segunda a sexta);
Contratação CLT.

Etapas do processo

Etapa 1: Cadastro
Etapa 2: Aguarde as próximas etapas!
Etapa 3: Entrevista Comportamental
Etapa 4: Análise Reputacional e de Conflitos
Etapa 5: Entrevista Técnica
Etapa 6: Carta Proposta
Etapa 7: Contratação

NÓS QUEREMOS MUDAR O MUNDO E COMEÇAMOS POR AQUI! VOCÊ VEM COM A GENTE?

Somos uma Fintech, Instituição de Pagamento credenciada pelo Banco Central do Brasil e temos como propósito maximizar a produtividade das empresas através da tecnologia. Oferecemos uma solução completa para gestão de cobranças, pagamentos, antecipações de recebíveis e atendemos mais de 200 mil clientes divididos entre profissionais autônomos, microempreendedores individuais (MEI) e grandes empresas.

Nosso sonho começou em 2010, em Joinville/SC e acreditamos que o céu não é o limite para o nosso crescimento. Não é à toa que atualmente nosso time está em vários cantos do Brasil! Mais de 1.000 pessoas sonham junto com o Confidencial (Apenas para Cadastrados), de forma colaborativa, inovadora, eficiente, com autonomia e liberdade para voar alto.

Voos altos exigem recursos para viver e trabalhar melhor, além de liberdade para administrá-los. Por isso, acolhemos e cuidamos do nosso time oferecendo benefícios que apoiam seu crescimento pessoal e profissional:

Para saúde e bem-estar: temos assistência médica e odontológica sem coparticipação, seguro de vida, auxílio para compra de medicamentos e para realizar atividades físicas. Além disso, a Neon é nossa parceira para cuidar da saúde financeira do time e a Zenklub para a saúde física e mental (oferecemos 4 sessões mensais de terapia ou nutricionista gratuitas). Na sede, também temos quick massage.

Para alimentação e família: nosso benefício alimentação é flexível, por meio de um cartão de crédito, bandeira Visa. O saldo pode ser usado como cada um desejar. Na sede, temos free food e, para as famílias, oferecemos auxílio creche, programa de apoio parental e licença maternidade e paternidade estendida.

Para educação e crescimento: além de um ambiente de desafios e muito desenvolvimento, temos uma plataforma de treinamentos in company e disponibilizamos auxílio educação que subsidia 70% de mensalidades de graduações e idiomas, bem como a compra de cursos e livros, para que nosso time nunca pare de aprender.

Para o trabalho remoto de qualidade: oferecemos auxílio Home Office, equipamentos de trabalho, auxílio mobília e temos parceria com a WOBA, para os nossos colaboradores usarem coworkings em todo o Brasil quando desejarem. Conheça nossa sede, em Joinville/SC, nesse tour virtual!

Extras, porque o Dream Team merece: temos Day Off no mês do aniversário, auxílio Happy Hour, bonificação por indicação de novos colaboradores, bonificação baseada em metas anuais, plano de Stock Options e um ambiente leve, no dress code!

Site Reliability Engineer (SRE) Lead - Observabilidade

Responsabilidades e atribuições

Requisitos e qualificações

Informações adicionais

Etapas do processo

NÓS QUEREMOS MUDAR O MUNDO E COMEÇAMOS POR AQUI! VOCÊ VEM COM A GENTE?

Trabalha ES

Site de Vagas de Empregos

Vagas em Vitória

Emprego Capixaba

Encontrar emprego rápido

Emprego em Vila Velha

Vaga de Emprego na Serra

Vaga de Emprego em Cariacica

Vagas de Empregos

Vagas no ES

maior site de vagas

site de vagas

emprego

Empregos

Emprego Capixaba

Vagas de Emprego em Vitória

vaga de emprego

trabalha

trabalhaes

trabalhaes.com.br

emprego no espírito santo

vaga de emprego rápido

site de vagas de emprego

buscar emprego

encontrar emprego

procurar emprego

Empregos Espírito Santo

Emprego Espirito Santo