AI Engineer (Sênior) — Agentes, Plataforma & RAG

A Leega é uma empresa focada no atendimento eficiente e inovador em seus clientes.

Isso não poderia ser diferente com o nosso principal combustível: as pessoas!

Nossa cultura é inspiradora e nossos valores estão presentes no dia a dia: ética e transparência, excelência de qualidade, trabalho em equipe, responsabilidade econômica, social e ambiental, relações humanas e credibilidade.

Buscamos profissionais inovadores que sejam movidos por desafios e focados em resultados.

Se você busca uma empresa dinâmica e parceira e que investe em seus colaboradores através de capacitação constante, a Leega é o lugar para você!

>> A LEEGA É PARA TODOS, ficaremos muito felizes em ter você em nosso time. Venha fazer parte da nossa história e da construção do nosso futuro.

Cadastre-se agora mesmo em nossas vagas!

Responsabilidades e atribuições

Sobre a oportunidade

Você vai construir a plataforma de agentes de IA da Guanabara e o ecossistema que distribui IA generativa governada à companhia. O princípio que rege tudo: a inteligência vem do modelo, mas a confiança vem da estrutura em volta dele — por isso o coração do sistema é uma camada semântica determinística (Cube.js) que impede o modelo de inventar números, somada a verificação e governança de ponta a ponta.

Seus Desafios

Orquestração de agentes — construir agentes com LangGraph no padrão Supervisor/ReAct, com memória de curto/longo prazo e estado durável (PostgresSaver).
Camada semântica e RAG — evoluir a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking) que ancoram as respostas em dado real.
Skills, subagentes e MCP — criar e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em fluxo spec-driven, conectando agentes a sistemas corporativos.
Verificação e avaliação — manter o verificador (LLM-as-judge) e suítes de eval (offline/online) com amostragem de traces para pegar drift de qualidade.
Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider) otimizando custo e latência.
Adaptação e serving de modelos — quando RAG e prompting não bastam, fazer fine-tuning supervisionado e PEFT (LoRA/QLoRA), quantização e destilação; servir modelos abertos/privados com vLLM e roteamento SLM↔LLM.
Governança e segurança — aplicar guardrails de PII (Presidio), defesa contra prompt injection e observabilidade ponta a ponta (Langfuse).

Você atua na fronteira entre IA e negócio, colaborando com as áreas de dados, engenharia e as operações que consomem os agentes.

Requisitos e qualificações

Stack & Ferramentas

Agentes & estado: LangGraph, LangChain (Supervisor/ReAct), PostgresSaver
Modelos & gateway: LiteLLM (multi-provider, Bedrock), Hugging Face
Fine-tuning & serving: PEFT (LoRA/QLoRA), quantização, destilação, vLLM
RAG & busca: Qdrant, re-ranking; GraphRAG/Neo4j sob demanda
Conhecimento & tools: Cube.js (semantic layer), MCP/FastMCP, n8n
Governança & eval: Presidio, Langfuse, LLM-as-judge, OpenTelemetry
Harness & dev: Claude Code (skills, subagentes, CLAUDE.md), Python/FastAPI

O que Buscamos

Essenciais

Experiência construindo aplicações de IA generativa em produção (agentes ou RAG). • Python e design de APIs (FastAPI/FastMCP).
Frameworks de agentes (LangGraph, LangChain) e function calling estruturado (Pydantic).
RAG e vector databases (Qdrant ou similares).
Gateways/roteamento de LLMs (LiteLLM) e o Model Context Protocol (MCP).
Fine-tuning e adaptação de modelos: PEFT (LoRA/QLoRA), quantização e serving (vLLM).
Autoria de skills e agentes para o Claude Code — central nesta posição.

Diferenciais

Camadas semânticas (Cube.js) como fonte de recuperação determinística.
Fine-tuning avançado: instruction tuning, destilação, fine-tuning de embeddings e roteamento SLM↔LLM.
Guardrails de PII (Presidio) e defesa contra prompt injection.
Observabilidade e avaliação (Langfuse, LLM-as-judge, evals).
GraphRAG / Neo4j como evolução híbrida sob demanda.
Plataformas de automação (n8n) e integração com sistemas corporativos.

Informações adicionais

Trabalho Remoto
Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

Etapas do processo

Etapa 1: Cadastro
Etapa 2: Avaliação de Perfil
Etapa 3: Teste Coploy
Etapa 4: Entrevista Gestor
Etapa 5: Entrevista Cliente
Etapa 6: Contratação

Onde a inteligência humana amplifica o poder dos dados

Na Leega, não entregamos apenas linhas de código ou dashboards. Transformamos desafios tecnológicos complexos em impacto real. Com mais de 15 anos de estrada, unimos a profundidade da experiência humana à velocidade da Inteligência Artificial para criar soluções que mudam negócios e, acima de tudo, melhoram a vida das pessoas.

Somos uma consultoria de tecnologia, agnóstica e estratégica. Com escritórios no Brasil e na Europa, nosso time de mais de 580 talentos multidisciplinares vive e respira o ecossistema de Data Analytics, Cloud e IA. Dominamos a base, da Governança à Engenharia, para garantir que a tecnologia não seja apenas uma ferramenta, mas uma vantagem competitiva sustentável para os maiores players do mercado.

AI Engineer (Sênior) — Agentes, Plataforma & RAG

Responsabilidades e atribuições

Requisitos e qualificações

Informações adicionais

Etapas do processo

Onde a inteligência humana amplifica o poder dos dados

Trabalha ES

Site de Vagas de Empregos

Vagas em Vitória

Emprego Capixaba

Encontrar emprego rápido

Emprego em Vila Velha

Vaga de Emprego na Serra

Vaga de Emprego em Cariacica

Vagas de Empregos

Vagas no ES

maior site de vagas

site de vagas

emprego

Empregos

Emprego Capixaba

Vagas de Emprego em Vitória

vaga de emprego

trabalha

trabalhaes

trabalhaes.com.br

emprego no espírito santo

vaga de emprego rápido

site de vagas de emprego

buscar emprego

encontrar emprego

procurar emprego

Empregos Espírito Santo

Emprego Espirito Santo