Informações
Quer fazer a diferença na nova economia e transformar pessoas e negócios para prosperarem? Vem pra Cadastra!
Como Engenheiro de Machine Learning, você vai atuar no desenvolvimento de frameworks e ferramentas de LLM para suportar o crescimento acelerado de um dos nossos clientes. Você vai atuar no desenvolvimento e orientar o time nas melhoras práticas de mercado, com objetivo de fornecer dados de maneira sustentável, escalonável e com segurança. Sua atuação vai ser cross com vários times da área de dados.
Continua apos o anúncio
O que a Cadastra espera de você:
- Graduação ou especialização em Ciência da Computação, Engenharia, Matemática, Estatística ou áreas relacionadas;
- Domínio no uso de modelos como GPT, BERT, T5 ou similares, e na aplicação de Retrieval-Augmented Generation;
- Experiência prática com tecnologias como Vector Search, Pinecone, Weaviate, Milvus para gerenciamento de embeddings;
- Proficiência em Python (Hugging Face, LangChain, PyTorch, TensorFlow) e experiência com ferramentas de MLOps (MLflow, Kubeflow, Vertex AI);
- Habilidade para processar grandes volumes de dados textuais, realizar indexações eficientes e implementar fluxos de ETL;
- Forte capacidade analítica para identificar desafios técnicos e propor soluções que gerem valor direto para os negócios;
- Competência em comunicação, colaboração e organização, com capacidade de trabalhar em equipes multidisciplinares e comunicar conceitos técnicos a públicos diversos;
Continua apos o anúncio
Diferenciais:
- Experiência em sistemas distribuídos de treinamento e inferência para LLMs;
- Familiaridade com APIs e integrações para modelos baseados em IA (e.g., OpenAI API, Hugging Face Hub, Anthropic);
- Vivência em design de sistemas de busca e recuperação de informações;
- Conhecimento em otimização de desempenho e custos para modelos RAG em produção;
- Interesse em questões éticas e práticas de mitigação de viés em IA;
- Contribuições para projetos open-source relacionados a IA, RAG ou bancos de dados vetoriais.
Continua apos o anúncio
No nosso Data Hub você terá o desafio de:
- Projetar e implementar sistemas baseados em LLMs, integrando Retrieval-Augmented Generation (RAG) e bancos de dados vetoriais para melhorar a recuperação de informações e personalização de respostas;
- Criar pipelines robustos e automatizados para treinamento, ajuste fino (fine-tuning) e deployment de modelos em produção, otimizando desempenho e custo;
- Desenvolver processos eficientes de ingestão, indexação e consulta de dados estruturados e não estruturados em bancos de dados vetoriais, como Vector Search, Pinecone, Weaviate ou Milvus;
- Ajustar e testar LLMs para tarefas específicas, utilizando embeddings customizados e técnicas avançadas de aprendizado transferido;
- Implementar estratégias inovadoras para recuperação eficiente de dados em fluxos RAG, otimizando latência e precisão;
- Desenvolver métricas e ferramentas para monitorar a performance de modelos em produção, detectando drifts e garantindo confiabilidade;
- Projetar soluções alinhadas a padrões éticos, regulamentações de privacidade e segurança de dados;
- Criar documentação técnica clara e prática para facilitar o compartilhamento de conhecimento e a escalabilidade do trabalho;
- Trabalhar de forma integrada com equipes multidisciplinares (engenharia, produto, ciência de dados) para alinhar soluções de IA aos objetivos de negócio;
Continua apos o anúncio
O que oferecemos:
Vale alimentação e refeição no cartão FLASH🥗
Auxílio Home Office no cartão FLASH 💳
Plano de saúde de acordo com a sua localidade 🩺
Plano odontológico de acordo com a sua localidade 🦷
Day off de aniversário + valor depositado no cartão FLASH🎉
Licença-maternidade e paternidade estendida 🍼
Participação nos lucros (PLR) 💰
Seguro de vida 🧡
Auxílio creche 👶
Continua apos o anúncio
Bônus por indicação 💰
Vale-transporte 🚍
Clude | Plataforma de Saúde 🩺
Total Pass 🏋🏽♀️
CRM Bônus 💸