Estamos en búsqueda de un/a Ingeniero/a SRE senior para potencialmente sumarse a un proyecto de consultoría. El rol tendrá como objetivo fortalecer la confiabilidad, estabilidad y resiliencia de los sistemas críticos, guiando el diseño e implementación de un modelo operativo SRE basado en las prácticas de Google y el marco CALMS. Responsabilidades principales: Diseñar y adaptar el modelo operativo SRE al contexto de la organización. Relevar flujos críticos, dependencias y puntos de falla en sistemas clave. Definir y mantener el catálogo de servicios SRE (incidentes, postmortems, observabilidad, capacity planning, error budgets). Estandarizar procesos de despliegue y cambios en entornos multicloud (AWS, OCI, otros). Integrar métricas técnicas con impacto de negocio. Colaborar con equipos de consultoría, calidad y change management para asegurar una implementación transversal y sostenible. Impulsar la adopción cultural de prácticas de confiabilidad mediante comunicación, capacitación y gestión del conocimiento. Acompañar la ejecución de postmortems y planes de mejora continua. Apoyar la capacitación práctica de equipos de monitoreo y soporte. +5 años en roles de SRE o confiabilidad en entornos críticos (idealmente banca/finanzas). Experiencia en gestión de incidentes de alta criticidad y definición de procesos de estabilidad. Conocimiento profundo en observabilidad (Dynatrace, Prometheus, OpenTelemetry, etc.) y correlación de métricas. Experiencia en automatización de despliegues, pruebas de regresión y frameworks CI/CD. Capacidad demostrada de traducir métricas técnicas en impacto de negocio y de liderar procesos de cambio cultural hacia la confiabilidad. Capacidad para entender el negocio del cliente y lo traducirlo en decisiones de SRE. Capacidad para generar documentación clara y ejecutiva (mapas de arquitectura, modelos de equipo, roadmaps, etc.). Excelente comunicación para interactuar con perfiles técnicos y no técnicos. Certificaciones deseables (al menos 2 de ellas): Architect Professional (opcional, por presencia de OCI en el entorno). SRE Practitioner (para reforzar el marco cultural y de procesos). Si te interesa el desafío y cumplís con los requisitos, no dudes en postularte a fin de que podamos contactarte para compartirte más detalles. ¡Gracias y te esperamos! #J-18808-Ljbffr
Site Reliability Engineer
CONFIDENCIAL
mexico, mexico
Publicado hace 7 días
Denunciar empleo