Job Url: https://jobs.acid.cl/apply/6YKNsQdqkV/RetailTech-Site-Reliability-Engineering Job Description: (Retail-Tech) Site Reliability Engineering Multiple Countries Tiempo completo Acid Labs es una firma de diseño y desarrollo de software end to end. Ejecutamos un proceso ágil estandarizado pero flexible, centrado en la calidad y la comunicación. Nos centramos en la creación de productos web y móviles increíbles, hemos estado involucrados en el desarrollo web y móvil desde 2006, convirtiéndonos en socios sólidos para nuestros clientes . Nos especializamos en crear nuevos productos a partir de un proceso UX / UI, desarrollando proyectos desde cero y también sobre proyectos ya creados, trabajando solo o como equipo para mejorias. Somos expertos en software de venta minorista, comercio electrónico a medida y empresarial, aprovechamos las configuraciones de CRM y escalamos las ventas a través del diseño y la tecnología. ¡Nos encontramos en búsqueda de Site Reliability Engineering! Responsabilidades Implementar y mantener sistemas de monitorización, alertas y trazabilidad. Automatizar tareas operativas repetitivas mediante scripts y herramientas de orquestación. Gestionar infraestructura utilizando enfoques declarativos con herramientas de IaC como Terraform. Colaborar con la resolución de incidentes críticos, con foco en reducir el MTTR y preservar la estabilidad del negocio. Colaborar estrechamente con equipos de desarrollo para fortalecer la confiabilidad y escalabilidad de los servicios. Diseñar, implementar y mantener SLOs/SLIs que alineen la operación con los objetivos del negocio. Requisitos  Experiencia en Kubernetes (autoscaling, deployments, network policies, etc.). Experiencia con lenguajes como Python, Golang, Java o Node.js. Conocimientos en patrones de diseño para soluciones resilientes y ejecución de pruebas de carga en entornos controlados. Conocimiento profundo de AWS, y deseable experiencia adicional en otros cloud providers (GCP, Azure). Dominio de infraestructura como código con Terraform. Conocimiento en redes, seguridad, y troubleshooting de infraestructura distribuida. Experiencia en automatización de procesos operativos. Buen manejo de herramientas de observabilidad como Prometheus, Grafana, New Relic, o similares. Experiencia administrando bases de datos SQL y NoSQL en ambientes productivos. Mejor si tienes  Deseable experiencia en pipelines CI/CD con GitHub Actions o GitLab CI/CD.