Job Url: https://jobs.acid.cl/apply/6YKNsQdqkV/RetailTech-Site-Reliability-Engineering

Job Description: (Retail-Tech) Site Reliability Engineering
Multiple Countries
Tiempo completo
Acid Labs es una firma de diseño y desarrollo de software end to end. Ejecutamos un proceso ágil estandarizado pero flexible, centrado en la calidad y la comunicación. Nos centramos en la creación de productos web y móviles increíbles, hemos estado involucrados en el desarrollo web y móvil desde 2006, convirtiéndonos en socios sólidos para nuestros clientes . Nos especializamos en crear nuevos productos a partir de un proceso UX / UI, desarrollando proyectos desde cero y también sobre proyectos ya creados, trabajando solo o como equipo para mejorias. Somos expertos en software de venta minorista, comercio electrónico a medida y empresarial, aprovechamos las configuraciones de CRM y escalamos las ventas a través del diseño y la tecnología.

¡Nos encontramos en búsqueda de Site Reliability Engineering!

Responsabilidades

Implementar y mantener sistemas de monitorización, alertas y trazabilidad.
Automatizar tareas operativas repetitivas mediante scripts y herramientas de orquestación.
Gestionar infraestructura utilizando enfoques declarativos con herramientas de IaC como Terraform.
Colaborar con la resolución de incidentes críticos, con foco en reducir el MTTR y preservar la estabilidad del negocio.
Colaborar estrechamente con equipos de desarrollo para fortalecer la confiabilidad y escalabilidad de los servicios.
Diseñar, implementar y mantener SLOs/SLIs que alineen la operación con los objetivos del negocio.
Requisitos 

Experiencia en Kubernetes (autoscaling, deployments, network policies, etc.).
Experiencia con lenguajes como Python, Golang, Java o Node.js.
Conocimientos en patrones de diseño para soluciones resilientes y ejecución de pruebas de carga en entornos controlados.
Conocimiento profundo de AWS, y deseable experiencia adicional en otros cloud providers (GCP, Azure).
Dominio de infraestructura como código con Terraform.
Conocimiento en redes, seguridad, y troubleshooting de infraestructura distribuida.
Experiencia en automatización de procesos operativos.
Buen manejo de herramientas de observabilidad como Prometheus, Grafana, New Relic, o similares.
Experiencia administrando bases de datos SQL y NoSQL en ambientes productivos.
Mejor si tienes 

Deseable experiencia en pipelines CI/CD con GitHub Actions o GitLab CI/CD.