Trayectoria profesional

Experiencia

Trayectoria enfocada en SRE, Observabilidad e Infraestructura. Desde desarrollo backend hasta Ingeniería Cloud a escala.

Sept 2025 - Actualidad

IC4 - Sr Observability Infrastructure Engineer

Spin · Remote

Como Sr Observability Infrastructure Engineer mi rol se enfoca en escalar la visibilidad de los sistemas para toda la compañía. Colaboro en la gestión y administración de múltiples tenants de Datadog, plataforma crítica utilizada por más de 1000 colaboradores para la visualización integral de logs, métricas, trazas y eventos. Esta responsabilidad incluye la gestión estratégica de más de 6000 monitores productivos a través de cuatro unidades de negocio, asegurando que la identificación y generación de alertas críticas sea prioritaria. Mi valor reside en traducir la Observabilidad técnica en impacto de negocio: impulso la generación de métricas custom con un fuerte enfoque en la operación de cara al cliente final. Además, colaboro activamente en la creación de dashboards operativos a nivel de infraestructura y de negocio. Para la gestión de incidentes, administro y optimizo las políticas de escalación y enrutamiento de alertas, garantizando la eficiencia del proceso al integrarlas con Jira Service Management (ITSM).

Responsabilidades y Logros:

  • Gestión multi-tenant de alertas (+1200 usuarios, +6000 monitores)
  • Reduccion en un 60% de alertas falsos positivos mediante la calibración de monitores
  • Generación de métricas de negocio custom basadas en logs y trazas, generación de dashboards operativos
  • Implementación de un modelo de Gobierno de Alertas como Código mediante Terraform. Centralicé la configuración de routing rules, schedules y políticas de escalación para más de 50 equipos distribuidos en 5 unidades de negocio, logrando la federación de roles y eliminando la configuración manual de la plataforma.
  • Optimización de políticas de escalación y enrutamiento en Jira Service Management. Categorización de alertas basada en Golden Metrics (Requests, Errores, Latencia) para alinear la respuesta operativa con el impacto real en la experiencia de usuario.
DatadogJira Service ManagementOpenTelemetryCloudWatchPrometheus

Jan 2024 - Sept 2025

IC3 - Site Reliability Engineer

Spin · Remote

Como Site Reliability Engineer trabaje en la respuesta ante incidentes críticos, coordinando equipos multidisciplinarios y aplicando marcos ITIL para optimizar los procesos de escalamiento, documentación y comunicación. Colabore con los Incident Managers para mejorar la priorización de alertas, afinar los procesos de post-mortem y asegurar la integración de herramientas de monitoreo en los flujos de trabajo de incidentes. Realice análisis de causa raíz para identificar problemas recurrentes y propongo mejoras arquitectónicas como circuit breakers, rate limits y estrategias de caché, con el fin de aumentar la resiliencia del sistema. Trabaje en conjunto con los equipos de desarrollo para incorporar prácticas SRE en toda la organización, como la propiedad de servicios, rotaciones de guardias y revisiones de confiabilidad. Contribuí a que los equipos de producto cuenten con la autonomía y visibilidad necesarias para asumir la responsabilidad directa sobre la salud, latencia y disponibilidad de sus servicios.

Responsabilidades y Logros:

  • Atención a incidentes críticos en esquema de rotacion OnCall
  • Generacion de monitores de alertas para equipos de desarrollo como de operaciones
  • Confeccion de post-mortems y análisis de causa raíz
  • Seguimiento de problemas recurrentes y propuesta de mejoras arquitectónicas
  • Seguimiento de SLA con proveedores de servicios
AWSKubernetesTerraformArgoCDArgo RolloutsHelm ChartsLinkerdJira Service ManagementDatadog

Jun 2022 - Jan 2024

Infrastructure Engineer

Ventura TRAVEL · Remote

Lideré la regeneración completa de la infraestructura en Google Cloud Platform, diseñando desde cero y desplegando con Terraform componentes críticos como clusters de Kubernetes, buckets de Cloud Storage y networking cloud (VPCs, subredes, firewall). Este proyecto mejoró significativamente la estabilidad y fiabilidad de los sistemas, estableciendo una base sólida y escalable para los entornos de producción.

Responsabilidades y Logros:

  • Reducción del 75% en costos de infraestructura Cloud en GCP
  • Diseño de una estrategia de ejecución de Pipelines sobre instancias Spot en GKE, logrando una reducción del 50% en tiempos de ejecución y duplicando la cantidad de despliegues diarios
  • Disminución del MTTA un -75% y MTTR un -50% gracias al despliegue de un stack de observabilidad (Prometheus, Loki, Grafana) con cobertura de alertas en el 100% de los microservicios.
  • Consolidación del gobierno de infraestructura mediante Terraform con estrategias de FinOps para el control de presupuesto cloud.
Google Cloud PlatformKubernetesTerraformGrafanaPrometheusLokiGitLab CIArgoCDTraefikCloudflare

2021

DevOps Engineer

Time Jobs · Chile (Remote)

Participe en la transformación estratégica de la infraestructura cloud, ejecutando la migración completa de la operación de la empresa desde AWS a Google Cloud Platform (GCP). Este proyecto garantizó la continuidad del negocio y sentó las bases para una arquitectura escalable y eficiente en costos, mediante el diseño e implementación de una estrategia GitOps completa. Utilizamos Terraform para el aprovisionamiento de infraestructura (IaC) y ArgoCD para la automatización del despliegue de microservicios, estandarizando los flujos de trabajo en toda la organización.

Responsabilidades y Logros:

  • Migracion completa de AWS a GCP sin interrupcion operativa
  • Desarrollo de librería privadas para la generación de spans y atributos personalizados de OpenTelemetryu, elevando la calidad de la observabilidad y acelerando el diagnóstico de problemas complejos.
  • Implementación de una estrategia de despliegue declarativa utilizando Terraform y ArgoCD, logrando unificar y automatizar el ciclo de vida de la infraestructura y los microservicios en toda la organización.
AWSGCPGitLabTerraformArgoCDOpenTelemetryPrometheusGrafanaLokiGitLab CITraefikCloudflare

2021

Backend Roles

Varios · Remote

Experiencia en desarrollo backend con NodeJs.

Responsabilidades y Logros:

  • Desarrollo de microservicios con NodeJs y TypeScript
Node.jsTypeScriptMongoDBNestJSPostgreSQLDocker