E

Skill Entry

Error budget policy for service reliability

Implementa la práctica SRE de Google que vincula la velocidad de producto con la fiabilidad medida: define un service-level objective (SLO), deriva un presupuesto de errores a partir de la indisponibilidad o eventos malos permitidos, y gobierna lanzamientos según el presupuesto restante. Esta skill operativiza la política de error budget del SRE Workbook para cuantificar trade-offs en lugar de discutir la fiabilidad solo por anecdótica.

Categoría Operaciones
Plataforma Any engineering org
Fecha de publicación 2026-05-11
sresloreliability

Casos de uso

  • Decidir congelar releases arriesgadas tras incidentes repetidos
  • Negociar calendario de lanzamiento entre producto e infraestructura
  • Priorizar endurecimiento cuando los errores visibles consumen presupuesto rápido
  • Explicar por qué una feature espera hasta recuperar presupuesto
  • Definir metas trimestrales alineadas con expectativas de clientes

Funciones principales

  • Elegir SLIs de journeys reales (latencia, éxito, frescura), no solo métricas vanidosas
  • Fijar SLO y calcular error budget como 100% menos el SLO en una ventana móvil
  • Definir acciones por umbrales: endurecer cambios, parar lanzamientos o imponer fixits
  • Instrumentar burn rate para reaccionar antes de agotar el presupuesto
  • Revisar la política trimestralmente cuando promesa de producto o arquitectura cambien

Relacionados

Relacionados

3 Entradas indexadas