Error budget policy drafting

Adapta el ejemplo de política de presupuesto de errores del workbook de Google en una guía repetible para ligar el ritmo de releases a la fiabilidad medida: define objetivos (proteger a usuarios de fallos repetidos de SLO preservando incentivos de innovación), detalla qué ocurre cuando la ventana móvil agota el presupuesto (congelar cambios salvo defectos urgentes o trabajo de seguridad), codifica umbrales de investigación por outage y documenta escalamiento cuando hay desacuerdo sobre el cálculo del presupuesto.

Categoría Operaciones

Plataforma Google SRE Workbook / Codex

Fecha de publicación 2026-05-13

reliabilityslopolicy

Casos de uso

El liderazgo pide reglas explícitas que conecten congelaciones de despliegue con mediciones objetivas de SLO
Los campeones de fiabilidad necesitan lenguaje compartido sobre por qué los freezes son barreras temporales, no castigos
Los revisores de incidentes deben decidir si un outage grande dispara postmortems obligatorios ligados a umbrales de presupuesto
Equipos de plataforma negociando dependencias quieren cláusulas para outages de otras organizaciones frente a defectos internos
Finanzas o producto escalan desacuerdos sobre si métricas mal clasificadas distorsionaron el consumo del presupuesto

Funciones principales

Documenta el alcance del servicio (binarios, clientes o datasets cubiertos) para alinear dónde aplican los presupuestos
Declara objetivos explícitos y no objetivos (la política no busca castigar)
Describe la ventana móvil de medición—el apéndice de Google usa cuatro semanas—y vincula criterios de pausa/reanudación al cumplimiento documentado del SLO
Enumera excepciones al freeze como defectos de máxima severidad o remediaciones de seguridad obligatorias
Añade cláusulas de outage como umbrales del workbook—por ejemplo postmortems obligatorios cuando un incidente consume más de una fracción definida del presupuesto—y especifica severidad de action items
Publica guía de escalamiento ante desacuerdos sobre cálculos del presupuesto o prioridades de remediación

Relacionados

3 Entradas indexadas

Example SLO document authoring

Operaciones

Operacionaliza el Apéndice A del libro de trabajo de Google SRE reinterpretando la carpeta ficticia del “Example Game Service” como checklist ejecutable: redactar el trabajo visible para usuarios; fijar ventanas móviles (ej. cuatro semanas); emparejar subsistemas con SLIs bien definidas (disponibilidad excluyendo 5xx, latencias con cortes ms, freshness de tablas derivadas, corrección vía probes, cobertura de pipelines); exponer texto num/denom; fundamentar redondeos; derivar presupuestos de error objetivo‑a‑objetivo y enlazar la política de presupuesto de errores correlativa.

AI economic benefit distribution readiness review

Operaciones

Convierte orientación de política pública y relaciones laborales sobre riqueza impulsada por IA en una lista para economías semiconductor-heavy: documentar si las ganancias llegan a bonos, dividendos públicos o reinversión; evaluar riesgo de concentración bursátil; preparar diálogo laboral recurrente. Cita reportajes CNBC sobre el viceprimer ministro surcoreano, huelga Samsung y rally Kospi liderado por fabricantes de chips.

Agentic coding vendor readiness review

Operaciones

Convierte guías de fiabilidad de plataforma y agentes de codificación multi-proveedor en una lista antes de estandarizar un stack de IA para código: inventariar SLAs del host SCM (incidentes en githubstatus.com), comparar agentes primarios/reserva (Copilot, Cursor, Claude Code, Codex), verificar observabilidad con Braintrust u otras trazas, y ensayar flujos cuando el host o la API del agente fallen. Cita páginas de estado y cambios de facturación públicos (p. ej. Copilot por uso en github.blog).

Casos de uso

Funciones principales

Relacionados

Example SLO document authoring

AI economic benefit distribution readiness review

Agentic coding vendor readiness review

Noticias relacionadas