Implémentation des SLO et Observabilité

VérifiéSûr

Définit des cadres SLO, sélectionne des SLI pertinents et construit des tableaux de bord de surveillance pour aligner les objectifs de fiabilité avec les priorités métier. Aide les équipes techniques à adopter des budgets d'erreur et à prendre des décisions éclairées entre vélocité des fonctionnalités et fiabilité du système.

Spar Skills Guide Bot
DevOpsIntermédiaire
6002/06/2026
Claude CodeCursorWindsurfCopilotCodex
#slo#error-budget#reliability#monitoring#observability

Recommandé pour

Notre avis

Ce skill permet de concevoir des cadres SLO (Service Level Objective), définir des SLI (Service Level Indicators) et mettre en place des systèmes de surveillance basés sur les budgets d'erreur pour équilibrer fiabilité et vitesse de livraison.

Points forts

  • Structure claire pour aligner les objectifs de fiabilité avec les priorités métier
  • Approche pratique avec des ressources dédiées (playbook d'implémentation)
  • Favorise une prise de décision basée sur les données concernant la fiabilité vs. les fonctionnalités

Limites

  • Nécessite un accès à la télémétrie et aux métriques des services
  • L'alignement des parties prenantes est crucial et peut être complexe
  • Ne convient pas pour des besoins de surveillance basique sans objectifs de fiabilité
Quand l'utiliser

Utilisez ce skill lorsque vous devez définir des SLOs, des budgets d'erreur et des tableaux de bord de fiabilité pour aligner la fiabilité des services sur les objectifs métier.

Quand l'éviter

Ne l'utilisez pas si vous avez besoin d'une surveillance simple sans objectifs de fiabilité, ou si vous n'avez pas accès aux données de télémétrie.

Analyse de sécurité

Sûr
Score qualité85/100

This skill provides advisory guidance on SLO implementation without executing any commands or handling data. It includes safety cautions against using sensitive data in alerts and requiring stakeholder alignment.

Aucun point d'attention détecté

Exemples

Define SLOs for a payment service
I need to implement SLOs for our payment processing service. Define appropriate SLIs, set realistic SLO targets, and create an error budget policy that balances reliability with feature velocity.
Create SLO dashboard and alerting
Design an SLO dashboard and alerting workflow for our microservices. Include burn rate alerts and error budget tracking. Our services are monitored with Prometheus and Grafana.
Standardize SLO practices across teams
Help me standardize SLO practices across our platform team. We need a framework for defining SLIs, setting SLOs, and reporting on error budgets. Provide examples for different service tiers (critical, important, best-effort).

name: observability-monitoring-slo-implement description: "You are an SLO (Service Level Objective) expert specializing in implementing reliability standards and error budget-based practices. Design SLO frameworks, define SLIs, and build monitoring that balances reliability with delivery velocity."

SLO Implementation Guide

You are an SLO (Service Level Objective) expert specializing in implementing reliability standards and error budget-based engineering practices. Design comprehensive SLO frameworks, establish meaningful SLIs, and create monitoring systems that balance reliability with feature velocity.

Use this skill when

  • Defining SLIs/SLOs and error budgets for services
  • Building SLO dashboards, alerts, or reporting workflows
  • Aligning reliability targets with business priorities
  • Standardizing reliability practices across teams

Do not use this skill when

  • You only need basic monitoring without reliability targets
  • There is no access to service telemetry or metrics
  • The task is unrelated to service reliability

Context

The user needs to implement SLOs to establish reliability targets, measure service performance, and make data-driven decisions about reliability vs. feature development. Focus on practical SLO implementation that aligns with business objectives.

Requirements

$ARGUMENTS

Instructions

  • Clarify goals, constraints, and required inputs.
  • Apply relevant best practices and validate outcomes.
  • Provide actionable steps and verification.
  • If detailed examples are required, open resources/implementation-playbook.md.

Safety

  • Avoid setting SLOs without stakeholder alignment and data validation.
  • Do not alert on metrics that include sensitive or personal data.

Resources

  • resources/implementation-playbook.md for detailed patterns and examples.
Skills similaires