- Definition von Observability
- Drei Säulen der Observability:
- Logging
- Monitoring
- Tracing
- Best Practices für Logging:
- Strukturiertes Logging im JSON-Format
- Aggregation an einem zentralen Ort
- Relevante Informationen und Kontext
- Definition von Schweregraden
- Best Practices für Monitoring:
- Messung der richtigen Dinge (z.B. SLAs, KPIs)
- Auslastung aller begrenzten Ressourcen
- Fehlerrate und Art der Fehler
- Performance-relevante Metriken (z.B. Latenz, Traffic)
- Priorisierung der wichtigsten Metriken
- Verwendung von Monitoring-Tools (z.B. Prometheus, Grafana)
- Best Practices für Tracing:
- Verfolgung von Requests über mehrere Systeme hinweg
- Verwendung von Tracing-Tools (z.B. Jaeger)
- Best Practices für Alerting:
- Definition relevanter Schwellwerte
- Business-relevante Alarme
- Unterscheidung zwischen kritischen und weniger wichtigen Alerts
- Dokumentation der Bearbeitung und Lösung von Alerts
- Integration mit Support-Prozessen
- Vermeidung von unnötigen Alarmen