Tableaux de bord Grafana
La pile de surveillance est livrée avec des tableaux de bord pré-provisionnés couvrant chaque couche de l'infrastructure.
1. Tableau de bord de la plateforme FirstBreath (Personnalisé)
Fichier : grafana_dashboard.json
C'est le "Centre de commande" principal pour le pipeline de vision. Utilisez-le pour suivre la logique métier.
- Panneaux clés : Utilisez ceci pour voir si l'Application est saine.
- Total Camera FPS : Les flux sont-ils actifs ?
- Inference Latency : L'IA est-elle lente ?
- Redis Queue Depth : Le backlog augmente-t-il ?
- Active Workers : Les conteneurs
batch-inferencefonctionnent-ils ?
2. Aperçu de l'hôte (Node Exporter)
Fichier : node-exporter.json (ID Communauté : 1860)
Utilisez ceci pour vérifier la santé de la Machine Physique/Virtuelle (VPS).
- CPU Busy : Le processeur de l'hôte est-il saturé ?
- RAM Used : Le système utilise-t-il le swap ?
- Disk I/O : La base de données écrit-elle trop sur le disque ?
- Network Bandwidth : Le flux RTSP sature-t-il le lien 1Gbps ?
3. Conteneurs Docker (cAdvisor)
Fichier : cadvisor.json (ID Communauté : 14282)
Utilisez ceci pour déboguer des conteneurs spécifiques (par ex., "Pourquoi redis-worker a-t-il planté ?").
- Per-Container Memory : Identifiez les fuites de mémoire dans les services Python.
- Per-Container CPU : Voyez quel service accapare le processeur.
- Network Rx/Tx : Suivez la bande passante par service.
4. Métriques GPU NVIDIA (DCGM)
Fichier : dcgm.json
Utilisez ceci pour surveiller le Matériel de Réseau Neuronal.
- GPU Utilization : % du temps où le noyau GPU est occupé.
- Memory Allocated : Utilisation VRAM (Critique pour les modèles YOLO).
- Temperature : Assurez-vous que le refroidissement est adéquat (le throttling thermique tue les performances).
- Power Usage : Suivi de la consommation en watts.
📚 Notes d'importation
Ces tableaux de bord sont situés dans monitoring/dashboards/ et sont automatiquement importés par Grafana via la configuration provisioning.
Note : Ne modifiez pas les tableaux de bord manuellement dans l'interface utilisateur si
allowUiUpdatesest défini sur false ; les modifications seront perdues lors de la recréation du conteneur ! Modifiez plutôt la source JSON.