Aller au contenu principal

Tableaux de bord Grafana

La pile de surveillance est livrée avec des tableaux de bord pré-provisionnés couvrant chaque couche de l'infrastructure.

1. Tableau de bord de la plateforme FirstBreath (Personnalisé)

Fichier : grafana_dashboard.json

C'est le "Centre de commande" principal pour le pipeline de vision. Utilisez-le pour suivre la logique métier.

  • Panneaux clés : Utilisez ceci pour voir si l'Application est saine.
    • Total Camera FPS : Les flux sont-ils actifs ?
    • Inference Latency : L'IA est-elle lente ?
    • Redis Queue Depth : Le backlog augmente-t-il ?
    • Active Workers : Les conteneurs batch-inference fonctionnent-ils ?

2. Aperçu de l'hôte (Node Exporter)

Fichier : node-exporter.json (ID Communauté : 1860)

Utilisez ceci pour vérifier la santé de la Machine Physique/Virtuelle (VPS).

  • CPU Busy : Le processeur de l'hôte est-il saturé ?
  • RAM Used : Le système utilise-t-il le swap ?
  • Disk I/O : La base de données écrit-elle trop sur le disque ?
  • Network Bandwidth : Le flux RTSP sature-t-il le lien 1Gbps ?

3. Conteneurs Docker (cAdvisor)

Fichier : cadvisor.json (ID Communauté : 14282)

Utilisez ceci pour déboguer des conteneurs spécifiques (par ex., "Pourquoi redis-worker a-t-il planté ?").

  • Per-Container Memory : Identifiez les fuites de mémoire dans les services Python.
  • Per-Container CPU : Voyez quel service accapare le processeur.
  • Network Rx/Tx : Suivez la bande passante par service.

4. Métriques GPU NVIDIA (DCGM)

Fichier : dcgm.json

Utilisez ceci pour surveiller le Matériel de Réseau Neuronal.

  • GPU Utilization : % du temps où le noyau GPU est occupé.
  • Memory Allocated : Utilisation VRAM (Critique pour les modèles YOLO).
  • Temperature : Assurez-vous que le refroidissement est adéquat (le throttling thermique tue les performances).
  • Power Usage : Suivi de la consommation en watts.

📚 Notes d'importation

Ces tableaux de bord sont situés dans monitoring/dashboards/ et sont automatiquement importés par Grafana via la configuration provisioning.

Note : Ne modifiez pas les tableaux de bord manuellement dans l'interface utilisateur si allowUiUpdates est défini sur false ; les modifications seront perdues lors de la recréation du conteneur ! Modifiez plutôt la source JSON.