Aller au contenu

Pedago Watch — Diagnostics

Commandes de diagnostic rapide

cd /root/projects/pedago-tools-monitoring

# État de tous les services monitoring
docker compose ps

# Health check Grafana
curl -s http://127.0.0.1:6050/api/health

# Health check Uptime Kuma
curl -s http://127.0.0.1:6001

# Health check Loki
curl -s http://127.0.0.1:6100/ready

# Utilisation des ressources
docker stats --no-stream | grep -E "pedago-"

Vérifier les logs de chaque service

cd /root/projects/pedago-tools-monitoring

# Grafana
docker compose logs grafana --tail 20

# Loki
docker compose logs loki --tail 20

# Promtail
docker compose logs promtail --tail 20

# Uptime Kuma
docker compose logs uptime-kuma --tail 20

# Tous les services
docker compose logs --tail 10

Vérifier que Promtail envoie bien à Loki

# Vérifier les targets Promtail
curl -s http://127.0.0.1:9080/targets 2>/dev/null || echo "Promtail API non exposée"

# Vérifier que Loki reçoit des logs
curl -s "http://127.0.0.1:6100/loki/api/v1/labels" | python3 -m json.tool

Vérifier l'espace disque des volumes

# Espace disque global
df -h

# Espace Docker
docker system df

# Détail par volume
docker system df -v | grep -E "pedago|monitoring"

DNS des sous-domaines monitoring

nslookup grafana.epitools.bj
nslookup uptime.epitools.bj

Vérifier les pipelines

# Derniers runs
gh run list --repo EpitechAfrik/pedago-tools-monitoring

# Logs d'un run
gh run view RUN_ID --repo EpitechAfrik/pedago-tools-monitoring --log-failed

Nettoyage

# Images non utilisées
docker image prune -f

# Nettoyage ciblé : images > 7 jours
docker image prune -a --filter "until=168h"