Comment nous détectons une fuite mémoire PHP avant qu’elle fasse tomber un site

Un site WordPress e-commerce d’un client agence a commencé à présenter un comportement étrange un mardi matin : sa consommation mémoire PHP-FPM grimpait lentement, sans relation évidente avec le trafic. Aucune alerte classique ne s’était déclenchée. Le site répondait. Tout allait “bien”.

Sauf qu’à ce rythme, il aurait OOM-killed à 17h. En pleine campagne d’emailing.

Le pattern qu’aucun outil traditionnel ne voit

Les outils de monitoring classiques (UptimeRobot, Pingdom, même certains APM) regardent des seuils. Si la mémoire dépasse 80%, alerte. Sinon, silence radio. Le problème : une fuite lente reste sous le seuil pendant des heures, puis explose d’un coup.

Notre agent IA travaille différemment. Il analyse la trajectoire des métriques, pas leurs valeurs absolues. Une consommation mémoire qui monte de 2% par heure depuis 4 heures consécutives, sans corrélation avec le trafic, c’est un signal — même si la valeur absolue est encore confortable.

[agent] site-client-42.fr — anomalie mémoire détectée
        ↳ pic_php_fpm: 412 Mo (+ 18 % vs baseline 14 jours)
        ↳ tendance: linéaire sur 4h, sans corrélation trafic
        ↳ verdict: fuite mémoire probable
        ↳ extrapolation: OOM dans ~6h si non traité
        ↳ priorité: P2 — intervention recommandée
[agent] Rapport envoyé à : ops@studio-pixel.fr

L’investigation : qu’est-ce qui fuit ?

Un humain a pris le relais (l’agent ne touche jamais à la prod sans validation). En 20 minutes, on a identifié le coupable : un plugin de cache qui stockait des objets en mémoire sans jamais les libérer après une mise à jour récente. Régression connue, patch disponible depuis 3 jours, jamais appliqué.

Mise à jour appliquée, redémarrage propre du pool PHP-FPM, mémoire normalisée en 90 secondes. Le client agence a reçu un mail à 11h47 : “Anomalie résolue. Voici ce qui s’est passé. Aucune action requise de votre part.”

Pourquoi c’est important

Un OOM-kill en pleine campagne, c’est entre 30 minutes et 2 heures de downtime selon comment l’équipe technique réagit. Pour un site e-commerce qui fait 12 000 € de chiffre d’affaires par jour, c’est entre 1 500 € et 2 500 € de pertes directes — sans compter l’image abîmée auprès des clients qui se prennent une page d’erreur en pleine commande.

L’audit IA ne remplace pas l’expertise humaine. Il l’amplifie. Il voit les patterns que nous, humains, ne voyons pas parce qu’ils sont noyés dans le bruit. Et quand il signale quelque chose, c’est qu’il a vraiment quelque chose à dire.

Note — Cet agent tourne sur tous les sites hébergés en offre IA — par VM en mutualisé, par cluster en dédié. Le rapport mensuel, les alertes contextuelles et la priorisation sont inclus dans l’add-on +49 € / +149 €.

Comment nous détectons une fuite mémoire PHP avant qu’elle fasse tomber un site

Le pattern qu’aucun outil traditionnel ne voit

L’investigation : qu’est-ce qui fuit ?

Pourquoi c’est important

Audit gratuit de votre infra

À lire aussi

L’architecture de notre agent IA : LLM open source, VLAN isolation, zéro fuite

CVE-2024-4577 : pourquoi les hébergeurs mutualisés classiques vous laissent exposés

Migration de 40 sites clients en 72h : retour d’expérience