Bonjour à tous,
Depuis hier soir, vous avez peut-être rencontré des difficultés pour accéder à Cachem.fr (lenteurs et inaccessibilité du site). Après une rapide analyse lundi soir (23h40), la machine virtuelle sur laquelle nous hébergeons 3 sites Web avait un statut étrange : suspendu. Après un redémarrage, tout était de nouveau opérationnel… mais des ralentissements importants sont à nouveau apparus. Quelques heures plus tard vers 2h43, le site était de nouveau inaccessible (même statut). Une fois encore, un redémarrage a permis de retrouver un service « stable » à 7h02.
Les premières investigations n’ont rien fait apparaître de particulier. Certes, il y a quelques mises à jour à faire, mais aucune explication sur les pannes répétées. Il est donc décidé à 8h00 de démarrer la mise à jour des applications. Malheureusement, tout ne se passera pas comme voulu. À 8h45, les différents sites sont à nouveau hors ligne. Plus rien ne répond, la seule solution est de tout réinstaller (y compris le système d’exploitation Debian). Pour faire au plus vite, il est décidé de changer de serveur (et d’hébergeur) avec à la clé un retour de service pour Cachem à 12h26.
La bonne nouvelle : aucun fichier, article ou commentaire n’a disparu grâce aux sauvegardes régulières. Tout est opérationnel, même s’il y a encore quelques bugs d’affichage liés à des questions de sécurité. Cela n’empêche en rien la consultation d’article ou la navigation.
Pour le Forum NAS, ce sera un peu plus long avec un retour à la normale à 14h07. Cependant, quelques messages (au moins 1) publiés entre 8h13 et 8h45 sont malheureusement perdus à jamais. Tout le reste est bien présent (images et messages), même les plus vieux messages.
Tout est opérationnel, mais il faut rester vigilant. Un changement d’hébergeur n’est pas anodin. Si les sites sont bien en ligne à ce jour, cela ne veut pas dire qu’il ne va pas y avoir un souci dans les prochaines heures/prochains jours.
Les sauvegardes de fichiers et bases de données ont permis de restaurer (relativement) rapidement les différents sites sans trop de casse. Je vais revoir ma procédure de restauration d’un site Web afin de réduire le délai. Il y a moyen de gagner encore quelques minutes précieuses. Voilà, vous savez tout de l’incident qui a perturbé Cachem et le Forum NAS aujourd’hui. Je suis sincèrement désolé de la gêne occasionnée.
À bientôt.
FX