UpAndClear : Clear mais pas très Up...

23 mai 2016

Me revoici :)

Dimanche dernier je me suis rendu compte que mon SSL Lets Encrypt était arrivé à expiration. Je n’avais jamais pris le temps d’automatiser le renouvellement puisque je recevais les emails en amont pour me prévenir de l’approche de la date de péremption. Mais ce coup là je n’ai pas eu d’email et j’ai fait mon poisson rouge…

Mon installation LE n’étant plus à jour j’ai sottement suivi leur premier HowTo, sans trop regarder ni me poser de question et j’ai simplement mis en l’air ma configuration Nginx et le système. En mode Rescue je suis allé voir les derniers paquets installés pour faire le tri et nettoyer. Mais juste avant, éclair de génie, j’en ai profité pour prendre un dump de SQL et du www/. Bien inspiré… puisque le disque dur du serveur a lâché quelques minutes plus tard. Et pas de chance, c’était un dédié Online avec un seul disque dur.

Plutôt que d’attendre le remplacement du disque j’ai préféré monter une VM sur un ProxMox que j’ai chez SYS (le seul serveur de virtu que j’ai en RAID1 qui, s’il ne constitue certainement pas un backup, reste pratique pour tout réinstaller si un DD lâche) afin d’y placer le blog, même provisoirement. J’avais le temps lundi mais j’ai eu un coup de flemme. Puis finalement la semaine fut bien remplie niveau boulot et je n’ai pu m’y mettre que vendredi après-midi. Setup VM Debian 8, blocage du serveurs Web sur mon IP histoire de bosser tranquillement, installation PHP, Nginx MySQL etc. Je réinjecte les dumps, je teste. Tout roule. Je mets LE, cette fois-ci en faisant attention à ce que je fais, je l’active. Je teste. RAS. Super :)

BAM! Perte du SSH. Dans mon Conky, qui PING tous mes serveurs, je vois du rouge partout pour les VM de ce ProxMox. Y compris l’hôte lui-même. Vendredi 20h. Je reboote via le manager SYS, pareil. Je fais un joli message au SAV en sachant pertinemment qu’en temps normal je n’ai pas le support “VIP” et qu’un vendredi à 20h c’est juste mort pour le weekend. Je me dis que je vais feinter SYS et activer le monitoring de la machine via le manager. Vu que je bloque le PING (sauf d’une IP perso) et le monitoring OVH ça va les faire réagir. Bien vu, ils ont effectivement donné suite. En gros : “Perte de PING, tech vérifie hardware, RAS => reboot Rescue”. Niqu* donc, pas d’aide à espérer de leur part. Je leur ai fait le coup 4/5 fois dans la soirée, toujours la même chose.

Je voulais leur intervention étant donné que rien n’avait changé sur la machine, à part un setup de VM qui tournait déjà (très bien) depuis des heures. Pour moi c’était donc soit un souci hardware soit un souci réseau de leur côté. Par dépit j’ai finalement pris le mode Rescue, monté mon RAID, pris un dump de mes VM/CT et checké iptables, la configuration réseau, les logs. En vain. Dans les logs je voyais tout ce que je faisais puis plus rien. Et ensuite le reboot. Donc… mystère. Qui restera un mystère. Car même en les ayant au téléphone samedi après-midi aucune aide n’a pu m’être apportée.

J’ai donc hier pris sur moi de réinstaller la machine. Heureusement que des VM se montent en 1 commande…

 

Du coup quitte à réinstaller le blog je suis passé de Nginx à Apache2. SACRILEGE !!! Ouais mais nan. Je suis pas un pro d’Apache mais je voulais tester le HTTP2 et 2-3 autres trucs. Donc si ça coupe quelques minutes de temps en temps c’est “normal”, on va dire ça. Et ça rame un peu mais comme je veux mettre le blog aussi sur Tor (à venir, pas encore fait) c’est compliqué de jouer avec le cache. Déjà que WordPress et 2 URLs dont 1 Tor c’est plus que le bordel à gérer…

 

Bref. Have fun!

 

Mots clés