25 ans dans une startup - billet n.35
Zythom - Zythom MEM, 11/10/2018
Introduction - billet n.34
La climatisation avait été oubliée. Elle était restée branchée sur le courant normal.
"C'est qu'on ne met pas aussi facilement une clim sur un onduleur", me dit l'installateur. C'est bien la peine d'avoir une salle serveurs qui tourne à plein régime, si c'est pour cramer les composants des machines en montant à 60°...
Après moultes devis tout aussi élevés les uns que les autres, j'ai fini par choisir de mettre deux climatisations : l'une directement branchée sur le groupe électrogène, et capable de redémarrer toute seule en cas de coupure (il faut 3s pour que le groupe électrogène atteigne sa puissance électrique nominale), et l'autre sur le courant standard.
Chaque clim est capable de maintenir la salle serveurs à une température acceptable. Et pour éviter qu'elles ne fonctionnent en même temps (pour économiser l'énergie et faire durer plus longtemps chaque clim), elles sont réglées sur une température qui diffère d'un degré. Et à chaque contrôle de maintenance des clims, on inverse la différence. Une seule clim fonctionne, et si elle s'arrête (panne mécanique par exemple), l'autre prendra le relais après une élévation de température d'un degré.
Si une panne générale électrique survient, les deux clims s'arrêtent, et celle branchée sur le groupe électrogène redémarrera.
Comme bien sur, en tant que responsable de tous les ennuis techniques et informatiques possibles et imaginables, je suis d'astreinte 24/7 toute l'année, j'ai mis en place un serveur Nagios (maintenant remplacé par un serveur Centreon), et je reçois un email associé à un SMS (envoyé gratuitement par Google via un script GMail) en cas d'alerte.
Une sonde Centreon surveille la température de la salle, et si elle monte trop haut (panne des deux clims par exemple) un processus d'arrêt en douceur des 70 serveurs virtuels, et des machines physiques hôtes, se déclenche. Je peux partir en vacances l'esprit tranquille.
Jusqu'au jour où je reçois un coup de téléphone affolé du gardien. Un truc imprévu nous tombait sur la tête. Et cette fois, c'est grave. Très grave.
A suivre...
--------------
Ce récit est basé sur des faits réels, les noms et certains lieux ont été changés.
La climatisation avait été oubliée. Elle était restée branchée sur le courant normal.
"C'est qu'on ne met pas aussi facilement une clim sur un onduleur", me dit l'installateur. C'est bien la peine d'avoir une salle serveurs qui tourne à plein régime, si c'est pour cramer les composants des machines en montant à 60°...
Après moultes devis tout aussi élevés les uns que les autres, j'ai fini par choisir de mettre deux climatisations : l'une directement branchée sur le groupe électrogène, et capable de redémarrer toute seule en cas de coupure (il faut 3s pour que le groupe électrogène atteigne sa puissance électrique nominale), et l'autre sur le courant standard.
Chaque clim est capable de maintenir la salle serveurs à une température acceptable. Et pour éviter qu'elles ne fonctionnent en même temps (pour économiser l'énergie et faire durer plus longtemps chaque clim), elles sont réglées sur une température qui diffère d'un degré. Et à chaque contrôle de maintenance des clims, on inverse la différence. Une seule clim fonctionne, et si elle s'arrête (panne mécanique par exemple), l'autre prendra le relais après une élévation de température d'un degré.
Si une panne générale électrique survient, les deux clims s'arrêtent, et celle branchée sur le groupe électrogène redémarrera.
Comme bien sur, en tant que responsable de tous les ennuis techniques et informatiques possibles et imaginables, je suis d'astreinte 24/7 toute l'année, j'ai mis en place un serveur Nagios (maintenant remplacé par un serveur Centreon), et je reçois un email associé à un SMS (envoyé gratuitement par Google via un script GMail) en cas d'alerte.
Une sonde Centreon surveille la température de la salle, et si elle monte trop haut (panne des deux clims par exemple) un processus d'arrêt en douceur des 70 serveurs virtuels, et des machines physiques hôtes, se déclenche. Je peux partir en vacances l'esprit tranquille.
Jusqu'au jour où je reçois un coup de téléphone affolé du gardien. Un truc imprévu nous tombait sur la tête. Et cette fois, c'est grave. Très grave.
A suivre...
--------------
Ce récit est basé sur des faits réels, les noms et certains lieux ont été changés.
Un truc imprévu (allégorie) Cliquez pour agrandir l'image Source : Golem |