25 ans dans une startup - billet n.34
Zythom - Zythom MEM, 9/10/2018
Introduction - billet n.33
On ne plaisante pas avec l'électricité. Toute la salle serveurs est alimentée en courant secouru, c'est-à-dire issu d'onduleurs. Le problème est que de temps en temps, en fait à chaque intervention de maintenance sur les onduleurs, tout saute, et on se retrouve sans aucun serveur, alors que le courant "normal" continue de fonctionner sur tous les postes de la startup.
Évidemment, c'est sur le service informatique que tout le mécontentement se déverse...
Je réfléchis donc à essayer d'améliorer la situation, et me plonge dans les différents types d'onduleurs, les capacités des batteries, les différents contrats de maintenance, etc. Puis, je me souviens qu'il y a une sorte de groupe électrogène vaguement utilisé dans un coin de la startup. Je mène ma petite enquête et je comprends que ce groupe sert uniquement en cas d'incendie : il alimente les moteurs des trappes d'évacuation des fumées. Comme il ne sert jamais, il a un peu été oublié dans son coin.
J'étudie la documentation, et les textes réglementaires. Rien ne s'oppose à ce que j'exploite un peu plus les capacités de cet énorme groupe électrogène. D'abord, je le fais réparer (il doit être chauffé en permanence par une résistance électrique pour le maintenir en température, et éviter une rupture en cas de démarrage et d'exploitation immédiate à pleine charge), puis je trouve une entreprise capable d'en assurer la maintenance. Ensuite, avec une entreprise électrique qualifiée, je fais mettre en place une dérivation pour alimenter tous les onduleurs de la startup. Enfin, je fais valider tout cela par la commission de sécurité qui passe tous les trois ans.
J'ai donc un groupe électrogène qui démarre en cas de coupure de courant, et met environ 3 secondes à fournir un courant de charge pour les onduleurs. Ceux-ci auront immédiatement pris le relais de la coupure, sans micro-coupure, et continueront de tenir leur rôle tant qu'il y aura du carburant dans le groupe électrogène. Au pire, si un jour la demande de courant est trop importante, la capacité des onduleurs de faire fonctionner la salle serveurs aura été passée d'un quart d'heure à plusieurs jours.
Bien sur, j'ai vérifié que les serveurs, les systèmes de stockage et les commutateurs avaient tous au moins deux alimentations, l'une sur le secouru et l'autre sur le courant standard.
A la première panne électrique de secteur, je suis allé voir si tout allait bien en salle serveurs. Tout fonctionnait parfaitement... sauf un détail. Un petit détail qui risquait de ruiner la salle serveurs.
A suivre...
--------------
Ce récit est basé sur des faits réels, les noms et certains lieux ont été changés.
On ne plaisante pas avec l'électricité. Toute la salle serveurs est alimentée en courant secouru, c'est-à-dire issu d'onduleurs. Le problème est que de temps en temps, en fait à chaque intervention de maintenance sur les onduleurs, tout saute, et on se retrouve sans aucun serveur, alors que le courant "normal" continue de fonctionner sur tous les postes de la startup.
Évidemment, c'est sur le service informatique que tout le mécontentement se déverse...
Je réfléchis donc à essayer d'améliorer la situation, et me plonge dans les différents types d'onduleurs, les capacités des batteries, les différents contrats de maintenance, etc. Puis, je me souviens qu'il y a une sorte de groupe électrogène vaguement utilisé dans un coin de la startup. Je mène ma petite enquête et je comprends que ce groupe sert uniquement en cas d'incendie : il alimente les moteurs des trappes d'évacuation des fumées. Comme il ne sert jamais, il a un peu été oublié dans son coin.
J'étudie la documentation, et les textes réglementaires. Rien ne s'oppose à ce que j'exploite un peu plus les capacités de cet énorme groupe électrogène. D'abord, je le fais réparer (il doit être chauffé en permanence par une résistance électrique pour le maintenir en température, et éviter une rupture en cas de démarrage et d'exploitation immédiate à pleine charge), puis je trouve une entreprise capable d'en assurer la maintenance. Ensuite, avec une entreprise électrique qualifiée, je fais mettre en place une dérivation pour alimenter tous les onduleurs de la startup. Enfin, je fais valider tout cela par la commission de sécurité qui passe tous les trois ans.
J'ai donc un groupe électrogène qui démarre en cas de coupure de courant, et met environ 3 secondes à fournir un courant de charge pour les onduleurs. Ceux-ci auront immédiatement pris le relais de la coupure, sans micro-coupure, et continueront de tenir leur rôle tant qu'il y aura du carburant dans le groupe électrogène. Au pire, si un jour la demande de courant est trop importante, la capacité des onduleurs de faire fonctionner la salle serveurs aura été passée d'un quart d'heure à plusieurs jours.
Bien sur, j'ai vérifié que les serveurs, les systèmes de stockage et les commutateurs avaient tous au moins deux alimentations, l'une sur le secouru et l'autre sur le courant standard.
A la première panne électrique de secteur, je suis allé voir si tout allait bien en salle serveurs. Tout fonctionnait parfaitement... sauf un détail. Un petit détail qui risquait de ruiner la salle serveurs.
A suivre...
--------------
Ce récit est basé sur des faits réels, les noms et certains lieux ont été changés.