C'est toujours la même chose, quand un provider tombe ou a des problèmes, tu as les clients des autres providers qui trollent plutôt que d'envoyer de l'amour. C'est juste totalement ridicule.
AWS a un incident ? Les clients GCP trollent. OVH rencontre des problèmes ? Scaleway et consorts en profitent pour tacler. Un provider quelconque a une panne ? Les clients des concurrents et même certains membres du staff arrivent avec leurs critiques ouvertes et leurs remarques acerbes.
Et pendant ce temps, des équipes d'ops sont en train de suer sang et eau, à 3h du matin, pour rétablir le service.
Aujourd'hui, j'ai envie de parler de ce comportement que j'observe depuis des années dans notre industrie. Parce que franchement, il est temps qu'on arrête ces conneries.
Le schéma est toujours le même lors d'un incident d'infrastructure :
Ce dernier point, c'est le problème. Sur Twitter, LinkedIn, dans les communautés Slack ou Discord, je vois fleurir :
Parfois, c'est même des employés des concurrents qui se permettent des remarques limite marketing déguisé en "conseil technique".
J'ai beaucoup réfléchi à ce phénomène, et je pense qu'il y a plusieurs facteurs psychologiques et sociaux qui entrent en jeu.
Je l'observe partout dans la tech : Linux vs Windows, Vim vs Emacs, React vs Vue... Et bien sûr, AWS vs GCP vs Azure. On choisit un camp, et ce camp devient une partie de notre identité professionnelle.
Quand "notre" choix technique semble validé par les problèmes du concurrent, ça nous conforte dans notre décision. C'est rassurant. C'est humain.
Mais c'est aussi toxique.
Certaines personnes (parfois même du staff des entreprises) voient les incidents des concurrents comme une opportunité marketing gratuite. "Passez chez nous, on est plus fiables" devient le message sous-jacent.
Le problème ? C'est contre-productif. La prochaine fois que leur infrastructure aura un souci (et ça arrivera), ils seront les cibles des mêmes attaques.
J'ai l'impression que beaucoup de ceux qui trollent n'ont jamais géré d'infrastructure critique à grande échelle. Ils ne savent pas ce que c'est que de :
C'est facile de critiquer quand on n'est pas dans les tranchées.
"Ça n'arrivera jamais chez nous." C'est ce que pensent beaucoup de monde... jusqu'à ce que ça arrive.
L'infrastructure parfaite n'existe pas. Tous les grands providers ont eu (et auront) des incidents :
Ce comportement n'est pas qu'un problème de "hurt feelings". Je vois des conséquences concrètes et néfastes.
Quand les équipes savent qu'elles seront trollées publiquement, elles peuvent être tentées de :
Résultat ? Moins de transparence, moins de post-mortems détaillés, moins d'apprentissage collectif.
Je suis convaincu qu'on est tous dans le même bateau. Ops, SRE, DevOps, Platform Engineers... on fait tous face aux mêmes défis :
En se trollant mutuellement, on détruit cette solidarité qui devrait nous unir.
Les meilleurs post-mortems que j'ai lus viennent d'entreprises qui n'ont pas peur d'être transparentes sur leurs erreurs. Si le trolling devient la norme, on aura moins de :
Et toute la communauté sera plus pauvre techniquement.
Pour les équipes plus petites ou les startups, voir comment les "grands" se font traiter peut être terrorisant. Ça peut même les dissuader d'être transparents sur leurs propres incidents.
Je ne dis pas qu'il faut être aveuglément positif envers tous les providers. Tu as parfaitement le droit de :
Mais il y a un moment et un lieu pour ça. Et ce n'est PAS pendant un incident actif.
Imagine la situation : tu fais partie d'une équipe d'ops en pleine gestion d'incident. Tu es sous pression, tu n'as pas dormi, tu fais tout ce que tu peux pour restaurer le service. Et pendant ce temps, tu vois sur Twitter ou LinkedIn des gens qui se foutent de ta gueule, qui font des memes, qui utilisent ton stress comme argument marketing.
C'est terrible. C'est même cruel.
Ces équipes sont composées d'êtres humains. Des gens qui ont des familles, qui ont sacrifié leur nuit, qui sont déjà sous une pression énorme. Rajouter une couche de moquerie publique à ce moment précis, c'est juste inhumain.
Tu veux critiquer un provider ? Très bien. Fais-le :
Mais pendant l'incident ? Le minimum de décence, c'est soit de se taire, soit d'envoyer du soutien.
J'ai ma petite idée sur comment on pourrait mieux réagir lors des incidents d'infrastructure. Voici ce que je fais (ou essaie de faire) personnellement.
Un simple message de soutien peut faire une énorme différence pour une équipe en crise :
Ces messages coûtent rien, mais ils montrent qu'on comprend la réalité du métier.
Plutôt que de troller, je préfère :
C'est une opportunité d'apprentissage collectif, pas de division.
Je me rappelle toujours que :
Un peu d'humilité ne fait jamais de mal.
Quand une entreprise fait un bon post-mortem transparent, j'essaie de le souligner publiquement :
C'est comme ça qu'on crée une culture d'apprentissage.
Je ne suis pas naïf. Je sais que le trolling ne va pas disparaître du jour au lendemain. Mais je crois qu'on peut tous faire notre part.
La prochaine fois qu'un provider a un incident, je t'invite à :
Et si tu es client du provider en question et impacté, oui, tu as le droit d'être frustré. Mais même là, il y a une différence entre exprimer ta frustration de manière constructive et verser dans l'insulte ou le mépris.
L'infrastructure moderne est complexe. Les incidents sont inévitables. Ce qui n'est pas inévitable, c'est notre réaction face à ces incidents.
On peut choisir le trolling, le tribalisme et la toxicité. Ou on peut choisir l'empathie, le soutien et l'apprentissage collectif.
Pour ma part, mon choix est fait. Et toi ?
La prochaine fois que tu vois un incident majeur, demande-toi : qu'est-ce que tu veux contribuer à la communauté ? Du bruit ou du soutien ?