Courriels et marteaux dorés

Ça commence tout bêtement. Vous concevez une application qui est lancée toute les heures. Lorsqu’elle termine, un sommaire de l’exécution est envoyé par courriel à une liste d’individus pour résumer ce qui s’est passé. Sans même vous en rendre compte, vous venez de commettre une erreur.

La première semaine tout va bien. Vous avez un courriel à chaque heure. Vous êtes satisfaits; l’application va bien. Mais, chaque matin, vous avez 16 courriels qui vous attendent. Puis le lundi vous en avez une pelleté. Vous avez une téléphone intelligent? Chaque heure il sonne. Grrr, c’est énervant tous ces courriels.

Vous vous dites finalement que simplement avoir des messages seulement s’il y a des erreurs devrait suffire. Vous implémentez la nouvelle fonctionnalité. Super. Plus de courriels sauf en cas de problème.

Le temps passe. Un problème survient. “Erreur: corruption de données détectée.” Le problème est complexe et après 5 heures il n’est toujours pas corrigé. Comble de malchance, un nouveau problème survient. “Erreur: échec de connexion à la base de données.”. Une journée passe et l’erreur de corruption est finalement corrigée. Puis une journée passe. Puis une autre. Le problème de connexion à la base de données est toujours présent. Pourtant il devrait être simple à régler et il y a au moins trois personnes sur la liste des destinataires des alertes capables d’y remédier. Vous investiguez.

  • L’une des personnes avait créé un filtre qui envoie tous les messages de ce type à la corbeille. Elle a simplement réglée le problème en aval avec le filtre avant qu’il ne le soit en amont avec l’envoi juste en cas d’erreur.
  • La deuxième personne ne consultait plus les courriels car elle assumait que c’était la même erreur depuis le début.
  • La troisième personne se fiait simplement sur les autres.

Peut-on leur en vouloir? Ils ont certainement leur part de responsabilité, mais la mécanique choisie a certainement sa part de blâme.En effet, l’envoi de courriels de ce type entre dans l’anti-patron (antipattern) du «Marteau Doré».

Avec un bon marteau, tous les problèmes ressemblent à des clous. Cette conception consiste à réutiliser une technologie familière de manière obsessionnelle appliquée à beaucoup de problèmes.(lien)

GoldenHammer
Quel était le problème? On veut suivre l’état du système. Quelle solution a été choisie? Le bon vieux courriel; facile à paramétrer, tout le monde y a accès.

Et pourtant la solution a échoué. Malgré les alertes répétées un des problèmes est passé innapperçu pendant un trop long moment.

  1. SPAM!: Quand on reçoit une tonne de courriels identiques qui ne nous intéressent généralement pas, ça devient du SPAM. C’est immanquable, certaines personnes créeront un filtre pour envoyer ces courriels directement aux poubelles. (C’est d’ailleurs pour ça que la fonctionnalité visant à n’envoyer que les erreurs a été créée.)
  2. Tous les œufs dans le même panier: Un seul courriel servait à rapporter toutes les erreurs. L’information était fortement couplée et difficile à distinguer.
  3. Effet du témoin: Que se passe-t-il quand on «assigne» une même responsabilité à un groupe d’individus? Ils se déresponsabilisent! (lien)

La solution: un système de surveillance. Plutôt que de spammer votre groupe de support, spammez ce système! Il se fera un plaisir fou de lire avec attention toutes les belles données que vous lui fournirez. Il ne vous restera plus qu’à formuler des règles d’alertes pour envoyer des courriels ciblés en cas de problème. Voyons comment il règle quelques uns des problèmes énumérés précédemment.

  1. SPAM!: Un bon système de surveillance avec une configuration appropriée ne vous enverra qu’une seule alerte par erreur détectée. Ainsi, le problème de corruption de données n’aurait généré qu’un seul message plutôt qu’un toutes les heures. Le problème de connexion aurait à son tour généré un message quelques jours plus tard. Impossible d’appeler ça du spam.
  2. Tous les œufs dans le même panier: Chaque erreur a son courriel et son destinataire. Deux erreurs différentes? Deux messages. Impossible de se confondre.
  3. Effet du témoin: Le système indiquera le progrès de la situation. Est-ce que quelqu’un a pris connaissance du problème? Est-il entrain d’y travailler? Avec ces informations, fini les suppositions.

À lui seul, le système de surveillance ne peut pas complètement régler le problème lié à l’effet du témoin. Il est impératif qu’en tout temps UNE SEULE personne soit en charge. Si votre système envoi les alertes à un groupe, vous retombez dans le panneau. À personne? Même chose. Il ne faut l’assigner qu’à une seule personne. Le système l’assigne à tort à quelqu’un qui n’y connait rien? Parfait. Cette personne trouvera la bonne et le lui redonnera. Elle court même le risque d’en apprendre plus sur un système qui lui était inconnu et vous venez du même coup d’accroître le niveau général des connaissances de votre équipe. N’est-ce pas gagnant?

En bref, si vous voulez faire de la surveillance, le courriel à lui seul est insuffisant et vous tomberez dans l’un des pièges énumérés. Utilisez un système qui n’enverra que les alertes nécessaires et surtout ciblez une seule personne à la fois.

Leave a Reply