Chaos Engineering

✒ Enzo SandrĂ© · 📆 03/12/2025 · đŸ§Ș Tests

🐒 Si vous voulez prouver qu’un systĂšme distribuĂ© est tolĂ©rant aux pannes, vous devrez essayer de le mettre en panne, en production. Que se passe-t-il si le reverse proxy tombe ? Si une rĂ©gion AWS entiĂšre est indisponible ? Les humains ont tendance Ă  esquiver inconsciemment les vĂ©ritables scĂ©narios problĂ©matiques, il faut donc permettre Ă  un robot, le Chaos Monkey, de provoquer des pannes alĂ©atoires en injectant des donnĂ©es erronnĂ©es, en ajoutant de la latence ou en coupant des machines. ComplĂ©tement idiot ? Non, cette technique que l’on appelle Chaos Engineering est utilisĂ©e par toutes les organisations qui se prĂ©parent sĂ©rieusement Ă  l’inattendu. Shit happens.

📝 La maniĂšre de mener de telles campagnes de test est assez cadrĂ©e. Le papier qui en parle est assez court, je ne ferai que de le paraphraser en le rĂ©sumant.

SOURCE

A. Basiri et al., “Chaos Engineering,” in IEEE Software, vol. 33, no. 3, pp. 35-41, May-June 2016, DOI:10.1109/MS.2016.60.

Enzo Sandré


📄 Lien public DOIs: 10.48550/arXiv.1702.05843