đ Si vous voulez prouver quâun systĂšme distribuĂ© est tolĂ©rant aux pannes, vous devrez essayer de le mettre en panne, en production. Que se passe-t-il si le reverse proxy tombe ? Si une rĂ©gion AWS entiĂšre est indisponible ? Les humains ont tendance Ă esquiver inconsciemment les vĂ©ritables scĂ©narios problĂ©matiques, il faut donc permettre Ă un robot, le Chaos Monkey, de provoquer des pannes alĂ©atoires en injectant des donnĂ©es erronnĂ©es, en ajoutant de la latence ou en coupant des machines. ComplĂ©tement idiot ? Non, cette technique que lâon appelle Chaos Engineering est utilisĂ©e par toutes les organisations qui se prĂ©parent sĂ©rieusement Ă lâinattendu. Shit happens.
đ La maniĂšre de mener de telles campagnes de test est assez cadrĂ©e. Le papier qui en parle est assez court, je ne ferai que de le paraphraser en le rĂ©sumant.
SOURCE
A. Basiri et al., âChaos Engineering,â in IEEE Software, vol. 33, no. 3, pp. 35-41, May-June 2016, DOI:10.1109/MS.2016.60.
Enzo Sandré
đ Lien public DOIs: 10.48550/arXiv.1702.05843