đš Câest dans les vieilles controverses que lâon trouve les meilleurs papiers. 5 chercheurs dĂ©montrent que le score de mutation ne fait pas mieux que le coverage pour Ă©viter des bugs futurs. Leur rĂ©sultat va Ă lâencontre du consensus Ă©tabli. Artefact statistique ? Non, nouvelle mĂ©thode de calcul et critique rigoureuse des prĂ©cĂ©dents travaux.
đ La mĂ©thode de calcul prĂ©cĂ©demment admise, consistait Ă introduire des bugs dans un programme, puis Ă vĂ©rifier le pourcentage de ces bugs couverts par la mĂ©thode testĂ©e (branch coverage, statement coverage, mutation score, etc.).
đȘČ Pour les auteurs, il nây a quâune trĂšs faible corrĂ©lation avec les bugs rĂ©els. Ils ont prĂ©fĂ©rĂ© miner les sources de logiciels Open Source et vĂ©rifier, pour chaque bug rĂ©solu, si le code fautif Ă©tait couvert par la mĂ©thode testĂ©e.
đ Le rĂ©sultat renvoie le score de mutation au niveau des autres mĂ©thodes : utile pour repĂ©rer les parties sous-testĂ©es, pas plus. Le champion tombe de son piĂ©destal.
đ Ăvidemment, une Ă©tude ne changera pas le consensus, elle devra ĂȘtre rĂ©pliquĂ©e, mais il sâagit dâune belle avancĂ©e de la recherche.
SOURCES
Ahmed, Iftekhar, Rahul Gopinath, Caius Brindescu, Alex Groce and Carlos Jensen. âCan testedness be effectively measured?â Proceedings of the 2016 24th ACM SIGSOFT International Symposium on Foundations of Software Engineering (2016): n. pag.
Enzo Sandré
DOIs: 10.1145/2950290.2950324