Introduction

La mission de Citalid est d'aider les entreprises et les assureurs à gérer le risque cyber en quantifiant sa fréquence et les pertes financières qui y sont associées. Notre solution logicielle permet aux entreprises de mettre en place des stratégies de gestion du risque cyber adaptées et optimales en termes d'efficacité et de rentabilité.

Dans le cadre de la crise actuelle liée COVID-19, certains éditeurs cyber fournissent gratuitement leurs produits aux acteurs qui sont en première ligne (par exemple les hôpitaux). Nous soutenons fortement ces initiatives. Notre produit étant conçu pour aider les décideurs à prévenir/préparer les crises plutôt qu'à les affronter, nous avons réfléchi à d'autres moyens de nous rendre utiles en cette période.

Il se trouve que nous aidons les assureurs cyber à quantifier l'exposition financière de leur portefeuille d'assurés. L'un des plus grands problèmes auxquels ils sont confrontés est la nature systémique du risque cyber, qui peut rapidement conduire à des défauts de mutualisation et des faillites. Dans ce contexte, Citalid a construit des modèles stochastiques afin de simuler la propagation de logiciels malveillants, tels que Wannacry et NotPetya en 2017.

Considérant les similitudes entre virus informatiques et biologiques, nous avons décidé de construire un modèle simple dont l'unique but est d'évaluer l'efficacité des stratégies de confinement possibles pour lutter contre le virus SRAS-CoV-2.

Approche Citalid face au virus COVID-19 dans cet articleApproche Citalid face aux cyberattaques dans sa plateforme de gestion de risque
Modélisation de l'épidémie à partir des données disponiblesModélisation de scénarios de risque cyber à partir d'informations sur la menace et le contexte économique
Modélisation de la population et des liens sociauxModélisation des organisations et de leur contexte / écosystème
Modélisation des stratégies de confinement et de quarantaineModélisation des stratégies de défense
Simulation de la propagation de l'épidémieSimulation des fréquences des scénarios de risque pertinents et des chances de succès des attaquants
Simulation de l'état de la population post-épidémieSimulation des impacts financiers des scénarios de risque pertinents
Effectuer un grand nombre de simulations pour calculer la stratégie optimaleEffectuer un grand nombre de simulations pour calculer la stratégie optimale

La différence principale est que nous ne sommes ni épidémiologistes ni médecins : le seul but de cet article est de sensibiliser et de partager nos méthodes dans ce cas bien spécifique. L'approche développée ci-dessous est issue de différentes études et travaux de recherche, et doit être strictement limitée à des simulations à vocation pédagogique. En revanche, dans le domaine de la cybersécurité, nos simulations s'appuient sur des modèles de pointe que nous développons depuis des années, et qui sont enrichis par notre expertise en matière de renseignement sur les menaces et par nos bases de données propriétaires.

N.B. : si vous souhaitez passer directement aux conclusions sans lire les détails du modèle, vous pouvez cliquer ici (SPOILER ALERT!).

1. Modélisation de la propagation du COVID-19

1.1 Approche générale

La démarche proposée ici consiste à modéliser les relations sociales au sein d'une population donnée à l'aide de graphes. Un nœud représente un individu tandis qu'une arête, reliant deux nœuds, représente une relation sociale entre eux. Les relations sociales étant bilatérales, les arêtes ne sont pas orientées.

graph 0

Dans l'état initial, on suppose qu'un nombre donné d'individus, choisis au hasard au sein de la population, sont infectés (les nœuds marqués en rouge ci-dessous). Chaque jour, les personnes infectées croisent leurs connaissances (c'est-à-dire les autres nœuds qui leur sont liés), qui ont donc une certaine probabilité d'être exposées au virus et d'être à leur tour infectées. Au fur et à mesure que la simulation se déroule, l'épidémie se propage ainsi au sein de la population.

1.2. Modélisation de l'épidémie

Décrivons plus en détail la modélisation de l'épidémie. Nous avons choisi de travailler avec le modèle SEIR communément utilisé, qui est un cas particulier de ce que l'on appelle la théorie Kermack-McKendrick. Ce modèle divise la population en quatre catégories :

  • Les individus susceptibles de contracter la maladie, qui n'ont pas encore été exposés au virus ;
  • Les individus exposés, qui sont en période d'incubation sans symptôme et qui sont pour l'instant supposés non-contagieux ;
  • Les individus infectés, qui sont contagieux et généralement symptomatiques ;
  • Les individus guéris, qui ont été infectés mais sont maintenant guéris et immunisés contre le virus.
covid19 1

Nous avons ajouté deux autres catégories à ce modèle :

  • Les individus placés en quarantaine, qui sont mis en isolement total jusqu'à leur rétablissement ou leur décès, et ne risquent donc pas de contaminer d'autres individus. Nous supposons qu'un certain nombre de tests de détection du virus sont effectués parmi les individus présentant des symptômes proches de ceux du COVID-19, et que chaque test a une probabilité pquarantaine de détecter un individu exposé au virus, l'individu testé étant alors placé en quarantaine ;
  • Les individus décédés, qui sont le résultat du taux de létalité de l'épidémie - nous supposons que le décès se produit à la fin de la période d'infection avec une probabilité de plétalité, un individu infecté ayant donc une probabilité de guérison de 1 - plétalité.

N.B. : attention à ne pas confondre le "taux de létalité de l'infection" (IFR), qui est la proportion de décès par rapport au nombre total de personnes infectées, avec le "taux de létalité des cas" (CFR), qui est la proportion de décès par rapport au nombre total personnes diagnostiquées. Dans le cas du COVID-19, toutes les personnes infectées ne peuvent pas être diagnostiquées, donc le taux de létalité des cas est plus élevé que le taux de létalité de l'infection, que nous considérons ici.

Les paramètres de l'épidémie sont les suivants :

  • Le nombre initial d'individus infectés, tirés au sort au début de la simulation.
  • Le temps d'incubation, qui varie selon les individus. Nous tirons une valeur spécifique de temps d'incubation pour chaque individu en fonction d'une distribution de probabilité spécifique. Une distribution de probabilité représente les probabilités d'occurrence de chaque valeur de temps d'incubation possible dans nos tirages. La distribution de probabilité est choisie de telle sorte que la durée d'incubation moyenne soit de 5 jours.
incubation time
  • La durée de l'infection, qui varie également selon les individus. Nous tirons une valeur spécifique de temps d'infection pour chaque individu en fonction d'une distribution de probabilité spécifique. La distribution de probabilité est choisie de telle sorte que le temps moyen d'infection soit de 8 jours.
infection time
  • Le taux de létalité de l'infection (plétalité), comme vu plus haut, varie en fonction de l'âge, de l'état de santé, du mode de vie, etc. Nous tirons une valeur spécifique de taux de mortalité de l'infection pour chaque individu en fonction d'une distribution de probabilité spécifique. La distribution de probabilité est choisie de manière à ce que le taux moyen de létalité soit en moyenne de 2 %.
fatality rate

N.B. : nous nous sommes inspirés de cette thèse française d'actuariat pour choisir les distributions de probabilité. Comme expliqué dans cette thèse, les lois Gamma sont les plus utilisées lorsqu'il s'agit de modéliser des phénomènes temporels, ce qui en fait des candidats idéaux pour modéliser les temps d'incubation et d'infection. En ce qui concerne le taux de létalité, nous utilisons une distribution log-normale en raison de sa queue de distribution élevée, permettant des valeurs extrêmes avec des probabilités non-négligeables. C'est par exemple la loi utilisée par Swiss Re pour modéliser le taux de surmortalité, calibré en pondérant les données de plusieurs épidémies du XXème siècle aux États-Unis.

1.3. Modélisation de la population et des liens sociaux

Afin de modéliser les relations sociales au sein d'une population de manière représentative, nous générons un graphe aléatoire.

Les deux techniques ci-dessous sont couramment utilisées pour générer des graphes aléatoires représentant des réseaux du monde réel.

  • Le modèle Barabási–Albert génère des graphes dans lesquels la distribution du nombre d'arêtes auxquelles un nœud donné est connecté converge vers une loi de puissance (ce qu'on appelle les "réseaux invariant d'échelle"). En d'autres termes, la plupart des nœuds sont connectés à un nombre similaire de nœuds, mais quelques nœuds sont connectés à un grand nombre d'autres nœuds - suivant le paradigme des "riches qui deviennent de plus en plus riches". Un tel phénomène est très courant dans les réseaux sociaux en ligne par exemple, et explique ici le cas des "super propagateurs" - ces individus qui croisent potentiellement le chemin de beaucoup d'autres individus, et risquent donc de largement propager le virus.
  • Le modèle Watts-Strogatz génère des graphes avec des phénomènes de "petit monde", dont un coefficient de clustering élevé et des longueurs moyennes de chemin courtes. En d'autres termes, il existe des communautés locales (par exemple des groupes d'amis), et le nombre d'arêtes à suivre pour atteindre n'importe quel nœud est assez court en moyenne. Cette dernière propriété est souvent mentionnée à propos des réseaux sociaux en ligne, lorsqu'on dit par exemple que tous les individus sont séparés au maximum par "six poignées de main".

Aucun des modèles ci-dessus n'est en soi pleinement satisfaisant pour représenter une population réelle.

C'est pourquoi nous avons décidé de les combiner. Notre idée est la suivante :

  • Tout d'abord, nous générons un graphe de Watts-Strogatz (c'est-à-dire un "petit monde") GWS, qui représente les connaissances que les nœuds rencontrent régulièrement, par exemple leurs collègues et amis. En effet, une personne rencontre souvent les mêmes personnes au quotidien.
  • Parmi les connaissances de chaque nœud de GWS, nous considérons qu'un petit nombre de nœuds sont des membres de sa famille. Les membres de sa famille sont fréquentés plus souvent et plus longuement, ce qui augmente la probabilité de transmission.
  • Enfin, nous générons un graphe Barabási-Albert (c'est-à-dire avec des "super-propagateurs") GBA, qui représente les inconnus que chacun de nous rencontre chaque jour, par exemple dans les lieux publics, les supermarchés, les transports publics, etc. Les habitants des grandes villes, par exemple, sont plus susceptibles de rencontrer beaucoup de gens chaque jour.

Chaque jour, un individu donné :

  • Passe beaucoup de temps avec un petit nombre de personnes, les membres de sa famille, qui font partie de ses voisins dans le graphe GWS . Si l'individu est infecté, les membres de sa famille risquent à leur tour d'être exposés au virus avec une probabilité : pfamille.
  • Passe moins de temps avec un plus grand nombre de connaissances, qui correspondent à ses voisins dans le graphe GWS . Si l'individu est infecté, ses connaissances risquent à leur tour d'être exposées au virus avec une probabilité :
    pconnaissances < pfamille.
  • Croise un grand nombre d'inconnus dans les lieux publics, qui correspondent à ses voisins dans le graphe GBA . Si l'individu est infecté, les inconnus croisés risquent à leur tour d'être exposés au virus avec une probabilité :
    pinconnus << pconnaissances < pfamille.

1.4. Modélisation des stratégies de confinement

Notre objectif final est d'évaluer l'efficacité des différentes stratégies de confinement.

Les stratégies de confinement, actuellement appliquées par la plupart des gouvernements, visent à renforcer la distanciation sociale entre les individus pendant une période de temps fixée, dans l'espoir de ralentir voire de maîtriser totalement l'épidémie.

Afin de simuler les impacts des stratégies de confinement sur la population, nos hypothèses sont que, pendant le confinement :

  • Les gens se confinent avec leur famille, c'est-à-dire avec leurs voisins considérés comme leur famille dans le graphe GWS. Ils passent beaucoup plus de temps avec leur famille qu'hors confinement.
    Nous supposons que, pendant le confinement, deux nœuds quelconques d'une famille donnée sont reliés par une arête (c'est-à-dire que tous les membres d'une même famille passent du temps les uns avec les autres), et que deux nœuds de familles différentes ne sont reliés par aucune arête (c'est-à-dire qu'il n'y a plus de relations sociales entre les différentes familles). Par conséquent, le confinement conduit à une partition du graphe GWS en de nombreux petits ensembles de nœuds isolés. Si un individu est infecté, la probabilité de transmission, c'est-à-dire la probabilité qu'il contamine à son tour un des membres de sa famille, augmente pendant le confinement :
    pfamille_pendant_confinement = Kfamille_pendant_confinement * pfamille, avec Kfamille_pendant_confinement > 1.
partition
  • Les gens cessent de voir leurs collègues et amis, c'est-à-dire leurs voisins dans le graphe GWS qui ne sont pas des membres de leur famille.
    Par conséquent, une personne infectée ne risque plus de transmettre le virus à ses connaissances : pconnaissances_pendant_confinement = 0. Cette hypothèse est optimiste, compte tenu de ce qui est réellement observé dans les populations confinées, mais il faut espérer qu'elle soit quand même proche de la réalité : #restezchezvous.
  • La plupart des gens doivent continuer à se rendre dans des lieux publics comme les supermarchés, où ils croisent des inconnus. Cependant, ils le font beaucoup moins souvent, et croisent donc beaucoup moins d'inconnus qu'hors confinement.
    Par conséquent, un individu infecté risque encore d'exposer des inconnus au virus, mais avec une probabilité de transmission réduite :
    pinconnus_pendant_confinement = Kinconnus_pendant_confinement * pinconnus avec Kinconnus_pendant_confinement < 1.

2. Simulations et évaluation de l'efficacité de différentes stratégies de confinement

Après avoir modélisé l'épidémie, la population et les stratégies de confinement, nous allons maintenant effectuer des simulations afin d'évaluer les effets des différentes stratégies sur la propagation du virus.

L'exécution de nombreuses simulations sur de grands graphes nécessite une grande puissance de calcul. Nous avons donc choisi de déterminer d'abord les stratégies les plus prometteuses en exécutant un grand nombre de simulations sur de petits graphes, avec des algorithmes optimisés pour pouvoir s'exécuter en temps raisonnable. Après avoir déterminé la stratégie optimale, nous vérifierons qu'elle passe bien à l'échelle en la testant sur de plus grands graphes.

2.1. Petits graphes avec simulations de Monte-Carlo

Lorsqu'il y a beaucoup d'incertitude sur les paramètres d'entrée, la meilleure méthode pour obtenir des résultats exploitables est d'utiliser les simulations de Monte-Carlo. C'est ce que font nos algorithmes de quantification de l'exposition financière de nos clients au risque cyber, et nous pensons que c'est également approprié dans le cas de notre analyse du COVID-19.

L'idée principale de la méthode de Monte Carlo appliquée ici est d'effectuer un grand nombre de simulations avec différents états initiaux (par exemple, une sélection différente d'individus initialement infectés) pour obtenir un échantillon représentatif de situations possibles. Il s'agit ensuite d'agréger les résultats de manière statistique afin de comprendre au mieux la propagation de l'épidémie. Rappelons que notre modèle attribue des paramètres différents (relations sociales, temps d'incubation et d'infection, taux de létalité, etc.) à chaque nœud.

Pour avoir une idée de l'impact du choix de l'état initial, c'est-à-dire des personnes infectées dès le début de la simulation, vous pouvez visionner les deux vidéos ci-dessous. Elles correspondent à des simulations effectuées avec les mêmes paramètres, mais avec deux ensembles différents de 3 individus initialement infectés. Dans la première simulation, l'épidémie se propage lentement et s'arrête vers le 60ème jour, tandis que dans la seconde elle se propage à la quasi-totalité de la population, et ne s'arrête que vers le 160ème jour.

Pour des raisons de puissance de calcul, nous commençons par effectuer des simulations sur des petits graphes de 100 individus. L'idée est de simuler la propagation du virus au sein d'un petit échantillon de population des centaines de fois, afin de l'étudier au mieux.

Notre objectif est de tester l'impact des différentes stratégies de confinement et de quarantaine contre le virus. Définir une stratégie consiste à fixer les paramètres suivants :

  • la durée du confinement, en semaines ;
  • le nombre de tests de détection du virus effectués quotidiennement sur les individus présentant des symptômes proches de ceux du COVID-19, ainsi que la probabilité de quarantaine pquarantaine que chaque test détecte effectivement un cas de COVID-19 et résulte en la mise en quarantaine de l'individu testé ;
  • le seuil de la stratégie, qui correspond au nombre d'individus infectés avant que la stratégie (confinement, quarantaine ou les deux) ne soit appliquée.

Pour chaque combinaison de ces 3 paramètres, nous effectuons 100 simulations avec 3 personnes différentes initialement infectées. Nous avons choisi de conserver les mêmes valeurs pour les paramètres suivants pour toutes les simulations :

  • Taille totale de la population : 100 ;
  • Nombre moyen de membres de la famille pour chaque individu : 2 ;
  • Facteur multiplicatif appliqué à la probabilité de transmission pendant le confinement pour les membres de la famille : Kfamille_pendant_confinement = 5;
  • Nombre moyen de connaissances par individu (y compris la famille) : 5 ;
  • Nombre moyen d'inconnus croisés par individu : 30 ;
  • Facteur multiplicatif appliqué à la probabilité de transmission pendant le confinement pour les inconnus croisés : Kinconnus_pendant_confinement = 1/3.

Nous calculons également la probabilité de transmission afin que chaque individu infecté expose en moyenne trois autres individus au virus hors confinement, tout en assurant que :

  • pconnaissances = pfamille / 3;
  • pinconnus = pfamille / 10.

2.1.1. Simulation du pire scénario : pas de confinement ni de quarantaine

Commençons par simuler le pire scénario : pas de confinement ni de quarantaine. Cette simulation correspond donc à un scénario dans lequel aucune mesure n'est prise pour maîtriser l'épidémie. Afin de mieux visualiser la propagation, voici une vidéo de l'une des 100 simulations que nous avons effectuées.

Le graphique suivant représente les résultats moyens des 100 simulations. Chaque courbe représente respectivement l'évolution du nombre d'individus susceptibles (c'est-à-dire non-encore exposés), exposés, infectés, guéris et décédés au cours du temps.

small worst case 0

Les histogrammes suivants montrent la répartition des individus sains (ou "susceptibles"), guéris et décédés à la fin de chacune des 100 simulations.

Dans un scénario sans confinement ni quarantaine, l'impact de l'épidémie sur la population est maximal.

Le nombre moyen d'individus susceptibles, c'est-à-dire n'ayant jamais été exposés au virus, n'est que de 18,2. Le nombre moyen de personnes mortes à cause du virus est de 2,2.

Le nombre de personnes infectées atteint une valeur élevée (environ 12 % de la population est infectée en même temps), ce qui risque de submerger les infrastructures sanitaires et de rendre la gestion de l'épidémie encore plus difficile. Il convient de noter que, dans la pratique, le taux de létalité augmente lorsque les infrastructures de santé sont débordées : nous avons choisi de ne pas modéliser ce facteur particulier, ce qui constitue un point d'amélioration pour notre modèle.

N.B. : A partir de maintenant et jusqu'à la fin de l'article, nous choisissons de nous concentrer principalement sur la variation du nombre d'individus susceptibles (ou sains) à la fin de l'épidémie afin d'évaluer les impacts des stratégies de confinement. Les différents états (susceptible, exposé, infecté, mis en quarantaine, guéri et décédé) sont des vases communicants dans notre modèle : une augmentation du nombre d'individus susceptibles en fin d'épidémie implique directement une diminution de la somme des individus guéris et décédés. Comme nous nous concentrons sur l'étude de la propagation du virus plutôt que sur la prévision du nombre de décès, nous considérons qu'il s'agit là du critère le plus pertinent..

2.1.2. Impact de la durée du confinement

Simulons l'application d'un confinement de deux semaines, toujours sans aucune stratégie de quarantaine. Pour ces simulations, nous fixons le seuil de confinement à 30 : le confinement est donc appliqué dès que 30 individus (soit 30 % de la population totale de 100 individus) ont été infectés (nombre cumulé depuis le début de l'épidémie).

Dans le tableau ci-dessous, la période de confinement est mise en évidence en gris.

smart 2 week lockdown 0 1

Les histogrammes suivants superposent la distribution des individus susceptibles, guéris et décédés à la fin de chacune des 100 simulations, pour les simulations sans confinement et avec un confinement de 2 semaines.

Les résultats des simulations avec un confinement de deux semaines sont meilleurs que ceux des simulations sans confinement. Le nombre de personnes susceptibles dans la population, c'est-à-dire de personnes qui n'ont pas été exposées au virus, augmente de 54 %. Le pic de personnes infectées est aplati, et le nombre de personnes décédées est réduit de 16 %.

Évaluons maintenant l'impact de différentes durées de confinement.

Les graphiques suivants montrent les résultats des simulations pour différentes durées de confinement allant de 0 à 12 semaines.

Les résultats s'améliorent à mesure que la durée de confinement augmente. Le nombre moyen d'individus sains jamais exposés au virus augmente, et le nombre moyen de décès diminue.

Les histogrammes suivants comparent un scénario sans confinement à un scénario avec un confinement de 12 semaines.

smart 12 week lockdown

Les résultats des simulations avec un confinement de 12 semaines sont nettement meilleurs que ceux des simulations sans confinement.

POINT CLÉ 1 : même lorsqu'elles sont appliquées tardivement (30 % des personnes déjà infectées), les stratégies de confinement diminuent le nombre de personnes exposées au virus et aplatissent le pic de personnes infectées. Le nombre d'individus sains qui n'ont pas été exposés au virus à la fin de l'épidémie est plus que doublé dans nos simulations à petite échelle pour un confinement de 3 mois par rapport aux simulations sans confinement, et le nombre de décès est réduit d'environ 27%.

POINT CLÉ 2 : plus les stratégies de confinement sont longues, plus elles sont efficaces pour réduire le nombre de personnes exposées. Cependant, au-delà d'une certaine durée de confinement, on observe des rendements décroissants. Dans nos simulations à petite échelle, le premier mois de confinement est très significatif (augmentation de 183 % des individus sains par rapport aux simulations sans confinement), puis les rendements diminuent fortement après les 6 premières semaines de confinement, se stabilisant à près de 225 % d'augmentation du nombre d'individus sains.

Que se passe-t-il si nous appliquons le confinement plus tôt ?

2.1.3. Impact du seuil de confinement

Simulons l'application d'un confinement dès que respectivement 5, 15 et 30 individus sont infectés (en cumulé), toujours sans stratégie de quarantaine. Les simulations sont effectuées pour différentes durées de confinement allant de 2 à 12 semaines. Voici tout d'abord les résultats obtenus pour des durées de confinement de 2 et 6 semaines.

smart 2 week lockdown different thresholds

Ce graphique met en évidence l'importance d'appliquer le confinement le plus tôt possible, c'est-à-dire avant qu'un trop grand nombre de personnes ne soient infectées par le virus. Le nombre d'individus sains est augmenté de 37 % avec une stratégie de confinement précoce (seuil de verrouillage de 5 individus) par rapport à un confinement tardif (seuil de confinement de 30 individus).

small comparison lockdowns thresholds

Le nombre d'individus sains à la fin de l'épidémie dans le scénario avec un confinement de 2 semaines appliqué tôt (seuil de 5 individus) est très proche du nombre d'individus sains avec un confinement de 4 semaines appliqué tardivement (seuil de 30 individus).

small ratio late early lockdowns 1

Si le confinement est appliqué très tard (seuil de 30 individus infectés), une durée de confinement particulièrement longue de 12 semaines n'augmente que de 12 % le nombre d'individus sains par rapport à un confinement précoce de 2 semaines.

En d'autres termes, plus le confinement est appliqué tardivement (seuil de confinement élevé), plus il doit être long pour être efficace. L'efficacité de la prolongation de la durée de confinement converge vers une limite, comme attendu en raison des rendements décroissants observés ci-dessus.

POINT CLÉ 3 : en appliquant le confinement plus tôt, on réduit le nombre de personnes exposées au virus. L'effet est d'autant plus fort que la durée du confinement augmente. Plus le confinement est appliqué tardivement, plus il doit être long pour être efficace : un confinement de 2 semaines appliqué tôt (dès que 5 individus sur 100 sont infectés) a des effets similaires à un confinement de 4 semaines appliqué tard (dès que 30 individus sur 100 sont infectés). En raison de la diminution des rendements, il est très difficile - voire impossible - de rattraper un retard important dans l'application du confinement simplement en prolongeant la durée de celui-ci.

Quels sont les résultats pour un scénario où un confinement de 3 mois est appliqué dès que 5 personnes sont infectées ?

small 3 months lockdown 5 threshold 1
small 3 months lockdown 5 threshold susceptible

Dans ce scénario, l'impact de l'épidémie est réduit de manière drastique. Les simulations correspondantes aboutissent à une moyenne de 71,7 individus sains (contre 18,2 dans le scénario sans confinement), 27,5 individus guéris (contre 79,6) et 0,8 individus décédés (contre 2,2) à la fin de la simulation.

Mais quid de la quarantaine ?

2.1.4. Impact de la stratégie de dépistage

Modélisons l'action qui consiste à effectuer chaque jour, de manière aléatoire, un nombre donné de tests de détection du virus parmi les individus présentant des symptômes proches de ceux du COVID-19. Comme pour les stratégies de confinement, nous supposons que les tests ne commencent pas avant qu'un certain seuil (seuil de quarantaine) d'individus infectés en cumulé ne soit atteint.

Chaque test peut être positif (c'est-à-dire que la personne testée est soit exposée soit infectée) ou négatif. Nous considérons que la probabilité qu'un test soit positif et entraîne une mise en quarantaine de la personne testée est pquarantaine = 0.3. Cette probabilité correspond à peu près à ce que nous observons en France. En effet, 10k tests sont actuellement réalisés chaque jour dans la population, et environ 3k individus en moyenne sont détectés comme ayant le COVID-19. Nous supposons qu'un individu testé positif au COVID-19 est mis en quarantaine jusqu'à la fin de sa période d'infection, ne risquant ainsi pas d'exposer qui que ce soit d'autre au virus.

Supposons tout d'abord que le seuil de quarantaine d'individus infectés à atteindre avant que les tests ne commencent à être mis en œuvre est de 30 individus, et qu'un seul test est ensuite effectué chaque jour parmi les individus symptomatiques. Ramené à un pays comme la France, cela signifierait environ 700 000 tests par jour au lieu des 10 000 tests actuels ! Cependant, effectuer moins d'un test par jour serait inefficace dans notre population réduite à 100 individus, étant donné le petit nombre d'individus infectés à tout moment.

smart 1 test
smart 1 test susceptible

La stratégie est assez efficace, mais pas miraculeuse. Sans aucune politique de dépistage et de quarantaine, le nombre moyen d'individus sains à la fin de l'épidémie était de 18,2 individus, alors qu'un test par jour porte ce nombre à 31,9.

Comparons maintenant les résultats correspondant à différents nombres de tests quotidiens.

POINT CLÉ 4 : une politique de dépistage, combinée à une quarantaine pour les personnes testées positives, réduit la propagation du virus. Plus il y a de tests disponibles chaque jour, plus la réduction est importante. Commencer à effectuer un test chaque jour chez les individus symptomatiques lorsque 30 individus ont été infectés augmente le nombre d'individus sains à la fin de l'épidémie de 75 %, et réduit le nombre de décès de 20 %. Monter le nombre de tests disponibles par jour à 5 triple presque le nombre d'individus sains, et réduit le nombre de décès de plus de 40 %. Toutefois, compte tenu des difficultés pratiques que pose la mise en œuvre d'un dépistage massif des individus, les stratégies de quarantaine peuvent en réalité ne pas s'avérer aussi efficaces que les stratégies de confinement.

Étudions l'impact du seuil de quarantaine, c'est-à-dire du nombre d'individus infectés à atteindre avant que la politique de dépistage ne soit mise en œuvre.

smart 1 test threshold comparison

Avec un seul test disponible par jour, une stratégie de quarantaine n'est efficace que si le seuil de quarantaine est très bas (5 individus infectés), c'est-à-dire si la politique de dépistage est appliquée très tôt. Le nombre d'individus sains augmente alors d'environ 60 % par rapport aux politiques de quarantaine appliquées plus tard (seuils de quarantaine de 15 ou 30).

Voyons comment l'épidémie évoluerait si davantage de tests étaient disponibles.

smart 5 test threshold comparison

Avec 5 tests disponibles quotidiennement, un seuil de 15 individus permet une augmentation de 25% des individus sains par rapport à un seuil de 30 individus. Un seuil de 5 individus est optimal, avec une augmentation de 65 % des individus sains par rapport au seuil de 30 individus.

POINT CLÉ 5 : les politiques de dépistage sont d'autant plus efficaces qu'elles sont appliquées tôt, et l'écart semble se creuser à mesure que le nombre de tests disponibles au quotidien augmente. Un seuil de 5 individus infectés, comparé à un seuil de 30 individus infectés, augmente le nombre d'individus sains à la fin de l'épidémie de 60 % pour une politique de 1 test, et de 65 % pour une politique de 5 tests.

Et si nous combinions des stratégies de quarantaine et de confinement ?

2.1.5. Impact combiné des stratégies de dépistage et de confinement

Combinons désormais les stratégies de confinement et de dépistage avec différentes configurations. La probabilité que chaque test aboutisse à une quarantaine est toujours pquarantaine = 0.3.

Tout d'abord, comparons toutes les combinaisons d'absence de confinement, de confinement d'un mois, d'aucun test quotidien et de 1 test quotidien pour un confinement tardif (seuil de 30 personnes infectées).

small combined lockdown test 30 threshold

Le scénario avec un confinement d'un mois et aucun dépistage est un peu plus efficace que celui avec 1 test par jour et aucun confinement, mais pas de beaucoup (augmentation de 20 %). Toutefois, la combinaison des stratégies de confinement d'un mois et d'un test quotidien donne des résultats prometteurs, en triplant presque le nombre de personnes saines à la fin de l'épidémie.

Que se passerait-il si nous appliquions le confinement et le dépistage plus tôt ?

small combined lockdown test 5 threshold

Il est intéressant de noter que l'écart entre le scénario "1 mois de confinement - aucun dépistage" et le scénario "aucun confinement - 1 test par jour" semble se réduire. Les deux sont d'autant plus efficaces qu'ils sont mis en œuvre plus tôt. La stratégie combinée donne les meilleurs résultats que nous ayons pu observer dans l'ensemble de nos simulations.

Même si le nombre de tests quotidiens disponibles est faible par rapport à la taille de la population, un cercle vertueux est observé. En effet, le confinement ralentit la propagation de l'épidémie. Cela laisse plus de temps pour tester la population et mettre en quarantaine les individus infectés, ce qui permet de maîtriser encore plus l'épidémie.

POINT CLÉ 6 : la combinaison d'une politique de dépistage et d'un confinement crée un cercle vertueux, surtout lorsqu'elle est appliquée de manière précoce. Comme le confinement ralentit la propagation de l'épidémie, un plus grand nombre d'individus peuvent être testés et mis en quarantaine, ce qui permet de maîtriser davantage le virus. Par rapport au pire scénario sans aucun confinement ni dépistage, le nombre d'individus sains après l'épidémie triple presque lorsqu'un confinement d'un mois tardif (seuil de 30 individus infectés) est combiné avec 1 test quotidien. Si cette stratégie combinée est appliquée de manière précoce (seuil de 5 individus), ce nombre est plus que quadruplé.

2.2. Passage à l'échelle des simulations sur de grands graphes

Nous avons effectué notre simulation sur une population beaucoup plus importante : un graphe à un million de nœuds, qui pourrait par exemple représenter une grande ville comme Marseille, en France. Certains phénomènes sont plus faciles à repérer avec des graphes plus grands, le réservoir d'individus en bonne santé étant beaucoup plus important.

Nous avons effectué une seule simulation par ensemble de paramètres au lieu de 100, à la fois pour des raisons de puissance de calcul et parce que les chances que la propagation converge vers un même état final sont plus élevées pour les grands graphes. Nous avons choisi les paramètres suivants :

  • Taille totale de la population : 1 000 000 ;
  • Nombre moyen de membres de la famille par individu : 3 ;
  • Facteur multiplicatif appliqué à la probabilité de transmission pendant le confinement pour les membres de la famille : Kfamille_pendant_confinement = 5;
  • Nombre moyen de connaissances par individu (y compris la famille) : 30 ;
  • Nombre moyen d'inconnus par individu : 300 ;
  • Facteur multiplicatif appliqué à la probabilité de transmission pendant le confinement pour les inconnus croisés : Kinconnus_pendant_confinement = 1/10.

Nous calculons également la probabilité de transmission afin que chaque personne infectée expose en moyenne trois autres personnes au virus hors confinement, tout en garantissant que :

  • pconnaissances = pfamille / 5;
  • pinconnus = pfamille / 100.

2.2.1. Simulation du pire scénario : pas de confinement ni de quarantaine

Étudions d'abord les résultats pour un scénario sans confinement ni quarantaine.

large worst case 0

Le nombre maximum d'individus infectés dans la simulation à grande échelle se produit à une date beaucoup plus tardive que dans les simulations précédentes à petite échelle (jour 133 au lieu du jour 36), car il y a beaucoup plus d'individus à infecter pour l'atteindre. Il est également intéressant de noter que le pic a la même intensité, soit 12 % de la population totale, que dans le cas des plus petits graphes.

2.2.2. Impact de la durée du confinement

Simulons maintenant des confinements de durées différentes. Les confinements se produisent lorsque 15 000 personnes sont infectées, ce qui est assez tardif (cela correspond à peu près à l'application du confinement en France).

large lockdown lengths comparison

Comme l'illustre le graphique ci-dessus, un confinement plus long ne réduit pas significativement le nombre de personnes qui ont été exposées au virus à la fin de l'épidémie (un confinement de 3 mois n'évite l'exposition au virus qu'à 2 211 personnes de plus, soit 0,2 % de la population).

Les graphiques suivants illustrent l'évolution au cours du temps du nombre d'individus susceptibles (i.e. sains), exposés, infectés, guéris et décédés, avec différentes durées de confinement.

Avec un confinement d'un mois :

large 1 month lockdown 1

Et avec un confinement de 3 mois :

large 3 month lockdown 1

Un rapide coup d'œil aux graphiques montre qu'un confinement plus long retarde l'extinction complète de l'épidémie, c'est-à-dire le moment où il n'y a plus ni individu exposé ni individu infecté. La fin de l'épidémie se produit vers le 650ème jour pour un confinement d'un mois, mais seulement vers le 1600ème jour pour un confinement de trois mois ! Le nombre d'individus décédés n'est pas beaucoup réduit par un confinement plus long, diminuant de près de 1%. On serait en droit de penser que ce n'est pas si convaincant...

Cependant, en y regardant de plus près, on constate que le confinement divise la propagation de l'épidémie en deux pics d'individus infectés, les deux pics étant espacés au moins par la durée du confinement. Plus la période de confinement est longue, plus les pics sont aplatis et espacés.

En revanche, sans aucun confinement, on n'observe qu'un seul pic de personnes infectées, ce pic unique étant plus important que l'un ou l'autre des deux pics observés dans les scénarios avec confinement.

En d'autres termes, une stratégie de confinement permet d'étaler dans le temps le nombre de personnes ayant besoin d'une assistance médicale.

C'est exactement ce que les gouvernements recherchent ! Dans le monde réel, les pays s'efforcent de fournir des soins intensifs et des lits d'hôpitaux aux personnes présentant des symptômes, et tout ce qui peut alléger leur fardeau s'avère salvateur.

POINT CLÉ 7 : pour les grands graphes comportant un plus grand nombre d'individus sains, les stratégies de confinement tendent à diviser la propagation de l'épidémie en deux pics d'individus infectés. Chacun de ces deux pics est considérablement réduit par rapport au pic unique d'environ 200 000 individus infectés observé sans confinement (réduction de 15 % pour un confinement de trois mois, en considérant le plus élevé des deux pics). Les stratégies de confinement peuvent donc faire une réelle différence dans la gestion de crise dans les infrastructures de santé.

2.2.3. Impact de la stratégie de dépistage

Qu'en est-il de la politique de dépistage qui est actuellement appliquée en France ? Effectuer 10 000 tests par jour sur 67 millions d'individus avec une probabilité de quarantaine de 0,3 équivaut à effectuer 150 tests par jour sur 1 million d'individus.

large 150 tests

Cela semble assez inefficace, les petites différences constatées par rapport au pire scénario étant très probablement dues uniquement à l'aspect aléatoire des simulations.

Que se passe-t-il en revanche si l'on effectue 750 tests par jour au lieu de 150 ? Cela correspondrait au projet du gouvernement français d'augmenter le nombre de tests quotidiens de 10 000 à 50 000.

large 750 tests

C'est déjà plus efficace, puisque le nombre d'individus sains augmente de 12 % et que l'intensité du pic d'infectés diminue de près de 3 %. Mais pas encore assez efficace.

2.2.4. Impact combiné des stratégies de dépistage et de confinement

Comme nous l'avons fait pour les petits graphes, combinons les stratégies de confinement et de dépistage - toujours appliquées avec un seuil de 15 000 individus infectés et pquarantaine = 0.3.

large 150 tests lockdown comparison

Il est intéressant de noter qu'un confinement de trois mois, combiné à 150 tests quotidiens, semble suffisant pour maîtriser rapidement l'épidémie (avant le 180ème jour) et pour limiter de manière significative le nombre d'individus exposés au virus.

Zoomons sur ce scénario avec un confinement de 3 mois et 150 tests quotidiens :

large 150 tests 3 months 1

Moins de 7 % des individus sont exposés au virus, et le pic d'individus infectés ne représente que 2 % de l'ensemble de la population. Le nombre total de décès est divisé par plus de 13 par rapport au scénario le plus pessimiste. Le pic initial est réduit de près de 85 %, même s'il est avancé au jour 92 au lieu du jour 133. De plus, contrairement au scénario sans quarantaine, aucun second pic n'est observé.

Que se passe-t-il si nous passons à 750 tests par jour ?

large 750 tests lockdown comparison

Il semble qu'avec 750 tests quotidiens, un confinement de 2 mois suffise pour maîtriser l'épidémie avant le 160ème jour.

Zoomons sur ce scénario avec un confinement de 2 mois et 750 tests quotidiens :

large 750 tests 2 months 1

C'est impressionnant : l'épidémie est rapidement maîtrisée, et les résultats sont similaires à ceux du scénario avec trois mois de confinement et 150 tests quotidiens.

POINT CLÉ 8 : dans les simulations à grande échelle, la combinaison de stratégies de confinement précoce et de quarantaine reste le moyen optimal de faire face à l'épidémie. Le cercle vertueux observé dans les simulations sur des petits graphes passe bien à l'échelle. Un confinement de 3 mois, combiné à 150 tests quotidiens, est suffisant pour maîtriser complètement l'épidémie en moins de 6 mois. En augmentant la capacité de tests quotidiens à 750, un confinement de 2 mois devient suffisant pour atteindre des résultats similaires en 5 mois environ. Dans les deux cas, aucune seconde vague de personnes infectées n'est observée.

3. Extensions du modèle

Nous avons identifié les idées suivantes à explorer par la suite :

  • Il serait intéressant de tenir compte de la répartition de la population par âge, ou d'autres critères pouvant influencer l'épidémie : temps d'incubation, temps d'infection, taux de létalité, etc.
  • Il serait également intéressant de modéliser le fait que le taux de létalité augmente probablement avec le nombre de personnes infectées au-delà d'un certain seuil, en raison de la saturation des systèmes de santé nationaux. Il en va de même pour la probabilité de dépistage, car la communauté médicale et les gouvernements deviennent de plus en plus sensibilisés à cette question. Ces deux facteurs influenceraient le modèle dans des directions opposées.
  • Enfin, nous avons choisi d'effectuer nos simulations sur une population maximale d'un million d'individus. Les faire tourner sur une population similaire à celle d'un pays comme la France (avec 67 millions d'individus) serait certainement très instructif.

Conclusion

Nous avons mis en évidence quelques points clés tout au long de l'article. Notre modèle, que nous avons conçu uniquement à des fins pédagogiques, a permis de tirer les conclusions suivantes :

  • Les stratégies de confinement sont efficaces pour réduire l'impact du virus, surtout lorsqu'elles sont mises en œuvre rapidement. Plus le confinement est appliqué tardivement, plus il doit être long pour être efficace.
  • Des stratégies de confinement plus longues sont plus efficaces, mais avec des rendements décroissants. Il est donc très difficile, voire impossible, de rattraper un retard important dans l'application du confinement simplement en prolongeant la durée de celui-ci.
  • Lorsque la population est importante, les stratégies de confinement ont tendance à diviser la propagation de l'épidémie en deux pics d'individus infectés. Chacun de ces deux pics est considérablement réduit par rapport au pic unique observé sans confinement. Cela peut faire une réelle différence dans la gestion de la crise des infrastructures de santé.
  • Une politique de dépistage, avec une mise en quarantaine des personnes testées positivement, est également efficace pour réduire l'impact du virus, surtout lorsqu'elle est appliquée de manière précoce.
  • Les stratégies de dépistage sont d'autant plus efficaces que le nombre de tests quotidiens est élevé. Cependant, compte tenu des difficultés pratiques de mise en œuvre d'un dépistage massif des individus, les seules stratégies de quarantaine peuvent ne pas s'avérer aussi efficaces que les stratégies de confinement.

Enfin, la combinaison d'une politique de dépistage et d'une stratégie de confinement semble être la meilleure solution pour faire face à l'épidémie.

Pour notre simulation à grande échelle, un confinement de 3 mois avec une stratégie de 150 tests quotidiens (sur une population d'un million d'individus) suffit pour maîtriser complètement l'épidémie en moins de 6 mois avec des résultats impressionnants. En portant la capacité de tests quotidiens à 750, un confinement de deux mois suffit pour obtenir des résultats similaires en cinq mois environ. Dans les deux cas, aucune seconde vague épidémique n'est observée.

La combinaison d'une politique de dépistage et d'une stratégie de confinement crée un cercle vertueux : à mesure que le confinement ralentit la propagation de l'épidémie, davantage d'individus peuvent être testés et mis en quarantaine, ce qui permet de maîtriser d'autant mieux le virus.

Maxime CARTAN
Co-fondateur & Président
Citalid

Je tiens à remercier mon épouse Pauline qui, en plus d'avoir supporté quelques longues soirées de modélisation d'épidémies, a grandement amélioré cet article grâce à son talent de vulgarisatrice ainsi qu'à ses relectures méticuleuses.

Je tiens également à remercier Georgina HALL, professeure assistante en sciences de la décision à l'INSEAD, Olivier HAMON, directeur technique de Citalid, ainsi que mon beau-frère Romain COSSON. Discuter de mathématiques avec eux est toujours un plaisir plein d'enseignements : ils ont beaucoup contribué à cet article par leurs idées, leur soutien et leur relecture.

Annexes

Tableau récapitulatif des simulations à petite échelle

ScénarioNumber of individuals à la fin de l'épidémie
Confinement (semaines)Tests quotidiensSeuil de la stratégieSusceptibles (sains)GuérisDécédés
00N/A18.279.62.2
403038.759.61.7
1543.155.41.5
551.447.21.4
803042.555.91.6
1554.544.31.2
566.932.20.9
1203043.155.31.6
1555.942.91.2
571.727.50.8
00.13020.178.21.7
1521.077.21.7
523.674.61.8
013031.966.41.7
1532.066.11.9
550.448.51.1
053053.645.11.3
1567.431.80.9
588.311.30.3
413049.449.31.3
1562.436.61.0
578.820.60.5
813049.649.11.3
1563.135.91.0
581.518.00.5
453056.042.91.2
1570.928.20.8
588.810.80.4

Tableau récapitulatif des simulations à grande échelle

ScénarioNombre d'individus à la fin de l'épidémie
Confinement (semaines)Tests quotidiensSeuil de la stratégieSusceptibles (sains)GuérisDécédés
00N/A7,496968,79623,708
4015,0008,583967,88923,528
8015,0009,622966,43823,940
12015,0009,707966,55823,735
015015,000104,476873,84221,682
4111,153867,15321,694
8181,211799,16119,628
12934,91263,4941,594
075015,000113,748864,83721,415
4128,403850,26621,331
8938,45260,0731,475
12938,45160,0701,479