 |
Gestion des risques de santé en milieu urbain - Une orientation géostatistique et géospatiale d'un système multi agents
IV. Création des variables et analyses |  |  |
|  | L’approche méthodologique se résume en des séquences logiques devant aboutir à la mise en place du SMA. La première étape a consisté à la conceptualisation thématique et spatiale des variables associées au paludisme. En deuxième lieu, il a fallu créer ses variables. La troisième étape a consisté en une sélection rigoureuse des variables les plus fortement corrélées au paludisme, cette étape a permis l’optimisation statistique du modèle à mettre en place. Dans la quatrième étape, il a fallu construire une application spatiale du modèle statistique. Les deux dernières étapes ont servi d’éléments clés pour la mise en place du Système Expert (SE). En dernier lieu une définition fonctionnelle du SMA a été introduite.
1. Conceptualisation thématique et spatiale des variables associées au paludisme L’identification des variables potentiellement associées au paludisme s’est basée sur une multitude de travaux de recherches ayant abouti à des associations entre variables de multiple nature et le paludisme. Si l’une des règles fondamentales d’un SMA est de laisser le système ouvert sans aucune hypothèse au départ, il est évident que le SE deviendra très vite chaotique et la base de donnée physique excessivement lourde. Le système reste ouvert dans sa conceptualisation avec précisément l’introduction de variables qui pour théoriquement associées qu’elles soient au paludisme ne le sont pas forcément dans le cas de Yaoundé. Les évidences scientifiques combinées à une bonne connaissance empirique de la maladie ont également permis de dégager un paradigme original du paludisme urbain. Ce paradigme intègre l’habitat comme étant à la lisière entre le social et l’écologique (Figure 2).
 | Figure 2 : le paradigme du paludisme urbain |
2. Création des variables et analyses Le processus de création des variables s’est fait en deux grandes étapes suivant la nature des ces variables. Une grande partie des variables a été créée aux travers d’enquêtes de terrain à caractère rétrospectif. Une méthode stratifiée a permis la couverture spatiale de la ville entière, tandis que l’échantillonnage au hasard à l’intérieur des strates permettait de respecter les règles d’échantillonnage en épidémiologie (Figure 3). Cette méthode a permis la création d’une multitude de variables géoepidemiologiques et géosociales. L’information géographique sous-jacente se révélait être d’une résolution spatiale très fine. En effet le réseau dense de points formés par les individus/ménages enquêtés a permis une exploration intra spatiale (à l’intérieur des limites administratives de la ville) de toutes ces informations (figure 4). Des indicateurs mathématiques additionnels ont été construits à partir de ces variables [14].
 | Figure 3: Une méthode stratifiée et aléatoire pour la collecte des données socioépidémiologiques |
Pour éviter des artéfacts inhérents (au calcul d’une prévalence par ménage, un risque relatif du paludisme a été calculé [14] :
 |
représente un ménage; est le risqué relatif du paludisme calculé pour un ménage , représente le nombre de cas de paludisme dans un ménage pendant la période concernée; est le nombre de personnes vivant en permanence dans un ménage pendant la période concernée; est le nombre moyen de cas de paludisme dans un ménage pendant la période concernée, est calculé pour tout l’échantillon; est le nombre moyen de personnes vivant dans un ménage pendant la période concernée, est calculé pour tout l’échantillon. Une autre partie des variables dites écologiques ou naturelles a été créée à partir de diverses sources : images Quickbird de la ville de Yaoundé (0,6 m et 2,4m de résolution), données topographiques ASTER de 30 mètres de résolution, données Aster (15 mètres-30 mètres et 90 mètres de résolution) ont permis d’obtenir des valeurs de NDVI par saisons. (table 1) : Les données de climat ont également été introduites dans le la modélisation (table 1)
L’analyse statistique a eu un objectif discriminatoire, il s’agissait dans un premier temps d’éliminer les variables statistiquement non associées au risque relatif du paludisme, cette étape a été réalisée au travers de simple analyses bivariées faites avec Stata. En second lieu les variables qui bien que associées au risque relatif du paludisme étaient également statistiquement et thématiquement corrélées entre elles ont été soumises à un second processus de discrimination. Ainsi par exemple, la variable définissant un index économique basé sur les revenus des ménages et les dépenses a été sélectionnée au détriment d’une variable telle que le type d’emploi du chef du ménage. La troisième étape a consisté en l’élaboration de modèles logistique multinomiaux [15] [16]. Quatre modèles prédictifs ont été ainsi définis suivant la thématique des variables (table 1). Une évaluation de leur performance a été faite (table 1) : le modèle final a regroupé les bonnes prédictions de chacun des modèles distincts (table 1).

 | Table 1 : variables introduites et performances des modèles |
Les modèles spatiaux ont été construits au travers d’une méthode d’interpolation spatiale en l’occurrence la méthode des Fonctions à Base Radiale ou « Radial Basis Function » (RBF). Le choix de cette méthode n’est pas hasardeux. Elle a tenu compte du type de la distribution géostatistique (normalité et densité) de l’échantillon (les points constitués par les ménages). Une analyse préalable par une méthode bootstrap avec pour objectif de comparer l’exactitude des prédictions par diverses méthodes a été également faite (figure 4).
 | Figure 4 : comparaison des performances des méthodes d’interpolation spatiale |
 | Figure 5: Modèle spatiaux observés et prédits |
|
VI. Définition fonctionnelle et mise en place du SMA |  |  |
|  | L’objectif général de la mise en place d’un SMA dans le contexte actuel consiste à utiliser le modèle à des fins pratiques tout en intégrant la variété d’agents y intervenant. Ces agents définis dans la (figure 6), ne se limitent pas aux seuls prédicteurs du paludisme précédemment identifiés. Le système se définit selon deux entités d’agents distincts : Une entité qui pourrait être qualifiée de haut niveau et qui correspond en particulier á la conceptualisation, à la création et à l’intégration des données nécessaires [17]. L’entité correspondant au bas niveau se veut plus matérielle, elle est à l’interface directe du potentiel utilisateur (figure 6) [17]. Le système est suffisamment souple et ouvert pour tenir compte de facteurs additionnels (ou de l’évolution de ceux présents) pouvant intervenir à un moment ou un autre en fonction de l’évolution des caractéristiques du risque et de leur gestion. C’est un système qui a une ontologie définissant les relations entre agents [7], c’est un système intelligent [13].
 | Figure 6 : Représentation simplifiée du SMA |
1. Les analyses dans le SMA L’élément clé de l’entité d’analyses est le Data Mining System (DMS) [6] (figure 6): Il correspond à la conceptualisation des données à leur intégration et à leur traitement statistique tel que défini précédemment dans la section IV. C’est l’élément dans lequel toute la richesse de la recherche fondamentale liée au paludisme urbain doit s’exprimer. Ceci laisse supposer que la méthode de conceptualisation, de création et d’analyse des données telle que définie peut être améliorée. Le Data Surveillance System (DSS) (figure 6) correspondrait plus à la méthode mise en place pour collecter les données (voir section IV. 2). Il s’agit en fait de garantir une source pérenne de données, tout en optimisant sur la méthodologie et les outils de collecte des données brutes. La mise a jour de la base de données dépends de cet agent. Dans une perspective de gestion décentralisée, l’entité analyse peut inclure des agents représentant la vision de la gestion politique du risque soit par la municipalité, ou le gouvernement. L’influence des acteurs politiques et de leurs décisions s’illustre à ce niveau. Dans le cas de figure toute décision d’aménagement ou de promotion de lutte antipaludique peut avoir une influence sur le risque paludique. La mise en place du DSS et de ressources avenantes dépendrait dans un contexte sociopolitique normal de l’action des décideurs politiques. Dans une dynamique temporelle on pourrait ainsi assister soit à une baisse de la prévalence ou au contraire à une augmentation de la prévalence et cela pourrait bien être indirectement lié à une décision politique. 2. Le bas niveau dans le SMA Le bas niveau se veut plus concret, c’est le niveau matériel [4]. Il intègre les éléments éprouvés au niveau des analyses et a une vocation automatique dans une approche d’alerte précoce. L’élément le plus original du bas niveau est le Système Expert (SE) [4]. Il sert de boite noire dans cette abondance de variables. En fait la complexité du processus biologique du cycle paludique implique de prendre en compte la variation d’un certain nombre de critères. Il ne suffit pas de retenir des variables prédictives et de les représenter spatialement, encore faut-il en dégager la variabilité temporelle. Cette variabilité du risque est liée à un certain nombre de facteurs qui permettent de définir des seuils. De plus les interactions entre diverses variables doivent êtres prises en compte. Tous ces éléments rendent notre modèle prédictif un peu plus complexe. Le SE vient en définir l’intelligibilité en fixant des règles [20]. Il correspond à un module dédié customisé à l’intérieur d’un SIG et directement lié à une base de données.
L’agent Système de gestion des bases de Données (SGBD) contient des données prêtes à être utilisées par l’agent SIG [9] [4]. Il joue ainsi le rôle normal d’un SGBD. Il n’intègre que les variables introduites dans le modèle statistique final. La base de données physique s’en trouve ainsi moins encombrée. Il tient compte des interactions entre variables et des spécificités intra variables passées par le filtre du SE. L’Agent SIG : contient tous les outils de base nécessaires à la production des cartes via le système expert. Il correspond en l’occurrence dans le cas de figure présent au logiciel ArcGIS 9. Il a pour ainsi dire plus de « moyens » d’analyse que le SE [9] [4]. Il est évidemment en relation avec le SGBD. Tout comme le SE, il produit les cartes de risques ainsi que différents documents graphiques et tabulaires. Les documents produits peuvent être transmis par une interface pouvant prendre diverses formes : portail web et télévision pour diffusion vers large public, intranet (au sein d’une collectivité ou d’une administration par exemple) |
Bibliographie |  |  |
|  | 1. Curtis CF, Lines JD (2000). Should DDT be banned by international treaty? Parasitology today 16: 119-121. 2. Feber J. (1997). Les systèmes multi-agents: vers une intelligence collective. Inter Editions. 3. Fondjo E, Robert V, Le Goff G, Toto JC Carnevale P (1992). Le paludisme urbain à Yaoundé, Cameroon : 2 études entomologiques dans deux quartiers peu urbanisés. Bull Soc Pathol Exot 85: 57-63. 4. Gao G., Wang S., (2004). A multi –Agent system architecture for geographic information gathering. J Zheijiang Univ SCI 5(11):1367-1373. 5. Hay SI, Omumbo JA Craig MH and Snow RW (2000) Earth observation, Geographic Information Systems and Plasmodium falciparum malaria in Sub-Saharan Africa. In Hay SI, Randolph SE, Rogers DJ (ed) Remote Sensing and Geographical Information System in epidemiology, advances in parasitology volume 47, Academic press. 6. Ian H, Witten, Eibe Frank (2005). Data Mining: Practical Machine learning tools and techniques. Morgan Kaufman, San Francisco second Edtion. 7. Jenings N.R, Wooldridge (1998). Agent technology: foundations, applications and markets. Springer verlag 8. Keiser J, Utzinger J, De Castro MC, Smith TA, Tanner M, Burton HS (2004) Urbanization in sub-Saharan Africa and implication for malaria control. Emerging infectious diseases vol 11 n° 8, august 2005. 9. Luo Y.W., Wang X.L., (2000). Research on the Geo-Agents. Journal of Computer Research & Development, 32(12): 1504-1511. 10. MARA/ARMA (1998) Towards an Atlas of Malaria Risk in Africa-First Technical Report of MARA/ARMA collaboration. MARA/ARMA, Durban. 11. Maurice Halbwachs (1938). Morphologie Sociale. Armand Colin. 12. Manga L, Robert V, Messi J, Desfontaine M, Carnevale P. (1992). Le paludisme urbain à Yaoundé, Cameroun: 1. etude entomologique dans deux quartiers centraux. Mém Soc R Belg Ent 35: 155 162 13. Newell A (1982). The knowledge level, Artificial Intelligence, 18: 87-127. 14. Ngom, R. Siegmund A. (2009). Urban malaria in Africa- an environmental and socio-economic modelling approach for Yaoundé, Cameroon. Natural Hazards Journal of the International Society for Prevention and Mitigation of Natural Hazards. Editors T.S Murty; V. Schenk; T. Glade. Journal n° 11069 Extreme events: vulnerability, environment and society, Springer Netherlands. 15. Ngom R, Siegmund A. (2006)a. Using Remote Sensing and GIS to integrate various environmental factors into a predictive malaria transmission risks model in rural Burkina Faso. In : Manfred E, Ulrich M (ed) Remote Sensing for Environmental Monitoring, GIS Applications, and Geology IV. Proceedings of SPIE, volume 6366 63660M-1. 16. Ngom, R. Siegmund A. (2006)b Elaboration d’un modèle prédictif des risques de transmission paludique. In:Géomatique Expert, Nr. 52, Août- Septembre 2006, S.54. 17. Tang C., Xu L.D., (2001). An agent –based geographical information system. Knowledge_Based System, 14: 233-242. 18. United Nations (2002). World population prospects. The 2002 revision dataset on CD-ROM 19. WHO (2008). World Malaria Report. World Health Organization “WHO/HTM/GMP/2008.I 20. Wiseman RH, Symes CB, McMahon JB, Teesdale C (1939). Report on a malaria survey of Mombassa Nairobi, Kenya: The government Printer. 21. Wooldridge M (1997). Agent Based software engineering, IEEE Proc Software Engineering, 144:26-37
|
|
|