Recherche
 
   
  Du concept HBDS à la geodatabase topologique : 25 ans les séparent
     
  Françoise PIROT
CNRS-SIS-CEIAS-UMR8564

Thierry SAINT GERAND
Université de CAEN, GEOSYSCOM-UMR6063 CNRS IDEES
 
 

I : Introduction : rendre intelligible la complexité spatiale

Parmi la gamme des Systèmes d’information existants, les S.I.G. sont probablement ceux qui s’attaquent à l’un des problèmes méthodologiques les plus ardus :Comment appréhender le monde réel qui est à la fois complexe et multidimensionnel ? Parmi ces dimensions, trois au moins concourent ensemble à une certaine compréhension et à une certaine mis au jour des phénomènes qui composent celui-ci. Ces dimensions ou ensembles ou espaces sont l’espace de la réalité observable (thématique, sémantique), l’espace spatial ou géographique, l’espace temporel, espaces dans lesquels s’inscrivent les phénomènes qui participent à la construction de tout ou d’une partie du monde réel en fonction d’une problématique ou d’une application donnée.

Afin d’exprimer et communiquer la structure interne des phénomènes ainsi que des liens existants entre et à l’intérieur de ceux-ci, une modélisation est à réaliser. Au sein des méthodes proposées pour traiter les phénomènes spatiaux, celles d’inspiration hypergraphique et ensembliste apparaissent aujourd’hui comme des plus efficaces. Elles permettent de représenter sous forme de graphes et d’hypergraghes, de classes et d’hyperclasses, de liens et d’hyperliens la structure interne des phénomènes simples. Les phénomènes simples liés entre eux vont contribuer d’une part à la compréhension des phénomènes complexes exprimant une partie du monde réel étudié, d’autre part à réaliser un modèle conceptuel de données . L’auteur de cette méthode connue sous le nom HBDS (Hypergraph Based Data Structure) est F. Bouillé. La méthode hypergraphique permet d’élaborer les diagrammes de classes à partir desquels est construit le modèle logique puis physique.

II : Les étapes de la modélisation des données (cf figures 1 et 2)

- La modélisation géographique du monde réel réalisée en fonction d’une problématique donnée, d’une application donnée à l’aide de la méthode HBDS. Cette modélisation doit être réalisée par le thématicien du domaine
- le modèle conceptuel de données
- le modèle logique
- le modèle physique


Figure 1 : les différents niveaux de modélisation ( F. Pirot, 2000)


Figure 2 : Démarche méthodologique en vue de la conception et de la création d’un système d »information géographique ( F. Pirot, 2002)

III : Des concepts HBDS et de la topologie à leur implémentation logicielle : 25 ans les séparent

A la fin des années 1970, en parallèle avec le développement de la pensée « systémique », sont apparues de nouvelles approches, de nouveaux concepts et principes de formalisation concernant d’une part la structure des données, leur gestion, leur archivage, leur mise à jour, et d’autre part la structuration de l’information spatiale et aspatiale (thématique) . C’est François Bouillé, géologue et informaticien, qui proposa dans le cadre de sa thèse d’état l’application et la mise en œuvre de la théorie des graphes et des hypergraphes, de la topologie, de la théorie des ensembles pour créer « un modèle universel de banques de données, portable et simultanément partageable » ( titre de la thèse de Bouillé). Ces nouvelles approches sont apparues suite à un constat que les méthodes de type relationnel mis au point et utilisée dans le domaine de la gestion ne permettaient pas de prendre en compte d’une façon satisfaisante l’aspect géographique des « objets » c’est à dire, entre autres, la référence spatiale ( longitude, latitude, type d’emprise, forme, voisinage…) comme composante intégrante de l’objet et non comme de simples attributs de l’objet.

Mais il aura fallu 25 ans pour que ces concepts, ces réflexions, ces méthodes trouvent leur implémentation complète dans un logiciel, jusqu’à l’intégration de la topologie aussi bien dans la structure interne de l’information spatiale que dans la structure externe des données constituant des bases de données spatiales et les systèmes d’information géographique.

En effet, c’est déjà en 1977, que François Bouillé, géologue et informaticien, proposait « Un modèle universel de banque de données, simultanément partageable, portable et répartie ». Il introduisait les concepts de la théorie des graphes et des ensembles pour appréhender d’une part les structures internes de l’information spatiale et thématique, d’autre part pour manipuler, gérer, organiser, archiver les données dans les « banques de données ». Les concepts d’ Hypergraphe, de Graphe furent alors utilisés dans la conception et la création des bases de données spatialisées qui vont être alors structurées topologiquement. A l’époque, F. Bouillé écrivait à propos du modèle mathématique de la structure des données :

- « Un ensemble de graphes et hypergraphes constitue l’armature de la MAC N°1; cette armature est en quelque sorte un espace topologique supportant les données, sans le secours d’aucun espace métrique
- le second chapitre traite d’un point fondamental qui est la reconnaissance de la structure des phénomènes guidant la construction de la SD (Structure de Données). Il présente une construction peu traditionnelle et à l’encontre des idées communément admises jusqu’alors : la SD est déduite des phénomènes non des problèmes »

D’autre part, la structuration de l ‘information spatiale est pensée selon un modèle topologique c’est à dire qu’un objet géographique est assimilé à un graphe planaire particulier. Puis au début des années 1980, est conçu et créé le logiciel ArcInfo de type Géorelationnel. Les objets géographiques ont une structure interne possédant une topologie en terme de proximité, de contiguïté, de continuité. Ce sont des graphes planaires topologiques sans isthme auxquels sont associés des graphes duals. Durant la décennie 1980 - 1990, sont développées des méthodes algorithmiques prenant en compte le concept de topologie lors de la modélisation des objets, méthode qu’on va appeler « orientée objet ». De 1990 à 1995 surgissent plusieurs langages de modélisation qui vont donner naissance au langage de modélisation qui porte le nom de UML c’est à dire Unified Modelling Language En 1999-2000, s’introduit clairement la philosophie orientée objet dans une nouvelle gamme de produits ESRI à savoir ArcGis8.0. Au fur et à mesure des versions successives se déploie le concept de geodatabase et son expression à travers le langage UML. En 2003 , les principes de la topologie commandent la structuration interne de la geodatabase avec l’avènement d’ ArcGis8.3

ArcGisArcEditor : est le module de la gamme ArcGis qui est entièrement dédié à la création de la geodatabase topologique. Le module ArcEditor ne travaille qu’à partir d’un modèle conceptuel de données créé à partir d’une modélisation géographique. Une fois que le modèle conceptuel est rédigé selon la méthode hypergraphique HBDS, on peut créer la geodatabase qui va être une image physique du modèle conceptuel de données. En d’autres termes, la geodatabase ou modèle physique n’est autre que le modèle conceptuel de données (MCD) créé physiquement en « dur » mais vide d’objets. Par ailleurs, chaque case de la geodatabase c’est à dire du diagramme de classe correspond à une classe du MCD. On peut faire le paralléle entre les concepts développés dans la méthode hypergraphique HBDS de F. Bouillé et les concepts développés dans ArcGis et plus particulièrement dans ArcGis-Arceditor (ESRI). La correspondance est explicitée dans le tableau suivant

IV : Etude de cas : Projet Chanderi (Inde)

Le projet « Chanderi », relevant du domaine de la sociologie urbaine historique, a été initié par le Professeur G. Fussman du Collège de France, spécialiste de la civilisation indienne. Chanderi est une ville moyenne de 20000 habitants située au Sud Ouest de Delhi, dans l’état du Madhya-Pradesh, en bordure du plateau du Malwa (cf carte n°1). Le projet s’appuyait sur un S.I.G. pour étudier la ville du 11ème au 20ème siècle et comprendre globalement les interrelations entre les différents phénomènes historiques, sociologiques, culturels, spatiaux, naturels, économiques, etc…. Un modèle conceptuel a été conçu et créé selon la méthode HBDS en 1994. Dans un premier temps, les informations spatiales et/ou thématiques ont été créées intégralement (rien n’existant alors) à partir de sources très variées, hétérogènes, de qualité et de précision différentes comme les photographies aériennes, l’information satellitaire, les cartes topographiques, géologiques, les plans cadastraux, les enquêtes sociologiques, le suivi des parcours des processions religieuses, etc….


Carte n°1 : Carte de localisation de la ville de Chanderi (Madhya Pradesh – Inde) mise en relation avec le phénomène géologique et le phénomène topographique



IV-1 : Présentation du passage direct du Modèle Conceptuel de Données (MCD) de Chanderi (Inde) selon la méthode hypergraphique HBDS et la création de la geodatabase chanderi avec ArcGis/ArcEditor.


Création des hyperclasses (featuredataset) : agriculture, géologie, hydrographie, perception de l’espace, sociologie, topographie


IV-2 : Création des liens entre les classes avec relationship class


Création du lien castes_professions (relationship class) entre la classe (featureclass) castes et la classe (featureclass) professions



Création du lien castes_religions (relationship class) entre la classe castes et la classe religions


IV-3 : interrogation de l’information spatiale et aspatiale contenue dans l’hyperclasse (featuredataset) géologie.




classes (featureclass) ere, systeme, groupe, sous_groupe, type_de_roche de l’hyperclasse (featuredataset) geologie


Conclusion

Ces quelques développements ont permis de résumer l’historique de l’apparition de la modélisation hypergraphique, son développement logiciel, et de les illustrer via l’exemple thématique d’application fourni par le cas de la ville de Chanderi. L’avancée méthodologique majeure à en retenir est que , sous réserve d’un MCD suffisamment approfondi, la philosophie HBDS, telle que le concept de geodatabase l’introduit dans l'encapsulage objet permet de rendre informatiquement opérable sur la base d'une formalisation universelle, l'univers des requêtes de tous types (logiques, spatiales, temporelles, fonctionnelles....) nécessaires à la compréhension globale (éléments constitutifs, structure et processus évolutif éventuellement) d'un phénomène géographique.


Références Bibliographiques

Berge C. 1970 Théorie des graphes et des hypergraphes - Editeur : Dunod

Bouillé François, 1975 Structuration et saisie des données cartographiques. Journée d'étude: Acquisition et structuration de l'information graphique, Comité Français de Cartographie (CFC), Paris

Bouillé François, 1977 Un modèle universel de banque de données simultanément portable, répartie, Thèse d'Etat Es Sciences (spécialité : mathématiques, mention : informatique) Paris : Université Pierre et Marie Curie- Paris VI

Bouillé François 1978. Structuring cartographic data and spatial processes with the hypergraph-based data structure. In Geoffrey Dutton (ed.) First International Symposium on Topological Data Structures for GIS. Cambridge, Massachusetts: Laboratory for Computer Graphics and Spatial Analysis, Harvard University

Denègre J. et Salgé F. 1997 :
Système d'information géographique

Que sais-je n°3122 – PUF

Gabay J., 2001 ; Merise et UML pour la modélisation des systèmes d’information
Editeur : Dunod

Longley Paul A., Goodchild Michael F., Maguire David J., Rhind David W. 1999 : Geographical Information Systems ( 2 volumes), Second Edition
Editeur : John Wiley and sons

Longley Paul A., Goodchild Michael F., Maguire David J., Rhind David W 2001 : Geographic Information Systems and Science.
Editeur : John Wiley and sons

Longley Paul A., Brooks Sue M., MCDonnell Rachael, MacMillan Bill 1998 : Geocomputation, A primer
Editeur : John Wiley and sons

Molenaar Martien 1998 : An introduction to the theory of spatial objetc modelling for GIS
Editeur : Taylor and Francis

Raper J. 2000 : Multidimensional geographic information science
Editeurs : Taylor and Francis

Fotheringham S. and Rogerson P. 1994 : Spatial Analysis and GIS
Editeurs : Taylor and Francis

Fussman G., Sharma K., 1996 : Chanderi 1993 – 1996
Editeur :
Fussman G; Matringe D., E. Ollivier, Pirot F. 2003, Naissance et déclin d’une qasba: Chanderi du Xè au XVIIIè siècle, collège de France, publications de l’Institut de civilisation indienne, édition-diffusion de BOCCARD

Keith C. Clarke 1990 Analalytical and computer cartography
Hunter College - City University of New York
Editeur : Prentice Hall, Englewood Cliff, New Jersey

Haggett P. 1970 Analyse spatiale en géographie humaine
traduction de l'anglais. Collection U2 - DUNOD

Matringe D., Pirot F., Saint Gérand Th., Fussman G., Ollivier E. 1996 :
Un système d’information géographique sous ArcInfo appliqué à la recherche en sciences humaines : le programme “Chanderi” de morphologie urbaine historique.
Mémoire Vive, Bulletin de l’association française pour l’histoire et l’informatique, n° .

Pirot F., Ernould J.C., Fournet F.,2002 Les disparités spatiales de santé dans la ville de Ouagadougou (Burkina Faso), Une modélisation d’une genèse d’espaces à risques sanitaires selon la méthode hypergraphique H.B.D.S., Colloque francophone ESRI 2002, Issy-les-Moulineaux, 0ctobre 2002

Saint-Gérand T., 2002, « SIG : Structures conceptuelles pour l’analyse spatiale ». Thèse d’HDR, Univ. De Rouen
Pirot F., Saint-gérand Th., 2003 ARCINFO : un logiciel pour thématiciens. Bilan de 10 ans de formation par la recherche dans le secteur des Sciences de l’homme et de la société, Colloque francophone ESRI 2003, Issy-les-Moulineaux, 0ctobre 2003

Zeiler Michael 1999 : Modelling our World, The ESRI Guide to Geodatabase Design, ESRI Press
Zeiler Michael, David Arctur 2004 : Designing Geodatabases, Case Studies in GIS Data Modeling, ESRI Press

MacDonald A. 1999 : Building a geodatabase, Arcinfo8
ESRI Press