ECLATS : Extraction automatisée de Contenus GéoLinguistiques d’Atlas et analyse Spatiale

Le projet ANR ECLATS concerne la valorisation et l’analyse des documents cartographiques anciens, un patrimoine historique et culturel reconnu comme source d’information particulièrement riche mais difficilement exploitable. Nous nous intéressons plus particulièrement à l’Atlas Linguistiques de France (ALF), élaborés entre 1902 et 1910 et qui fournit les données de premier ordre en dialectologie. L’objectif est d’apporter un outillage logiciel et méthodologique facilitant l’extraction, l’analyse, la visualisation et la diffusion des données contenues dans les atlas linguistiques anciens afin de permettre des recherches novatrices en dialectologie. Le projet s’attache à :

  1. définir des modèles de représentation des données géolinguistiques en vue de leur intégration dans un système d’information ainsi que des formats d’échange favorisant l’interopérabilité des données ;
  2. proposer un processus de stockage des cartes numérisées afin de faciliter leur exploitation et leur diffusion et développer des méthodes d’extraction de contenus par vectorisation et annotation de contenus de cartes anciennes. Le caractère générique des propositions doit permettre leur application à d’autres documents cartographiques anciens.
  3. développer des méthodes d’analyse spatiale et de géovisualisation facilitant la production de cartes interprétatives et l’extraction de connaissances géolinguistiques ;
  4. promouvoir une démarche collaborative afin de faciliter la mutualisation et la diffusion des données géolinguistiques.