Un point sur OpenStreetMap
Quel est l’état du projet OpenStreetMap et comment participe-t-il au développement de la géomatique en général ? Éléments de réponse au travers de l’expérience de la SSLL toulousaine Makina Corpus. i l’on en croit les dernières courbes publiées, le nombre de contributeurs, ainsi que le nombre de données ajoutées, du projet OpenStreetMap (OSM) ne cesse d’augmenter : environ quatre milliards d’informations enregistrées dans la base de données pour un peu plus d’un million cinq cents mille utilisateurs (cf. graphique). La matière première brute est donc abondante, mais, à la différence des référentiels SIG qui se présen-
S
tent sous forme de tables bien structurées, OpenStreetMap propose des données « brutes », où les informations géométriques sont associées à des tags dont les noms ne sont pas toujours homogènes, et les valeurs souvent disparates (par exemple, pour un même tag, on pourra trouver des valeurs en français ou en anglais. Une nomenclature des tags les plus fréquents et devant être utilisés existe, toutefois : http:// wiki.openstreetmap.org/wiki/ Map_features.) Un traitement de fond est donc nécessaire avant même de commencer à utiliser les informations. Chez Makina Corpus, SSLL toulousaine spécialisée en
Figure 1 : Croissance du nombre d’utilisateurs enregistrés sur la plate-forme Open Street Map. Source : Wikipedia. 1. Voir le numéro précédent de Géomatique Expert.
60
Géomatique Expert|N° 98|Mai-Juin 2014
géomatique, OpenStreetMap est utilisé à différents niveaux. « Le premier niveau, pour ainsi dire, explique Frédéric Bonifas, consiste à contribuer personnellement à l’enrichissement de la base ; nous incitons tous les salariés de Makina Corpus à contribuer au projet. Au niveau suivant, nous dispensons des formations pour initier les personnes qui souhaitent devenir contributeurs, afin de leur enseigner à la fois les techniques de relevé et les outils de saisie. Le public intéressé est très divers, depuis des enfants jusqu’à des retraités, en passant par les agents des différentes collectivités territoriales. Parfois, nous intervenons nous-même dans la complétion de certaines zones ; par exemple,
Figure 2 : Extrait du catalogue des tags disponible à l’adresse http://wiki.openstreetmap.org/wiki/Map_features.
dans le cadre du projet Vu du ciel du Conseil général de LoireAtlantique1, nous avons enrichi les données de certaines communes de l’agglomération nantaise. Mais au-delà de cet aspect “contribution”, Makina Corpus travaille naturellement sur les aspects gestion et réutilisation. »
Personnalisation et réutilisation La première utilisation des données OSM consiste en la réalisation de plans de ville personnalisés, ou de fonds de carte spéciaux. Beaucoup de services techniques en mairie travaillent encore avec des outils de dessin vectoriel type Adobe Illustrator®, sans aucun lien avec une base de données géographiques. Avec les données OSM et des outils libres de type Mapnik, il est désormais possible de réaliser des plans qui n’ont rien à envier à la qualité obtenue avec les logiciels de dessin traditionnels, tout en liant les mises à jour à celle d’une base de données, éventuellement centralisée. OSM permet également de répondre à des besoins très particuliers, par exemple la réalisation de plans qui ne requièrent pas de connexion à des serveurs Internet externes, souvent pour des questions de sécurité (grandes entreprises avec des données sensibles, défense). Se pose cependant la question du traitement préalable des données : « Une partie des prestations que nous effectuons consiste précisément à filtrer ces données pour constituer des bases plus conformes à ce qu’attendent les logiciels
Figure 3 : Visualisation de la base des arbres du Conseil général des Hauts-de-Seine sur un fond de plan OpenStreetMap.
SIG, poursuit Frédéric Bonifas. Une partie des traitements est automatisable en créant des règles que l’on injecte ensuite dans des logiciels ETL, par exemple Talend ou GeoKettle. On peut, par exemple rassembler des tags, ou encore détecter les habitudes des contributeurs en analysant leurs ajouts. Les problèmes de qualité sont réels, mais il ne faut pas les surestimer. La BD Adresse® de l’IGN, avec laquelle il nous arrive également de travailler, montre parfois des lacunes ou des hétérogénéités semblables à celles d’OSM, et pourtant elle est commercialisée un bon prix. Heureusement, un grand nombre de développeurs travaillent spécifiquement à la conception d’applications d’évaluation ou d’amélioration de la qualité des données, on peut donc dire que celle-ci augmente avec le temps. » Un autre aspect des données OSM est la possibilité de les enrichir à volonté. L’ajout de données dans la base est particulièrement prisé par les collectivités locales qui y voient la possibilité de valoriser immédiatement des données publiques, plutôt que de les publier sur un serveur Open Data et d’attendre que des volontaires effectuent le transfert vers la base géographique. Ces opérations d’insertion vont de l’ajout de
ponctuels correspondant aux adresses, jusqu’à l’insertion de voies oubliées ou récemment créées. Hors du cadre de l’Open Data, des opérateurs privés peuvent également utiliser et modifier les données OSM, par exemple un grand groupe qui, dans le cadre de son programme de fidélisation, souhaite rédiger une carte personnalisée faisant apparaître ses propres points d’intérêt et disparaître ceux de ses concurrents. Les applications orientées défense utilisent également leurs propres enrichissements (évidemment sans que ceux-ci ne soient reversés dans la base commune !) « Le régime juridique de la base de données n’est finalement pas si contraignant que certains veulent bien le présenter. L’idée est que le reversement n’est obligatoire que si les nouvelles données sont “intimement” liées aux données d’origine. Un concept, j’avoue, assez flou, admet Frédéric Bonifas. Suffisamment, en tout cas, pour que certaines sociétés, comme MapBox considèrent que les points d’adresse présents dans la base ne sont pas utilisables en raison des implications légales de la licence choisie. » Bien que les données OSM soient gratuites, il est possible de les enrichir et de les revendre avec des données dérivées, Géomatique Expert|N° 98|Mai-Juin 2014
61
soit sous forme de fichiers, soit sous forme d’abonnement à un service Internet de type WMS/ WFS. C’est également le cas d’un atlas papier entièrement conçu avec les données OSM, et enrichi de différents points d’intérêt. Les données OSM sont cependant suffisantes pour un grand nombre d’usages, particulièrement quand il s’agit d’exploiter des extractions dans les centres-ville des grandes métropoles, où OpenStreetMap possède souvent un temps d’avance sur les autres fournisseurs. À l’inverse, dans les régions « moins peuplées », OSM présente souvent un aspect de « zone blanche ». « C’est la raison pour laquelle nous encourageons les collectivités territoriales à reverser leurs données, explique Frédéric Bonifas. OSM ne peut pas financer des salariés pour aller couvrir tous les recoins de la France. De plus, cette information existe, dans les communes, les communautés, les parcs naturels, les dépar-
Figure 4 : Image de la densité de traces OSM sur l’Europe. Source : Wikipedia.
62
Géomatique Expert|N° 98|Mai-Juin 2014
tements, les régions. Si ces structures acceptent de reverser leurs bases dans le projet, c’est gagné ! »
Doper l’utilisation ? Le format des données OSM, écrites en XML, est particulièrement souple : il n’y a pas de syntaxe véritable, chacun peut attacher un nombre de tags arbitraire à une donnée. L’inconvénient du XML demeure sa grande verbosité, qui oblige à transférer une quantité de non-informations aux côtés de la donnée utile. Cet inconvénient peut être partiellement résolu, soit en adoptant des formats plus compacts, comme le GeoJSON, soit en constituant des bases extraites dont on élimine les tags inutiles, soit à la volée, soit par prétraitement. Pour les exports, un format binaire dit « ProtoBuf » est également disponible ; compact, il n’est cependant pas lisible facilement par un humain. « Nous ne travaillons jamais avec
le format XML, poursuit Frédéric Bonifas. Nous avons développé une chaîne de traitements qui nous permet d’injecter les données OSM dans PostGIS. Le résultat de nos requêtes est fourni en GeoJSON. De toute manière, il n’est pas possible d’attaquer la base principale OSM pour effectuer des traitements massifs. Cette dernière est essentiellement conçue pour gérer les actualisations, c’est-à-dire des transactions de faible volume. La donnée OSM doit être répliquée sur des serveurs adéquats pour être utilisée dans des applications à grand succès. Il existe pour cela des sources en lecture seule, qui proposent le téléchargement en masse, ce qui permet d’alimenter des serveurs secondaires sur lesquels peuvent tourner des bases de données spatiales à la PostGIS. » Les données OSM vont-elles, à plus ou moins long terme, finir par supplanter les données IGN ? Dans les collectivités locales, qui bénéficient de la gratuité des données IGN, l’heure n’est pas au changement. « On peut cependant s’attendre à ce qu’OSM s’impose sur un certain nombre d’usages bien particuliers. La donnée IGN est encore très attractive, ne serait-ce que pour sa couverture homogène du territoire. En revanche, de plus en plus d’entreprises ou de collectivités territoriales utilisent OSM pour constituer des fonds de plans hautement personnalisés, ce que ne permet pas, par exemple, Google Maps. En géomatique pure, il ne faut pas se voiler la face : les données OSM ne sont que rarement exploitées pour autre chose que de la représentation ; leur usage en analyse demeure marginal. Il y a certaines exceptions :
on peut se servir des données OpenStreetMap pour constituer, par exemple, une base des chemins de halage et connaître ainsi les berges d’un cours d’eau qui sont mal desservies. » « J’ai l’impression, confie Anne Monteils, que la situation dans les collectivités locales est un peu disparate. D’un côté, nous avons les géomaticiens férus d’Open Source, qui utilisent des logiciels comme QGis, et qui connaissent OpenStreetMap et l’utilisent. De l’autre côté, nous avons les géomaticiens plus “classiques”, qui ne connaissent pas OSM, ou s’en méfient, et qui préfèrent la donnée IGN et d’autres référentiels comme le cadastre pour placer leurs données dérivées. Tout n’est pas non plus figé. Je connais au moins une mairie où le service communication, responsable du plan municipal, a accepté d’utiliser OSM comme source, et pour lequel nous avons développé une passerelle vers Illustrator™. Mais ce n’est pas la majorité. » Si la contribution à OpenStreetMap ne demande aucune compétence particulière, ni en géographie, ni en informatique, du fait du développement d’outils de saisie très conviviaux, ce n’est pas le cas de l’exploitation qui demeure, de facto, une prérogative d’informaticien. L’extraction, la manipulation des données XML, leur transformation dans un format plus commode ou leur stockage en base de données sont encore largement au-delà des compétences du grand public. En revanche, les informaticiens créent des applications intuitives qui exploitent les données OpenStreetMap, comme le réseau social Foursquare, par exemple. Toutefois, la commu-
Figure 5 : Le site UMAP permet de réutiliser très facilement les données OSM pour constituer ses propres cartes. Sa page d’accueil affiche, par zone géographique, le nombre de cartes ainsi réalisées.
nauté essaie de faciliter la réutilisation en proposant des outils ergonomiques et conviviaux comme uMap : http://umap. openstreetmap.fr/fr/.
Quel avenir pour OSM ? La base de données nécessite toujours des enrichissements, car de multiples applications se font jour. Mais l’un des problèmes à résoudre tient dans le processus de création de la base : chaque amélioration, par exemple l’ajout d’un tag, doit faire l’objet d’une campagne d’évangélisation. Il faut qu’une majorité de contributeurs l’adoptent, pour que son utilisation devienne envisageable. « Il y a un certain temps, reprend Frédéric Bonifas, nous souhaitions ajouter des informations d’accessibilité pour les handicapés. Nous avons bien créé une nomenclature, mais il fallait derrière convaincre la communauté de l’intérêt d’une telle démarche, faute de quoi elle serait restée vaine. Quel avenir pour les données OSM ? Si j’en crois les dernières statistiques, le nombre de contrib-
uteurs poursuit sa croissance, et la base de données contient de plus en plus d’informations. C’est vrai que cette envolée était plus marquante il y a quelques temps, et tend à se calmer un peu. Mais ce n’est pas pour cela que le projet patine, ni que l’on peut relier OSM à un phénomène de mode. Il faut entretenir le cercle vertueux : plus les développeurs utiliseront les données OSM, plus cela encouragera les contributeurs, donc plus les données seront complètes, etc. Il n’y a pas de raison que cela cesse, tant que les utilisateurs finaux en tirent bénéfice. » « Pour ma part, ajoute JeanPierre Oliva, P.-D.G. de Makina Corpus, je dirais que le jour où Google Maps a, pour la première fois, proposé une API web cartographique gratuite, le paysage géomatique a été révolutionné d’un coup. Il est possible qu’une autre révolution détrône les données OSM, mais, comme toutes les révolutions, elle n’est pas prévisible. Et, jusqu’à cette hypothétique bouleversement, OpenStreetMap a encore de beaux jours devant lui. » | Géomatique Expert|N° 98|Mai-Juin 2014
63