# Récupération et traitement des données OSM de la France (niveau 4, régions)

Il semble que le contour continental de la France ne soit pas directement disponible. On récupère donc les régions séparément. Les données présentées ci-dessous sont issus [d'OpenStreetMap © les contributeurs d’OpenStreetMap](https://www.openstreetmap.org/copyright).

## Récuération de la liste des régions

In [None]:
import requests
import json

# on cherche toutes les régions de France

overpass_url = "https://overpass-api.de/api/interpreter"
overpass_query = """
[out:json];
area[name="France"][boundary];
 rel(area)[boundary][admin_level=4];
 map_to_area;
 foreach->.d(
   (.d;);out;
 );
"""
response = requests.get(overpass_url, params={'data': overpass_query})
data = response.json()

In [None]:
sorted([e['tags']['name'] for e in data['elements']])

In [None]:
# on ne garde que les plus pertinentes
regions = [
    'Auvergne-Rhône-Alpes',
    'Bourgogne-Franche-Comté',
    'Bretagne',
    'Centre-Val de Loire',
    'Corse',
    'Grand Est',
    'Guadeloupe',
    'Guyane',
    'Hauts-de-France',
    'La Réunion',
    'Martinique',
    'Mayotte',
    'Normandie',
    'Nouvelle-Aquitaine',
    'Occitanie',
    'Pays de la Loire',
    "Provence-Alpes-Côte d'Azur",
    'Île-de-France']

## Récupérations des données régionales de contour

In [None]:
import gzip

# données géométriques au format JSON
for r in regions:
    overpass_query = """
[out:json];
relation[boundary=administrative][admin_level=4][name="{}"];
out geom;
""".format(r)
    response = requests.get(overpass_url, params={'data': overpass_query})
    with gzip.open("{}.geom.json.gz".format(r), 'w') as f:
        f.write(response.content)

## Traitement pour retrouver un contour ordonné

In [None]:
def contours(region=None, ways=None):
    # l'ordre des chemins n'est pas assuré mais on peut le retrouver :
    # https://gis.stackexchange.com/questions/119728/how-do-you-get-the-nodes-of-an-area-in-overpass-api-in-the-right-order
    if region is not None:
        data = json.load(gzip.open("{}.geom.json.gz".format(region)))
        ways = [[(p['lat'], p['lon']) for p in m['geometry']]
                for e in data['elements'] for m in e['members']
                if m['type'] == 'way' and m['role'] == 'outer']
    else:
        assert ways is not None
    
    # on construit le dico des chemins indicés par le premier point
    # (les chemins sont ajoutés dans les deux sens)
    res = {}
    for way in ways: 
        start, end = way[0], way[-1]

        if start in res:
            way = res[start][::-1] + way[1:]
            del res[start]
        if way[0] != way[-1] and end in res:
            way = way + res[end][1:]
            del res[end]
        res[way[0]] = way
        res[way[-1]] = way[::-1]

    for k, c in res.items():
        assert c[0] == c[-1], len(c)

    return sorted(res.values(), key=lambda x: len(x), reverse=True)

In [None]:
for r in regions:
    json.dump(contours(r), gzip.open("{}.borders.json.gz".format(r), 'wt'))

## Extraction des données continentales

In [None]:
for r in regions:
    data = json.load(gzip.open("{}.borders.json.gz".format(r)))[0]
    json.dump(data, gzip.open("{}.continental-borders.json.gz".format(r), 'wt'))

## Représentation en Lambert93 pour vérifier

In [None]:
import proj4py

# from WGS84 to Lambert93
_proj = proj4py.proj4('EPSG:4326', 'EPSG:2154')

def projete(points, reverse=False):
    if isinstance(points[0], (int, float)):
        points = [points]
    func = _proj.inverse if reverse else _proj.forward
    res = [tuple(func(p)) for p in points]
    return res if len(res) != 1 else res[0]

In [None]:
import matplotlib.pyplot as plt
import numpy as np

plt.figure(figsize=(8, 8))
plt.gca(aspect='equal')
for r in regions:
    if r in {"La Réunion", "Guadeloupe", "Guyane", "Martinique", "Mayotte"}: continue
    c = json.load(gzip.open("{}.continental-borders.json.gz".format(r)))
    pts = np.asarray(projete(c))
    plt.plot(pts[:, 0], pts[:, 1])
plt.axis("off")
plt.show()

## Construction du contour de la France

In [None]:
def union(region_list):
    # suppression des chemins qui apparaissent en double
    ways = {}
    for r in region_list:
        data = json.load(gzip.open("{}.geom.json.gz".format(r)))
        for e in data['elements']:
            for m in e['members']:
                if m['type'] != 'way' or m['role'] != 'outer':
                    continue
                ref = m['ref']
                if ref in ways:
                    del ways[ref]
                else:
                    ways[ref] = [(p['lat'], p['lon']) for p in m['geometry']]
    return contours(ways=ways.values())

In [None]:
france = union(regions)

In [None]:
plt.figure(figsize=(8, 8))
plt.gca(aspect='equal')
pts = np.asarray(projete(france[0]))
plt.plot(pts[:, 0], pts[:, 1])
plt.axis("off")
plt.show()