Travaux autour des extractions Finess de data.gouv.fr
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
data_origine
data_results/formats
data_temp
pgm
rmd
.DS_Store
.gitignore
LICENSE
README.md
finess_etalab.Rproj

README.md

finess_etalab

Travaux autour des extractions Finess de data.gouv.fr

Contexte

Proposer des programmes R (non sous forme de package pour le moment) permettant d'intégrer simplement et sans trop se poser de questions les fichiers finess de data.gouv.fr.

Les fichiers pris en charge actuellement sont :

Structure du projet

  • télécharger les fichiers d'extractions les plus récents sur le site depuis le site data.gouv.fr
  • un programme permet d'extraire les formats du fichier pdf décrivant les données (notice), cela évite des manipulations manuelles même si ensuite j'ai vérifié manuellement la justesse du résultat
  • à partir de ces formats normés (501 pour les entités juridiques, 507 pour les établissements gélocalisés), le programme importer.R intègre les fichiers et les réexporte sous forme de rds et csv
  • un programme permet d'homogénéiser les projections de géolocalisation en convertissant les différentes projections en WGS 84

Présentation du projet

Un R "bloc notes" est disponible ici.