Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Difference between insee and COGugaison #19

Open
paul-carteron opened this issue Jun 6, 2023 · 2 comments
Open

Difference between insee and COGugaison #19

paul-carteron opened this issue Jun 6, 2023 · 2 comments

Comments

@paul-carteron
Copy link

Hi,

Is there somewhere you explain the difference between your dataset and th official insee dataset ?

For 2023 your dataset has 34945 row and insee dataset has 37563.

@antuki
Copy link
Owner

antuki commented Jun 8, 2023

Bonjour,
Certaines tables de passage de l'Insee dont probablement celle dont vous faites référence listent l'ensemble des communes qui ont existé depuis plusieurs dizaines d'années. C'est pourquoi il y a + 37000 communes alors qu'aujourd'hui le nombre de communes est davantage proche de 35000.

@paul-carteron
Copy link
Author

Je vois, il y a donc un traitement de la donnée brute par vos soins pour obtenir le dataset final ?

Si c'est le cas, il pourrait être intéressant d'intégrer les données brutes et le script de traitement dans le package ou alors préciser les étapes de nettoyage dans la documentation.

Dans tous les cas, merci pour votre travail !

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants