Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Anomalies dans les données collectées par l'AIFE #5

Open
ColinMaudry opened this issue May 13, 2019 · 3 comments
Open

Anomalies dans les données collectées par l'AIFE #5

ColinMaudry opened this issue May 13, 2019 · 3 comments
Labels
anomalie Anomalie dans les données source

Comments

@ColinMaudry
Copy link

ColinMaudry commented May 13, 2019

Les données collectées et mises à disposition (mais pas produites) par l'AIFE sur data.gouv.fr ne sont pas conformes au format réglementaire.

Anomalies corrigées par notre script XSLT :

  • les valeurs du champ nature sont en MAJUSCULES au lieu d'avoir seulement La Première Lettre Accentuée
  • les valeurs du champ typeCode sont en MAJUSCULES au lieu d'avoir seulement La Première Lettre Accentuée

Anomalie non-corrigées

  • certains caractères des champs objet sont corrompus
  • les champs dateNotification et datePublicationDonnees sont souvent manquants
  • quelques champs id sont manquants (jq '.marches[] | select(.id | not))' json/data.gouv.fr_aife.json)
  • des codes de lieu d'exécution invalides (voir comm de marion-paclot)
  • des marchés n'ont pas de <titulaires> (jq '[ .marches[] | select((.titulaires | type != "array") and ._type == "Marché")] | length' json/decp.json)
@ColinMaudry
Copy link
Author

@marion-paclot Je n'ai trouvé que 9 id manquantes dans les données de l'AIFE, mais je ne suis pas sûr de ma méthode de comptage. As-tu perçu un ordre de grandeur supérieur ? As un moyen de compter qui soit fiable ?

@marion-paclot
Copy link

Je ne pense pas qu'il y en ait tellement plus. Du coup il faut quand même réfléchir à en générer des uniques qui n'entreront pas en conflit avec un id du futur.

@marion-paclot
Copy link

Autre problème, sur la géographie et les codes.
image
Comme dans l'outil, il pourrait y avoir une carte, ça perd pas mal de son intérêt

@ColinMaudry ColinMaudry added bug Something isn't working anomalie Anomalie dans les données source and removed bug Something isn't working labels May 22, 2019
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
anomalie Anomalie dans les données source
Projects
None yet
Development

No branches or pull requests

2 participants