Inventaire des codes sources des organismes publics (en construction)
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
organisations
repositories
.gitignore
LO.md
README.org
generate_csv.sh

README.org

Inventaire des dépôts de code source publiés par les organismes publics

But du dépôt

Le but de ce dépôt est de donner de la visibilité à l’ensemble des dépôts publiés par les comptes d’organisation d’organismes publics.

Ne sont pour l’instant traités que les comptes présents sur GitHub. Les comptes présents sur d’autres plates-formes (par ex. GitLab) pourront être intégrés dans un second temps.

Pour ajouter le compte d’organisation de votre organisme, vous pouvez proposer de modifier le fichier pertinent dans le dépôt de la DINSIC relatif à la Politique de Contribution Open Source de l’État.

Si votre compte est sur GitHub, vous pouvez aussi l’ajouter à la liste des comptes figurant sur cette page.

Évolutions possibles

Il est prévu de faire évoluer la collecte de ces informations en l’automatisant, en stockant les données dans une base de données et en proposant une interface web pour les parcourir.

Contenu du dépôt

  • un script collectant la liste des comptes d’organisation des organismes publics présents sur cette page GitHub ;
  • les fichiers .csv générés par ce script :
    • organisations/comptes-organismes-publics.csv
    • repositories/all_repositories.csv
    • [compte-organisation].csv pour chaque organisme

Liens vers une version web des principaux fichiers .csv

Structure des données collectées

Pour les comptes d’organisation, voici les en-têtes du fichier .csv généré et, en regard, le propriétés du fichier .json récupérées via l’API de GitHub :

Champ csvChamp json
Nom.login
URL.html_url
Blog.blog
Email.email
Description.bio
# de dépôts.public_repos
# followers.followers
Créé.created_at
Mis à jour.updated_at

Voici le tableau équivalent pour les dépôts de code source :

Champ csvChamp json
Nom.name
Organisation.owner.html_url
URL.html_url
Description.description
Fork?.fork
Créé.created_at
Mis à jour.updated_at
Homepage.homepage
# Stars.stargazers_count
# forks.forks_count
Licence.license
Issues.open_issues
Langages.language

Utilisation

Prérequis

Avec une distribution Debian ou dérivée :

~$ sudo apt-get update
~$ sudo apt-get install jq
~$ sudo pip install yq

Utilisation du script

Le script demande deux variables d’environnement:

  • GITHUB_USER : votre nom d’utilisateur GitHub
  • GITHUB_TOKEN : un token personnel GitHub (en créer un)

Pour tester le script :

~$ git clone https://github.com/etalab/inventaire-codes-sources-organismes-publics.git
~$ cd inventaire-codes-sources-organismes-publics/
~$ GITHUB_USER=xxx GITHUB_TOKEN=yyy ./generate_csv.sh

Le script va alors créer les répertoires organisations et repositories et y ajouter les fichiers utiles.

Contribuer

Vos contributions sont les bienvenues sous forme d’issues ou de pull request - quelques pistes :

  • tester le script sur tout système d’exploitation et signaler d’autres prérequis ;
  • proposer des en-têtes plus utiles ;
  • tout autre amélioration.

Droits d’auteur et licence

2018 Direction interministérielle du numérique et du système d’information et de communication de l’État, Bastien Guerry

2018 Les autres contributeurs dans la liste est accessible via l’historique du dépôt.

Les contenus publiés dans ce dépôt sont publiés sous Licence Ouverte 2.0 – voir le fichier LO.md dans ce répertoire. Vous êtes libre de réutiliser les contenus de ce dépôt sous les conditions précisées dans cette licence.