Skip to content
Switch branches/tags

Latest commit


Git stats


Failed to load latest commit information.
Latest commit message
Commit time

GH Archive Gouv FR

Download data from GH Archive and extract push events done with @* email addresses.


This works with a single Bash script. Dependencies are :

  • gunzip
  • jq
  • wget

This should be straightforward to run on a UNIX machine.


You can download the GitHub archive for a given month, extract log files and process them with the following command:

./ 2017-01

Be aware that this will take a good amount of bandwidth, storage and processing power. For example, the compressed log files for 2018-01 weight 95 GB.

Schema details

Modèle de données

Nom Type Description Exemple Propriétés
id nombre entier Identifiant unique de l'événement 2489811994
repository_name chaîne de caractères Le nom du répertoire GitHub openchordcharts/openchordcharts-sample-data
ref chaîne de caractères La branche concernée refs/heads/master
author_email chaîne de caractères L'adresse e-mail de l'auteur du commit Motif : .*@.*\.gouv\.fr$
author_domain chaîne de caractères Le nom de domaine de l'adresse e-mail de l'auteur du commit Motif : .*\.gouv\.fr$
author_name chaîne de caractères Le nom de l'auteur du commit Jean Dupont
message chaîne de caractères Le message de commit WIP
sha chaîne de caractères Le SHA1 du commit 288e534ef881c3973bc413a60370dfa59caf7fbe
organisation_name chaîne de caractères Le nom de l'organisation betagouv
created_at date et heure La date de création du commit, en ISO8601 2015-01-01T20:40:32Z


MIT. See the license file.


No releases published


No packages published