Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Référencement sur data.gouv.fr #16

Open
taniki opened this issue Oct 17, 2018 · 5 comments
Open

Référencement sur data.gouv.fr #16

taniki opened this issue Oct 17, 2018 · 5 comments

Comments

@taniki
Copy link

taniki commented Oct 17, 2018

Bonjour,

je suis actuellement développeur sur la plateforme data.gouv.fr et j'étais entrain de faire pivoter les données titres <-> éditeurs <-> subventions fournis par le ministère de la culture avec les données de la base SIRENE (entreprises) fournie par l'INSEE. J'ai plutôt de bons résultats mais il me manquait des données sur les regroupements. Votre jeu de données est très précieux dans ce sens et il me semble que ça serait une bonne chose que vous le référenciez sur la plateforme afin que les différentes personnes ayant usage puisse facilement le trouver.

@Asenar
Copy link
Contributor

Asenar commented Oct 17, 2018

Bonjour,

je t'invite à venir faire un tour sur le salon de discussion mentionné sur ce dépôt, on réfléchit justement à une manière de mettre en commun nos ressources en partant de ces données :)

@BoOz
Copy link
Contributor

BoOz commented Oct 24, 2018

Hello,

Ca serait bien de prévoir un flux de retour, pour quo'n puisse récupérer ici certaines infos issues de data.gouv.fr ou bien metalab.

@taniki tu es allé au bout de ta démarche ?

@taniki
Copy link
Author

taniki commented Oct 29, 2018

Pas complètement au bout mais il ne me reste pas grand chose. Je pense pouvoir m'y remettre dans le courant du mois de décembre.

J'ai commencé à mettre mes expérimentations ici : https://github.com/taniki/notebooks/tree/master/data.gouv.fr/presse.

J'ai aussi commencé à regarder pour faire des croisements avec wikipedia/wikidata.

La prochaine étape avant d'avoir un truc robuste, c'est plutôt de faire des tables de pivot/jointure plutôt que de se baser sur la simple identité de chaines de caractères. Ça ne sera pas très complexe (:

@BoOz
Copy link
Contributor

BoOz commented Nov 10, 2018

subventions fournis par le ministère de la culture

Le fichier est là, il y a à la fois les subventions et la diffusion.
https://www.data.gouv.fr/fr/datasets/aides-a-la-presse-classement-des-titres-de-presse-aides-1/

@johanricher
Copy link

J'envisage de faire une PR pour ajouter une colonne "wikidata_id" contenant tous les identifiants Wikidata pour tous les médias référencés dans medias_francais.tsv. Who's in ?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants