Skip to content
This repository has been archived by the owner on Mar 11, 2024. It is now read-only.

Latest commit

 

History

History
119 lines (74 loc) · 5.57 KB

20200107-charlotte.md

File metadata and controls

119 lines (74 loc) · 5.57 KB

Interview Charlotte

Interview par téléphone le 7 janvier 2020. Charlotte n'avait pas de données enregistrées de sa dernière interview en novembre 2017.

Charlotte est journaliste. Elle a un niveau avancé en recherche de données sur internet. Elle utilise DataGouv régulièrement pour trouver des jeux de données spécifiques, ou pour s'inspirer de sujet.

Quelle utilisatrice êtes-vous ?

— « Avez-vous recherché de la donnée récemment ? La recherche a-t'elle abouti ? Quelle donnée ? »

La dernière en date concerne les stations de ski. Je n'ai pas trouvé sur DataGouv. Je pensais pouvoir en trouver en provenant du Ministere des sports peut-être. Ou une association pro qui a la liste des stations de données logistique, des équipements, des fréquentations. J'ai besoin d'une donnée plutôt d'actualité.

J'ai finalement scrappé les données d'associations avec l'outil de Data Miner dans Chrome.

J'effectue mes recherches aussi avec des moteurs de recherche. Je teste en ce moment d'autres moteurs que Google : DuckDuckGo et Qwant. Mais les autres moteurs que Google ne me donnent pas autant d'outils que j'utilise activement : les opérateurs de recherche et les filtres. Je fait aussi de la recherche documentaire par date qui ne sont pas disponibles chez les autres moteurs.

Je commence d'abord mes recherches sur DataGouv. S'il y a trop de résultats, je passe par Google pour chercher sur DataGouv. Mais je passe quand-même essentiellement par le moteur de recherche de DataGouv et ça se passe relativement bien.

Test du prototype

— « Si l'on visite https://recherche.etalab.studio, que se passe t'il pour vous ? »

Qu'est-ce que je peux chercher ? "Eau" : j'ai pas l'impression que ca fonctionne. J'ai pris eau comme c'est un mot court qui se trouve dans beaucoup de mots.

Ce ne sont pas les résultats auxquels je m'attendais. C'est une recherche sémentique ? Ca me renvoie un résultat plus ou moins pertinent. C'est probablement parce que ce sont les jeux de données les plus utilisés ?

Ca me va pas du tout. Je n'ai pas le panneau de filtre sur la droite. Je l'utilise systématiquement avec la "Couverture spatiale".

Sur DataGouv, je regarde les 3 premiers résultats de recherche. Si ce n'est pas dedans j'utilise les filtres. Sans ça c'est pas utilisable.

Les outils de tri aussi sont bien utiles.

Ca ne me semble pas logique que « plus de résultats » envoie vers DataGouv.

Mais j'arrive pas à comprendre… Si je tappe « cadastre »… Je trouve des résultats, mais je ne comprends pas le tri.

Je tappe « logement », je tombe sur l'emplacement des distributeurs de préservatifs en 1er !

C'est vrai que ce panneau de filtres me donne beaucoup d'infos. J'ai l'impression d'être moins indépendante ici.

Mais je me débrouille bien sur l'internet et je pratique régulièrement et suis à l'aise avec les recherches et les bases de données. C'est frustrant pour moi de ne pas avoir de contrôle. Je ne sais pas quelle est la source, le format des données, quel est le tri.

— « En quoi cette outil vous aide ? Qu'est-ce qu'il vous manque pour faciliter votre recherche ? »

Ca me demanded plus de travail ici (sur le prototype) que par le moteur de recherche DataGouv. J'ai moins d'info.

Retour de 2017 à propos de data.gouv.fr

La source dans la version actuelle n'est indiquée que par l'image. Ca laisse planer un doute. J'aurais préféré l'avoir sous forme de texte, comme la granularité et la couverture spatiale. Le format des données me manque aussi. Ex : si je vois que c'est un document ou une image, je ne vais pas commencer par ces éléments. J'aurais voulu du csv, xls, json… ce que je peux exploiter. Eventuellement du pdf.

Ce que j'utilise dans la colonne de droite : Couverture spatiale, organisation, formats. Je n'utilise pas license, mots clés, les badges non plus (je ne comprends pas ce que c'est), réutilisations connues…

Utilisez-vous les réutilisations ?

Je vois éventuellement les réutilisations quand le jeu m'intéresse ; pas pour évaluer la pertinence de mon utilité des données.

Au préalable j'essaie de savoir quels sont les mots utilisés par les producteurs de données en faisant une recherche documentaire.

Je sais donc d'avance vers quelles sources je vais me tourner et quels mots sont utilisés pour tel type de données. Je vais sur Google pour lire les études produites. Je consultee ensuite les institutions qui travaillent sur le sujet et qui produisent des données. DataGouv n'est qu'un endroit. Je vais aussi directement faire des recherches sur les sites des institutions.

Autre usage de DataGouv

Je vais voir quels sont les derniers jeux de données publiés. J'y prends l'inspiration de ce qui se passe.

— « Allez vous consulter le suivi des sorties ? »

Ah non, je découvre. C'est pas mal ca aussi !

C'est peut-être pas assez… Le cote laïus est… C'est très narratif. Trop.

Je préfèrerais avoir un tableau/liste des données.

J'ai besoin de savoir qui a produit la donnée ; si c'est institutionnel. De quand elle date, je veux de la donnée récente. Une donnée de 2016, je ne peux pas la réutiliser. C'est l'effet de fraicheur qui intéresse les journaux.

— « Par où vous passez pour consulter les derniers jeux de données ? »

Je visite par la page d'accueil, l'onglet derniers jeux de données, puis voir plus. J'y suis par exemple allée pour le "ski", en décembre.