Skip to content

Commit

Permalink
nodegoat coquilles
Browse files Browse the repository at this point in the history
  • Loading branch information
spapastamkou committed Feb 28, 2022
1 parent f8e52bf commit 65d7258
Showing 1 changed file with 10 additions and 10 deletions.
20 changes: 10 additions & 10 deletions fr/lecons/concevoir-recherche-donnees-nodegoat.md
Original file line number Diff line number Diff line change
Expand Up @@ -26,35 +26,35 @@ doi:

## Introduction

Au moment de faire ses premiers pas dans le monde numérique, le chercheur ou la chercheuse en sciences humaines se confronte à plusieurs défis. Tout d’abord, les défis techniques : l’emploi des outils numériques n’est pas toujours évident et la maîtrise d’une méthode, d’un logiciel ou encore plus d’un langage de programmation exige souvent une pratique longue et parfois ardue. Mais l’initiation dans les méthodes numériques pose un autre défi, tout à fait différent mais également difficile : le besoin de réfléchir à sa recherche en termes de *données*.
Au moment de faire ses premiers pas dans le monde numérique, le chercheur ou la chercheuse en sciences humaines se confronte à plusieurs défis. Tout d’abord, les défis techniques : l’emploi des outils numériques n’est pas toujours évident et la maîtrise d’une méthode, d’un logiciel ou encore plus d’un langage de programmation exige souvent une pratique longue et parfois ardue. Mais l’initiation aux méthodes numériques pose un autre défi, tout à fait différent mais également difficile : le besoin de réfléchir à sa recherche en termes de *données*.

Dans cette leçon, nous discuterons des difficultés auxquelles on doit se confronter au moment de concevoir la recherche en termes de données. Nous donnerons aussi un ensemble d’éléments afin de faciliter ce processus aux chercheurs et chercheuses moins expérimenté(e)s. Dans cette leçon, nous allons donc :

1. Discuter des difficultés auxquelles on doit se confronter au moment de concevoir la recherche en termes de données.
2. Présenter les concepts de « base de données orientée objet » et de « modèle de données ».
3. Faire les premiers pas dans la construction d’une base de données pour une recherche en sciences humaines.

Pour ce dernier point, nous nous serviront de l’environnement de recherche *nodegoat* qui permet aux chercheurs de concevoir leur modèle de données de manière flexible, de gérer et conserver leurs données en ligne, d’exporter et importer ces données de manière simple et enfin, de produire des formes de visualisation géographique et de réseaux.
Pour ce dernier point, nous nous servirons de l’environnement de recherche *nodegoat* qui permet aux chercheurs et aux chercheuses de concevoir leur modèle de données de manière flexible, de gérer et conserver leurs données en ligne, d’exporter et importer ces données de manière simple et enfin, de produire des formes de visualisation géographique et de réseaux.

## Penser en termes de données : un défi conceptuel

De quoi parle-t-on quand on parle de *donnés* ?
De quoi parle-t-on quand on parle de *données* ?

De manière générale, nous pouvons définir les données (en anglais, *data*) comme des informations structurées en unités discrètes et se prêtant au traitement automatique. Ces informations doivent être constituées de manière telle que si quelqu'un d'autre les utilise et réalise sur elles les mêmes opérations que nous, il ou elle doit arriver au même résultat.

Produire des données sur la base d’une recherche implique un certain travail de *traduction* : il faut traduire nos informations de leur forme de base à une forme structurée. La donnée, contrairement à ce que l’on nous fait croire souvent, **n’est pas du tout donnée** : elle n’est pas disponible dans la réalité, elle n'attend pas à ce qu’elle soit recueillie, elle est au contraire le produit d’un travail d’interprétation et de transformation. Afin de produire ses données, le chercheur ou la chercheuse doit savoir comment lire ses sources, en extraire des informations et les consigner de manière structurée.

Pour ceux qui font de la recherche en sciences humaines, c’est souvent ici que commencent les problèmes ! Le concept même de *donnée* est parfois problématique. En histoire, en anthropologie ou en littérature, nous sommes habitués à réfléchir aux phénomènes que nous étudions en termes flexibles, ouverts et souvent incertains. Nous sommes habitués à réfléchir à la subjectivité du chercheur, à donner une place centrale à la contingence et enfin, et à voir les phénomènes politiques, sociaux et culturels que nous analysons comme des objets complexes que l'on ne peut pas tout simplement réduire à « un ensemble de données ». Comme le dit Miriam Posner [dans un billet de blog](https://miriamposner.com/blog/humanities-data-a-necessary-contradiction/) à ce sujet :
Pour ceux et celles qui font de la recherche en sciences humaines, c’est souvent ici que commencent les problèmes ! Le concept même de *donnée* est parfois problématique. En histoire, en anthropologie ou en littérature, nous sommes habitués à réfléchir aux phénomènes que nous étudions en termes flexibles, ouverts et souvent incertains. Nous sommes habitués à réfléchir à la subjectivité du chercheur, à donner une place centrale à la contingence et enfin, et à voir les phénomènes politiques, sociaux et culturels que nous analysons comme des objets complexes que l'on ne peut pas tout simplement réduire à « un ensemble de données ». Comme le dit Miriam Posner [dans un billet de blog](https://miriamposner.com/blog/humanities-data-a-necessary-contradiction/) à ce sujet :

>Les chercheurs en sciences humaines avons un rapport à la preuve tout à fait différent de celui d’autres scientifiques, même celui des chercheurs en sciences sociales. Nous avons de manières différentes de connaître les choses que les chercheurs travaillant dans d’autres champs d'études. Nous pouvons savoir que quelque chose est vrai sans forcément pouvoir indiquer un *dataset* tel que l'on le conçoit traditionnellement. Par exemple, nous sommes capables de comprendre que l’ancien film muet se servait des règles du mélodrame pour créer un récit clair, mais nous ne savons pas cela parce que nous avons une feuille de calcul, nous le savons parce que nous nous sommes plongés tellement dans nos sources que nous sommes devenus particulièrement sensibles à leurs nuances.
>Les chercheur(e)s en sciences humaines avons un rapport à la preuve tout à fait différent de celui d’autres scientifiques, même celui des chercheur(e)s en sciences sociales. Nous avons des manières différentes de connaître les choses que les chercheur(e)s travaillant dans d’autres champs d'études. Nous pouvons savoir que quelque chose est vrai sans forcément pouvoir indiquer un *dataset* tel que l'on le conçoit traditionnellement. Par exemple, nous sommes capables de comprendre que l’ancien film muet se servait des règles du mélodrame pour créer un récit clair, mais nous ne savons pas cela parce que nous avons une feuille de calcul, nous le savons parce que nous nous sommes plongé(e)s tellement dans nos sources que nous sommes devenus particulièrement sensibles à leurs nuances.
Ainsi, pour les chercheurs et chercheuses en sciences humaines, l’idée de lire leurs sources, leurs documents ou leurs notes ethnographiques pour en tirer des informations que l’on insérera dans des catégories fixes, discrètes et structurées dans un tableur est souvent contre-intuitive. Cela nous semble souvent même simpliste et superficielle : comment pourrait-on traduire en termes de *données* une tradition politique, la dimension affective d'une pratique culturelle locale, les enjeux conceptuels de la philosophie moderne ou la psychologie d’un personnage littéraire ?
Ainsi, pour les chercheurs et chercheuses en sciences humaines, l’idée de lire leurs sources, leurs documents ou leurs notes ethnographiques pour en tirer des informations que l’on insérera dans des catégories fixes, discrètes et structurées dans un tableur est souvent contre-intuitive. Cela nous semble souvent même simpliste et superficiel : comment pourrait-on traduire en termes de *données* une tradition politique, la dimension affective d'une pratique culturelle locale, les enjeux conceptuels de la philosophie moderne ou la psychologie d’un personnage littéraire ?

Concevoir notre recherche en termes de données offre pourtant des grands avantages. Dans un premier temps, aborder une recherche en termes de données nous permet d’enregistrer nos informations de façon telle qu’elles puissent être traitées de manière automatique par des méthodes numériques. Cela s’avère surtout utile quand on se confronte à une investigation qui doit manipuler une grande masse d’informations. Dans un deuxième temps, consigner ces informations dans une base de données nous permet de partager facilement ces information avec le reste de la communauté scientifique. Enfin, concevoir la recherche en termes de données offre des avantages non seulement techniques et pratiques, mais aussi conceptuelles, car le processus même de traduire nos informations en données exige que nous définissions de manière claire et nette les éléments de notre investigation, nos hypothèses et nos questions de recherche. Autrement dit : quand on réfléchit en termes de données et on se demande quelle est la structure selon laquelle on doit consigner ses informations, on est aussi obligé de se demander clairement quel sont les objets de notre recherche, quelles relations le relient mutuellement, comment ils interagissent et quels sont les conséquences de ces interactions.
Concevoir notre recherche en termes de données offre pourtant des grands avantages. Dans un premier temps, aborder une recherche en termes de données nous permet d’enregistrer nos informations de façon telle qu’elles puissent être traitées de manière automatique par des méthodes numériques. Cela s’avère surtout utile quand on se confronte à une investigation qui doit manipuler une grande masse d’informations. Dans un deuxième temps, consigner ces informations dans une base de données nous permet de partager facilement ces informations avec le reste de la communauté scientifique. Enfin, concevoir la recherche en termes de données offre des avantages non seulement techniques et pratiques, mais aussi conceptuelles, car le processus même de traduire nos informations en données exige que nous définissions de manière claire et nette les éléments de notre investigation, nos hypothèses et nos questions de recherche. Autrement dit : quand on réfléchit en termes de données et on se demande quelle est la structure selon laquelle on doit consigner ses informations, on est aussi obligé de se demander clairement quel sont les objets de notre recherche, quelles relations le relient mutuellement, comment ils interagissent et quels sont les conséquences de ces interactions.

## Base de données et modèle de données

Comme mentionné auparavant, si notre recherche produit à une quantité conséquente d’informations, c’est souvent préférable de consigner ces informations de manière organisée et structurée. Par exemple, disons que nous menons une recherche historique sur un ensemble de livres. Nous parlerons ici d’une recherche hypothétique : un projet portant sur les ouvrages produits par les écrivains dissidents des régimes communistes d’Europe de l’Est.
Comme mentionné auparavant, si notre recherche produit une quantité conséquente d’informations, c’est souvent préférable de consigner ces informations de manière organisée et structurée. Par exemple, disons que nous menons une recherche historique sur un ensemble de livres. Nous parlerons ici d’une recherche hypothétique : un projet portant sur les ouvrages produits par les écrivains dissidents des régimes communistes d’Europe de l’Est.

Si nous voulions consigner des informations sur ces livres. Nous le ferions de manière intuitive dans un tableau type feuille de calcul d’Excel, comme ça :

Expand All @@ -72,15 +72,15 @@ Ce tableau avec trois colonnes nous permet de consigner nos informations de mani

Pour l’instant, cela suffit comme instrument et ne pose pas de problème, parce que nous y conservons une masse d’informations peu conséquente. Mais disons que nous voulons approfondir notre enquête et nous poser de nouvelles questions sur les ouvrages et sur les auteurs. Nous pourrions élargir le tableau comme ça :

```

| Titre | Ville de parution | Langue de la première édition | Date de parution | Maison d’édition | Date de fondation de la maison d’édition | Auteur | Nationalité de l’auteur | Ville de naissance de l’auteur | Date de naissance de l’auteur |
| :------ | :------------- | :--------- | :------ | :-------------------- |:--------- |:---------| :---------| :---------| :---------|
| L’Archipel du Gulag | Paris | Français | 1973 | Le Seuil | 1930 | Alexandre Soljenitsyne | Russe | Kislovodsk | 1918 |
| Vie et destin | Genève | Français | 1980 | L’age de l’homme | 1955 |Vassili Grossman | Russe | Berdytchiv | 1905 |
| La nouvelle classe | New York | Anglais | 1957 | Praeger | 1950 | Milovan Djilas | Monténégrine | Podbišće | 1911 |
| La pensée captive | Paris | Polonais | 1953 | Instytut Literacki | 1946 | Czesław Miłosz | Polonaise | Szetejnie | 1911 |
| La machine et les rouages | Paris | Français | 1985 | Calmann-Lévy | 1920 | Michel Heller | Russe | Moguilev | 1922 |
```


Ce nouveau tableau nous permet d’approfondir dans l’analyse en ajoutant de nouvelles informations. Pourquoi on voudrait faire cela ? Par exemple, pour examiner s’il existe des relations entre les caractéristiques des livres avec les caractéristiques des auteures. Nous pourrions éventuellement nous demander si les auteurs des ouvrages emblématiques de la dissidence de l’Est sont surtout des individus nés dans des petites villes, si les auteurs de nationalité russe ont tendance à se faire traduire premièrement en français.

Expand Down

0 comments on commit 65d7258

Please sign in to comment.