Skip to content

regicid/docker_gallicagram

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Gallicagram

Gallicagram est un outil de lexicométrie programmé en R et développé par Benjamin Azoulay et Benoît de Courson pour la recherche en sciences humaines et sociales. Il permet de mesurer et de visualiser la fréquence d’apparition de mots ou de syntagmes dans de nombreux corpus numérisés, y compris ceux de Gallica et d'autres bibliothèques. Gallicagram explore une grande variété de genres : livres, presse, sous-titres de films, paroles de chanson, littérature scientifique, etc. Le logiciel est librement accessible en ligne à l'adresse https://shiny.ens-paris-saclay.fr/app/gallicagram, mais elle peut aussi être lancée en local.

Table des matières

Fonctionnalités

Gallicagram offre plusieurs fonctionnalités clés :

  • Analyse de la fréquence des mots : mesurez la fréquence d'apparition de mots ou de syntagmes dans divers corpus.
  • Comparaison de tendances : comparez l'évolution de plusieurs termes concurrents.
  • Recherche de cooccurrences : trouvez et analysez les termes apparaissant ensemble dans le texte avec l'opérateur *.
  • Restriction du corpus : explorez des sous-corpus spécifiques (tels que presse, livres, sélection de titres de presse, etc.).
  • Visualisation avancée : options de lissage de courbes, normalisation des valeurs, affichage des distributions chronologiques.
  • Analyse factorielle : représentez et interprétez les relations entre les mots et les périodes de manière synthétique.
  • Accès direct aux documents sources : possibilité de consulter directement les documents des corpus numériques correspondants aux occurrences retournées par le logiciel.

Installation

Prérequis

Instructions

  1. Clonez le dépôt :

    git clone https://github.com/regicid/docker_gallicagram.git
    cd docker_gallicagram/gallicagram
  2. Installez les dépendances R :

    install.packages(c('shiny', 'rmarkdown', 'ggplot2', 'plotly', 'stringr', 'Hmisc', 'xml2', 'shinythemes', 'htmlwidgets', 'httr', 'ngramr', 'dplyr', 'htmltools', 'shinyWidgets', 'purrr', 'RSelenium', 'rvest', 'rclipboard', 'RSQLite', 'tidytext', 'DBI', 'shinybusy', 'lubridate', 'ggthemes', 'RColorBrewer', 'cowplot', 'raster', 'leaflet', 'sf', 'scales', 'cartogram', 'shinyjs', 'gtrendsR', 'timetk', 'jsonlite', 'ggwordcloud', 'FactoMineR', 'chron', 'tidyr', 'shinyalert', 'factoextra', 'bezier', 'doParallel', 'crul'))
    
  3. Lancez l'application Shiny :

    shiny::runApp('path_to_app/docker_gallicagram/gallicagram')

Utilisation

Pour utiliser Gallicagram, suivez ces instructions :

  1. Ouvrez l'application Shiny dans votre navigateur.
  2. Choisissez le corpus parmi les options disponibles (Gallica, bibliothèques étrangères, Le Monde, etc.).
  3. Sélectionnez la période et la résolution temporelle (mensuelle ou annuelle).
  4. Saisissez les termes de votre recherche avec les opérateurs souhaités (&, +, *).
  5. Explorez les résultats et utilisez les différentes options de visualisation pour affiner votre analyse.
  6. Téléchargez les graphiques et les données pour une analyse ultérieure.

Pour plus d'exemples et de détails sur les options de recherche, veuillez consulter la Documentation.

Documentation

Vous trouverez dans les documents suivants rédigés par les concepteurs de Gallicagram des informations détaillées sur les corpus, les méthodes de recherche, les syntaxes de recherche, les options de visualisation et les précautions d'usage concernant le logiciel.

Contributions

Les contributions sont les bienvenues ! Si vous souhaitez améliorer l'application ou ajouter de nouvelles fonctionnalités, veuillez suivre ces étapes :

  1. Forkez le dépôt.
  2. Créez une nouvelle branche (git checkout -b my-fork).
  3. Effectuez vos modifications.
  4. Envoyez une pull request avec une description détaillée de vos modifications.

Assurez-vous de suivre les normes de codage et de bien tester vos modifications avant de soumettre une pull request.

Licence

Ce projet est sous licence GPL-3.0.

Contact

Pour toute question ou suggestion, n'hésitez pas à nous contacter :

Nous espérons que vous trouverez Gallicagram utile pour vos recherches en sciences humaines et sociales !

Modes de Recherche

Gallicagram propose quatre modes de recherche principaux :

  1. Par document : Compte le nombre de documents (volumes) présentant au moins une occurrence du syntagme par sous-période.
  2. Par page : Compte le nombre de pages présentant au moins une occurrence du syntagme par sous-période.
  3. Par article : Compte le nombre d'articles de presse présentant au moins une occurrence du syntagme par sous-période.
  4. Par n-gramme : Compte le nombre total d'occurrences du syntagme par sous-période.

Syntaxe de Recherche

  • Syntagme unique : Exemple : Clemenceau
  • Syntagmes concurrents : Séparés par &. Exemple : Georges Clemenceau&Aristide Briand
  • Recherche conditionnelle OU : Utilisez +. Exemple : communiste+communistes
  • Recherche de cooccurrences : Utilisez * avec une distance maximale définie. Exemple : universel*nation

Ces options peuvent se cumuler pour des recherches plus complexes.

Options de Visualisation

Gallicagram offre plusieurs types de visualisation pour aider à l'interprétation des données :

  1. Courbes : Courbes d'évolution avec marges d'erreur.
  2. Sommes : Graphiques en barres horizontales.
  3. Histogrammes : Graphiques en barres verticales.
  4. Bulles : Graphiques en bulles.
  5. Aires : Graphiques en aires.
  6. AFC (Analyse Factorielle des Correspondances) : Représentation des relations entre termes et périodes.
  7. Nuage de mots : Nuage de mots en fonction de leurs fréquences.
  8. Polaires : Visualisation des tendances saisonnières.

Corpus Disponibles

La liste des corpus interrogeables dans Gallicagram est disponible dans l'onglet notice du site.

Corpus Type de documents Langue Mode de recherche ID
Gallica-presse 1789-1950 – Le Monde 1945-2022 Presse ancienne et contemporaine Français N-gramme offline 0
Presse française – Gallica Presse ancienne Français N-gramme offline & Document online 1
Recherche par titre de presse – Gallica Presse ancienne Français Document online 3
Livres – Gallica Livres Français N-gramme offline & Document online 2
Corpus personnalisé – Gallica Divers Français Document online 4
Livres+Presse – Gallica Presse ancienne et livres Français N-gramme offline & Document online 56
Le Figaro (1854-1952) Presse ancienne Français N-gramme offline 66
L'Humanité (1904-1952) Presse ancienne Français N-gramme offline 67
Le Constitutionnel (1821-1913) Presse ancienne Français N-gramme offline 68
Le Journal de Paris (1777-1827) Presse ancienne Français N-gramme offline 69
Le Moniteur universel (1789-1901) Presse ancienne Français N-gramme offline 70
Le Temps (1861-1942) Presse ancienne Français N-gramme offline 71
Le Petit Journal (1863-1942) Presse ancienne Français N-gramme offline 72
Le Petit Parisien (1876-1944) Presse ancienne Français N-gramme offline 73
Le Journal Officiel (1869-1952) Presse ancienne Français N-gramme offline 74
Le Journal des Débats (1805-1944) Presse ancienne Français N-gramme offline 75
La Presse (1836-1930) Presse ancienne Français N-gramme offline 76
Le Monde Presse contemporaine Français N-gramme offline 30
Le Figaro Presse contemporaine Français Article online 31
Presse française – MediaCloud Presse contemporaine Français Article online 50
Presse suisse-romande – Bibliothèque nationale suisse Presse ancienne Français Article online 15
Presse wallonne – KBR Presse ancienne Français Page online 13
Presse québécoise – BanQ Presse ancienne et contemporaine Français Document online 28
Livres – Ngram Viewer Français Livres Français N-gramme online 5
Google Trends – France Recherches web Français Gtrends 44
Presse Auvergne-Rhône-Alpes – Lectura Presse ancienne régionale Français Page online 17
Presse du sillon lorain – Limédia Presse ancienne régionale Français Document online 18
Presse méridionale – Mémonum Presse ancienne régionale Français Document online 19
Presse de Saint-Denis – Commun-Patrimoine Presse ancienne régionale Français Document online 20
Presse de Brest – Yroise Presse ancienne régionale Français Document online 21
Presse des Pyrénées – Pireneas Presse ancienne régionale Français Document online 22
Presse toulousaine – Rosalis Presse ancienne régionale Français Document online 23
Presse diplomatique – Bibliothèque diplomatique numérique Presse ancienne spécialisée Français Document online 24
Presse francophone – RFN Presse ancienne régionale Français Document online 25
Presse alsacienne – Numistral Presse ancienne régionale Français Document online 26
Presse de Roubaix – BN-R Presse ancienne régionale Français Document online 27
Isidore Travaux de recherche Français Document online 36
Cairn.info Travaux de recherche Français Document online 32
Theses.fr Travaux de recherche Français Document online 33
Persée Travaux de recherche Français Document online 34
Rap français/Genius (1989-2023) Paroles de chansons Français N-gramme offline 81
MusixMatch – Français Paroles de chansons Français Document online 45
Opensubtitles / Films en français Sous-titres de films Français N-gramme offline 77
Opensubtitles / Films en anglais Sous-titres de films Français N-gramme offline 78
Presse allemande – Deutsche digitale bibliothek Presse ancienne Allemand Document online 43
Presse allemande – Europeana Presse ancienne Allemand Document online 6
Presse austro-hongroise – ANNO Presse ancienne Allemand Document online 29
Presse suisse-allemande – Bibliothèque nationale suisse Presse ancienne Allemand Article online 16
Presse germanophone – MediaCloud Presse contemporaine Allemand Article online 52
Livres – Ngram Viewer Allemand Livres Allemand N-gramme online 9
Google Trends – Allemagne Recherches web Allemand Gtrends 62
Google Trends – Autriche Recherches web Allemand Gtrends 63
MusixMatch – Allemand Paroles de chansons Allemand Document online 47
Presse britannique – BNA Presse ancienne et contemporaine Anglais Article online 8
Presse australienne – Trove Presse ancienne Anglais Article online 35
Presse américaine – Library of Congress Presse ancienne Anglais Page online 42
Presse anglophone – MediaCloud Presse contemporaine Anglais Article online 51
Livres – Ngram Viewer Anglais Livres Anglais N-gramme online 10
Google Trends – Grande-Bretagne Recherches web Anglais Gtrends 58
Google Trends – Etats-Unis Recherches web Anglais Gtrends 59
Google Trends – Australie Recherches web Anglais Gtrends 60
MusixMatch – Anglais Paroles de chansons Anglais Document online 46
Presse néerlandaise – Europeana Presse ancienne Néerlandais Document online 7
Presse flamande – KBR Presse ancienne Néerlandais Page online 14
Presse néerlandophone – MediaCloud Presse contemporaine Néerlandais Article online 53
Google Trends – Pays-Bas Recherches web Néerlandais Gtrends 64
MusixMatch – Néerlandais Paroles de chansons Néerlandais Document online 48
Presse espagnole – BNE Presse ancienne et contemporaine Espagnol Page online 11
Presse hispanophone – MediaCloud Presse contemporaine Espagnol Article online 54
Livres – Ngram Viewer Espagnol Livres Espagnol N-gramme online 12
Google Trends – Espagne Recherches web Espagnol Gtrends 61
MusixMatch – Espagnol Paroles de chansons Espagnol Document online 49

Précautions d'Usage

Pour une utilisation optimale de Gallicagram, les utilisateurs doivent tenir compte des spécificités et limitations des différents corpus et modes de recherche. Il est conseillé de consulter l'article de recherche associé pour une compréhension approfondie des méthodes de traitement et d'analyse des données.

Ce projet est en constante évolution. Nous vous remercions pour vos retours et espérons que Gallicagram vous sera d'une grande aide dans vos recherches.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages