# Mens en Maatschappij 100 jaar: Een analyse trendsgewijze veranderingen van de inhoud van het tijdschrift

*Jos Slabbekoorn*<br>
Radboud Universiteit<br>
jos.slabbekoorn@ru.nl

In [10]:
import pandas as pd
from great_tables import GT

## Introduction

_"Ter gelegenheid van het zeldzame verschijnsel dat een sociaalwetenschappelijk tijdschrift de eerbiedwaardige leeftijd van vijftig jaar bereikt, hebben wij enkele tellingen verricht."_ (Swanborn, 1975, p.271). Zo begon Swanborn zijn bijdrage aan het jubileumnummer toen Mens en Maatschappij 50 jaar bestond, keek een analyse maakte van de publicaties in ons tijdschrift tot dan toe. Nu 50 jaar verder, en Mens en Maatschappij haar honderd jarig jubileum viert, maken we een knipoog naar Swanborns's eerder bijdrage, en maken we een soort gelijke analyse.

Met deze knipoog naar Swanborn, maken we graag een soort gelijke analyse van alle bijdrages die Mens en Maatschappij gedurende haar honderd jarige bestaan heeft mogen publiceren. Hoewel deze analyse op diverse manieren kan worden geanalyseerd, zowel via kwantitatieve als kwalitatieve benaderingen. Zullen we in deze bijdrage een kwantitatieve methode hanteren, voor een diepgandere kwalitatieve methode, als reflectie op de tijdsgeest met een bredere, wetenschapshistorische invalshoek, zie de bloemlezig die ook in dit jubileumnummer is opgenomen. In deze tekst richten we ons op het beschrijven van enkele trends die we konden vaststellen op basis van honderd jaargangen van ons eigen tijdschrift. Het is aan de lezer om hierin een weerspiegeling te zien van bijvoorbeeld de ontwikkeling van de sociale wetenschappen in Nederland, het reilen en zeilen van een diverse groep Nederlandse sociale wetenschappers, of juist de stempel van eigenzinnige redactiekeuzes. (Swanborn, 1975).

Sinds Swanborns analyse is er natuurlijk veel veranderd. In de afgelopen vijftig jaar hebben zich aanzienlijke methodologische en technologische ontwikkelingen voorgedaan, waardoor onze aanpak er fundamenteel anders uitziet dan toen. Voor deze analyse maken we gebruik van moderne technieken zoals webscraping om eenvoudig alle publicaties te verzamelen en overzichtelijk te maken. Daarnaast passen we tekstherkenning toe om teksten automatisch uit gescande pdf-bestanden te extraheren en gebruiken we AI-ondersteunde *topic modelling* om artikelen efficiënt op onderwerp te classificeren. Op deze manier laten we het zware en arbeidsintensieve werk grotendels over aan computers, wat een stuk sneller gaat dan de handmatige telling, classificatie en analyse die Swanborn destijds uitvoerde. Daarmee illustreert deze bijdrage meteen ook hoe ingrijpend de methodologische vooruitgang is geweest en welke nieuwe mogelijkheden dit vandaag de dag biedt.

## Data
Om mijn dataset samen te stellen, heb ik het volledige archief van het tijdschrift Mens en Maatschappij gescrapet. Dit archief is verspreid over drie verschillende databases[^longnote].
Het scrapen ging in een paar stappen: eerst schreef ik Python-scripts om automatisch langs alle webarchief-pagina’s te gaan en belangrijke informatie zoals titels, auteurs, publicatiedata en abstracts eruit te halen. Daarna heb ik de data uit deze drie bronnen samengevoegd tot één overzichtelijk bestand en meteen dubbele entries eruit gefilterd.
Vervolgens gebruikte ik deze gecombineerde metadata automatisch de bijbehorende volledige artikelen downloadde.

Toen ik alle artikelen eenmaal had gedownload, moest ik de teksten voorbereiden voor verdere analyse. Dit proces verliep in een aantal stappen:
- Eerst haalde ik de tekst uit de gedownloade pdf-bestanden, door middel van tekstherkenningssoftware. Dit stelde me instaat om de ruwe tekst uit (ingescande) pdf-bestanden te halen. 
- Vervolgens maakte ik deze teksten schoner en beter bruikbaar door overbodige elementen zoals voetnoten, paginanummers en dubbele witregels te verwijderen. Hierdoor ontstond een nette en uniforme tekstverzameling die geschikt was voor analyse.
- Tijdens het controleren merkte ik dat bepaalde gegevens nog niet compleet waren in de metadata. Daarom parsede ik de schoongemaakte teksten, om hieruit de ontbrekende metadata gericht op te halen en zo eventuele gaten op te vullen.
- Als laatste stap zorgde ik ervoor dat de informatie uit de verschillende databases helemaal gelijk werd getrokken. Bijvoorbeeld, auteursnamen, datumnotaties en andere informatie werden geharmoniseerd, zodat ik één overzichtelijke dataset kreeg waarin alle gegevens netjes en consistent waren opgeslagen.


[^longnote]: 1925-2001 is online en Open Access beschikbaar via https://ugp.rug.nl/MenM <br>
2001-2008 is online en Open Access beschikbaar via https://www.aup.nl/en/journal/mens-en-maatschappij/back-issues <br>
2008-heden is online en (gedeeltelijk) Open Access beschikbaar via https://www.aup-online.com/content/journals/00259454/browse?page=previous-issues

## Resultaten

### Het aantal publicaties

![](figures/article_counts.svg)

In [23]:
print("make new table with nr of art, page counts")

make new table with nr of art, page counts


### Aantal auteurs


![](figures/author_counts.svg)

In [24]:
(
    pd.read_excel('tables/author_counts.xlsx')
    .assign(decade = lambda x: x['decade'].astype(str))
    .set_axis(['Decade', '1', '2', '3', '4', '5', '6'], axis=1)
    .pipe(GT)
    .tab_spanner(label="Aantal Auteurs", columns=['1', '2', '3', '4', '5', '6'])
)

Decade,Aantal Auteurs,Aantal Auteurs,Aantal Auteurs,Aantal Auteurs,Aantal Auteurs,Aantal Auteurs
Decade,1,2,3,4,5,6
"(1935, 1945]",221,6,0,0,0,0
"(1945, 1955]",209,7,0,0,1,0
"(1955, 1965]",264,9,0,0,0,0
"(1965, 1975]",178,22,7,1,3,0
"(1975, 1985]",163,54,13,4,1,0
"(1985, 1995]",135,58,41,6,1,0
"(1995, 2005]",100,74,30,5,1,0
"(2005, 2015]",119,48,58,18,6,0
"(2015, 2025]",120,70,39,17,5,4


### Meest gepubliceerde auteurs

![](figures/most_published_authors.svg)

### Onderwerpen

![](figures/topic_prevalence.svg)

## References

Swanborn, P. G. (1975). Mens en maatschappij 50 jaar: Enkele opmerkingen over verschuivingen in de inhoud van het tijdschrift. *Mens & Maatschappij, 50*(1), 271–277.