#### 0. Bibliotheken

In [2]:
import requests
import json

#### 1. Erstellungsdatum des Artikels abrufen

In [3]:
# base url der Wikipedia API
url = "https://de.wikipedia.org/w/api.php"

# Abrufen von Informationen über die Erstellung der Seite
creation_params = {
    "action": "query", # Art der Aktion => in dem Fall Abfrage
    "format": "json", # Format der Antwort => in dem Fall JSON
    "titles": "Hochschule Karlsruhe", # Titel der Seite
    "prop": "revisions", # Eigenschaft: Überarbeitungen
    "rvprop": "timestamp", # Eigenschaft der Überarbeitung: Zeitstempel
    "rvlimit": 1 , # Anzahl der Überarbeitungen
    "rvdir": "newer",  # Abrufen der ältesten Überarbeitung (older wäre die neueste)
}

# Anfrage an die Wikipedia API
creation_response = requests.get(url, params=creation_params)
# Ausgabe der Antwort
creation_data = creation_response.json()
creation_data

{'continue': {'rvcontinue': '20050317090155|4897606', 'continue': '||'},
 'query': {'pages': {'603448': {'pageid': 603448,
    'ns': 0,
    'title': 'Hochschule Karlsruhe',
    'revisions': [{'timestamp': '2005-03-17T08:58:28Z'}]}}}}

In [3]:
# Extrahieren des Erstellungsdatums
pages = creation_data.get("query").get("pages")
first_page = next(iter(pages.values()))
creation_date = first_page.get('revisions')[0].get('timestamp')
creation_date

'2005-03-17T08:58:28Z'

#### 2. Datum der letzten Änderung

In [4]:
url = "https://de.wikipedia.org/w/api.php"


creation_params = {
    "action": "query", 
    "format": "json", 
    "titles": "Hochschule Karlsruhe", 
    "prop": "revisions",
    "rvprop": "timestamp",
    "rvlimit": 1, 
    "rvdir": "older",  # Abrufen der neuesten Überarbeitung
}

creation_response = requests.get(url, params=creation_params)
creation_data = creation_response.json()
creation_data

{'continue': {'rvcontinue': '20240927183211|248950928', 'continue': '||'},
 'query': {'pages': {'603448': {'pageid': 603448,
    'ns': 0,
    'title': 'Hochschule Karlsruhe',
    'revisions': [{'timestamp': '2024-09-28T14:25:33Z'}]}}}}

In [70]:
pages = creation_data.get("query").get("pages")
first_page = next(iter(pages.values()))
last_revision = first_page.get('revisions')[0].get('timestamp')
last_revision


'2024-09-28T14:25:33Z'

#### 3. Anzahl der Bearbeitungen

In [5]:
url = "https://de.wikipedia.org/w/api.php"

creation_params = {
    "action": "query", 
    "format": "json", 
    "titles": "Python", 
    "prop": "revisions", 
    "rvprop": "timestamp",
    "rvlimit": 500, # Anzahl der Überarbeitungen (maxium ist 500)
    "rvdir": "older",  
}

creation_response = requests.get(url, params=creation_params)
creation_data = creation_response.json()
creation_data

{'batchcomplete': '',
 'query': {'pages': {'9698': {'pageid': 9698,
    'ns': 0,
    'title': 'Python',
    'revisions': [{'timestamp': '2024-07-08T15:33:54Z'},
     {'timestamp': '2024-06-06T02:29:14Z'},
     {'timestamp': '2024-05-13T19:19:32Z'},
     {'timestamp': '2024-05-13T19:18:16Z'},
     {'timestamp': '2024-04-06T08:06:51Z'},
     {'timestamp': '2024-02-25T23:42:48Z'},
     {'timestamp': '2024-02-25T23:42:15Z'},
     {'timestamp': '2024-02-25T23:36:45Z'},
     {'timestamp': '2024-02-25T23:34:55Z'},
     {'timestamp': '2024-02-25T23:34:23Z'},
     {'timestamp': '2024-02-25T23:33:54Z'},
     {'timestamp': '2023-11-08T22:46:50Z'},
     {'timestamp': '2022-01-06T11:35:34Z'},
     {'timestamp': '2022-01-06T11:35:20Z'},
     {'timestamp': '2022-01-06T11:34:24Z'},
     {'timestamp': '2022-01-06T11:34:07Z'},
     {'timestamp': '2020-09-25T09:53:24Z'},
     {'timestamp': '2020-03-05T16:46:15Z'},
     {'timestamp': '2020-02-07T08:09:26Z'},
     {'timestamp': '2020-02-07T08:09:13Z'},
   

In [52]:
pages = creation_data.get("query").get("pages")
first_page = next(iter(pages.values()))
count_revisions = first_page.get('revisions', [])
len(count_revisions)

174

#### 4. Kategorien des Artikels

#### 4.1 Kategorien in dem der Artikel vorkommt

In [6]:
url = "https://de.wikipedia.org/w/api.php"


categories_params = {
    "action": "query", 
    "format": "json",
    "titles": "Hochschule Karlsruhe", 
    "prop": "categories", # Eigenschaft: Kategorien
}

categories_response = requests.get(url, params=categories_params)
categories_data = categories_response.json()
categories_data

{'batchcomplete': '',
 'query': {'pages': {'603448': {'pageid': 603448,
    'ns': 0,
    'title': 'Hochschule Karlsruhe',
    'categories': [{'ns': 14,
      'title': 'Kategorie:Fachhochschule in Deutschland'},
     {'ns': 14, 'title': 'Kategorie:Gegründet 1878'},
     {'ns': 14, 'title': 'Kategorie:Hochschule in Karlsruhe'},
     {'ns': 14, 'title': 'Kategorie:Innenstadt-West (Karlsruhe)'},
     {'ns': 14, 'title': 'Kategorie:Technische Hochschule in Deutschland'},
     {'ns': 14, 'title': 'Kategorie:Wirtschaftshochschule in Deutschland'}]}}}}

In [28]:
pages = categories_data.get("query").get("pages")
first_page = next(iter(pages.values()))
categories = first_page.get('categories')
name_categories = []
for item in categories:
    category = item.get('title')
    category = category.split(":")[1]
    name_categories.append(category)
name_categories

['Fachhochschule in Deutschland',
 'Gegründet 1878',
 'Hochschule in Karlsruhe',
 'Innenstadt-West (Karlsruhe)',
 'Technische Hochschule in Deutschland',
 'Wirtschaftshochschule in Deutschland']

#### 4.2 Kategorien in dem der Artikel aufgeteilt ist

In [7]:

url = "https://de.wikipedia.org/w/api.php"


creation_params = {
    "action": "parse", 
    "format": "json", 
    "page": "Hochschule Karlsruhe", 
    "prop": "sections",
}

# Anfrage an die Wikipedia API
creation_response = requests.get(url, params=creation_params)
# Ausgabe der Antwort
creation_data = creation_response.json()
creation_data

{'parse': {'title': 'Hochschule Karlsruhe',
  'pageid': 603448,
  'sections': [{'toclevel': 1,
    'level': '2',
    'line': 'Das Studium',
    'number': '1',
    'index': '1',
    'fromtitle': 'Hochschule_Karlsruhe',
    'byteoffset': 3058,
    'anchor': 'Das_Studium',
    'linkAnchor': 'Das_Studium'},
   {'toclevel': 1,
    'level': '2',
    'line': 'Fakultäten',
    'number': '2',
    'index': '2',
    'fromtitle': 'Hochschule_Karlsruhe',
    'byteoffset': 3855,
    'anchor': 'Fakultäten',
    'linkAnchor': 'Fakultäten'},
   {'toclevel': 1,
    'level': '2',
    'line': 'Internationale Kontakte',
    'number': '3',
    'index': '3',
    'fromtitle': 'Hochschule_Karlsruhe',
    'byteoffset': 4126,
    'anchor': 'Internationale_Kontakte',
    'linkAnchor': 'Internationale_Kontakte'},
   {'toclevel': 1,
    'level': '2',
    'line': 'Angewandte Forschung',
    'number': '4',
    'index': '4',
    'fromtitle': 'Hochschule_Karlsruhe',
    'byteoffset': 6242,
    'anchor': 'Angewandte_For

In [8]:
pages = creation_data.get("parse")
sections = pages.get('sections')
for item in sections:
    print(item.get('line'))


Das Studium
Fakultäten
Internationale Kontakte
Angewandte Forschung
Forschungsinstitute
Kooperationen
Geschichte
Persönlichkeiten
Dozenten
Absolventen
Sonstige
Weblinks
Einzelnachweise
