In [1]:
import pandas as pd
import requests

In [2]:
# zum Zusammenbauen der Bibsonomy URL brauchen wir alles, was vor und nach der Query kommt
url_base = "https://www.bibsonomy.org/json/search/"
url_attr = "?items=1000"

# wir schreiben eine Funktion (definiert über def), der wir eine Suchanfrage übergeben (query)
# diese Funktion soll dann die Bibsonomy Ergebnisse als Dataframe zurückgeben

def df_from_query(query):
    # die URL; wir müssen Leerzeichen ersetzen mit "%20" nach ASCII Encoding guideline
    url = url_base + query.replace(" ", "%20") + url_attr
    
    result = requests.get(url)
    json_data = result.json()
    dataframe = pd.DataFrame(json_data["items"])
    return dataframe

In [3]:
df = df_from_query("desk lamp")

In [4]:
# wir erstellen eine leere Liste, in die wir unsere Dataframes packen
dataframes = []

# eine Liste von Suchanfragen
queries = ["global warming", "ice cream", "glacier", "weather Europe", "keyword"]

# jetzt gehen wir die Liste von Suchanfragen durch und rufen unsere Funktion für jede Suchanfrage auf
for q in queries:
    df = df_from_query(q)
    # schließlich fügen wir das DataFrame über append unserer Liste von Dataframes hinzu
    dataframes.append(df)
    
    # wie wir uns eine Statusausgabe schreiben würden:
    #print("Ergebnisse für", q , "gefunden. Dataframe enthält",len(df), "Einträge.")
    
    # mit einem f String lassen sich Variablen in Strings viel einfacher formatieren:
    print(f'Ergebnisse für {q} gefunden. Dataframe enthält {len(df["id"])} Einträge.')

Ergebnisse für global warming gefunden. Dataframe enthält 1441 Einträge.
Ergebnisse für ice cream gefunden. Dataframe enthält 99 Einträge.
Ergebnisse für glacier gefunden. Dataframe enthält 1255 Einträge.
Ergebnisse für weather Europe gefunden. Dataframe enthält 1143 Einträge.
Ergebnisse für keyword gefunden. Dataframe enthält 2000 Einträge.


In [5]:
# über die concat Funktion von Python fügen wie die Liste von einzelnen Dataframes zu einem einzelnen zusammen
# über "ignore_index" können wir den Index "resetten" und so die Einträge neu fortlaufend nummerieren
data = pd.concat(dataframes, ignore_index=True)

In [6]:
data

Unnamed: 0,type,id,tags,intraHash,label,user,description,date,changeDate,count,...,confidential,city,qnote,journalpub,nocites,paper,bibsource,bibdate,jstor_date,idbdi
0,Bookmark,https://www.bibsonomy.org/url/6011370a85317db0...,"[science, slashdot]",6011370a85317db0e6eaf80663998ab2,Losing the Public Debate On Global Warming - S...,yago,Global Warming Debate,2012-10-27 04:50:14,2012-10-27 04:50:14,1,...,,,,,,,,,,
1,Bookmark,https://www.bibsonomy.org/url/fb520f66ea794573...,"[THE_ENVIRONMENT, ZZZ_TO_SORT]",fb520f66ea7945739b597cc5411e5699,Global Warming Timeline,tudp,Global Warming Archive is the world's largest ...,2008-08-10 04:05:43,2008-08-10 05:04:58,1,...,,,,,,,,,,
2,Bookmark,https://www.bibsonomy.org/url/79d7af6aaf188380...,"[effects, solutions, warming, global, informat...",79d7af6aaf188380c3ccfb04fec78709,What is Global Warming? Its Effects and Potent...,innspubnet,"Global warming, also known as climate change, ...",2023-05-07 13:59:18,2023-05-07 13:59:18,1,...,,,,,,,,,,
3,Bookmark,https://www.bibsonomy.org/url/0aaf33b2db6d2cbf...,[physics],0aaf33b2db6d2cbf91cd773f957e6ce1,"Human activity, Solar activity and Global Warming",eufisica,Human activity affect much more to global warm...,2012-04-06 00:14:00,2013-08-26 08:25:51,1,...,,,,,,,,,,
4,Bookmark,https://www.bibsonomy.org/url/a2311acf0b0f219b...,"[usa, climate]",a2311acf0b0f219b41a1c5a4d9fb1b09,Williams: Global warming agenda is about contr...,mikaelbook,The global warming agenda is a desperate effor...,2015-12-12 13:20:57,2015-12-12 13:21:55,1,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5933,Publication,https://www.bibsonomy.org/bibtex/23727f1575420...,[dblp],3727f15754203542e1d16a97fa8071e3,Searching web databases by structuring keyword...,dblp,,2018-11-06 00:00:00,2018-11-07 16:54:24,2,...,,,,,,,,,,
5934,Publication,https://www.bibsonomy.org/bibtex/224938cc76175...,[dblp],24938cc7617525d0b7ef7333c69bc3e4,Intent-aware temporal query modeling for keywo...,dblp,,2018-11-06 00:00:00,2018-11-07 16:55:41,2,...,,,,,,,,,,
5935,Publication,https://www.bibsonomy.org/bibtex/2a53a79870520...,[dblp],a53a7987052089f6ec5eb61e96fd8cfb,Operational Assessment of Keyword Search on Or...,dblp,,2019-08-19 00:00:00,2019-08-20 12:16:17,1,...,,,,,,,,,,
5936,Publication,https://www.bibsonomy.org/bibtex/222e55cb7fa44...,[dblp],22e55cb7fa44a29b75f77a42be44987f,SPARK: a keyword search system on relational d...,dblp,,2019-04-29 00:00:00,2019-04-30 11:37:20,1,...,,,,,,,,,,


In [7]:
# wir speichern unser DataFrame als json
data.to_json("test.json")