# Bokeh 

In [4]:
import json
import requests
import csv
import pandas as pd
import datetime
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
from bokeh.io import output_notebook, show
from bokeh.plotting import figure
output_notebook()

In [2]:
with open('dump_api.json','r') as f:
    data = json.loads(f.read()) 

In [3]:
data_list = []
manuscrit_list = []
languages_count_list = []
names_fra_list = []
cities_fra_list = []
keywords_count_list = []
comments_count_list = []

for item in data:
    books = item['book']
    fragments = item['fragment']
    texts = item['texts']
    manuscripts = item['manuscripts']
    authors = item['authors']
    cities = item['cities']
    keywords = item['keywords']
    comments = item['comments']
    
    # Vérifier si la liste de manuscrits est vide
    manuscrit = len(manuscripts) > 0
    
    # Compter le nombre de textes pour chaque langue
    languages_count = {}
    for text in texts:
        language = text['language']
        if language in languages_count:
            languages_count[language] += 1
        else:
            languages_count[language] = 1
    
    # Récupérer les noms en français
    names_fra = [author['names'][2]['name'] for author in authors]
    
    data_list.append({
        'id': item['id'],
        'url': item['url'],
        'book': books['number'],
        'fragment': item['fragment'],
        'manuscrit': manuscrit,
        'nbr_textes': len(texts),
        'langues_count': languages_count,
        'names_fra': names_fra,
        'cities_fra': cities,
        'nbr_keywords': len(keywords),
        'nbr_comments': len(comments)
    })
    
    manuscrit_list.append(manuscrit)
    languages_count_list.append(languages_count)
    names_fra_list.append(names_fra)
    cities_fra_list.append(cities)
    keywords_count_list.append(len(keywords))
    comments_count_list.append(len(comments))

df = pd.DataFrame(data_list)
df['manuscrit'] = manuscrit_list
df['langues_count'] = languages_count_list
df['names_fra'] = names_fra_list
df['cities_fra'] = cities_fra_list
df['nbr_keywords'] = keywords_count_list
df['nbr_comments'] = comments_count_list

pd.set_option('display.max_colwidth', None)

df

Unnamed: 0,id,url,book,fragment,manuscrit,nbr_textes,langues_count,names_fra,cities_fra,nbr_keywords,nbr_comments
0,424,https://anthologiagraeca.org/api/passages/urn:cts:greekLit:tlg7000.tlg001.ag:1.1/,1,1,True,4,"{'grc': 1, 'eng': 1, 'fra': 1, 'por': 1}",[anonyme],[],2,1
1,438,https://anthologiagraeca.org/api/passages/urn:cts:greekLit:tlg7000.tlg001.ag:1.2/,1,2,True,4,"{'grc': 1, 'eng': 1, 'fra': 1, 'por': 1}",[anonyme],[],2,0
2,513,https://anthologiagraeca.org/api/passages/urn:cts:greekLit:tlg7000.tlg001.ag:1.3/,1,3,True,4,"{'grc': 1, 'eng': 1, 'fra': 1, 'por': 1}",[anonyme],[],2,0
3,514,https://anthologiagraeca.org/api/passages/urn:cts:greekLit:tlg7000.tlg001.ag:1.4/,1,4,True,4,"{'grc': 1, 'eng': 1, 'fra': 1, 'por': 1}",[anonyme],[],2,0
4,515,https://anthologiagraeca.org/api/passages/urn:cts:greekLit:tlg7000.tlg001.ag:1.5/,1,5,True,4,"{'grc': 1, 'eng': 1, 'fra': 1, 'por': 1}",[anonyme],[],2,0
...,...,...,...,...,...,...,...,...,...,...,...
4129,3638,https://anthologiagraeca.org/api/passages/urn:cts:greekLit:tlg7000.tlg001.ag:16.384/,16,384,False,2,"{'grc': 1, 'ita': 1}",[],[],0,0
4130,3558,https://anthologiagraeca.org/api/passages/urn:cts:greekLit:tlg7000.tlg001.ag:16.385/,16,385,False,2,"{'grc': 1, 'ita': 1}",[],[],0,0
4131,4125,https://anthologiagraeca.org/api/passages/urn:cts:greekLit:tlg7000.tlg001.ag:16.386/,16,386,False,2,"{'grc': 1, 'ita': 1}",[],[],0,0
4132,3523,https://anthologiagraeca.org/api/passages/urn:cts:greekLit:tlg7000.tlg001.ag:16.387/,16,387,False,2,"{'grc': 1, 'ita': 1}",[],[],0,0


In [5]:
# Dictionnaire pour stocker les compteurs de chaque livre
compteurs_livres = {}

# Comptage des éléments par livre
for element in data:
    url_livre = element['book']['number']
    
    # Vérification de l'existence de la clé dans le dictionnaire
    if url_livre in compteurs_livres:
        # Incrémentation du compteur
        compteurs_livres[url_livre] += 1
    else:
        # Initialisation du compteur
        compteurs_livres[url_livre] = 1

# Affichage des résultats
for url_livre, compteurs in compteurs_livres.items():
    print(f"Livre : {url_livre}, Nombre d'éléments : {compteurs}")


Livre : 1, Nombre d'éléments : 123
Livre : 2, Nombre d'éléments : 10
Livre : 3, Nombre d'éléments : 19
Livre : 4, Nombre d'éléments : 5
Livre : 5, Nombre d'éléments : 310
Livre : 6, Nombre d'éléments : 359
Livre : 7, Nombre d'éléments : 758
Livre : 8, Nombre d'éléments : 258
Livre : 9, Nombre d'éléments : 831
Livre : 10, Nombre d'éléments : 127
Livre : 11, Nombre d'éléments : 443
Livre : 12, Nombre d'éléments : 260
Livre : 13, Nombre d'éléments : 32
Livre : 14, Nombre d'éléments : 151
Livre : 15, Nombre d'éléments : 52
Livre : 16, Nombre d'éléments : 396


In [8]:
# create a new plot with default tools, using figure
p = figure(width=400, height=400, title="Nombre d'épigrammes par livre")

# add a circle renderer with x and y coordinates, size, color, and alpha
p.hex(list(compteurs_livres.keys()), list(compteurs_livres.values()), size=15, line_color="navy", fill_color="orange", fill_alpha=0.5)

show(p) # show the results

In [7]:
from math import pi
import pandas as pd
from bokeh.palettes import Category20c
from bokeh.transform import cumsum
from bokeh.models import Legend, Wedge, ColumnDataSource

x = compteurs_livres

data = pd.Series(x).reset_index(name='value').rename(columns={'index':'livre'})
data['color'] = Category20c[len(x)]

# represent each value as an angle = value / total * 2pi
data['angle'] = data['value']/data['value'].sum() * 2*pi

p = figure(height=450, title="Nombre d'épigrammes par livre", toolbar_location=None,
           tools="hover", tooltips="@livre: @value")

p.wedge(x=0, y=1, radius=0.4, 
        
        # use cumsum to cumulatively sum the values for start and end angles
        start_angle=cumsum('angle', include_zero=True), end_angle=cumsum('angle'),
        line_color="white", fill_color='color', legend_field='livre', source=data)

p.axis.axis_label=None
p.axis.visible=False
p.grid.grid_line_color = None
show(p)