# Database overview notebook

> First time use: follow instructions in the README.md file in this directory.

## Setup

In [22]:
import os
from dotenv import dotenv_values
import pandas
import ipywidgets as widgets

home_dir=os.getenv('HOME')
print("home  : "+home_dir)
mhk_env = dotenv_values(home_dir+"/.mhk")
mhk_home_dir=mhk_env['HOST_MHK_HOME']
app_env = dotenv_values(mhk_home_dir+'/app/.env')
pwd = app_env['MYSQL_ROOT_PASSWORD']  

home  : /Users/jrc


In [23]:
%load_ext sql

The sql extension is already loaded. To reload it, use:
  %reload_ext sql


## Connect to database

### Choose the database

In [24]:
connection_string = "mysql+mysqlconnector://root:{pwd}@localhost:3307/mysql".format(pwd=pwd)
%sql $connection_string
databases = %sql SELECT table_schema FROM information_schema.tables WHERE  table_name = 'entities';
print(databases)




33 rows affected.
+--------------------+
|    table_schema    |
+--------------------+
|       alunos       |
|      angelica      |
|     api_tests      |
|       china        |
|     dyncoopnet     |
|       eiras        |
|      familias      |
|       glopes       |
|       ilhavo       |
|      ilhavo2       |
|   ilhavo_contrib   |
|   ilhavo_editor    |
|   ilhavo_server    |
|   ilhavo_testes    |
|       lousa        |
|       lousa3       |
|       lousa4       |
|        mhk         |
|      notaveis      |
|       obidos       |
|       oguest       |
|        rhv         |
|     santaclara     |
|     santajusta     |
|       sister       |
|       soure        |
|     soure_edit     |
|    soure_editor    |
|     soure_mfg      |
|    soure_server    |
|       testes       |
|     toliveira      |
| toliveira_reviewed |
+--------------------+


In [11]:
db = "toliveira"
connection_string = "mysql+mysqlconnector://root:{pwd}@localhost:3307/{db}".format(pwd=pwd,db=db)
%sql $connection_string


In [12]:
%config SqlMagic.displaycon=False

# Pesquisa local

### Nacionalidades dos missionários

In [13]:

pessoas = %sql select the_value as nacionalidade, count(*) as n from attributes where the_type='nacionalidade' group by the_value order by 2 desc
pessoas


32 rows affected.


nacionalidade,n
Portugal,430
França,183
China,178
Itália,124
Espanha,43
Alemanha,36
Bélgica,23
Áustria,15
Flandres,12
Boémia,11


### Lista dos principais locais onde os missionários fizeram o noviciado

In [14]:
entradas = %sql select the_value, count(*) n  from attributes where the_type='jesuita-entrada' group by the_value  having n>10 order by n desc 
entradas

12 rows affected.


the_value,n
?,517
Coimbra,43
Paris,42
Lisboa,39
Roma,32
Goa,32
Évora,22
Nancy,15
Macau,14
Avignon,13


### Lista das nacionalidades e locais de nascimento dos missionários cujo local de entrada na Sociedade se desconhece

In [15]:
%%sql results <<  
    SELECT  distinct nacionalidades.the_value nacionalidade
    FROM (attributes entradas 
            left join attributes nacionalidades on (entradas.entity=nacionalidades.entity )) 
            left outer join attributes nascimentos  on (entradas.entity=nascimentos.entity 
            AND 
            nascimentos.the_type='nascimento') 
    WHERE nacionalidades.the_type='nacionalidade' 
        AND entradas.the_type='jesuita-entrada' 
        AND entradas.the_value='?' 
    ORDER by nacionalidade limit 100



19 rows affected.
Returning data to local variable results


In [16]:
nacionalidades = [r[0] for r in results]
# print(nacionalidades)
n = widgets.Select(
    options=nacionalidades,
    description='Escolher:',
    disabled=False,
)
display(n)

Select(description='Escolher:', options=('Alemanha', 'Áustria', 'Bélgica', 'Boémia', 'China', 'Espanha', 'Flan…

In [17]:
nacionalidade = n.value
print(nacionalidade)


Alemanha


In [18]:
%%sql results << SELECT  nacionalidades.the_value as nacionalidade ,nascimentos.the_value  as nascimento, nascimentos.the_date
    FROM (attributes entradas 
            left join attributes nacionalidades on (entradas.entity=nacionalidades.entity )) 
            left outer join attributes nascimentos  on (entradas.entity=nascimentos.entity 
            AND 
            nascimentos.the_type='nascimento') 
    WHERE nacionalidades.the_type='nacionalidade' 
        AND entradas.the_type='jesuita-entrada' 
        AND entradas.the_value='?' 
        AND nacionalidades.the_value='{nacionalidade}'
    ORDER BY nacionalidade, nascimento

14 rows affected.
Returning data to local variable results


In [19]:
results

nacionalidade,nascimento,the_date
Alemanha,?,16220000
Alemanha,Colónia,16580102
Alemanha,Colónia,16450908
Alemanha,Dillingen,16201218
Alemanha,"Diocese de Constance, Rottenburg am Neckar",16520420
Alemanha,Dorenbüren,15860500
Alemanha,Hötting-Innsbruck,16260000
Alemanha,"Mauerkirchen, dicese de Passau",17110924
Alemanha,Munique,17100117
Alemanha,"Nehaus, Westphalia",16791211


### Lista dos missionários com nomes chineses

In [20]:
%%sql
select distinct name,the_value from nattributes where the_type='nome-chines'

711 rows affected.


name,the_value
Baltasar Diego da Rocha,Lo Ti-ngo
Baltasar Diego da Rocha,T'ien-Yeou
Baltasar Diego da Rocha,Hei
Alessandro Valignano,范禮安
Adrien Grelon,Nié Tchong-Ts'ien Jo-Chouei
Agostinho de Avellar,Ting
Agostino Barelli,Ngai Sseu-Ting
Agostino Tudeschini,Tou Ngao-ting
Agostino Tudeschini,Kong K'ai
Albert le Comte Dorville,Wou Eul-To Tchao-Pei
