# Libraries

In [3]:
import requests
from bs4 import BeautifulSoup
import yfinance as yf
from ecbdata import ecbdata
from pyjstat import pyjstat

# data viz libraries 
import matplotlib.pyplot as plt
import seaborn as sns
import altair as alt
import plotly.graph_objects as go
import plotly.express as px

import plotly.graph_objects as go
import plotly.express as px
import datetime
from ipywidgets import interact, widgets
from plotly.subplots import make_subplots
from ipywidgets import interact

# data processing and modeling libraries
import pandas as pd
import numpy as np
from datetime import datetime
import scipy
import statsmodels.api as sm
from scipy.stats import norm

from IPython.display import display, HTML
import os

import warnings
warnings.filterwarnings("ignore")

# gvm library
from obiwan import *

username = os.getenv('USERNAME_COLABORADOR')

# Data Extraction

In [8]:
import inspect
import obiwan

funcoes = inspect.getmembers(obiwan, inspect.isfunction)
for nome, funcao in funcoes:
    print(nome)

KRI_analysis_risk_parameters_annex
calculate_annual_npv
calculate_sum_npv
extract_AAA_rated_yield_curves
extract_country_life_exp_index
extract_daily_ts_from_fred
extract_data_from_alphavantage
extract_data_from_bank_pt
extract_data_from_ecb
extract_discount_rates_from_mercer
extract_ecb_interest_rate_next_three_years
extract_euribor_1Y_next_three_years
extract_euribor_3M_next_three_years
extract_euribor_data_from_ecb
extract_euribors
extract_fed_next_three_years
extract_life_expectancy_by_year
get_data_from_yf
get_fx_data
plot_corr_matrix
write_data_in_excel


In [9]:
help(extract_data_from_bank_pt)

Help on function extract_data_from_bank_pt in module obiwan:

extract_data_from_bank_pt(series_id, variable_name)
    Function to extract data from BPSTAT API.
    
    Arguments: series_id int
             variable_name str.
             If variable_name is None, variable_name is set to urls label.
    
    Returns:   pandas dataframe with Date and variable_name columns



In [12]:
series_dict = {
    12519805: 'Taxa de juro (TAA) de novos depósitos a prazo até 1 ano dos particulares',
    12519806: 'Taxa de juro (TAA) de novos depósitos a prazo até 1 ano das empresas não financeiras',
    12519797: 'Montante de novos depósitos a prazo até 1 ano dos particulares',
    12519799: 'Montante de novos depósitos a prazo dos particulares',
    12519800: 'Montante de novos depósitos a prazo das empresas não financeiras',
    12519712: 'Taxa de juro (TAA) do stock de depósitos a prazo do setor não financeiro  (exceto administrações públicas)',
    12519807: 'Taxa de juro (TAA) de novos depósitos a prazo dos particulares',
    12519808: 'Taxa de juro (TAA) de novos depósitos a prazo das empresas não financeiras',
    12519717: 'Taxa de juro (TAA) do stock de depósitos à ordem dos particulares',
    12519720: 'Taxa de juro (TAA) do stock de depósitos a prazo dos particulares',
    12519785: 'Taxa de juro (TAA) do stock de empréstimos às empresas não financeiras',
    12519718: 'Taxa de juro (TAA) do stock de depósitos a prazo a mais de 2 anos dos particulares',
    12527037: 'Depósitos e equiparados-M€ (OIFM)',
    12556700: 'Depósitos e equiparados-Particulares-PRT-M€ (OIFM)',
    12529442: 'Depósitos e equiparados-SNF-PRT-M€ (OIFM)',
    12529238: 'Responsabilidades à vista-PRT-M€ (OIFM)',
    12556750: 'Responsabilidades à vista-Particulares-PRT-M€ (OIFM)',
    12529239: 'Responsabilidades à vista-SNF-PRT-M€ (OIFM)'
}

In [25]:
series_dict = {
    12519805: {
        'descricao': 'Taxa de juro (TAA) de novos depósitos a prazo até 1 ano dos particulares',
        'metrica': 'Taxa acordada anualizada',
        'medida': 'Percentagem'
    },
    12519806: {
        'descricao': 'Taxa de juro (TAA) de novos depósitos a prazo até 1 ano das empresas não financeiras',
        'metrica': 'Taxa acordada anualizada',
        'medida': 'Percentagem'
    },
    12519797: {
        'descricao': 'Montante de novos depósitos a prazo até 1 ano dos particulares',
        'metrica': 'Valor',
        'medida': 'Milhões de euros'
    },
    12519799: {
        'descricao': 'Montante de novos depósitos a prazo dos particulares',
        'metrica': 'Valor',
        'medida': 'Milhões de euros'
    },
    12519800: {
        'descricao': 'Montante de novos depósitos a prazo das empresas não financeiras',
        'metrica': 'Valor',
        'medida': 'Milhões de euros'
    },
    12519712: {
        'descricao': 'Taxa de juro (TAA) do stock de depósitos a prazo do setor não financeiro  (exceto administrações públicas)',
        'metrica': 'Taxa acordada anualizada',
        'medida': 'Percentagem'
    },
    12519807:  {
        'descricao': 'Taxa de juro (TAA) de novos depósitos a prazo dos particulares',
        'metrica': 'Taxa acordada anualizada',
        'medida': 'Percentagem'
    },
    12519808:  {
        'descricao': 'Taxa de juro (TAA) de novos depósitos a prazo das empresas não financeiras',
        'metrica': 'Taxa acordada anualizada',
        'medida': 'Percentagem'
    },
    12519717: {
        'descricao':  'Taxa de juro (TAA) do stock de depósitos à ordem dos particulares',
        'metrica': 'Taxa acordada anualizada',
        'medida': 'Percentagem'
    },
    12519720: {
        'descricao': 'Taxa de juro (TAA) do stock de depósitos a prazo dos particulares',
        'metrica': 'Taxa acordada anualizada',
        'medida': 'Percentagem'
    },
    12519785:  {
        'descricao': 'Taxa de juro (TAA) do stock de empréstimos às empresas não financeiras',
        'metrica': 'Taxa acordada anualizada',
        'medida': 'Percentagem'
    },
    12519718:  {
        'descricao':  'Taxa de juro (TAA) do stock de depósitos a prazo a mais de 2 anos dos particulares',
        'metrica': 'Taxa acordada anualizada',
        'medida': 'Percentagem'
    },
    12527037:  {
        'descricao': 'Depósitos e equiparados-M€ (OIFM)',
        'metrica': 'Valor em fim de período',
        'medida': 'Percentagem'
    },
    12556700:  {
        'descricao':  'Depósitos e equiparados-Particulares-PRT-M€ (OIFM)',
        'metrica': 'Valor em fim de período',
        'medida': 'Milhões de euros'
    },
    12529442: {
        'descricao':   'Depósitos e equiparados-SNF-PRT-M€ (OIFM)',
        'metrica': 'Valor em fim de período',
        'medida': 'Milhões de euros'
    },
    12529238:  {
        'descricao':  'Responsabilidades à vista-PRT-M€ (OIFM)',
        'metrica':  'Valor em fim de período',
        'medida': 'Milhões de euros'
    },
    12556750:  {
        'descricao': 'Responsabilidades à vista-Particulares-PRT-M€ (OIFM)',
        'metrica': 'Valor em fim de período',
        'medida': 'Milhões de euros'
    },
    12529239:  {
        'descricao':  'Responsabilidades à vista-SNF-PRT-M€ (OIFM)',
        'metrica': 'Valor em fim de período',
        'medida': 'Milhões de euros'
    }
}

In [16]:
dfs_dict = {descricao: extract_data_from_bank_pt(serie_id, variable_name=descricao) for serie_id, descricao in series_dict.items()}

df_exemplo = dfs_dict['Depósitos e equiparados-SNF-PRT-M€ (OIFM)']

In [30]:
pd.set_option('display.max_columns', None)

pd.set_option('display.max_rows', None)

In [36]:
df_final = pd.DataFrame()

descriptions = ["Date"]  
metrics = [""]           
measures = [""]         

for serie_id, info in series_dict.items():
    descricao = info["descricao"]
    metrica = info["metrica"]
    medida = info["medida"]
    
    df = extract_data_from_bank_pt(serie_id, variable_name=descricao)
    
    if df_final.empty:
        df_final = df[["Date"]]
    df_final = df_final.merge(df[["Date", descricao]], on="Date", how="outer")
    
    descriptions.append(descricao)
    metrics.append(metrica)
    measures.append(medida)

multiindex = pd.MultiIndex.from_arrays([descriptions, metrics, measures], names=["Descrição", "Métrica", "Medida"])

df_final.columns = multiindex

df_final = df_final.sort_values(by='Date', ascending=False)
df_final = df_final[df_final['Date'] >= '2003-01-31'].set_index('Date')
df_final


Descrição,Taxa de juro (TAA) de novos depósitos a prazo até 1 ano dos particulares,Taxa de juro (TAA) de novos depósitos a prazo até 1 ano das empresas não financeiras,Montante de novos depósitos a prazo até 1 ano dos particulares,Montante de novos depósitos a prazo dos particulares,Montante de novos depósitos a prazo das empresas não financeiras,Taxa de juro (TAA) do stock de depósitos a prazo do setor não financeiro (exceto administrações públicas),Taxa de juro (TAA) de novos depósitos a prazo dos particulares,Taxa de juro (TAA) de novos depósitos a prazo das empresas não financeiras,Taxa de juro (TAA) do stock de depósitos à ordem dos particulares,Taxa de juro (TAA) do stock de depósitos a prazo dos particulares,Taxa de juro (TAA) do stock de empréstimos às empresas não financeiras,Taxa de juro (TAA) do stock de depósitos a prazo a mais de 2 anos dos particulares,Depósitos e equiparados-M€ (OIFM),Depósitos e equiparados-Particulares-PRT-M€ (OIFM),Depósitos e equiparados-SNF-PRT-M€ (OIFM),Responsabilidades à vista-PRT-M€ (OIFM),Responsabilidades à vista-Particulares-PRT-M€ (OIFM),Responsabilidades à vista-SNF-PRT-M€ (OIFM)
Métrica,Taxa acordada anualizada,Taxa acordada anualizada,Valor,Valor,Valor,Taxa acordada anualizada,Taxa acordada anualizada,Taxa acordada anualizada,Taxa acordada anualizada,Taxa acordada anualizada,Taxa acordada anualizada,Taxa acordada anualizada,Valor em fim de período,Valor em fim de período,Valor em fim de período,Valor em fim de período,Valor em fim de período,Valor em fim de período
Medida,Percentagem,Percentagem,Milhões de euros,Milhões de euros,Milhões de euros,Percentagem,Percentagem,Percentagem,Percentagem,Percentagem,Percentagem,Percentagem,Percentagem,Milhões de euros,Milhões de euros,Milhões de euros,Milhões de euros,Milhões de euros
Date,Unnamed: 1_level_3,Unnamed: 2_level_3,Unnamed: 3_level_3,Unnamed: 4_level_3,Unnamed: 5_level_3,Unnamed: 6_level_3,Unnamed: 7_level_3,Unnamed: 8_level_3,Unnamed: 9_level_3,Unnamed: 10_level_3,Unnamed: 11_level_3,Unnamed: 12_level_3,Unnamed: 13_level_3,Unnamed: 14_level_3,Unnamed: 15_level_3,Unnamed: 16_level_3,Unnamed: 17_level_3,Unnamed: 18_level_3
2024-09-30,2.56,3.03,11249.0,11603.0,7133.0,2.21,2.55,3.02,0.03,2.07,5.29,1.59,354073.9,188482.0,65092.9,136163.2,80014.5,40739.3
2024-08-31,2.58,3.07,11164.0,11563.0,5862.0,2.22,2.57,3.07,0.03,2.07,5.37,1.54,355407.6,188345.6,66523.3,137911.3,81006.1,42605.7
2024-07-31,2.65,3.11,12130.0,12559.0,7571.0,2.21,2.63,3.1,0.03,2.05,5.42,1.46,353115.7,189017.5,63686.9,136545.7,82666.8,40420.9
2024-06-30,2.68,3.28,9683.0,10061.0,7479.0,2.22,2.66,3.27,0.03,2.05,5.44,1.42,352699.8,186698.2,65756.1,136518.1,81561.5,41905.2
2024-05-31,2.75,3.31,10202.0,10606.0,7575.0,2.24,2.72,3.3,0.03,2.07,5.49,1.39,350767.3,184298.7,65681.6,134027.1,79214.7,41976.8
2024-04-30,2.79,3.4,10212.0,10645.0,7985.0,2.24,2.75,3.39,0.03,2.06,5.51,1.34,350326.3,183230.4,64971.5,132706.2,78811.1,41173.8
2024-03-31,2.8,3.39,7350.0,7698.0,6358.0,2.2,2.77,3.38,0.03,2.02,5.53,1.29,346521.3,182203.3,64033.1,131274.7,78327.0,40655.6
2024-02-29,2.82,3.33,7309.0,7548.0,5403.0,2.12,2.81,3.32,0.03,1.94,5.54,1.23,343987.8,181398.8,62839.7,131271.3,78069.5,40627.1
2024-01-31,2.92,3.42,9282.0,9588.0,7558.0,2.02,2.9,3.42,0.03,1.84,5.55,1.17,341405.4,180501.1,62577.3,131442.6,78553.7,40816.3
2023-12-31,3.1,3.46,9309.0,9554.0,7536.0,1.88,3.08,3.46,0.02,1.67,5.52,1.12,340900.4,179782.1,64096.5,134655.1,80648.5,42324.1


In [37]:
help(extract_euribor_data_from_ecb)

Help on function extract_euribor_data_from_ecb in module obiwan:

extract_euribor_data_from_ecb(tenor, start_date)
    Function to extract Euribor data.
    Extracted from ECB.
    Returns a dataframe with euribor data for a defined tenor from start_date until now.
    
    Params: 
        - tenor (str): '3M' or '6M' or '1M' or '1Y'
        - startdate (str)
    
    Returns a dataframe with euribor data for the specified tenor from start_date until now.
    
    >>> Usage example:  extract_euribor_data_from_ecb('1Y', '2020-01-01')



In [38]:
extract_euribor_data_from_ecb('3M', '2003-01-31')

Unnamed: 0,Date,Euribor 3M
0,2003-02-01,2.5777
1,2003-03-01,2.450714
2,2003-04-01,2.46945
3,2003-05-01,2.308381
4,2003-06-01,2.084333
5,2003-07-01,2.092522
6,2003-08-01,2.172095
7,2003-09-01,2.177636
8,2003-10-01,2.172652
9,2003-11-01,2.22405


In [44]:
import csv
import re
import requests
from lxml import html
from datetime import datetime as date

year=2024
base_url = 'http://www.euribor-rates.eu'
url = 'euribor-{}.asp?i1={}&i2=1'
current_year_url = 'euribor-rate-{}-{}.asp'

granularity = 'monthly'

# To get infos from 1999 to last year. Notice that end of range is not included
years_available_in_history = [str(year) for year in range(1999, date.now().year)]

# Pattern for file naming
file_name = 'euribor_{}{}_by_month.csv'.format


def get_available_maturity_levels(year, **kwargs):
    page = requests.get(base_url + '/' + url.format(year, "1"))
    tree = html.fromstring(page.text)
    # To get possibles values for each year
    options = tree.xpath('//option')
    if kwargs.get('type') and kwargs.get('type') == 'labels':
        return list(set([i.text for i in options]))
    else:
        return list(set([i.attrib['value'] for i in options]))


def shorten_label(label):
    label = label.replace(
        ' ', ''
    ).replace(
        'weeks',
        'w'
    ).replace(
        'week',
        'w'
    ).replace(
        'months',
        'm'
    ).replace(
        'month',
        'm'
    )
    return label


def shorten_labels(labels):
    return list(map(lambda x: shorten_label(x), labels))


def select_and_write_data(tree, maturity_level, year, xpath_selector, **kwargs):
    trs = tree.xpath(xpath_selector)
    if kwargs.get('reverse_order'):
        trs.reverse()
    # Prepare to write and loop on scrapped data for url
    with open(file_name(maturity_level, year), 'w') as csvfile:
        # Initialize csv writer
        csv_writer = csv.writer(csvfile, quoting=csv.QUOTE_MINIMAL)
        for tr in trs:
            # Get td from tr parent
            date = tr.getchildren()[0].text.strip()
            value = tr.getchildren()[1].text.replace('%', '').replace(',', '.').strip()
            splitted_date = date.split('-')
            if splitted_date[-1] != str(year): # Current year page shows past year data as well, omit it
                continue
            if kwargs.get('dateformat') and kwargs.get('dateformat') == 'mm-dd-yyyy':
                splitted_date = [splitted_date[2], splitted_date[0], splitted_date[1]]
            else:
                splitted_date.reverse()
            iso_8601 = '-'.join(splitted_date)

            try:
                numeric_value = float(value)
                csv_writer.writerow([
                    iso_8601,
                    '{0:.3f}'.format(numeric_value),
                    maturity_level,
                    granularity
                ])
            except:
                # Empty value (during 2013 change)
                pass


def get_history_data():
    for year in years_available_in_history:
        print(year)
        values = get_available_maturity_levels(year)
        # Loop now for each year
        for value in values:
            page = requests.get(base_url + '/' + url.format(year, value))
            tree = html.fromstring(page.text)
            # Get Name for the file from options where selected
            maturity_level = tree.xpath('//option[@selected]')[0].text
            maturity_level = shorten_label(maturity_level)
            select_and_write_data(
                tree,
                maturity_level,
                year,
                '//div[@class="maincontent"]/table/tr/td/table/tr/td/table/tr'
            )


def get_current_year_data():
    labels = [x for x in get_available_maturity_levels('2014', type='labels')]
    year = date.now().year
    for label in labels:
        maturity_level = shorten_label(label)
        splitted_label = label.split(' ')
        maturity = splitted_label[0] # for example '12' in the case of '12 months'
        timeunit = splitted_label[1] # for example 'months' in the case of '12 months'
        page = requests.get(base_url + '/' + current_year_url.format(maturity, timeunit))
        tree = html.fromstring(page.text)
        #trs = tree.xpath('//div[@class="maincontent"]/table/tr/td[2]/table/tr/td/table/tr')
        #print trs
        select_and_write_data(
            tree,
            maturity_level,
            year,
            '//div[@class="maincontent"]/table/tr/td[2]/table/tr/td/table/tr',
            dateformat='mm-dd-yyyy',
            reverse_order=True
        )

In [50]:
for year in years_available_in_history:
    values = get_available_maturity_levels(year)
    # Loop now for each year
    for value in values:
        print(values)
        page = requests.get(base_url + '/' + url.format(year, value))
        print(page)
        print(base_url + '/' + url.format(year, value))

In [46]:
get_current_year_data()

In [53]:
get_available_maturity_levels(year)

[]