# FASE 1 DATA MINING

## Índice

### 1.Introducción, hipótesis de trabajo y objetivos.

### 2.Fase 1: Minería de datos

    2.1. IPC español y turco (Selenium)
    2.2. Valores de la Lira y el euro en la década 2011-2021(API)
    2.3. Índice de democracia (selenium)
    
### 3.Fase 2: Limpieza y creación de la base de datos. (En el siguiente archivo)

# ---------------------------------------------------------------------------------------------------------------




    

## 1. Introducción, hipótesis de trabajo y objetivos.

España y Turquía representan dos extremos del Mediterráneo que han tenido desarrollos debido a sus contextos económicos y culturales.

No obstante, queremos comprobar si existe una relación entre manejo de las políticas económicas, la devaluación del valor
de la moneda y el índice de democracia de ambos países.

En este caso nuestra hipótesis parte de que, si hay una decrecimiento y recesión económicas, debe haber un cambio en los valores
del índice de democracia. Por tanto, nos permitirá analizar los datos dados y comprobar si estos están más influenciados por la política económica interior o, en cambio, existen eventos internacionales que que perjudican las democracias en mayor o menor medida.

Tenemos que recordar que compramos dos países que han tenido recorridos histórcios muy distintos. España es una democracia imperfecta dentro del contesto macroeconómico de la UE, mientras que Turquía está transitando desde un régimen republicano fuértemente impulsado por las ideas del Kemalismo, a un régimen presidencialista de tipo mixto, en el que la presidencia está asumiendo papeles y funciones de los otros poderes.

Del mismo modo, económicamente, España depende de las decisiones del BCE en lo relativo a sus políticas económicas de tipo macro. En el otro lado de la ecuación, Turquía posee control pleno sobre su divisa.

Culturalmente, nos encontramos con dos sociedades avanzadas que, al margen de sus diferencias, tienen unos niveles de consumo aceptables.

### Partiendo de la necesidad de comparar dos países muy dispares, hemos encontrado los siguientes elementos para comprobar esta hipótesis:

1.El Índice de precios al consumo, que siempre es un indicador valioso de las dificultades que atraviesa una sociedad para
proveerse de bienes y servicios.

2.Los ratios de cambio en el valor de la moneda: Una variabilidad alta o una estabilidad de la moneda (el euro frente a la
lira turca) nos dará una clave de cómo la política del Banco Central Europeo difiere de la del Banco de Turquía a la hora
de afrontar los cambios económicos.

3.El Índice democrático: En este caso, es esencial ver si la caída o mejora de la economía repercute de forma esencial
en las reformas políticas y libertades. O si, en cambio es al revés.

Para realizar esta comparativa, nos hemos propuesto realizar una serie histórica desde el año 2011 al 2021, para tener una
perspectiva diacrónica de los cambios a nivel macroeconómico y su correlación con las libertades y derechos de la sociedad
española y turca a lo largo de la mismo.


Es por ello que necesitamos obtener dichas medidas macroeconómicas mediante dos técnicas de vital importancia en el quehacer
del analísta de datos: el uso de APIs, y el data mining.


### Las fuentes que hemos usado son las siguientes:

1.IPC turco y español:
https://www.inflation.eu/es/tasas-de-inflacion/espana/inflacion-historica/ipc-inflacion-espana.aspx
https://www.inflation.eu/es/tasas-de-inflacion/turquia/inflacion-historica/ipc-inflacion-turquia.aspx

2.Ratio de cambios euro/lira 
API: https://exchangeratesapi.io/documentation/

3.Índice de democracia:
https://en.wikipedia.org/wiki/Democracy_Index

### Nuestro objetivo general:

Realizar una tabla comparativa con los valores de cada uno de los países para después combinar ambas, haciendo así un análisis individual y comparativo a la hora de ver las diferencias y las similitudes, así como los 
cambios y permanencias a nivel diacrónico.



## 2. Fase 1: Minería de datos

En esta fase nos vamos a centrar en conseguir los datos dados en cada una de las webs para dejarlos listos para su inserción posterior en el data frame de cada país. Como cada variable no se queda cargada, vamos a guardarlas todas en diversos archivos csv para su posterior uso en la fase del data frame.

### LIBRERÍAS Y FUNCIONES QUE VAMOS A REQUERIR

In [1]:
import json
import requests as rq
from requests.structures import CaseInsensitiveDict
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
import csv
from load import *




### 2.1. IPC español y turco (Selenium)

In [2]:
#TURQUÍA
URL_TURK= 'https://www.inflation.eu/es/tasas-de-inflacion/turquia/inflacion-historica/ipc-inflacion-turquia.aspx'
PATH=ChromeDriverManager().install() 
driver=webdriver.Chrome(PATH)
driver.get(URL_TURK)


  driver=webdriver.Chrome(PATH)


In [3]:
driver.find_elements(By.CLASS_NAME, 'tabledata1')[0].text

' IPC Turquía 2021 36,08 %   IPC Turquía 2011 10,45 % '

In [4]:
IPC_TRU1= driver.find_elements(By.CLASS_NAME, 'tabledata1')

In [5]:
IPC_TURK_lst1= [i.text for i in IPC_TRU1]
IPC_TURK_clean1=[i for i in IPC_TURK_lst1[0:5]]


In [6]:
IPC_TRU2= driver.find_elements(By.CLASS_NAME, 'tabledata2')

In [7]:
IPC_TURK_lst2=[i.text for i in IPC_TRU2 ]
IPC_TURK_clean2= [i for i in IPC_TURK_lst2[0:5]]

In [8]:
IPC_TURK_COMPLETE= [i.strip().split('   ') for l in zip(IPC_TURK_clean1, IPC_TURK_clean2)for i in l]
IPC_TURK_COMPLETE1=[d for l in IPC_TURK_COMPLETE for d in l ]
IPC_TURK_COMPLETE1.sort(reverse=True)
ipc_Turquia= IPC_TURK_COMPLETE1[0:11]

In [9]:
ipc_Turquia

['IPC Turquía 2021 36,08 %',
 'IPC Turquía 2020 14,60 %',
 'IPC Turquía 2019 11,84 %',
 'IPC Turquía 2018 20,30 %',
 'IPC Turquía 2017 11,92 %',
 'IPC Turquía 2016 8,53 %',
 'IPC Turquía 2015 8,81 %',
 'IPC Turquía 2014 8,17 %',
 'IPC Turquía 2013 7,40 %',
 'IPC Turquía 2012 6,16 %',
 'IPC Turquía 2011 10,45 %']

In [10]:
writelstcsv([str(i) for i in ipc_Turquia],'turk_ipc.csv')

In [11]:
driver.quit()

In [12]:
#ESPAÑA
URL_SP='https://www.inflation.eu/es/tasas-de-inflacion/espana/inflacion-historica/ipc-inflacion-espana.aspx'
driver=webdriver.Chrome(PATH)
driver.get(URL_SP)

  driver=webdriver.Chrome(PATH)


In [13]:
SP=driver.find_elements(By.CLASS_NAME,'tabledata1')
SP2=driver.find_elements(By.CLASS_NAME,'tabledata2')

In [14]:
SPls=[i.text for i in SP[0:5]]
SPls2=[i.text for i in SP2[0:5]]

In [15]:
SPcomb= [i.strip().split('   ') for a in zip(SPls, SPls2)for i in a]
SPsort= [i for a in SPcomb for i in a]
SPsort.sort(reverse=True)
ipc_españa=SPsort[0:11]
ipc_españa

['IPC España 2021 6,55 %',
 'IPC España 2020 -0,53 %',
 'IPC España 2019 0,79 %',
 'IPC España 2018 1,18 %',
 'IPC España 2017 1,11 %',
 'IPC España 2016 1,57 %',
 'IPC España 2015 0,02 %',
 'IPC España 2014 -1,04 %',
 'IPC España 2013 0,25 %',
 'IPC España 2012 2,87 %',
 'IPC España 2011 2,38 %']

In [16]:
writelstcsv([str(i) for i in ipc_españa],'sp_ipc.csv')

In [17]:
driver.quit()

### 2.1. Valores de la Lira y el euro en la década 2011-2021(API)

En este apartado recurrimos a una API de valores monetarios. Al no tener subscripción de pago a la misma, tuvimos que realizar la extración  del valor por año mediante sucesivas búsquedas. La primera corresponde a Turquía, mientras que la segunda es la española.

In [18]:
#ESPAÑA

URL_CURRENCY_11='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2011-01-01'

In [19]:
response=rq.get(URL_CURRENCY_11).json()

In [20]:
response

{'meta': {'last_updated_at': '2011-01-01T23:59:59Z'},
 'data': {'EUR': {'code': 'EUR', 'value': 0.485032}}}

In [21]:
TURK_vs_EUR_2011= response['data']['EUR']

In [22]:
URL_CURRENCY_12='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2012-01-01'

In [23]:
 response=rq.get(URL_CURRENCY_12).json()

In [24]:
response['data']['EUR']

{'code': 'EUR', 'value': 0.408758}

In [25]:
TURK_vs_EUR_2012= response['data']['EUR']

In [26]:
URL_CURRENCY_13='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2013-01-01'

In [27]:
 response=rq.get(URL_CURRENCY_13).json()

In [28]:
response['data']['EUR']

{'code': 'EUR', 'value': 0.424308}

In [29]:
TURK_vs_EUR_2013= response['data']['EUR']

In [30]:
URL_CURRENCY_14='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2014-01-01'
response=rq.get(URL_CURRENCY_14).json()
response['data']['EUR']

{'code': 'EUR', 'value': 0.338909}

In [31]:
TURK_vs_EUR_2014= response['data']['EUR']

In [32]:
URL_CURRENCY_15='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2015-01-01'
response=rq.get(URL_CURRENCY_15).json()
response['data']['EUR']

{'code': 'EUR', 'value': 0.354253}

In [33]:
TURK_vs_EUR_2015= response['data']['EUR']

In [34]:
URL_CURRENCY_16='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2016-01-01'
response=rq.get(URL_CURRENCY_16).json()
response['data']['EUR']

{'code': 'EUR', 'value': 0.315736}

In [35]:
TURK_vs_EUR_2016= response['data']['EUR']

In [36]:
URL_CURRENCY_17='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2017-01-01'
response=rq.get(URL_CURRENCY_17).json()
response['data']['EUR']

{'code': 'EUR', 'value': 0.268494}

In [37]:
TURK_vs_EUR_2017= response['data']['EUR']

In [38]:
URL_CURRENCY_18='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2018-01-01'
response=rq.get(URL_CURRENCY_18).json()
response['data']['EUR']

{'code': 'EUR', 'value': 0.219473}

In [39]:
TURK_vs_EUR_2018= response['data']['EUR']

In [40]:
URL_CURRENCY_19='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2019-01-01'
response=rq.get(URL_CURRENCY_19).json()
response['data']['EUR']

{'code': 'EUR', 'value': 0.164947}

In [41]:
TURK_vs_EUR_2019= response['data']['EUR']

In [42]:
URL_CURRENCY_20='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2020-01-01'
response=rq.get(URL_CURRENCY_20).json()
response['data']['EUR']

{'code': 'EUR', 'value': 0.149884}

In [43]:
TURK_vs_EUR_2020= response['data']['EUR']

In [44]:
URL_CURRENCY_21='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=EUR&base_currency=TRY&date=2021-01-01'
response=rq.get(URL_CURRENCY_21).json()
response['data']['EUR']

{'code': 'EUR', 'value': 0.110433}

In [45]:
TURK_vs_EUR_2021= response['data']['EUR']

In [46]:
TURK_vs_EUR_2021['value']

0.110433

In [47]:
eur_currency_2021_2011= [TURK_vs_EUR_2021['value'],TURK_vs_EUR_2020['value'],TURK_vs_EUR_2019['value'],TURK_vs_EUR_2018['value'],\
                             TURK_vs_EUR_2017['value'], TURK_vs_EUR_2016['value'], TURK_vs_EUR_2015['value'], TURK_vs_EUR_2014['value'],\
                             TURK_vs_EUR_2013['value'],TURK_vs_EUR_2012['value'],TURK_vs_EUR_2011['value']]

In [48]:
writelstcsv([str(i) for i in eur_currency_2021_2011],'eu_try_currency.csv')

In [49]:
#TURQUIA
URL_CURRENCY_11='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2011-01-01'
response=rq.get(URL_CURRENCY_11).json()
response['data']['TRY']

{'code': 'TRY', 'value': 2.061718}

In [50]:
EUR_vs_TURK_2011= response['data']['TRY']

In [51]:
URL_CURRENCY_12='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2012-01-01'
response=rq.get(URL_CURRENCY_12).json()
response['data']['TRY']

{'code': 'TRY', 'value': 2.446434}

In [52]:
EUR_vs_TURK_2012= response['data']['TRY']

In [53]:
URL_CURRENCY_13='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2013-01-01'
response=rq.get(URL_CURRENCY_13).json()
response['data']['TRY']

{'code': 'TRY', 'value': 2.356776}

In [54]:
EUR_vs_TURK_2013= response['data']['TRY']

In [55]:
URL_CURRENCY_14='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2014-01-01'
response=rq.get(URL_CURRENCY_14).json()
response['data']['TRY']

{'code': 'TRY', 'value': 2.950645}

In [56]:
EUR_vs_TURK_2014= response['data']['TRY']

In [57]:
URL_CURRENCY_15='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2015-01-01'
response=rq.get(URL_CURRENCY_15).json()
response['data']['TRY']

{'code': 'TRY', 'value': 2.822841}

In [58]:
EUR_vs_TURK_2015= response['data']['TRY']

In [59]:
URL_CURRENCY_16='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2016-01-01'
response=rq.get(URL_CURRENCY_16).json()
response['data']['TRY']

{'code': 'TRY', 'value': 3.167202}

In [60]:
EUR_vs_TURK_2016= response['data']['TRY']

In [61]:
URL_CURRENCY_17='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2017-01-01'
response=rq.get(URL_CURRENCY_17).json()
response['data']['TRY']

{'code': 'TRY', 'value': 3.724482}

In [62]:
EUR_vs_TURK_2017= response['data']['TRY']

In [63]:
URL_CURRENCY_18='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2018-01-01'
response=rq.get(URL_CURRENCY_18).json()
response['data']['TRY']

{'code': 'TRY', 'value': 4.556361}

In [64]:
EUR_vs_TURK_2018= response['data']['TRY']

In [65]:
URL_CURRENCY_19='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2019-01-01'
response=rq.get(URL_CURRENCY_19).json()
response['data']['TRY']

{'code': 'TRY', 'value': 6.062554}

In [66]:
EUR_vs_TURK_2019= response['data']['TRY']

In [67]:
URL_CURRENCY_20='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2020-01-01'
response=rq.get(URL_CURRENCY_20).json()
response['data']['TRY']

{'code': 'TRY', 'value': 6.671838}

In [68]:
EUR_vs_TURK_2020= response['data']['TRY']

In [69]:
URL_CURRENCY_21='https://api.currencyapi.com/v3/historical?apikey=DhPCbko5L9svm4OuWtlP73jgHOvW4JSbnK3ZuiLV&currencies=TRY&base_currency=EUR&date=2021-01-01'
response=rq.get(URL_CURRENCY_21).json()
response['data']['TRY']

{'code': 'TRY', 'value': 9.055228}

In [70]:
EUR_vs_TURK_2021= response['data']['TRY']

In [71]:
EUR_vs_TURK_2021['value']

9.055228

In [72]:
turk_eu_2021_2011=[EUR_vs_TURK_2021['value'],EUR_vs_TURK_2020['value'],EUR_vs_TURK_2019['value'],EUR_vs_TURK_2018['value'],\
                  EUR_vs_TURK_2017['value'],EUR_vs_TURK_2016['value'],EUR_vs_TURK_2015['value'],EUR_vs_TURK_2014['value'],\
                  EUR_vs_TURK_2013['value'],EUR_vs_TURK_2012['value'],EUR_vs_TURK_2011['value']]

In [73]:
turk_eu_2021_2011

[9.055228,
 6.671838,
 6.062554,
 4.556361,
 3.724482,
 3.167202,
 2.822841,
 2.950645,
 2.356776,
 2.446434,
 2.061718]

In [74]:
writelstcsv([str(i) for i in turk_eu_2021_2011],'try_eu_currency.csv')

### 2.3. Índice de democracia (selenium)

In [75]:
URL_DEMOCRACY= 'https://en.wikipedia.org/wiki/Democracy_Index'
PATH=ChromeDriverManager().install() 
driver=webdriver.Chrome(URL_DEMOCRACY)
driver.get(URL_DEMOCRACY)

  driver=webdriver.Chrome(URL_DEMOCRACY)


In [76]:
driver.find_elements(By.TAG_NAME, 'tr')[46].text #encontramos que luxemburgo es el 46 en la clase 'tr', ahora solo tenemos que
#contar
driver.find_elements(By.TAG_NAME, 'tr')[51].text 
driver.find_elements(By.TAG_NAME, 'tr')[54].text 
SP_INDEX= driver.find_elements(By.TAG_NAME, 'tr')[51].text.split()
SP_TURK= driver.find_elements(By.TAG_NAME, 'tr')[54].text.split()
#Con la base de wikipedia, contamos los valores desde el año 2021 al 2011 de forma descendente.
indi_demo_sp=SP_INDEX[4:15]
indi_demo_turk=SP_TURK[4:15]

In [77]:
driver.find_elements(By.TAG_NAME, 'tr')[51].text

'24  Spain Flawed democracy 7.94 8.12 8.29 8.08 8.08 8.30 8.30 8.05 8.02 8.02 8.02 8.16 8.45 8.34'

In [78]:
driver.find_elements(By.TAG_NAME, 'tr')[51].text.split()

['24',
 'Spain',
 'Flawed',
 'democracy',
 '7.94',
 '8.12',
 '8.29',
 '8.08',
 '8.08',
 '8.30',
 '8.30',
 '8.05',
 '8.02',
 '8.02',
 '8.02',
 '8.16',
 '8.45',
 '8.34']

In [79]:
SP_INDEX= driver.find_elements(By.TAG_NAME, 'tr')[51].text.split()

In [80]:
indi_demo_sp=SP_INDEX[4:15]

In [81]:
indi_demo_sp

['7.94',
 '8.12',
 '8.29',
 '8.08',
 '8.08',
 '8.30',
 '8.30',
 '8.05',
 '8.02',
 '8.02',
 '8.02']

In [82]:
indi_demo_turk

['4.35',
 '4.48',
 '4.09',
 '4.37',
 '4.88',
 '5.04',
 '5.12',
 '5.12',
 '5.63',
 '5.76',
 '5.73']

In [83]:
driver.quit()

In [84]:
writelstcsv([str(i) for i in indi_demo_sp],'spdemoindex.csv')

In [85]:
writelstcsv([str(i) for i in indi_demo_turk],'turkdemoindex.csv')