# Ideas y pruebas de mini proyectos

In [17]:
import pandas as pd
import requests
import openpyxl

## Análisis del mercado inmobiliario de Madrid


#### 1. ¿Cuál es el objetivo del proyecto? 

    Realizar un análisis del mercado inmobiliario de Madrid, y generar predicciones de los precios. 

#### 2. ¿Cuáles serían tus fuentes de datos? 

    Archivo csv: Madrid_Housing.csv. 

#### 3. ¿Qué herramientas quieres probar o practicar?

    Uso de polars para el tratamiento y limpieza de datos. Uso de modelos de machine learning para las predicciones. 

#### 4. ¿Qué skills nuevas te gustaría incorporar en el proceso? 

    - Organización del proyecto, mediante un correcto establecimiento de las tareas a realizar en los tiempo sugeridos
    - Mejorar la comuncación de resultados de manera desarrollada, así como la visualización.
    -  Uso de mapas con herramientas de visualización. 

Enlace a idea del proyecto desarrollada en knime: https://bit2brain.com/analisis-datos-viviendas-madrid-knime/. Otra opción es realizarlo en knime también, y realizar una comparación, entre realizarlo en código (uso de python, etc, y directamente en knime, a golpe de click). 

In [2]:
data = pd.read_csv("Madrid_Housing.csv")
data

Unnamed: 0,Rooms,Type,SellerG,Date,Distance,Postcode,Bedroom,Bathroom,Car,Landsize,BuildingArea,YearBuilt,Regionname,Propertycount,Price
0,3,t,Inmobiliaria Grupo Fincasa,03-09-2016,13.5,28014,3.0,2.0,1.0,303.0,225,2016.0,Cuzco,3464,840000
1,2,h,Inmobiliaria MetroCuadrado,03-09-2016,3.3,28021,2.0,1.0,0.0,120.0,82,1900.0,Ciudad Universitaria,3280,1275000
2,2,h,Alfa Inmobiliaria,03-09-2016,3.3,28016,2.0,1.0,0.0,159.0,inf,,Chamberí,3280,1455000
3,4,h,Inmobiliaria Barreras,03-09-2016,6.4,28031,3.0,2.0,4.0,853.0,263,1930.0,Latina,2211,2000000
4,3,h,Inmobiliaria Fincas Asesoria,03-09-2016,6.4,28004,3.0,2.0,2.0,208.0,inf,2013.0,Vicálvaro,2211,1110000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
27109,3,h,Inmobiliaria NuevaVida,30-09-2017,22.7,28013,3.0,1.0,6.0,569.0,130,1959.0,Ciudad Universitaria,11806,627500
27110,3,u,Inmobiliaria Don Piso,30-09-2017,12.0,28004,3.0,1.0,1.0,,105,1990.0,Latina,21650,475000
27111,4,h,Inmobiliaria Zome,30-09-2017,20.6,28032,4.0,2.0,2.0,,225,1995.0,Salamanca,5833,591000
27112,3,h,Inmobiliaria MetroCuadrado,30-09-2017,22.2,28028,3.0,2.0,1.0,544.0,,,Paseo de la Castellana,4054,780500


In [3]:
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 27114 entries, 0 to 27113
Data columns (total 15 columns):
 #   Column         Non-Null Count  Dtype  
---  ------         --------------  -----  
 0   Rooms          27114 non-null  int64  
 1   Type           27114 non-null  object 
 2   SellerG        27114 non-null  object 
 3   Date           27114 non-null  object 
 4   Distance       27113 non-null  float64
 5   Postcode       27114 non-null  int64  
 6   Bedroom        20678 non-null  float64
 7   Bathroom       20672 non-null  float64
 8   Car            20297 non-null  float64
 9   Landsize       17873 non-null  float64
 10  BuildingArea   10543 non-null  object 
 11  YearBuilt      11985 non-null  float64
 12  Regionname     27114 non-null  object 
 13  Propertycount  27114 non-null  int64  
 14  Price          27114 non-null  int64  
dtypes: float64(6), int64(4), object(5)
memory usage: 3.1+ MB


## Análisis del PIB, IPC y tasas de desempleo

#### 1. ¿Cuál es el objetivo del proyecto? 

    Análisis de la evolución de los siguientes indicadores económicos: PIB, IPC, tasa de desempleo; y explicar su evolución (ley de Okun y curva de Phillips), así como realizar proyecciones a futuro. 

#### 2. ¿Cuáles serían tus fuentes de datos? 
    
    Api del IMF: 

#### 3. ¿Qué herramientas quieres probar o practicar?

    Uso de polars para el tratamiento de datos, herramientas de visualización como PowerBI, Tableau..., uso de R para análisis estadísticos. 

#### 4. ¿Qué skills nuevas te gustaría incorporar en el proceso? Enuméralas: pueden ser técnicas (manejar APIs, visualización, análisis estadístico, uso de mapas, machine learning…) o habilidades de gestión (planning, comunicación de resultados, trabajo en equipo…)

    Organización del proyecto, mediante un correcto establecimiento de las tareas a realizar en los tiempo sugeridos; mejorar la comuncación de resultados de manera desarrollada.

Links: https://datasupport.imf.org/knowledge?id=knowledge_category&sys_kb_id=b849dc6b47294ad8805d07c4f16d4311&category_id=9959b2bc1b6391903dba646fbd4bcb6a
https://data.imf.org/en/dashboards/weo%20dashboard 

In [None]:
# información sobre los códigos de los indicadores del IMF para usarlos en la API
pd.read_excel("IFS Indicator Mapping.xlsx")

Unnamed: 0,IFS Code,IFS Indicator,IMF Data Database,IMF Data Code
0,[CountryCode].PCPI_IX.[FrequencyCode],PCPI_IX,CPI,[CountryCode].CPI._T.IX.[FrequencyCode]
1,[CountryCode].PCPI_PC_PP_PT.[FrequencyCode],PCPI_PC_PP_PT,CPI,[CountryCode].CPI._T.POP_PCH_PA_PT.[FrequencyC...
2,[CountryCode].PCPI_PC_CP_A_PT.[FrequencyCode],PCPI_PC_CP_A_PT,CPI,[CountryCode].CPI._T.YOY_PCH_PA_PT.[FrequencyC...
3,[CountryCode].PCPIHA_IX.[FrequencyCode],PCPIHA_IX,CPI,[CountryCode].HICP._T.IX.[FrequencyCode]
4,[CountryCode].LWR_IX.[FrequencyCode],LWR_IX,LS,[CountryCode].WR.IX.[FrequencyCode]
...,...,...,...,...
199,[CountryCode].NFID_NSA_XDC.Q,NFID_NSA_XDC,QNEA,[CountryCode].N111N.V.NSA.XDC.Q
200,[CountryCode].NCGGC_R_NSA_XDC.Q,NCGGC_R_NSA_XDC,QNEA,[CountryCode].P32_S13.Q.NSA.XDC.Q
201,[CountryCode].NFIOS_NSA_XDC.Q,NFIOS_NSA_XDC,QNEA,[CountryCode].N1121N.V.NSA.XDC.Q
202,[CountryCode].NFIOS_R_NSA_XDC.Q,NFIOS_R_NSA_XDC,QNEA,[CountryCode].N1121N.Q.NSA.XDC.Q


In [26]:
# import libraries

import sdmx

 

# retrieve data

IMF_DATA = sdmx.Client('IMF_DATA')

data_msg = IMF_DATA.data('CPI', key='USA+CAN.CPI.CP01.IX.M', params={'startPeriod': 2000, 'endPeriod': 2025})

 

# convert to pandas

cpi_df = sdmx.to_pandas(data_msg)

pd.DataFrame(cpi_df)


xml.Reader got no structure=… argument for StructureSpecificData


Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,Unnamed: 4_level_0,Unnamed: 5_level_0,Unnamed: 6_level_0,Unnamed: 7_level_0,Unnamed: 8_level_0,Unnamed: 9_level_0,Unnamed: 10_level_0,value
COUNTRY,INDEX_TYPE,COICOP_1999,TYPE_OF_TRANSFORMATION,FREQUENCY,COMMON_REFERENCE_PERIOD,OVERLAP,SCALE,ACCESS_SHARING_LEVEL,SECURITY_CLASSIFICATION,TIME_PERIOD,Unnamed: 11_level_1
CAN,CPI,CP01,IX,M,2002A,OL,0,PUBLIC_OPEN,PUB,2000-M01,91.700000
CAN,CPI,CP01,IX,M,2002A,OL,0,PUBLIC_OPEN,PUB,2000-M02,91.400000
CAN,CPI,CP01,IX,M,2002A,OL,0,PUBLIC_OPEN,PUB,2000-M03,91.900000
CAN,CPI,CP01,IX,M,2002A,OL,0,PUBLIC_OPEN,PUB,2000-M04,92.100000
CAN,CPI,CP01,IX,M,2002A,OL,0,PUBLIC_OPEN,PUB,2000-M05,93.000000
...,...,...,...,...,...,...,...,...,...,...,...
USA,CPI,CP01,IX,M,2010A,OL,0,PUBLIC_OPEN,PUB,2025-M02,144.334363
USA,CPI,CP01,IX,M,2010A,OL,0,PUBLIC_OPEN,PUB,2025-M03,145.044320
USA,CPI,CP01,IX,M,2010A,OL,0,PUBLIC_OPEN,PUB,2025-M04,144.592175
USA,CPI,CP01,IX,M,2010A,OL,0,PUBLIC_OPEN,PUB,2025-M05,144.894074


## Recomendador de zapatillas

#### 1. ¿Cuál es el objetivo del proyecto? 

    Crear un recomendador de zapatillas de trail running. 

#### 2. ¿Cuáles serían tus fuentes de datos? 
    
    Web scraping de las webs de los vendedores principales de zapatillas de trail running. (https://www.asics.com/es/es-es/, https://www.lasportiva.com/es/zapatos-trail-running-prodigio-max-hombre-zfrs104 )

#### 3. ¿Qué herramientas quieres probar o practicar?

    Modelos de machine learning. 

#### 4. ¿Qué skills nuevas te gustaría incorporar en el proceso? Enuméralas: pueden ser técnicas (manejar APIs, visualización, análisis estadístico, uso de mapas, machine learning…) o habilidades de gestión (planning, comunicación de resultados, trabajo en equipo…)

    Organización del proyecto, mediante un correcto establecimiento de las tareas a realizar en los tiempo sugeridos; mejorar la comuncación de resultados de manera desarrollada

## Análisis de la Balanza de Pagos de España

#### 1. ¿Cuál es el objetivo del proyecto? 

    Análisis de la balanza de pagos de España (pendiente definir exactamente el qué). 

#### 2. ¿Cuáles serían tus fuentes de datos? 
    
    Api del BDE: https://www.bde.es/webbe/es/estadisticas/recursos/api-estadisticas-bde.html. Para acceder a los nombres/códigos de las series: https://app.bde.es/bie_www/bie_wwwias/xml/Arranque.html?Idioma=es&CUADRO=be,19,1# 

#### 3. ¿Qué herramientas quieres probar o practicar?

    Pendiente definir

#### 4. ¿Qué skills nuevas te gustaría incorporar en el proceso? Enuméralas: pueden ser técnicas (manejar APIs, visualización, análisis estadístico, uso de mapas, machine learning…) o habilidades de gestión (planning, comunicación de resultados, trabajo en equipo…)

    Organización del proyecto, mediante un correcto establecimiento de las tareas a realizar en los tiempo sugeridos; mejorar la comuncación de resultados de manera desarrollada

In [None]:
url = "https://app.bde.es/bierest/resources/srdatosapp/listaSeries?idioma=es&series=D_1NBAF472&rango=30M"

In [None]:
def data(idioma, listado_series, rango_temporal):

    url = f"https://app.bde.es/bierest/resources/srdatosapp/listaSeries?idioma={idioma}&series={listado_series}&rango={rango_temporal}"
    
    response = requests.get(url)

    if response.status_code == 200:
        print("Solicitud exitosa")
    else:
        print(f"Error: {response.status_code}")

    datos = response.json()
    return datos

In [None]:
datos = data("es", "D_UNFKA0CN", "MAX")
datos

Solicitud exitosa


[{'serie': 'D_UNFKA0CN',
  'descripcion': 'ECONOMÍA MUNDIAL - SERIE DESESTACIONALIZADA CHINA PRODUCTO INTERIOR BRUTO PRECIOS CORRIENTES',
  'descripcionCorta': 'Economía internacional. China. PIB. Precios corrientes. Datos CVEC',
  'codFrecuencia': 'Q',
  'decimales': 3,
  'simbolo': 'B  EUR',
  'informacion': [{'titulo': 'Nombre',
    'descripcion': 'Economía internacional. China. PIB. Precios corrientes. Datos CVEC'},
   {'titulo': 'Descripción',
    'descripcion': 'ECONOMÍA MUNDIAL - SERIE DESESTACIONALIZADA CHINA PRODUCTO INTERIOR BRUTO PRECIOS CORRIENTES'},
   {'titulo': 'Unidades', 'descripcion': 'Billones de euros'},
   {'titulo': 'Decimales', 'descripcion': '3'},
   {'titulo': 'Número de observaciones', 'descripcion': '127'},
   {'titulo': 'Primer valor', 'descripcion': '[1T 1992] 526,280B  EUR'},
   {'titulo': 'Último valor', 'descripcion': '[3T 2023] 31.999,230B  EUR'},
   {'titulo': 'Valor mínimo', 'descripcion': '[1T 1992] 526,280B  EUR'},
   {'titulo': 'Valor máximo', 'des

In [None]:
datos[0]

{'serie': 'D_UNFKA0CN',
 'descripcion': 'ECONOMÍA MUNDIAL - SERIE DESESTACIONALIZADA CHINA PRODUCTO INTERIOR BRUTO PRECIOS CORRIENTES',
 'descripcionCorta': 'Economía internacional. China. PIB. Precios corrientes. Datos CVEC',
 'codFrecuencia': 'Q',
 'decimales': 3,
 'simbolo': 'B  EUR',
 'informacion': [{'titulo': 'Nombre',
   'descripcion': 'Economía internacional. China. PIB. Precios corrientes. Datos CVEC'},
  {'titulo': 'Descripción',
   'descripcion': 'ECONOMÍA MUNDIAL - SERIE DESESTACIONALIZADA CHINA PRODUCTO INTERIOR BRUTO PRECIOS CORRIENTES'},
  {'titulo': 'Unidades', 'descripcion': 'Billones de euros'},
  {'titulo': 'Decimales', 'descripcion': '3'},
  {'titulo': 'Número de observaciones', 'descripcion': '127'},
  {'titulo': 'Primer valor', 'descripcion': '[1T 1992] 526,280B  EUR'},
  {'titulo': 'Último valor', 'descripcion': '[3T 2023] 31.999,230B  EUR'},
  {'titulo': 'Valor mínimo', 'descripcion': '[1T 1992] 526,280B  EUR'},
  {'titulo': 'Valor máximo', 'descripcion': '[4T 2

In [None]:
data("es", "D_1NBAF472", "30M")

Solicitud exitosa


[{'serie': 'D_1NBAF472',
  'descripcion': 'Euribor a un año',
  'descripcionCorta': 'Euribor a un año',
  'codFrecuencia': 'M',
  'decimales': 3,
  'simbolo': '%',
  'informacion': [{'titulo': 'Nombre', 'descripcion': 'Euribor a un año'},
   {'titulo': 'Descripción',
    'descripcion': 'Tipos de interés. De referencia del mercado hipotecario. Euribor a un año.'},
   {'titulo': 'Unidades', 'descripcion': 'Porcentaje'},
   {'titulo': 'Decimales', 'descripcion': '3'},
   {'titulo': 'Número de observaciones', 'descripcion': '318'},
   {'titulo': 'Primer valor', 'descripcion': '[Ene 1999] 3,062 %'},
   {'titulo': 'Último valor', 'descripcion': '[Jun 2025] 2,081 %'},
   {'titulo': 'Valor mínimo', 'descripcion': '[Ene 2021] -0,505 %'},
   {'titulo': 'Valor máximo', 'descripcion': '[Jul 2008] 5,393 %'},
   {'titulo': 'Fuente',
    'descripcion': 'EURIBOR European Banking Federation\nACI Asociación de Mercados Financieros\nBanco Central Europeo'},
   {'titulo': 'Notas',
    'descripcion': 'Tipo