# Entregable 1

## Consigna:

Script que extraiga datos de una API pública

### Objetivos generales

✓ Tener un código inicial que será usado
en el proyecto final como un script ETL
inicial.

### Objetivos específicos

✓ El script debería extraer datos en JSON
y poder leer el formato en un
diccionario de Python.

✓ La entrega involucra la creación de una
versión inicial de la tabla donde los
datos serán cargados posteriormente.

## 1) Bajar datos de una API en formato JSON

Para este ejemplo voy a utilizar la API de [Datos Argentina](https://www.datos.gob.ar/)

Y voy a extraer los datos de: Exportaciones de productos primarios. En millones de dólares FOB

Para probar la API ir a: [API de Series de Tiempo AR: Generador de URLs](https://datosgobar.github.io/series-tiempo-ar-call-generator/)

In [12]:
import pandas as pd
import numpy as np
import requests
import urllib.parse

In [1]:
def get_api_call(ids, **kwargs):
    API_BASE_URL = "https://apis.datos.gob.ar/series/api/"
    kwargs["ids"] = ",".join(ids)
    return "{}{}?{}".format(API_BASE_URL, "series", urllib.parse.urlencode(kwargs))

In [7]:
api_call = get_api_call(["74.3_IEPP_0_M_35"], start_date="2000-01-01", end_date="2023-10-01")
print(api_call)

https://apis.datos.gob.ar/series/api/series?start_date=2000-01-01&end_date=2023-10-01&ids=74.3_IEPP_0_M_35


In [8]:
result = requests.get(api_call).json()
print(result)

{'data': [['2000-01-01', 379.492374], ['2000-02-01', 371.756283], ['2000-03-01', 541.383917], ['2000-04-01', 654.577308], ['2000-05-01', 734.574431], ['2000-06-01', 577.899514], ['2000-07-01', 416.284218], ['2000-08-01', 394.59976], ['2000-09-01', 296.616722], ['2000-10-01', 282.487822], ['2000-11-01', 320.459718], ['2000-12-01', 376.05679], ['2001-01-01', 524.742868], ['2001-02-01', 443.651245], ['2001-03-01', 434.568055], ['2001-04-01', 655.217651], ['2001-05-01', 764.803589], ['2001-06-01', 649.025399], ['2001-07-01', 589.173275], ['2001-08-01', 612.551971], ['2001-09-01', 478.828023], ['2001-10-01', 278.306668], ['2001-11-01', 262.829509], ['2001-12-01', 358.849421], ['2002-01-01', 450.28883], ['2002-02-01', 368.162846], ['2002-03-01', 548.074781], ['2002-04-01', 570.455216], ['2002-05-01', 632.241809], ['2002-06-01', 531.822663], ['2002-07-01', 464.236945], ['2002-08-01', 427.001056], ['2002-09-01', 370.460765], ['2002-10-01', 279.240725], ['2002-11-01', 321.885771], ['2002-12-01'

## 2) Creación de dataframe a partir de la data extraída

In [15]:
# Tenemos una lista de diccionario
# Entonces, podemos crear un DataFrame

data = result["data"]
df_exportaciones = pd.DataFrame(data,columns=["date_from", "millones_dolares"])

In [16]:
df_exportaciones.head()

Unnamed: 0,date_from,millones_dolares
0,2000-01-01,379.492374
1,2000-02-01,371.756283
2,2000-03-01,541.383917
3,2000-04-01,654.577308
4,2000-05-01,734.574431


In [18]:
df_exportaciones.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100 entries, 0 to 99
Data columns (total 2 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   date_from         100 non-null    object 
 1   millones_dolares  100 non-null    float64
dtypes: float64(1), object(1)
memory usage: 1.7+ KB
