In [50]:
# Importar librerías para tratamiento de datos
# -----------------------------------------------------------------------
import pandas as pd  

# Importar librerías para uso de API's
# -----------------------------------------------------------------------
import requests

# Importar librerías para procesamiento de texto
# -----------------------------------------------------------------------
import re

# Importar librerías para pausar la ejecución
# -----------------------------------------------------------------------
from time import sleep  # Sleep se utiliza para pausar la ejecución del programa por un número de segundos.

# Configuraciones
# -----------------------------------------------------------------------

pd.set_option('display.max_columns', None) # Muestra todas las columnas de los DataFrame
pd.set_option('display.width', None) # Ajusta el ancho de la consola para evitar truncamientos

1. Conectar con la API y explorar respuestas.

In [51]:
def llamar_api(url):

    # Llama a la API y devuelve la información. La uso para pruebas.

    # url = "https://yoga-api-nzy4.onrender.com/v1/categories"

    respuesta = requests.get(url)

    if respuesta.status_code != 200:
        print(f"Error al conectar con la API: {respuesta.reason} ")

    else: 
        print("Conexión exitosa")
        categorias = respuesta.json()
        return categorias

# Probamos la llamada

url = "https://yoga-api-nzy4.onrender.com/v1/categories"
respuesta = llamar_api(url)

Conexión exitosa


# Funciones para llamar a la API y extraer posturas por categoría o nivel e información de categorías

In [52]:
def extraer_categorias ():

    # Llama a la API y devuelve un df con información de las categorías. Guarda los datos en un csv .

    url = "https://yoga-api-nzy4.onrender.com/v1/categories"

    respuesta = requests.get(url)

    if respuesta.status_code != 200:
        print(f"Error al conectar con la API: {respuesta.reason} ")

    else: 

        print("Conexión exitosa")
        contenido = respuesta.json()
        lista_categorias = []

        for c in contenido:
            dic={}
            dic['id'] = c['id']
            dic['name'] = c['category_name']
            dic['descripcion'] = c['category_description']
            lista_categorias.append(dic) 

        df_categorias = pd.DataFrame(lista_categorias)

        # Guardo esta información en un csv

        df_categorias.to_csv('categorias.csv', index=False)
        print("Categorías extraídas. CSV creado")

        return df_categorias

In [53]:
def extraer_posturas_categorias():

    # Llama a la API y devuelve un df con las posturas organizadas por categorías. Guarda los datos en un csv.


    url = "https://yoga-api-nzy4.onrender.com/v1/categories"

    respuesta = requests.get(url)

    if respuesta.status_code != 200:
        print(f"Error al conectar con la API: {respuesta.reason} ")

    else: 

        print("Conexión exitosa")
        categorias = respuesta.json()
        lista_posturas_categorias = []

        for i in range(0, len(categorias)):

            categoria_id = categorias[i]['id']
              
            for pos in categorias[i]['poses']:

                dic = {}
                dic['id'] = pos['id']
                dic['nombre'] = pos['english_name'] 
                dic['nombre_sans'] = pos['sanskrit_name']
                dic['categoria'] = pos['category_name']
                dic['categoria_id'] = categoria_id
                dic['descripcion'] = pos['pose_description']
                dic['beneficios'] = pos['pose_benefits']
                dic['url_svg'] = pos['url_svg']
                dic['url_png'] = pos['url_png']
                dic['url_svg_alt'] = pos['url_svg_alt'] 

                lista_posturas_categorias.append(dic) 

        df_posturas_categorias = pd.DataFrame(lista_posturas_categorias)

        # Guardo esta información en un csv

        df_posturas_categorias.to_csv('posturas_categorias.csv', index=False)
        print("Posturas extraídas por categorías. CSV creado")

        return df_posturas_categorias


In [54]:
def extraer_posturas ():
    
    # Devuelve un dataframe con todas las posturas y crea un csv 

    url = "https://yoga-api-nzy4.onrender.com/v1/poses"

    respuesta = requests.get(url)

    if respuesta.status_code != 200:
        print(f"Error al conectar con la API: {respuesta.reason} ")

    else: 
        
        print("Conexión exitosa")
        contenido_pos = respuesta.json()

        # Creo un dataframe de posturas.

        lista_posturas = []

        for pos in contenido_pos:
            dic = {}
            dic['id'] = pos['id']
            dic['nombre'] = pos['english_name'] 
            dic['nombre_sans'] = pos['sanskrit_name']
            dic['descripcion'] = pos['pose_description']
            dic['beneficios'] = pos['pose_benefits']
            dic['url_svg'] = pos['url_svg']
            dic['url_png'] = pos['url_png']
            dic['url_svg_alt'] = pos['url_svg_alt'] 
            lista_posturas.append(dic) 

        df_posturas = pd.DataFrame(lista_posturas)

        # Guardo esta información en un csv

        df_posturas.to_csv('posturas.csv', index=False)
        print("Posturas extraídas. CSV creado")

        return df_posturas

In [55]:
def extraer_posturas_niveles ():
    
    # Devuelve las posturas organizadas por niveles (inicio, intermedio, avanzado)

    niveles = ['beginner', 'intermediate', 'expert']

    lista_posturas_niveles = []

    for nivel in niveles:

        url = f"https://yoga-api-nzy4.onrender.com/v1/poses?level={nivel}"

        dic_niveles = {
            'beginner': 0, 
            'intermediate': 1, 
            'expert': 2}

        respuesta = requests.get(url)

        if respuesta.status_code != 200:
            print(f"Error al conectar con la API: {respuesta.reason} ")

        else: 
            
            print("Conexión exitosa")
            contenido_niv = respuesta.json()
            posturas_niv = contenido_niv['poses']
            
            for pos in posturas_niv:
                dic = {}
                dic['id'] = pos['id']
                dic['nombre'] = pos['english_name'] 
                dic['nombre_sans'] = pos['sanskrit_name']
                dic['descripcion'] = pos['pose_description']
                dic['beneficios'] = pos['pose_benefits']
                dic['url_svg'] = pos['url_svg']
                dic['url_png'] = pos['url_png']
                dic['url_svg_alt'] = pos['url_svg_alt'] 
                dic['nivel'] = nivel
                dic['nivel_num'] = dic_niveles[nivel]
                lista_posturas_niveles.append(dic) 

    df_posturas_niv = pd.DataFrame(lista_posturas_niveles)

    # Guardo esta información en un csv

    df_posturas_niv.to_csv('posturas_niveles.csv', index=False)
    print("Posturas extraídas por niveles. CSV creado")

    return df_posturas_niv

Extraigo los datos.

In [56]:

df_cat = extraer_categorias()
df_pos = extraer_posturas()
df_niv = extraer_posturas_niveles()
df_pos_cat = extraer_posturas_categorias()

Conexión exitosa
Categorías extraídas. CSV creado
Conexión exitosa
Posturas extraídas. CSV creado
Conexión exitosa
Conexión exitosa
Conexión exitosa
Posturas extraídas por niveles. CSV creado
Conexión exitosa
Posturas extraídas por categorías. CSV creado


Ahora junto todos estos datos en un solo dataframe.


In [57]:
dic_niveles = {
    'id_nivel' : [0, 1, 2],
    'nivel': ['beginner', 'intermediate','expert']
}

df_niveles = pd.DataFrame(dic_niveles)
df_niveles.to_csv('niveles.csv')

In [58]:
df_niveles

Unnamed: 0,id_nivel,nivel
0,0,beginner
1,1,intermediate
2,2,expert


Ahora juntamos todos los datos en un único dataframe.

In [59]:
df_pp_cat = pd.read_csv('posturas_categorias.csv')

df_cat = pd.read_csv('categorias.csv')

df_pp_niv = pd.read_csv('posturas_niveles.csv')

Unimos primero por el identificador de las categorías.

In [60]:
df = pd.merge(left=df_pp_cat , right=df_cat, left_on= 'categoria_id', right_on='id', suffixes=('_postura', '_categoria'))

In [61]:
df.sample()

Unnamed: 0,id_postura,nombre,nombre_sans,categoria,categoria_id,descripcion_postura,beneficios,url_svg,url_png,url_svg_alt,id_categoria,name,descripcion_categoria
88,21,Half-Moon,Ardha Chandrāsana,Balancing Yoga,11,From a standing position one leg is straight w...,"Strengthens the abdomen, ankles, thighs, butto...",https://res.cloudinary.com/dko1be2jy/image/upl...,https://res.cloudinary.com/dko1be2jy/image/upl...,https://www.dropbox.com/s/gpumf9eehr8wo9g/half...,11,Balancing Yoga,Build a strong foundation for your asana pract...


Borro la columna repetida.

In [62]:
df.drop(labels='id_categoria', axis=1, inplace=True)

In [63]:
df.rename(columns={'categoria_id': 'id_categoria'}, inplace=True)


In [64]:
df.columns

Index(['id_postura', 'nombre', 'nombre_sans', 'categoria', 'id_categoria',
       'descripcion_postura', 'beneficios', 'url_svg', 'url_png',
       'url_svg_alt', 'name', 'descripcion_categoria'],
      dtype='object')

Ahora juntamos con niveles. Los uno por el identificador de la postura.

In [65]:
df_pp_niv.columns

Index(['id', 'nombre', 'nombre_sans', 'descripcion', 'beneficios', 'url_svg',
       'url_png', 'url_svg_alt', 'nivel', 'nivel_num'],
      dtype='object')

In [66]:
df_niveles = df_pp_niv[['id', 'nivel', 'nivel_num']]

In [67]:
df = pd.merge(left=df , right=df_niveles, left_on= 'id_postura', right_on='id', suffixes=('_postura', '_nivel'))

In [68]:
df.sample()

Unnamed: 0,id_postura,nombre,nombre_sans,categoria,id_categoria,descripcion_postura,beneficios,url_svg,url_png,url_svg_alt,name,descripcion_categoria,id,nivel,nivel_num
27,44,Warrior One,Vīrabhadrāsana I,Strengthening Yoga,3,"From a standing position, the legs are in a wi...","Stretches the chest, lungs, shoulders, neck, b...",https://res.cloudinary.com/dko1be2jy/image/upl...,https://res.cloudinary.com/dko1be2jy/image/upl...,https://www.dropbox.com/s/j9fip5gm1o1l3fx/warr...,Strengthening Yoga,Work and tone your entire body with strengthen...,44,beginner,0


In [69]:
df.rename(columns={'descripcion_postura': 'descripcion', 'name' : 'nombre_cat', 'descripcion_categoria': 'beneficios', 'nivel_num' : 'id_nivel', 'beneficios': 'beneficios_repetidos'}, inplace=True)


In [70]:
df.columns

Index(['id_postura', 'nombre', 'nombre_sans', 'categoria', 'id_categoria',
       'descripcion', 'beneficios_repetidos', 'url_svg', 'url_png',
       'url_svg_alt', 'nombre_cat', 'beneficios', 'id', 'nivel', 'id_nivel'],
      dtype='object')

In [71]:
df.drop(labels=['categoria', 'id', 'beneficios_repetidos'], axis=1, inplace=True)
df.columns

Index(['id_postura', 'nombre', 'nombre_sans', 'id_categoria', 'descripcion',
       'url_svg', 'url_png', 'url_svg_alt', 'nombre_cat', 'beneficios',
       'nivel', 'id_nivel'],
      dtype='object')

In [72]:
df.to_csv('info_posturas_completo.csv')

--------------------------------------------------- 


{"base":"https://yoga-api-nzy4.onrender.com/v1","categories":"https://yoga-api-nzy4.onrender.com/v1/categories","category-by-id":"https://yoga-api-nzy4.onrender.com/v1/categories?id=value","category-by-name":"https://yoga-api-nzy4.onrender.com/v1/categories?name=value","category-by-id-level":"https://yoga-api-nzy4.onrender.com/v1/categories?id=value&level=value","poses":"https://yoga-api-nzy4.onrender.com/v1/poses","pose-by-id":"https://yoga-api-nzy4.onrender.com/v1/poses?id=value","pose-by-name":"https://yoga-api-nzy4.onrender.com/v1/poses?name=value","poses-by-level":"https://yoga-api-nzy4.onrender.com/v1/poses?level=beginner"}

### DOCU

INFORMACIÓN DE YOGA-API


https://github.com/alexcumplido/yoga-api

The base url is:

https://yoga-api-nzy4.onrender.com/v1

Endpoints usage (get)
/categories -- all categories
/categories?id=value -- category by id
/categories?name=value -- category by name
/categories?id=value&level=value -- category poses filtered by level
/poses -- all poses
/poses?id=value -- pose by id
/poses?name=value -- pose name
/poses?level=value -- poses filtered by level
* level: beginner, intermediate, expert

* name : english and not sanskrit or adpated

* nothing is case-sensitive

Request base URL:

https://yoga-api-nzy4.onrender.com/v1


Response:

{
  "base": "https://yoga-api-nzy4.onrender.com/v1",
  "categories": "/categories",
  "category-by-id": "/categories?id=value",
  "category-by-name": "/categories?name=value",
  "category-byID-and-level": "/categories?id=value&level=value",
  "poses": "/poses",
  "pose-by-id": "/poses?id=value",
  "pose-by-name": "/poses?name=value",
  "poses-by-level": "/poses?level=value"
}
The base URL is the root of the URL. If you ever make a request and you get back a 404 NOT FOUND response, then check the base URL first.

Categories
Endpoints
/categories
/categories?id=value
/categories?name=value
/categories?id=value&level=value
Example request categories:

https://yoga-api-nzy4.onrender.com/v1/categories


Example request category by id or name:

https://yoga-api-nzy4.onrender.com/v1/categories?id=4
https://yoga-api-nzy4.onrender.com/v1/categories?name=Chest Opening Yoga



Poses
Endpoints
/poses
/poses?id=value
/poses?name=value
/poses?level=value
Example request poses:

https://yoga-api-nzy4.onrender.com/v1/poses

