# **CREACIÓN DE UNA BASE DE DATOS CON UNA API**

## **¿Qué es una API?**

Las interfaces de programación de aplicaciones (API por sus siglas en inglés) ​son una pieza de código que permite a diferentes aplicaciones comunicarse entre sí y compartir información y funcionalidades. Una API es un intermediario entre dos sistemas, que permite que una aplicación se comunique con otra y pida datos o acciones específicas.

Una API representa la capacidad de comunicación entre componentes de software. Se trata del conjunto de llamadas a ciertas bibliotecas que ofrecen acceso a ciertos servicios desde los procesos y representa un método para conseguir abstracción en la programación, generalmente (aunque no necesariamente) entre los niveles o capas inferiores y los superiores del software. Uno de los principales propósitos de una API consiste en proporcionar un conjunto de funciones de uso general, por ejemplo, para dibujar ventanas o iconos en la pantalla. De esta forma, los programadores se benefician de las ventajas de las API haciendo uso de su funcionalidad, evitándose el trabajo de programar todo desde el principio. Las API asimismo son abstractas: el software que proporciona una cierta API generalmente es llamado la implementación de esa API.

## **Ejemplos**

[Reddit|PRAW](https://praw.readthedocs.io/en/stable/)
[Spotify|Spotipy](https://spotipy.readthedocs.io/en/2.22.1/#examples)
[Mastodon|Mastodon.py](https://mastodonpy.readthedocs.io/en/stable/)

## **Wikipedia API**

Wikipedia es una enciclopedia libre, políglota y editada de manera colaborativa. Es administrada por la Fundación Wikimedia.

[Wikipedia-API](https://github.com/martin-majlis/Wikipedia-API) es un contenedor de Python fácil de usar para la API de Wikipedia. Admite la extracción de textos, secciones, enlaces y categorías de Wikipedia.
El objetivo de Wikipedia-API es proporcionar una API simple y fácil de usar para recuperar información de Wikipedia.

## **Objetivo**

La sesión de hoy será comunicarse con Wikipedia y crear una base de datos en base de una consulta de **"Categoría"** utilizando Wikipedia-API.



# **IMPORTANDO TODAS LAS LIBRERÍAS**

Para esta sesión utilizaremos librerías que hemos usando en el pasado, como Pandas y Wikipedia-API. Adempas utilizaremos una nueva herramienta que es parte de los modulos incluídos de Python.

In [1]:
import wikipediaapi
import pandas as pd
pd.set_option("display.notebook_repr_html", False)
from itertools import islice

In [2]:
wiki_wiki = wikipediaapi.Wikipedia('Ciencias Sociales Computacionales (lup22776@uvg.edu.gt)', 'en')
page_py = wiki_wiki.page('Guatemala')

In [3]:
print("Page exists: %s" % page_py.exists())
print("Page - Title: %s" % page_py.title)
print("Page - Sections: %s" % page_py.sections)

Page exists: True
Page - Title: Guatemala
Page - Sections: [Section: Etymology (1):
The name "Guatemala" comes from the Nahuatl word Cuauhtēmallān, or "place of many trees", a derivative of the K'iche' Mayan word for "many trees" or, perhaps more specifically, for the Cuate/Cuatli tree Eysenhardtia. This name was originally used by the Mexica to refer to the Kaqchikel city of Iximche, but was extended to refer to the whole country during the Spanish colonial period.
Subsections (0):
, Section: History (1):

Subsections (4):
Section: Pre-Columbian (2):
The first evidence of human habitation in Guatemala dates to 12,000 BC. Archaeological evidence, such as obsidian arrowheads found in various parts of the country, suggests a human presence as early as 18,000 BC. There is archaeological proof that early Guatemalan settlers were hunter-gatherers. Maize cultivation had been developed by the people by 3500 BC. Sites dating to 6500 BC have been found in the Quiché region in the Highlands, and

In [4]:
cat_marxism = wiki_wiki.page("Category:Marxism")
print("Page exists: %s" % cat_marxism.exists())

Page exists: True


In [5]:
def print_categorymembers(categorymembers, level=0, max_level=1):
    for c in categorymembers.values():
        print("%s: %s (ns: %d)" % ("*" * (level + 1), c.title, c.ns))
        if c.ns == wikipediaapi.Namespace.CATEGORY and level < max_level:
            print_categorymembers(c.categorymembers, level=level + 1, max_level=max_level)

print("Category Members: Category:Marxism")
print_categorymembers(cat_marxism.categorymembers)

Category Members: Category:Marxism
*: Marxism (ns: 0)
*: Outline of Marxism (ns: 0)
*: 7th World Congress of the Comintern (ns: 0)
*: Accelerationism (ns: 0)
*: Analyse & kritik (ns: 0)
*: Anarchy of production (ns: 0)
*: Anti-capitalism (ns: 0)
*: Anti-revisionism (Marxism–Leninism) (ns: 0)
*: Anti-Stalinist left (ns: 0)
*: Austromarxism (ns: 0)
*: Autonomism (ns: 0)
*: Better dead than red (ns: 0)
*: Bloc of Soviet Oppositions (ns: 0)
*: Capital (Marxism) (ns: 0)
*: Centrist Marxism (ns: 0)
*: Chinese Left-wing Youth (ns: 0)
*: Christian theological praxis (ns: 0)
*: Class reductionism (ns: 0)
*: Class Struggle (board game) (ns: 0)
*: Communist Correspondence Committee (ns: 0)
*: Communist League (ns: 0)
*: Communization (ns: 0)
*: Counterhegemony (ns: 0)
*: Creative destruction (ns: 0)
*: Crisis of Marxism (ns: 0)
*: Critical management studies (ns: 0)
*: Criticism of Marxism (ns: 0)
*: Democracy in Marxism (ns: 0)
*: Détente (ns: 0)
*: Deutscher Memorial Prize (ns: 0)
*: Division o

In [6]:
pages_names = cat_marxism.categorymembers
print(pages_names)

{'Marxism': Marxism (id: ??, ns: 0), 'Outline of Marxism': Outline of Marxism (id: ??, ns: 0), '7th World Congress of the Comintern': 7th World Congress of the Comintern (id: ??, ns: 0), 'Accelerationism': Accelerationism (id: ??, ns: 0), 'Analyse & kritik': Analyse & kritik (id: ??, ns: 0), 'Anarchy of production': Anarchy of production (id: ??, ns: 0), 'Anti-capitalism': Anti-capitalism (id: ??, ns: 0), 'Anti-revisionism (Marxism–Leninism)': Anti-revisionism (Marxism–Leninism) (id: ??, ns: 0), 'Anti-Stalinist left': Anti-Stalinist left (id: ??, ns: 0), 'Austromarxism': Austromarxism (id: ??, ns: 0), 'Autonomism': Autonomism (id: ??, ns: 0), 'Better dead than red': Better dead than red (id: ??, ns: 0), 'Bloc of Soviet Oppositions': Bloc of Soviet Oppositions (id: ??, ns: 0), 'Capital (Marxism)': Capital (Marxism) (id: ??, ns: 0), 'Centrist Marxism': Centrist Marxism (id: ??, ns: 0), 'Chinese Left-wing Youth': Chinese Left-wing Youth (id: ??, ns: 0), 'Christian theological praxis': Chr

In [7]:
data = []
for key, value in islice (pages_names.items(), 1, None):
    page_py = wiki_wiki.page(key)
    data.append(
        {
            'Title': page_py.title,
            'Summary': page_py.summary,
            'Content': page_py.sections
        }
    )
df = pd.DataFrame(data)

In [8]:
display(df)

                                   Title  \
0                     Outline of Marxism   
1    7th World Congress of the Comintern   
2                        Accelerationism   
3                       Analyse & kritik   
4                  Anarchy of production   
..                                   ...   
127  Category:Marxist schools of thought   
128         Category:Marxist terminology   
129              Category:Marxist theory   
130               Category:Marxist works   
131         Category:Works about Marxism   

                                               Summary  \
0    The following outline is provided as an overvi...   
1    The Seventh World Congress of the Communist In...   
2    Accelerationism is a range of revolutionary an...   
3    analyse & kritik (ak) (full German title: "ana...   
4    In Marxist theory, anarchy of production is a ...   
..                                                 ...   
127                                                      
128    

In [9]:
df.to_csv('../data/database_wikipedia_marxism.csv')