# **CREACIÓN DE UNA BASE DE DATOS CON UNA API**

## **¿Qué es una API?**

Las interfaces de programación de aplicaciones (API por sus siglas en inglés) ​son una pieza de código que permite a diferentes aplicaciones comunicarse entre sí y compartir información y funcionalidades. Una API es un intermediario entre dos sistemas, que permite que una aplicación se comunique con otra y pida datos o acciones específicas.

Una API representa la capacidad de comunicación entre componentes de software. Se trata del conjunto de llamadas a ciertas bibliotecas que ofrecen acceso a ciertos servicios desde los procesos y representa un método para conseguir abstracción en la programación, generalmente (aunque no necesariamente) entre los niveles o capas inferiores y los superiores del software. Uno de los principales propósitos de una API consiste en proporcionar un conjunto de funciones de uso general, por ejemplo, para dibujar ventanas o iconos en la pantalla. De esta forma, los programadores se benefician de las ventajas de las API haciendo uso de su funcionalidad, evitándose el trabajo de programar todo desde el principio. Las API asimismo son abstractas: el software que proporciona una cierta API generalmente es llamado la implementación de esa API.

## **Ejemplos**

[Reddit|PRAW](https://praw.readthedocs.io/en/stable/)
[Spotify|Spotipy](https://spotipy.readthedocs.io/en/2.22.1/#examples)
[Mastodon|Mastodon.py](https://mastodonpy.readthedocs.io/en/stable/)

## **Wikipedia API**

Wikipedia es una enciclopedia libre, políglota y editada de manera colaborativa. Es administrada por la Fundación Wikimedia.

[Wikipedia-API](https://github.com/martin-majlis/Wikipedia-API) es un contenedor de Python fácil de usar para la API de Wikipedia. Admite la extracción de textos, secciones, enlaces y categorías de Wikipedia.
El objetivo de Wikipedia-API es proporcionar una API simple y fácil de usar para recuperar información de Wikipedia.

## **Objetivo**

La sesión de hoy será comunicarse con Wikipedia y crear una base de datos en base de una consulta de **"Categoría"** utilizando Wikipedia-API.



# **IMPORTANDO TODAS LAS LIBRERÍAS**

Para esta sesión utilizaremos librerías que hemos usando en el pasado, como Pandas y Wikipedia-API. Adempas utilizaremos una nueva herramienta que es parte de los modulos incluídos de Python.

In [1]:
import wikipediaapi
import pandas as pd
pd.set_option("display.notebook_repr_html", False)
from itertools import islice

In [2]:
wiki_wiki = wikipediaapi.Wikipedia('Ciencias Sociales Computacionales (ramonzamora89@gmail.com)', 'en')
page_py = wiki_wiki.page('Guatemala')

In [7]:
print("Página existe: %s" % page_py.exists())
print("Página - Título: %s" % page_py.title)
print("Página - Secciones: %s" % page_py.sections)

Página existe: True
Página - Título: Guatemala
Página - Secciones: [Section: Etymology (1):
The name "Guatemala" comes from the Nahuatl word Cuauhtēmallān, or "place of many trees", a derivative of the K'iche' Mayan word for "many trees" or, perhaps more specifically, for the Cuate/Cuatli tree Eysenhardtia. This name was originally used by the Mexica to refer to the Kaqchikel city of Iximche, but was extended to refer to the whole country during the Spanish colonial period.
Subsections (0):
, Section: History (1):

Subsections (4):
Section: Pre-Columbian (2):
The first evidence of human habitation in Guatemala dates to 12,000 BC. Archaeological evidence, such as obsidian arrowheads found in various parts of the country, suggests a human presence as early as 18,000 BC. There is archaeological proof that early Guatemalan settlers were hunter-gatherers. Maize cultivation had been developed by the people by 3500 BC. Sites dating to 6500 BC have been found in the Quiché region in the Highla

In [9]:
cat_narrativas = wiki_wiki.page("Category:Narratology")
print("Page exist: %s" % cat_narrativas.exists())

Page exist: True


In [10]:
def print_categorymembers(categorymembers, level=0, max_level=1):
    for c in categorymembers.values():
        print("%s: %s (ns: %d)" % ("*" * (level +1), c.title, c.ns))
        if c.ns == wikipediaapi.Namespace.CATEGORY and level < max_level:
            print_categorymembers(c.categorymembers, level=level + 1, max_level=max_level)

print("Miembros de la categoría: Category:Narratology")
print_categorymembers(cat_narrativas.categorymembers)

Miembros de la categoría: Category:Narratology
*: Narratology (ns: 0)
*: Narrative (ns: 0)
*: Action fiction (ns: 0)
*: The American Monomyth (ns: 0)
*: Anagnorisis (ns: 0)
*: Archetype (ns: 0)
*: Aristeia (ns: 0)
*: Article (publishing) (ns: 0)
*: Artistic license (ns: 0)
*: Authorial intent (ns: 0)
*: Authoritarian literature (ns: 0)
*: Balanced sentence (ns: 0)
*: Beat (filmmaking) (ns: 0)
*: Big Dumb Object (ns: 0)
*: Body swap (ns: 0)
*: Catharsis (ns: 0)
*: Central conceit (ns: 0)
*: Character (arts) (ns: 0)
*: Character arc (ns: 0)
*: Characterization (ns: 0)
*: Childhood secret club (ns: 0)
*: Climax (narrative) (ns: 0)
*: Clip show (ns: 0)
*: Comic book death (ns: 0)
*: Conflict (narrative) (ns: 0)
*: Continuity (fiction) (ns: 0)
*: Contrast (literary) (ns: 0)
*: Deathtrap (plot device) (ns: 0)
*: Deictic field and narration (ns: 0)
*: Description (ns: 0)
*: Deus ex machina (ns: 0)
*: Dialogue in writing (ns: 0)
*: Diegesis (ns: 0)
*: Dionysian imitatio (ns: 0)
*: Documentary 

In [11]:
pages_names = cat_narrativas.categorymembers
print(pages_names)

{'Narratology': Narratology (id: ??, ns: 0), 'Narrative': Narrative (id: ??, ns: 0), 'Action fiction': Action fiction (id: ??, ns: 0), 'The American Monomyth': The American Monomyth (id: ??, ns: 0), 'Anagnorisis': Anagnorisis (id: ??, ns: 0), 'Archetype': Archetype (id: ??, ns: 0), 'Aristeia': Aristeia (id: ??, ns: 0), 'Article (publishing)': Article (publishing) (id: ??, ns: 0), 'Artistic license': Artistic license (id: ??, ns: 0), 'Authorial intent': Authorial intent (id: ??, ns: 0), 'Authoritarian literature': Authoritarian literature (id: ??, ns: 0), 'Balanced sentence': Balanced sentence (id: ??, ns: 0), 'Beat (filmmaking)': Beat (filmmaking) (id: ??, ns: 0), 'Big Dumb Object': Big Dumb Object (id: ??, ns: 0), 'Body swap': Body swap (id: ??, ns: 0), 'Catharsis': Catharsis (id: ??, ns: 0), 'Central conceit': Central conceit (id: ??, ns: 0), 'Character (arts)': Character (arts) (id: ??, ns: 0), 'Character arc': Character arc (id: ??, ns: 0), 'Characterization': Characterization (id:

In [12]:
data = []
for key, value in islice (pages_names.items(), 1, None):
    page_py = wiki_wiki.page(key)
    data.append(
        {
            'Title': page_py.title,
            'Summary': page_py.summary,
            'Content': page_py.sections
        }
    )
df = pd.DataFrame(data)

In [13]:
display(df)

                                                 Title  \
0                                            Narrative   
1                                       Action fiction   
2                                The American Monomyth   
3                                          Anagnorisis   
4                                            Archetype   
..                                                 ...   
205            Category:Third-person narrative fiction   
206  Category:Traditional narratives of indigenous ...   
207                       Category:Traditional stories   
208                                    Category:Tropes   
209                             Category:Worldbuilding   

                                               Summary  \
0    A narrative, story, or tale is any account of ...   
1    Action fiction is a literary genre that focuse...   
2    The American Monomyth is a 1977 book by Robert...   
3    Anagnorisis (; Ancient Greek: ἀναγνώρισις) is ...   
4    The conc

In [14]:
df.to_csv('../data/base_datos_wikipedia_narrativa.csv')