# Sesión 3, Parte 1

En esta sesión repasaremos un concepto que permite agregar código externo (y por ende, funcionalidades adicionales) a nuestro código. Para trabajar con datos, generalmente es necesario preparar nuestro computador instalando módulos (librerías) que no vienen por defecto en la instalación de Python. Hoy veremos cómo preparar el computador para eso.

<p>
<font size='1'>Material creado por &copy; 2024 José Tomás Marquinez, todos los derechos reservados; sacando algunos extractos del material elaborado por &copy; 2015 Karim Pichara - Christian Pieringer, todos los derechos reservados; y de las modificaciones realizadas por Equipos Docentes IIC2233 UC.</font>
<br>


# Tabla de contenidos

1. Módulos externos
    1. [Cómo encontrarlos](#como-encontrarlos)
    2. [Cómo instalarlos](#como-instalarlos)
    3. [Cómo usarlos](#como-usarlos)


# Módulos externos

<a id="como-encontrarlos"></a>

## Cómo encontrarlos

La primera pregunta que surge cuando estamos intentando trabajar con algo que no sabemos hacer, es cómo hacerlo. Y en ese sentido, siempre hay alguien que se hizo la misma pregunta.

Para ilustrarlo con un ejemplo, supongamos que queremos trabajar con la base de datos de películas más completa de internet: [Internet Movie Database (IMDb)](https://www.imdb.com/). ¿Cómo podemos trabajar con esa base de datos desde Python?

<style>
.custom-image {
  width: 600px;
  height: auto;

}
</style>

<center><img src="img/Google_search_IMDB.png" alt="image" class="custom-image"></center>


Es generalmente la primera respuesta la que mejor explica cómo. Generalmente también ayuda informarse desde StackOverFlow, una comunidad en que los mismos integrantes de la comunidad responden las distintas dudas que tienen los que están buscando responder algo. Sin embargo, en esta ocasión, sigamos lo que nos dijo [la primera respuesta](https://www.geeksforgeeks.org/python-imdbpy-searching-a-movie/):


<a id="como-instalarlos"></a>

## Cómo instalarlos

En ese mismo sitio nos comentan que basta con escribir un comando en el _command prompt_ de nuestro computador, también conocida como la _consola_ o la _terminal_. Para abrir la terminal en nuestro computador, se puede hcaer lo siguiente:

- Para Windows, se puede buscar por "Secuencia de comandos" o bien apretar Windows + X.
- Para MacOS, se puede buscar por "Terminal". Para ello, es posible apretar Command + Espacio, y buscar "Terminal".
- Para Linux, se puede apretar Ctrl + Alt + T, o averiguar cómo fue hecho eso en la distribución particular que estén usando.

En el sitio web, nos indican que la instalación de cualquier paquete externo se puede hacer utilizando _*PIP*_. PIP es un nombre recursivo, que significa "Paquetes de instalación PIP" (_PIP Installs Packages_), o bien "Programa de Instalación Preferida". PIP es un sistema de administración de paquetes escrito para Python que permite instalar y administrar estos módulos externos. Si bien es posible instalar los módulos de otra forma, Python mismo sugiere utilizar este sistema para instalar módulos al trabajar, ya que se conecta a un repositorio online de paquetes públicos.

Entonces, para instalar este módulo, el sitio web encontrado indica lo siguiente:

<center><img src="img/pip_install.png" alt="image" class="custom-image"></center>

En algunos ambientes de trabajo, se puede instalar directamente desde un Jupyter Notebook (desconozco si en todos los sistemas operativos). Esto se puede hacer programando esa línea con un caracter de escape `!`.



In [None]:
! pip install IMDbPY



Esto, lo que hizo por detrás, es instalar un archivo llamado `imdb.py` en nuestro computador (en un directorio en donde se encuentran todos los módulos instalados), al que podemos hacer referencia posterior para usarlo. Este archivo contiene una clase `IMDb` que contiene métodos que permiten interactuar con la base de datos de IMDb.

<a id="como-usarlos"></a>

## Cómo usarlos

Eso es todo. Todo lo que resta es **importar el módulo** instalado, leer la documentación y preguntarle muchas cosas a Google para responder cómo hacer lo que necesitamos hacer. La mayoría de los módulos que trabajan directamente con sistemas externos (`IMDbPY` con IMDb, `tweepy` con X, `instagram-explore` o `instabot` para Instagram, y muchos otros), suelen conectarse a algo que se conoce como una **API** (_Application Programming Interface_). En el mundo de las APIs, la palabra Aplicación refiere a cualquier programa que tiene una función particular, mientras que la palabra Interfaz se refiere a un contrato de un servicio entre dos aplicaciones. Este contrato define cómo se comunican estas dos aplicaciones entre sí utilizando solicitudes y respuestas (_requests_ y _responses_). Así, estos módulos lo que hacen es solicitarle información mediante una _request_ a un sitio (que tiene un _endpoint_ o URL específico para esto), y recibir la _response_ que contiene la información de respuesta.

En particular, IMDbPy permite, por ejemplo, buscar todos los títulos de películas bajo cierto nombre. Sigamos lo que indica el tutorial, importando `imdb` (lo que importaría, a su vez, la clase implementada en ese archivo):

In [None]:
# importing the module
import imdb
# creating an instance of the IMDB()
ia = imdb.IMDb()
# Using the Search movie method
items = ia.search_movie('Avengers')
for i in items:
    print(i)

Avengers: Endgame
The Avengers
Avengers: Infinity War
Avengers: Age of Ultron
The Avengers
Avengers: The Kang Dynasty
Avengers: Secret Wars
The Avengers
Avengers Assemble
Avengers: United They Stand
Avengers: Quantum Encounter
The New Avengers
The Avengers: Earth's Mightiest Heroes
Avengers of Justice: Farce Wars
Avengers Grimm
Ultimate Avengers: The Movie
Crippled Avengers
Marvel Future Avengers
Next Avengers: Heroes of Tomorrow
Lego Marvel Avengers: Code Red


También podemos, por ejemplo, extraer todas las películas en la que ha participado algún actor/actriz en particular. Sin embargo, esto es necesario hacerlo a través del ID de la persona (visible en la URL de su sitio en IMDb):

<style>
.custom-image-small {
  width: 300px;
  height: auto;

}
</style>

<center><img src="img/emma_stone.png" alt="image" class="custom-image-small"></center>

O bien preguntándole a la API:

In [None]:
search_movie = ia.search_person('Emma Stone')
search_movie[0]

<Person id:1297015[http] name:_Emma Stone_>

In [None]:
# person id
code = "1297015"
 
# printing person name
print(ia.get_person(code))


Emma Stone


In [None]:
# getting information
actor_results = ia.get_person_filmography(code)
actor_results

{'data': {'filmography': {'actress': [<Movie id:14786246[http] title:_Cruella 2 (None)_>,
    <Movie id:12300742[http] title:_Untitled Yorgos Lanthimos Remake Project (None)_>,
    <Movie id:31176520[http] title:_Eddington (None)_>,
    <Movie id:22408160[http] title:_Kinds of Kindness (2024)_>,
    <Movie id:13623608[http] title:_The Curse (2024) (2023)_>,
    <Movie id:14230458[http] title:_Poor Things (2023)_>,
    <Movie id:11729844[http] title:_Bleat (2022)_>,
    <Movie id:15977708[http] title:_Saturday Morning All Star Hits! (2021)_>,
    <Movie id:3228774[http] title:_Cruella (2021)_>,
    <Movie id:13972044[http] title:_Dear Diary: World's First Pranks (2021)_>,
    <Movie id:2850386[http] title:_The Croods: A New Age (2020)_>,
    <Movie id:11438728[http] title:_Louis Vuitton: Coeur Battant (2019)_>,
    <Movie id:1560220[http] title:_Zombieland: Double Tap (2019)_>,
    <Movie id:9471222[http] title:_Paul McCartney: Who Cares (2018)_>,
    <Movie id:10177486[http] title:_Let

Vemos que esto es un diccionario y es por eso que el tutorial nos sugiere hacer este camino (aunque tuve que hacerle una edición):

In [None]:
# printing movie name
for index in range(15):
    movie_name = actor_results['data']['filmography']['actress'][index]
    print(movie_name)

Cruella 2
Untitled Yorgos Lanthimos Remake Project
Eddington
Kinds of Kindness
The Curse
Poor Things
Bleat
Saturday Morning All Star Hits!
Cruella
Dear Diary: World's First Pranks
The Croods: A New Age
Louis Vuitton: Coeur Battant
Zombieland: Double Tap
Paul McCartney: Who Cares
Let's Dance


Cerremos, con otro ejemplo.

Veamos cuántas temporadas tiene una serie:

In [None]:
search_movie = ia.search_movie('Breaking Bad')
search_movie[0]

<Movie id:0903747[http] title:_"Breaking Bad" (2013) (2008)_>

In [None]:
# id 
code = "0903747"
  
# getting information 
series = ia.get_movie(code) 
  
# getting seasons of the series 
season = series.data['seasons'] 
  
# printing the object i.e name 
print(series) 
  
# print the seasons 
print(season) 

Breaking Bad
['1', '2', '3', '4', '5']
