In [1]:
# Uso de funciones
# Partes de módulos completas
# Importa algunos cálculos estadísticos básicos desde la librería 'statistics'
from statistics import mean, median, mode, stdev
import matplotlib.pyplot as plt
import numpy as np
import csv

# Un ejemplo simple para calcular la media
test_scores = [40, 85, 92, 76, 94, 99, 78]

# Abre el archivo de lectura
file = open(r'./netflix_titles.csv')

# Lee el archivo en el objeto csvreader
csvreader = csv.reader(file)

# Extrae los datos a una lista
rows = []
for row in csvreader: rows.append(row)

# Generamos el objeto movies con todas las filas de la lista
movies = np.array(rows)

# Vamos a generar un array solamente de los años, para trabajar sobre él
release_year = movies[1:, 7]

# Transformación del array en números
release_year_int = [int(numeric_string) for numeric_string in release_year]

# Cálculo de la media y la desviación estándar del arreglo
mean_year = mean(release_year_int)
stdev_year = stdev(release_year_int)
min_year = min(release_year_int)
max_year = max(release_year_int)

# Ahora bien, estos datos nos sirven para entender los años en los que las películas se mostraron al público
# No sé si será tan relevante saber el año promedio, pero sí saber cómo hacerlo

# Ahora se trabajará con el campo duración
# Asignamos al array duration las duraciones de todas las películas
# Las duraciones pueden estar en 'min=minutos', o en 'season' o 'seasons' = temporadas
duration = movies[1:, 9]

# Generar un array de las duraciones en minutos
duration_min = (duration[np.char.endswith(duration, 'min')])

# Una vez que tenemos las películas terminadas en min, se convierte el registro, ej, '90 min' a un número = 90
# Eso se hace utilizando la función 'strip' de la librería numpy (np.char)

# Elimina la terminación ' min'
duration_min_end = np.char.strip(duration_min, ' min')

# Transforma el array a números
duration_min_int = [int(numeric_string) for numeric_string in duration_min_end]

# Así, se obtiene un nuevo reporte estadístico, mucho más interesante
# Enfocado en las duraciones de las películas

mean_movie = mean(duration_min_int)
stdev_movie = stdev(duration_min_int)
min_movie = min(duration_min_int)
max_movie = max(duration_min_int)

# Para ver el nombre solamente de la película se puede referir al campo de esta forma
# Los índices vienen del primer campo 's3778' / 's4254', que es un índice numérico
print(movies[3778][2])
print(movies[4254][2])

Silent
Black Mirror: Bandersnatch


# Importando funciones de internet
- En esta sección, se verá cómo importar funciones de internet
- Para este ejemplo se utilizó una función llamada 'IMDbPY': https://www.geeksforgeeks.org/python-imdbpy-searching-a-movie/
- IMDB es una base de datos digital enorme de información de películas
- La librería trae información de IMDB - una de las librerías públicas

## Instalación de la librería en nuestro entorno
- En muchas ocasiones tendremos que instalar nuevas librerías, y eso se lo hace utilizando el 'terminal' desde VSC

In [2]:
# Importando funciones de la web
# https://www.geeksforgeeks.org/python-imdbpy-searching-a-movie/
# Usando IMDbPY
!pip install imdbpy

Collecting imdbpy
  Obtaining dependency information for imdbpy from https://files.pythonhosted.org/packages/6f/3c/38555ae0ae26487eff082065a1f7b7a490f7f6e13ea249b8e82cfcc6eb31/IMDbPY-2022.7.9-py3-none-any.whl.metadata
  Downloading IMDbPY-2022.7.9-py3-none-any.whl.metadata (498 bytes)
Collecting cinemagoer (from imdbpy)
  Obtaining dependency information for cinemagoer from https://files.pythonhosted.org/packages/a7/cc/959c7d74b7d6124852fc4741c154c8f50848f47360955f780636102ec711/cinemagoer-2023.5.1-py3-none-any.whl.metadata
  Downloading cinemagoer-2023.5.1-py3-none-any.whl.metadata (2.9 kB)
Downloading IMDbPY-2022.7.9-py3-none-any.whl (1.2 kB)
Downloading cinemagoer-2023.5.1-py3-none-any.whl (297 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m297.2/297.2 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0mm
[?25hInstalling collected packages: cinemagoer, imdbpy
Successfully installed cinemagoer-2023.5.1 imdbpy-2022.7.9


In [3]:
# Importing the module
import imdb

# Creating instance of IMDB
ia = imdb.IMDb()

# Busca el nombre de la película correspondiente a la más corta (s3778) y más larga (s4254)
name = movies[3778][2]

# Busca la película
search = ia.search_movie(name)

# Printing the result
for i in search: print(i)

Silent Witness
Silent Hill
Silent Night
Silent Night
Silent Running
Silent Hill: Revelation
A Silent Voice: The Movie
Silent House
Silent Rage
Silent
The Silent Sea
Silent Hours
Return to Silent Hill (Jeremy Irvine, Hannah Emily Anderson)
Jay and Silent Bob Strike Back
Cottonmouth
Silent Hill: Ascension
Silent Movie
Silent Fall
Silent Night, Deadly Night
The Silent Service


In [4]:
# Busca el nombre de la película correspondiente a la más corta (s3778) y más larga (s4254)
name = movies[4254][2]

# Busca la película
search = ia.search_movie(name)

# Printing the result
for i in search: print(i)

Black Mirror: Bandersnatch
Black Mirror: Bandersnatch
Black Mirror: Bandersnatch
Black Mirror: Bandersnatch
Black Mirror: Bandersnatch
Black Mirror: Bandersnatch
Black Mirror - Bandersnatch
Black Mirror Bandersnatch
Black Mirror: Bandersnatch - Spoilercast
Quickie: Black Mirror: Bandersnatch (S10.E4)
43 - Black Mirror: Bandersnatch (2018)
Bird Box/Black Mirror: Bandersnatch
'Black Mirror: Bandersnatch' Spoiler Discussion
DR228: Black Mirror: Bandersnatch and The Masked Singer
AFL Season 2020 Round 6 - The Black Mirror Bandersnatch Special
Star Wars Park - X-Men & The MCU - Black Mirror: Bandersnatch
200: Charlie Brooker: Bandersnatch, Black Mirror, GamesWipe - The Retro Hour EP200
Choose Your Own Adventure: Customer Service Experience (Black Mirror Bandersnatch Parody)
Black Mirror: Bandersnatch Izleme Deneyiminde Bir Devrim mi? - Yeni Sezon Gelmis mi? 1
Collateral Gaming vs. Collateral Cinema Collaboration Special: David Slade's Black Mirror: Bandersnatch


In [5]:
!pip install Cinemagoer



In [6]:
!pip install imdb

[31mERROR: Could not find a version that satisfies the requirement imdb (from versions: none)[0m[31m
[0m[31mERROR: No matching distribution found for imdb[0m[31m
[0m

# Wrap up
- Se vieron las funcionalidades principales de importar librerías completas (paquetes) y sus funciones/submódulos individuales
- Se generó una importación simple de un archivo CSV
- Se generó una exploración inicial acerca del manejo estadístico con NumPy
- Se instaló una librería utilizando !pip install
- Se descargó una librería desde la web para ver información de películas (IMDB) y además se hicieron algunas consultas para entender su funcionamiento y la implementación de la misma en una aplicación propia.