<a href="https://colab.research.google.com/github/sergiomirazo/movify/blob/main/movies.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<h1> Construcción y despliegue en producción de un cuadro de mandos interactivo para visualizar datos cinematográficos </h1>

<p> Autor: Sergio Mirazo </p>

In [2]:
!pip install pandas
!pip install requests
!pip install streamlit
!pip install firebase-admin
!pip install google-cloud-firestore
!pip install google-auth


Collecting streamlit
  Downloading streamlit-1.37.0-py2.py3-none-any.whl.metadata (8.5 kB)
Collecting gitpython!=3.1.19,<4,>=3.0.7 (from streamlit)
  Downloading GitPython-3.1.43-py3-none-any.whl.metadata (13 kB)
Collecting pydeck<1,>=0.8.0b4 (from streamlit)
  Downloading pydeck-0.9.1-py2.py3-none-any.whl.metadata (4.1 kB)
Collecting watchdog<5,>=2.1.5 (from streamlit)
  Downloading watchdog-4.0.1-py3-none-manylinux2014_x86_64.whl.metadata (37 kB)
Collecting gitdb<5,>=4.0.1 (from gitpython!=3.1.19,<4,>=3.0.7->streamlit)
  Downloading gitdb-4.0.11-py3-none-any.whl.metadata (1.2 kB)
Collecting smmap<6,>=3.0.1 (from gitdb<5,>=4.0.1->gitpython!=3.1.19,<4,>=3.0.7->streamlit)
  Downloading smmap-5.0.1-py3-none-any.whl.metadata (4.3 kB)
Downloading streamlit-1.37.0-py2.py3-none-any.whl (8.7 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m8.7/8.7 MB[0m [31m29.2 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading GitPython-3.1.43-py3-none-any.whl (207 kB)
[2K   [90m━━━━━━━━━━

<h2> 1. Analizamos la estructura del dataset movies.csv </h2>
<p>Primero hacemos un EDA del dataset movies.csv antes de cargarlo a la base de datos en Firebase.</p>

In [3]:
import pandas as pd
import requests

# Subimos el dataset a Google colab
url = 'https://raw.githubusercontent.com/sergiomirazo/datasets/main/movies.csv'
response = requests.get(url)
open('movies.csv', 'wb').write(response.content)

# Cargar el CSV con Pandas como dataframe df
df = pd.read_csv("movies.csv", encoding="latin-1") # Tuve problemas con el encoding así que especificamos Latin-1 encoding

# Mostrar los primeros renglones del dataframe
df.head()

Unnamed: 0,budget,company,country,director,genre,gross,name,rating,released,runtime,score,star,votes,writer,year
0,8000000.0,Columbia Pictures Corporation,USA,Rob Reiner,Adventure,52287414.0,Stand by Me,R,1986-08-22,89,8.1,Wil Wheaton,299174,Stephen King,1986
1,6000000.0,Paramount Pictures,USA,John Hughes,Comedy,70136369.0,Ferris Bueller's Day Off,PG-13,1986-06-11,103,7.8,Matthew Broderick,264740,John Hughes,1986
2,15000000.0,Paramount Pictures,USA,Tony Scott,Action,179800601.0,Top Gun,PG,1986-05-16,110,6.9,Tom Cruise,236909,Jim Cash,1986
3,18500000.0,Twentieth Century Fox Film Corporation,USA,James Cameron,Action,85160248.0,Aliens,R,1986-07-18,137,8.4,Sigourney Weaver,540152,James Cameron,1986
4,9000000.0,Walt Disney Pictures,USA,Randal Kleiser,Adventure,18564613.0,Flight of the Navigator,PG,1986-08-01,90,6.9,Joey Cramer,36636,Mark H. Baker,1986


<h2> 2. Configuraciones para Firebase </h2>

In [None]:
# Montar en Google Drive
from google.colab import drive
drive.mount('/content/gdrive')

keys_path = '/content/gdrive/MyDrive/keys.json'

from google.cloud import firestore
import firebase_admin
from firebase_admin import credentials

#Verificar credenciales de Google
cred = credentials.Certificate(keys_path)
print("Credentials: " + str(cred))

# Empezar Firebase
if not firebase_admin._apps:
    firebase_admin.initialize_app(cred)  # Solo en caso de existir una app
else:
    print("Firebase app ya inicializada.")

# Especificar el ID del proyecto explícitamente
project_id = cred.project_id  # Obtener el ID del proyecto desde las credenciales
db = firestore.Client(project=project_id)

# Verificar la conexión a Firestore
try:
    # Intentar acceder a un documento de ejemplo para validar la conexión
    test_doc = db.collection('movies').document('test_doc').get()
    if test_doc.exists:
        print("Conexión a Firestore verificada con éxito.")
    else:
        print("Conexión a Firestore verificada con éxito, pero el documento de prueba no existe.")
except Exception as e:
    print("Error al conectar con Firestore:", e)

In [1]:

# Recorrer el DataFrame y subir cada fila como un documento en Firestore
for index, row in df.iterrows():
    document_id = f"movie_{index}"  # Crear un ID único para cada documento
    document_data = row.to_dict()  # Convertir la fila a un diccionario
    try:
        # Subir el documento a Firestore
        db.collection('movies').document(document_id).set(document_data)
        print(f"Documento {document_id} subido con éxito.")
    except Exception as e:
        print(f"Error al subir el documento {document_id}: {e}")

print("¡Todos los documentos han sido subidos a Firestore!")

[1;30;43mSe han truncado las últimas 5000 líneas del flujo de salida.[0m
Documento movie_1821 subido con éxito.
Documento movie_1822 subido con éxito.
Documento movie_1823 subido con éxito.
Documento movie_1824 subido con éxito.
Documento movie_1825 subido con éxito.
Documento movie_1826 subido con éxito.
Documento movie_1827 subido con éxito.
Documento movie_1828 subido con éxito.
Documento movie_1829 subido con éxito.
Documento movie_1830 subido con éxito.
Documento movie_1831 subido con éxito.
Documento movie_1832 subido con éxito.
Documento movie_1833 subido con éxito.
Documento movie_1834 subido con éxito.
Documento movie_1835 subido con éxito.
Documento movie_1836 subido con éxito.
Documento movie_1837 subido con éxito.
Documento movie_1838 subido con éxito.
Documento movie_1839 subido con éxito.
Documento movie_1840 subido con éxito.
Documento movie_1841 subido con éxito.
Documento movie_1842 subido con éxito.
Documento movie_1843 subido con éxito.
Documento movie_1844 subido 