In [2]:
import requests
from bs4 import BeautifulSoup
import pandas as pd


In [3]:
# Eventos deportivos

url = "https://www.topendsports.com/events/calendar-2025.php"
resp = requests.get(url)  # Realizar una solicitud HTTP para obtener contenido HTML de la pagina
resp.raise_for_status()  # Verifica si la solicitud fue exitosa.
soup = BeautifulSoup(resp.content, "html.parser") # Analiza el contenido HTML utilizando BeautifulSoup 
# lo convierte en un objeto navegable.



In [30]:
table = soup.find("table")  # Localiza la primera tabla HTML en la página
rows = table.find_all("tr")[1:]  # : Extrae todas las filas (<tr>) menos la primera

datos = []
for tr in rows:   # Recorre cada fila, extrae el texto dentro de cada columna (<td>)
    cols = [td.get_text(strip=True) for td in tr.find_all("td")]
    if len(cols) >= 4:  # Asegura que hay al menos 4 columnas. Si hay menos, se descarta la fila.
        date_str, deporte, evento, lugar = cols[:4] # Construye un diccionario por fila y lo agrega a la lista "datos"
        datos.append({
            "Fecha": date_str,
            "Deporte": deporte,
            "Evento": evento,
            "Ubicación": lugar
        })


In [31]:
df = pd.DataFrame(datos)  # Convierte la lista de diccionarios en un DataFrame de pandas
df.to_csv("eventos_2025.csv", index=False, encoding="utf‑8‑sig") # Exportar el DF a un archivo csv
print("Guardado en eventos_2025.csv")


Guardado en eventos_2025.csv


In [32]:
# Eventos deportivos

import requests
from bs4 import BeautifulSoup
import json

url = "https://thesportstoday.com/2025-sporting-events-calendar/"

# Obtener contenido de la página
resp = requests.get(url)
resp.raise_for_status()

# Crear objeto BeautifulSoup para analizar el HTML
soup = BeautifulSoup(resp.content, "html.parser")

# Encontrar la tabla que contiene los eventos
table = soup.find("table")
if not table:
    raise RuntimeError("No se encontró la tabla de eventos")

# Obtener todas las filas de la tabla, excluyendo encabezado
rows = table.find_all("tr")[1:]  # omitimos encabezado

# Lista para almacenar los datos extraídos
eventos = []
for tr in rows:
    cols = [td.get_text(strip=True) for td in tr.find_all("td")]
    if len(cols) >= 4:
        fecha, deporte, evento, ubicacion = cols[:4]
        eventos.append({
            "fecha": fecha,
            "deporte": deporte,
            "evento": evento,
            "ubicacion": ubicacion
        })

# Guardar como JSON
with open("eventos_2025_sportstoday.json", "w", encoding="utf-8") as f:
    json.dump(eventos, f, ensure_ascii=False, indent=2)

print(f"{len(eventos)} eventos guardados en eventos_2025_sportstoday.json")


62 eventos guardados en eventos_2025_sportstoday.json


In [35]:
# Eventos deportivos


import requests
from bs4 import BeautifulSoup
import pandas as pd

url = "https://sportlaunches.com/2025-sport-events/"
resp = requests.get(url)
resp.raise_for_status()
soup = BeautifulSoup(resp.content, "html.parser")

# Buscar la sección "Mai" que contiene los eventos de mayo
section = soup.find("h2", string=lambda t: t and "Mai" in t)

# Tomamos la tabla siguiente a ese encabezado:
table = section.find_next("table") if section else soup.find("table")

# Lista para almacenar eventos filtrados por mes
eventos = []
if table:
    for tr in table.find_all("tr"):
        cols = [td.get_text(strip=True) for td in tr.find_all("td")]
        if len(cols) >= 4:
            fecha, nombre, deporte, ubicacion = cols[0], cols[1], cols[2], cols[3]
            # Filtrar solo eventos que pertenezcan a mayo (May en inglés o Mai en alemán)
            if "May" in fecha or "Mai" in fecha:
                eventos.append({
                    "Fecha": fecha,
                    "Deporte": deporte,
                    "Evento": nombre,
                    "Ubicación": ubicacion
                })
                
# Exportar los datos a un CSV
df = pd.DataFrame(eventos)
df.to_csv("eventos_mayo_2025.csv", index=False, encoding="utf-8-sig")
print(f"{len(df)} eventos guardados en eventos_mayo_2025.csv")


18 eventos guardados en eventos_mayo_2025.csv


In [36]:
# Conectar con MongoDB

from pymongo import MongoClient

# URI local o de Atlas (ajústalo según tu caso)
client = MongoClient("mongodb://localhost:27017/")  

# Conectar a la db de MongoCompass
db = client["eventos_deportivos_2025"]




In [41]:
import json

# The Sports Today
with open("eventos_2025_sportstoday.json", "r", encoding="utf-8") as f:
    data_sportstoday = json.load(f)
    
# Exportar los datos a una coleccion en mongoCompass llamada "sports"
db["sports"].insert_many(data_sportstoday)


InsertManyResult([ObjectId('688e8dbbb4debce916a7b868'), ObjectId('688e8dbbb4debce916a7b869'), ObjectId('688e8dbbb4debce916a7b86a'), ObjectId('688e8dbbb4debce916a7b86b'), ObjectId('688e8dbbb4debce916a7b86c'), ObjectId('688e8dbbb4debce916a7b86d'), ObjectId('688e8dbbb4debce916a7b86e'), ObjectId('688e8dbbb4debce916a7b86f'), ObjectId('688e8dbbb4debce916a7b870'), ObjectId('688e8dbbb4debce916a7b871'), ObjectId('688e8dbbb4debce916a7b872'), ObjectId('688e8dbbb4debce916a7b873'), ObjectId('688e8dbbb4debce916a7b874'), ObjectId('688e8dbbb4debce916a7b875'), ObjectId('688e8dbbb4debce916a7b876'), ObjectId('688e8dbbb4debce916a7b877'), ObjectId('688e8dbbb4debce916a7b878'), ObjectId('688e8dbbb4debce916a7b879'), ObjectId('688e8dbbb4debce916a7b87a'), ObjectId('688e8dbbb4debce916a7b87b'), ObjectId('688e8dbbb4debce916a7b87c'), ObjectId('688e8dbbb4debce916a7b87d'), ObjectId('688e8dbbb4debce916a7b87e'), ObjectId('688e8dbbb4debce916a7b87f'), ObjectId('688e8dbbb4debce916a7b880'), ObjectId('688e8dbbb4debce916a7b8

In [42]:
import pandas as pd

# Convertir archivos csv en df y exportarlos
df1 = pd.read_csv("eventos_2025.csv")
df2 = pd.read_csv("eventos_mayo_2025.csv")

# Convertir DataFrame a diccionarios y subir a la coleccion "sports"
db["sports"].insert_many(df1.to_dict(orient="records"))
db["sports"].insert_many(df2.to_dict(orient="records"))


InsertManyResult([ObjectId('688e8dbeb4debce916a7b9a0'), ObjectId('688e8dbeb4debce916a7b9a1'), ObjectId('688e8dbeb4debce916a7b9a2'), ObjectId('688e8dbeb4debce916a7b9a3'), ObjectId('688e8dbeb4debce916a7b9a4'), ObjectId('688e8dbeb4debce916a7b9a5'), ObjectId('688e8dbeb4debce916a7b9a6'), ObjectId('688e8dbeb4debce916a7b9a7'), ObjectId('688e8dbeb4debce916a7b9a8'), ObjectId('688e8dbeb4debce916a7b9a9'), ObjectId('688e8dbeb4debce916a7b9aa'), ObjectId('688e8dbeb4debce916a7b9ab'), ObjectId('688e8dbeb4debce916a7b9ac'), ObjectId('688e8dbeb4debce916a7b9ad'), ObjectId('688e8dbeb4debce916a7b9ae'), ObjectId('688e8dbeb4debce916a7b9af'), ObjectId('688e8dbeb4debce916a7b9b0'), ObjectId('688e8dbeb4debce916a7b9b1')], acknowledged=True)

In [43]:
from pymongo import MongoClient
import pandas as pd

# Conexión a MongoDB
client = MongoClient("mongodb://localhost:27017/")
db = client["eventos_deportivos_2025"]
collection = db["eventos_2025"]

# Obtener todos los documentos
datos = list(collection.find({}, {"_id": 0}))  # Excluir el campo _id

# Crear DataFrame
df = pd.DataFrame(datos)

# Vista previa
print(df.head())
print(df.columns)


Empty DataFrame
Columns: []
Index: []
RangeIndex(start=0, stop=0, step=1)


In [44]:
# Concierto y Eventos

In [47]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import json

# Lista que contiene artistas y las URLs correspondientes 
tours = [
    {"artist": "Beyoncé", "url": "https://en.wikipedia.org/wiki/Cowboy_Carter_Tour"},
    {"artist": "Katy Perry", "url": "https://en.wikipedia.org/wiki/The_Lifetimes_Tour"},
    {"artist": "Lainey Wilson", "url": "https://en.wikipedia.org/wiki/Whirlwind_World_Tour"},
    {"artist": "Iron Maiden", "url": "https://en.wikipedia.org/wiki/Run_for_Your_Lives_World_Tour"},
    {"artist": "Oasis", "url": "https://en.wikipedia.org/wiki/Oasis_Live_%2725_Tour"},
    {"artist": "Blackpink", "url": "https://en.wikipedia.org/wiki/Blackpink_2025_World_Tour"},
    {"artist": "Lady Gaga", "url": "https://en.wikipedia.org/wiki/The_Mayhem_Ball"}
]

# Itera sobre cada elemento de la lista y lo analiza como HTML
data = []
for tour in tours:
    resp = requests.get(tour["url"])
    soup = BeautifulSoup(resp.content, "html.parser")
    # Extraemos fechas de inicio-fin y número de shows
    infobox = soup.find("table", class_="infobox")
    if infobox:
        rows = infobox.find_all("tr")
        info = {"artista": tour["artist"]}
        for tr in rows:
            th = tr.find("th")
            td = tr.find("td")
            if th and td:
                key = th.text.strip().lower()  # Limpia el texto y convierte la clave a minúsculas para normalizar.
                val = td.text.strip()
                # Asocia los datos encontrados a las claves esperadas (inicio, fin, número de shows).
                if "start date" in key:
                    info["inicio"] = val
                elif "end date" in key:
                    info["fin"] = val
                elif "number of shows" in key:
                    info["n_shows"] = val
        data.append(info) # Guarda el diccionario en la lista de datos

# Guardar en CSV
df = pd.DataFrame(data)
df.to_csv("conciertos_giras_2025.csv", index=False, encoding="utf-8-sig")

print(f"Guardados {len(data)} eventos de gira en CSV y JSON")


Guardados 7 eventos de gira en CSV y JSON


In [48]:
import requests
from bs4 import BeautifulSoup
import json

# Lista que contiene artistas y las URLs correspondientes
tours = [
    {"artist": "Oasis", "url": "https://en.wikipedia.org/wiki/Oasis_Live_%2725_Tour"},
    {"artist": "Iron Maiden", "url": "https://en.wikipedia.org/wiki/Run_for_Your_Lives_World_Tour"},
    {"artist": "Kendrick Lamar & SZA", "url": "https://en.wikipedia.org/wiki/Grand_National_Tour"}
]

# Itera sobre cada elemento de la lista y lo analiza como HTML
data = []
for tour in tours:
    resp = requests.get(tour["url"])
    resp.raise_for_status()
    soup = BeautifulSoup(resp.content, "html.parser")
    info = {"artista": tour["artist"]}
    # Buscar tabla infobox
    infobox = soup.find("table", class_="infobox")
    if infobox:
        for tr in infobox.find_all("tr"):
            th = tr.find("th"); td = tr.find("td")
            if not (th and td): continue
            key = th.get_text(strip=True).lower()
            val = td.get_text(" ", strip=True)
            if "start date" in key:
                info["inicio"] = val
            elif "end date" in key:
                info["fin"] = val
            elif "number of shows" in key:
                info["n_shows"] = val
    data.append(info)

# Guardar como JSON
with open("giras_conciertos_2025.json", "w", encoding="utf-8") as f:
    json.dump(data, f, ensure_ascii=False, indent=2)

print(f"Guardados {len(data)} registros en giras_conciertos_2025.json")


Guardados 3 registros en giras_conciertos_2025.json


In [49]:
import requests
from bs4 import BeautifulSoup

# Giras y sus URLs
tours = [
    {"artist": "Beyoncé", "url": "https://en.wikipedia.org/wiki/Cowboy_Carter_Tour"},
    {"artist": "Blackpink", "url": "https://en.wikipedia.org/wiki/Deadline_World_Tour"}
]

# Lista para almacenar líneas de texto
lines = []

for tour in tours:
    resp = requests.get(tour["url"])
    resp.raise_for_status()
    soup = BeautifulSoup(resp.content, "html.parser")
    
    # Extraer datos clave
    data = {"artista": tour["artist"]}
    infobox = soup.find("table", class_="infobox")
    
    if infobox:
        for tr in infobox.find_all("tr"):
            th = tr.find("th")
            td = tr.find("td")
            if not (th and td): continue
            key = th.get_text(strip=True).lower()
            val = td.get_text(" ", strip=True)
            if "concert tour name" in key:
                data["nombre_tour"] = val
            elif "start date" in key:
                data["inicio"] = val
            elif "end date" in key:
                data["fin"] = val
            elif "number of shows" in key:
                data["n_shows"] = val

    # Formatear línea de texto
    lines.append(f"Artista: {data.get('artista', 'N/A')}")
    lines.append(f"Nombre del Tour: {data.get('nombre_tour', 'N/A')}")
    lines.append(f"Inicio: {data.get('inicio', 'N/A')}")
    lines.append(f"Fin: {data.get('fin', 'N/A')}")
    lines.append(f"Número de Shows: {data.get('n_shows', 'N/A')}")
    lines.append("-" * 40)

# Guardar en archivo .txt
with open("giras_conciertos_2025.txt", "w", encoding="utf-8") as f:
    f.write("\n".join(lines))

print("Datos guardados en 'giras_conciertos_2025.txt'")


Datos guardados en 'giras_conciertos_2025.txt'


In [50]:
# Festivales de Musica



In [53]:
import requests
from bs4 import BeautifulSoup
import json

# Fuentes web seleccionadas
urls = [
    "https://www.musiclipse.com/2025/01/20/top-10-music-festivals-around-the-world-to-attend-in-2025",
    "https://wavytrip.com/2025/01/13/top-2025-music-festivals"
]

festivales = []

for url in urls:
    resp = requests.get(url)
    resp.raise_for_status()
    soup = BeautifulSoup(resp.content, "html.parser")
    # Buscar encabezados y párrafos con información relevante
    for section in soup.find_all(['h2','h3','p']):
        text = section.get_text(strip=True)
        # Detectamos entradas típicas con formato de nombre + fecha + ubicación
        if any(month in text for month in ["2025","June","July","August","April","May"]) and text.count(',')>=1:
            festivales.append({"info": text, "fuente": url})

# Procesar las entradas
datos = []
for item in festivales:
    raw = item["info"]
    origen = item["fuente"]
    # Intentamos separar nombre, fechas y ubicación
    parts = raw.split("Date") if "Date" in raw else raw.split("Date:")
    if len(parts) > 1:
        nombre = parts[0].strip()
        rest = parts[1]
        rest = rest.replace("Location:", "|")
        rest_parts = rest.split("|")
        fechas = rest_parts[0].strip()
        ubicacion = rest_parts[1].strip() if len(rest_parts)>1 else ""
    else:
        comps = raw.split(",")
        nombre = comps[0].strip()
        fechas = comps[1].strip() if len(comps)>1 else ""
        ubicacion = comps[-1].strip()
    datos.append({
        "nombre": nombre,
        "fechas": fechas,
        "ubicacion": ubicacion,
        "fuente": origen
    })

# Guardar archivo JSON
with open("festivales_2025_scraping.json", "w", encoding="utf-8") as f:
    json.dump(datos, f, ensure_ascii=False, indent=2)

print(f"Guardados {len(datos)} festivales en 'festivales_2025_scraping.json'")




Guardados 24 festivales en 'festivales_2025_scraping.json'


In [72]:

import requests
from bs4 import BeautifulSoup
import csv

url = "https://www.casagangotena.com/es/blog/consejos-de-viaje/mejores-restaurantes-centro-historico-quito/"
headers = {"User-Agent": "Mozilla/5.0"}

response = requests.get(url, headers=headers)
response.raise_for_status()

soup = BeautifulSoup(response.text, "html.parser")

# En esta página, cada restaurante aparece dentro de un encabezado <h3> seguido de un párrafo
items = soup.find_all("h3")

restaurantes = []
for h3 in items:
    nombre = h3.get_text(strip=True)
    # el párrafo siguiente suele contener la descripción
    descripcion = ""
    if h3.find_next_sibling("p"):
        descripcion = h3.find_next_sibling("p").get_text(strip=True)
    restaurantes.append({"nombre": nombre, "descripcion": descripcion})

# Guardar como CSV
with open("top10_restaurantes_quito.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=["nombre", "descripcion"])
    writer.writeheader()
    writer.writerows(restaurantes)

print(f"Extraídos {len(restaurantes)} restaurantes desde Casa Gangotena.")



Extraídos 10 restaurantes desde Casa Gangotena.


In [78]:
import sqlite3
import csv

# Conexion con sqlite en la db "proyecto_analisis"
conn = sqlite3.connect("proyecto_analisis.db")
cursor = conn.cursor()
cursor.execute("CREATE TABLE IF NOT EXISTS conciertos (artista TEXT, inicio text, fin TEXT)")

# Exportar los datos del csv a una tabla "conciertos" en sqlite
with open("conciertos_giras_2025.csv", newline="", encoding="utf-8") as f:
    reader = csv.reader(f)
    for row in reader:
        cursor.execute("INSERT INTO conciertos (artista, inicio, fin) VALUES (?,?,?)", row)

conn.commit()
conn.close()


In [80]:
import sqlite3
import csv

# Conexion con sqlite en la db "proyecto_analisis"
conn = sqlite3.connect("proyecto_analisis.db")
cursor = conn.cursor()
cursor.execute("CREATE TABLE IF NOT EXISTS giras (artista TEXT, inicio TEXT,fin text)")

# Exportar los datos del json a una tabla "giras" en sqlite
with open("giras_conciertos_2025.json", encoding="utf-8") as f:
    data = json.load(f)
    for row in data:
        cursor.execute("INSERT INTO giras (artista, inicio, fin) VALUES (?,?, ?)", (row["artista"],row["inicio"],row["fin"]))

conn.commit()
conn.close()



In [11]:
import sqlite3
import csv
import json

# Conexion con sqlite en la db "proyecto_analisis"
conn = sqlite3.connect("proyecto_analisis.db")
cursor = conn.cursor()
cursor.execute("CREATE TABLE IF NOT EXISTS festival (nombre TEXT, fechas TEXT,ubicacion text)")

# Exportar los datos del json a una tabla "festival" en sqlite
with open("festivales_2025_scraping.json", encoding="utf-8") as f:
    data = json.load(f)
    for row in data:
        cursor.execute("INSERT INTO festival (nombre, fechas, ubicacion) VALUES (?,?, ?)", (row["nombre"],row["fechas"],row["ubicacion"]))

conn.commit()
conn.close()


In [12]:
import sqlite3
import csv

# Conexion con sqlite en la db "proyecto_analisis"
conn = sqlite3.connect("proyecto_analisis.db")
cursor = conn.cursor()
cursor.execute("CREATE TABLE IF NOT EXISTS restaurantes (nombre TEXT, descripcion text)")

# Exportar los datos del csv a una tabla "restaurantes" en sqlite
with open("top10_restaurantes_quito.csv", newline="", encoding="utf-8") as f:
    reader = csv.reader(f)
    for row in reader:
        cursor.execute("INSERT INTO restaurantes (nombre,descripcion) VALUES (?,?)", row)

conn.commit()
conn.close()


In [13]:
# ACTIVIDADES Y HOBBIES


In [16]:

import requests
from bs4 import BeautifulSoup
import json

url = "https://www.proturec.com/quito/actividades-quito/"
headers = {"User-Agent": "Mozilla/5.0"}

res = requests.get(url, headers=headers)
res.raise_for_status()

soup = BeautifulSoup(res.text, "html.parser")

actividades = []

# Ejemplo: extraer párrafos con bullet points
for ul in soup.find_all("ul"):
    for li in ul.find_all("li"):
        texto = li.get_text(strip=True)
        if texto:
            actividades.append({"actividad": texto})

# Eliminar duplicados
actividades = [dict(t) for t in {tuple(d.items()) for d in actividades}]

# Guardar en JSON
with open("actividades_quito.json", "w", encoding="utf-8") as f:
    json.dump(actividades, f, ensure_ascii=False, indent=2)

print(f"✅ {len(actividades)} actividades guardadas en actividades_quito.json")



✅ 153 actividades guardadas en actividades_quito.json


In [22]:
import requests
from bs4 import BeautifulSoup
import json

url = "https://www.wikihow.com/Find-Hobbies"
headers = {"User-Agent": "Mozilla/5.0"}

response = requests.get(url, headers=headers)
response.raise_for_status()

soup = BeautifulSoup(response.text, "html.parser")

hobbies = []

# Extraer las listas de hobbies de la página (dentro de secciones <ul>)
for ul in soup.select("ul"):
    for li in ul.find_all("li"):
        texto = li.get_text(strip=True)
        if texto and len(texto) < 80:  # Filtrar textos muy largos
            hobbies.append(texto)

# Eliminar duplicados
hobbies = list(dict.fromkeys(hobbies))

with open("hobbies_wikihow.json", "w", encoding="utf-8") as f:
    json.dump(hobbies, f, ensure_ascii=False, indent=2)

print(f"✅ {len(hobbies)} hobbies guardados en hobbies_wikihow.json")



✅ 42 hobbies guardados en hobbies_wikihow.json


In [23]:

url = "https://www.timeanddate.com/holidays/ecuador/"
headers = {"User-Agent": "Mozilla/5.0"}

# Realizar solicitud HTTP y verificar estado
response = requests.get(url, headers=headers)
response.raise_for_status()

# Analizar el HTML con BeautifulSoup
soup = BeautifulSoup(response.text, "html.parser")

# Lista para almacenar los eventos extraídos
eventos = []

# Buscar la tabla principal de días festivos
tabla = soup.find("table", attrs={"id": "holidays-table"})
if tabla:
    # Recorrer cada fila (excepto el encabezado)
    for fila in tabla.find_all("tr")[1:]:
        columnas = fila.find_all("td")
        if len(columnas) >= 3:
            fecha = columnas[0].text.strip()
            nombre = columnas[1].text.strip()
            tipo = columnas[2].text.strip()
            eventos.append([fecha, nombre, tipo])

# Guardar los datos en un archivo CSV
with open("eventos_ecuador.csv", "w", encoding="utf-8", newline="") as f:
    writer = csv.writer(f)
    writer.writerow(["Fecha", "Nombre", "Tipo"])  # Cabecera
    writer.writerows(eventos)

print(f"✅ {len(eventos)} eventos guardados en 'eventos_ecuador.csv'")



✅ 23 eventos guardados en 'eventos_ecuador.csv'


In [24]:
import csv
from pymongo import MongoClient

# URI de conexión a MongoDB local
MONGO_URI = "mongodb://localhost:27017/"

def insertar_eventos_csv(ruta):
    try:
        # Conexión con MongoDB
        client = MongoClient(MONGO_URI)
        db = client["eventos_deportivos_2025"]
        collection = db["actividades_eventos"]

        eventos = []
        # Leer archivo CSV y procesar cada fila
        with open(ruta, encoding="utf-8") as f:
            reader = csv.DictReader(f)
            for row in reader:
                eventos.append({
                    "tipo_dato": "evento",  # Etiqueta útil para filtrado en la colección
                    "fecha": row.get("Fecha"),
                    "nombre": row.get("Nombre"),
                    "categoria": row.get("Tipo")
                })

        # Insertar documentos si hay eventos válidos
        if eventos:
            result = collection.insert_many(eventos)
            print(f"✅ Insertados {len(result.inserted_ids)} eventos desde {ruta}")

        # Cerrar conexión
        client.close()

    except Exception as e:
        print(f"❌ Error al insertar eventos desde {ruta}: {e}")

# Ejecución directa
if __name__ == "__main__":
    insertar_eventos_csv("eventos_ecuador.csv")


✅ Insertados 23 eventos desde eventos_ecuador.csv


In [25]:
import json
from pymongo import MongoClient

MONGO_URI = "mongodb://localhost:27017/"

def insertar_hobbies_json(ruta):
    try: # Crea conexión a la base eventos_deportivos_2025 y accede (o crea) la colección actividades_eventos
        client = MongoClient(MONGO_URI)
        db = client["eventos_deportivos_2025"]
        collection = db["actividades_eventos"]
        
# Lee el archivo JSON y genera una lista de diccionarios, uno por hobby, con una etiqueta de tipo de dato
        with open(ruta, encoding="utf-8") as f:
            hobbies = json.load(f)
            hobbies_docs = [{"tipo_dato": "hobby", "nombre": h} for h in hobbies]
        # Inserta todos los documentos en MongoDB y muestra confirmación con el número de inserciones realizadas
        if hobbies_docs: 
            result = collection.insert_many(hobbies_docs)
            print(f"✅ Insertados {len(result.inserted_ids)} hobbies desde {ruta}")
        client.close()
    except Exception as e:
        print(f"❌ Error al insertar hobbies desde {ruta}: {e}")

if __name__ == "__main__":
    insertar_hobbies_json("hobbies_wikihow.json")


✅ Insertados 42 hobbies desde hobbies_wikihow.json


In [26]:
import json
from pymongo import MongoClient

MONGO_URI = "mongodb://localhost:27017/"

def insertar_actividades_json(ruta):
    try:
        client = MongoClient(MONGO_URI)
        db = client["eventos_deportivos_2025"]
        collection = db["actividades_eventos"]

        with open(ruta, encoding="utf-8") as f:
            actividades = json.load(f)
            actividades_docs = []
            for a in actividades:
                doc = {"tipo_dato": "actividad"}
                doc.update(a)
                actividades_docs.append(doc)
        if actividades_docs:
            result = collection.insert_many(actividades_docs)
            print(f"✅ Insertadas {len(result.inserted_ids)} actividades desde {ruta}")
        client.close()
    except Exception as e:
        print(f"❌ Error al insertar actividades desde {ruta}: {e}")

if __name__ == "__main__":
    insertar_actividades_json("actividades_quito.json")


✅ Insertadas 153 actividades desde actividades_quito.json


In [None]:
from pymongo import MongoClient

# Configura las cadenas de conexión
LOCAL_URI = "mongodb://localhost:27017/"
ATLAS_URI = "mongodb+srv://kevin:jony12344@cluster0.sfbgrnk.mongodb.net/"

DB_NAME = "eventos_deportivos_2025"
COLLECTION_NAME = "sports"

# Conectar a MongoDB local
client_local = MongoClient(LOCAL_URI)
db_local = client_local[DB_NAME]
colec_local = db_local[COLLECTION_NAME]

# Conectar a MongoDB Atlas
client_atlas = MongoClient(ATLAS_URI)
db_atlas = client_atlas[DB_NAME]
colec_atlas = db_atlas[COLLECTION_NAME]

# Obtener todos los documentos de la colección local
documentos = list(colec_local.find())

if not documentos:
    print("❌ No se encontraron documentos en la colección local")
else:
    # Quitar _id para evitar conflicto en Atlas
    for doc in documentos:
        if "_id" in doc:
            del doc["_id"]

    # Insertar documentos en Atlas
    result = colec_atlas.insert_many(documentos)
    print(f"✅ Migrados {len(result.inserted_ids)} documentos a MongoDB Atlas")

# Cerrar conexiones
client_local.close()
client_atlas.close()


In [28]:
from pymongo import MongoClient
# Migracion de datos de mongoDB a Atlas
LOCAL_URI = "mongodb://localhost:27017/"
ATLAS_URI = "mongodb+srv://kevin:jony12344@cluster0.sfbgrnk.mongodb.net/"

local_client = MongoClient(LOCAL_URI)
atlas_client = MongoClient(ATLAS_URI)

local_col = local_client["eventos_deportivos_2025"]["sports"]
atlas_col = atlas_client["proyecto_analisis"]["parte1"]

docs = [{k: v for k, v in doc.items() if k != "_id"} for doc in local_col.find()]

if docs:
    result = atlas_col.insert_many(docs)
    print(f"✅ Migrados {len(result.inserted_ids)} documentos de 'nombre_db_local.nombre_coleccion_local' a 'nombre_db_atlas.nombre_coleccion_atlas'")
else:
    print("⚠️ No se encontraron documentos para migrar.")

local_client.close()
atlas_client.close()


✅ Migrados 330 documentos de 'nombre_db_local.nombre_coleccion_local' a 'nombre_db_atlas.nombre_coleccion_atlas'


In [29]:
from pymongo import MongoClient

LOCAL_URI = "mongodb://localhost:27017/"
ATLAS_URI = "mongodb+srv://kevin:jony12344@cluster0.sfbgrnk.mongodb.net/"

local_client = MongoClient(LOCAL_URI)
atlas_client = MongoClient(ATLAS_URI)

local_col = local_client["eventos_deportivos_2025"]["actividades_eventos"]
atlas_col = atlas_client["proyecto_analisis"]["parte1"]

docs = [{k: v for k, v in doc.items() if k != "_id"} for doc in local_col.find()]

if docs:
    result = atlas_col.insert_many(docs)
    print(f"✅ Migrados {len(result.inserted_ids)} documentos de 'nombre_db_local.nombre_coleccion_local' a 'nombre_db_atlas.nombre_coleccion_atlas'")
else:
    print("⚠️ No se encontraron documentos para migrar.")

local_client.close()
atlas_client.close()

✅ Migrados 218 documentos de 'nombre_db_local.nombre_coleccion_local' a 'nombre_db_atlas.nombre_coleccion_atlas'


In [31]:
import sqlite3
from pymongo import MongoClient

# Migracion de datos de SQLite a Atlas
SQLITE_PATH = "proyecto_analisis.db"
ATLAS_URI = "mongodb+srv://kevin:jony12344@cluster0.sfbgrnk.mongodb.net/"
MONGO_DB_NAME = "proyecto_analisis"
MONGO_COLLECTION_NAME = "parte1"

# Conexión SQLite
conn = sqlite3.connect(SQLITE_PATH)
cursor = conn.cursor()

# Conexión Mongo Atlas
client = MongoClient(ATLAS_URI)
db = client[MONGO_DB_NAME]
collection = db[MONGO_COLLECTION_NAME]

# Obtener todas las tablas de SQLite
cursor.execute("SELECT name FROM sqlite_master WHERE type='table';")
tablas = [row[0] for row in cursor.fetchall()]

documentos_totales = []

for tabla in tablas:
    cursor.execute(f"SELECT * FROM {tabla}")
    columnas = [desc[0] for desc in cursor.description]
    filas = cursor.fetchall()

    for fila in filas:
        doc = {"tabla": tabla}  # Para saber de qué tabla viene el dato
        for col, val in zip(columnas, fila):
            doc[col] = val
        documentos_totales.append(doc)

if documentos_totales:
    collection.insert_many(documentos_totales)
    print(f"✅ Insertados {len(documentos_totales)} documentos en la colección '{MONGO_COLLECTION_NAME}' de la base '{MONGO_DB_NAME}'")

conn.close()
client.close()


✅ Insertados 46 documentos en la colección 'parte1' de la base 'proyecto_analisis'
