<a href="https://colab.research.google.com/github/RAFS20/Mongo_DB/blob/main/CSV_a_Mongo_DB.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Cuaderno de: Ricardo Alonzo Fernández Salguero

# Instalación de pymongo y pandas

In [1]:
!pip install pymongo pandas

Collecting pymongo
  Downloading pymongo-4.6.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (677 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m677.1/677.1 kB[0m [31m6.4 MB/s[0m eta [36m0:00:00[0m
Collecting dnspython<3.0.0,>=1.16.0 (from pymongo)
  Downloading dnspython-2.4.2-py3-none-any.whl (300 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m300.4/300.4 kB[0m [31m10.9 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: dnspython, pymongo
Successfully installed dnspython-2.4.2 pymongo-4.6.1


# Creación de .csv de ejemplo

In [2]:
import pandas as pd
import random

# Genera datos simulados
data = {
    'Nombre': ['Juan', 'María', 'Carlos', 'Laura', 'Pedro'],
    'Edad': [25, 30, 22, 28, 35],
    'Ciudad': ['Madrid', 'Barcelona', 'Sevilla', 'Valencia', 'Bilbao'],
    'Puntuación': [random.randint(1, 100) for _ in range(5)]
}

# Crea un DataFrame
df = pd.DataFrame(data)

# Nombre del archivo CSV
csv_file = "tu_archivo.csv"

# Guarda el DataFrame como un archivo CSV
df.to_csv(csv_file, index=False)

print(f"Se ha generado el archivo CSV: {csv_file}")


Se ha generado el archivo CSV: tu_archivo.csv


# Cargar un .csv a Mongo DB

In [3]:
import pandas as pd
import random
from urllib.parse import quote_plus
from pymongo.mongo_client import MongoClient
from pymongo.server_api import ServerApi


# Define tu nombre de usuario y contraseña en bruto
username = "clasesmongo"
password = "!!4egt9a!pUb#@E"

# Codifica el nombre de usuario y la contraseña usando quote_plus
encoded_username = quote_plus(username)  # Codifica el nombre de usuario
encoded_password = quote_plus(password)  # Codifica la contraseña

# Construye la URI de MongoDB para la conexión
uri = f"mongodb+srv://{encoded_username}:{encoded_password}@cluster0.segsxqx.mongodb.net/?retryWrites=true&w=majority"

# Crea un nuevo cliente de MongoDB y se conecta al servidor
try:
    client = MongoClient(uri, server_api=ServerApi('1'))  # Crea un cliente de MongoDB con la URI y la API del servidor especificada
    client.admin.command('ping')  # Envía un ping al servidor para confirmar la conexión exitosa
    print("Hiciste ping a tu implementación. ¡Te has conectado con éxito a MongoDB!")

    # Define el nombre de la base de datos y la colección donde se cargarán los datos CSV
    db_name = "mi_base_de_datos"
    collection_name = "mi_coleccion_csv"

    # Carga el archivo CSV en un DataFrame de pandas
    df = pd.read_csv(csv_file)

    # Convierte el DataFrame en una lista de diccionarios (cada fila del CSV se convierte en un diccionario)
    data = df.to_dict(orient="records")

    # Selecciona la base de datos y la colección en MongoDB
    db = client[db_name]
    collection = db[collection_name]

    # Borra la colección existente (esto eliminará todos los documentos en esa colección)
    collection.drop()

    # Inserta los datos en la colección de MongoDB
    collection.insert_many(data)

    # Imprime un mensaje de éxito
    print(f"Se cargaron {len(data)} documentos desde el CSV a la colección {collection_name} en la base de datos {db_name}.")

except Exception as e:
    print(e)





Hiciste ping a tu implementación. ¡Te has conectado con éxito a MongoDB!
Se cargaron 5 documentos desde el CSV a la colección mi_coleccion_csv en la base de datos mi_base_de_datos.


# Comprobación de que el .csv fue cargado

In [4]:
from urllib.parse import quote_plus
from pymongo.mongo_client import MongoClient
from pymongo.server_api import ServerApi

# Tu nombre de usuario y contraseña en bruto
username = "clasesmongo"
password = "!!4egt9a!pUb#@E"

# Codifica porcentaje el nombre de usuario y la contraseña
encoded_username = quote_plus(username)
encoded_password = quote_plus(password)

# Construye la URI de MongoDB
uri = f"mongodb+srv://{encoded_username}:{encoded_password}@cluster0.segsxqx.mongodb.net/?retryWrites=true&w=majority"

# Nombre de la base de datos y colección donde cargaste el CSV
db_name = "mi_base_de_datos"
collection_name = "mi_coleccion_csv"

# Crea un nuevo cliente y conecta al servidor
try:
    client = MongoClient(uri, server_api=ServerApi('1'))
    # Envía un ping para confirmar una conexión exitosa
    client.admin.command('ping')
    print("Hiciste ping a tu implementación. ¡Te has conectado con éxito a MongoDB!")

    # Selecciona la base de datos y la colección
    db = client[db_name]
    collection = db[collection_name]

    # Consulta todos los documentos en la colección
    cursor = collection.find()

    # Imprime los documentos
    for document in cursor:
        print(document)

except Exception as e:
    print(e)


Hiciste ping a tu implementación. ¡Te has conectado con éxito a MongoDB!
{'_id': ObjectId('658de96a29bc735ae6aa56aa'), 'Nombre': 'Juan', 'Edad': 25, 'Ciudad': 'Madrid', 'Puntuación': 49}
{'_id': ObjectId('658de96a29bc735ae6aa56ab'), 'Nombre': 'María', 'Edad': 30, 'Ciudad': 'Barcelona', 'Puntuación': 83}
{'_id': ObjectId('658de96a29bc735ae6aa56ac'), 'Nombre': 'Carlos', 'Edad': 22, 'Ciudad': 'Sevilla', 'Puntuación': 29}
{'_id': ObjectId('658de96a29bc735ae6aa56ad'), 'Nombre': 'Laura', 'Edad': 28, 'Ciudad': 'Valencia', 'Puntuación': 85}
{'_id': ObjectId('658de96a29bc735ae6aa56ae'), 'Nombre': 'Pedro', 'Edad': 35, 'Ciudad': 'Bilbao', 'Puntuación': 58}
