# Taller básico sobre MONGOdb
----


1.   Instalar librerías
2.   descargar e instalar un Sevidor propio de MongoDb
3.   Crear una Bd
4.   Crear colecciones
5.   descargar .zip (csv) cargarlos en una Colección



# 1.Instalar librerías

In [2]:
# Instalar librerías necesarias para MongoDB en Windows
!pip install pymongo        # librería para conectar con MongoDB
!pip install requests       # para descargar archivos
print("✅ Librerías instaladas correctamente para Windows")


[notice] A new release of pip is available: 25.1.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip
ERROR: Invalid requirement: '#': Expected package name at the start of dependency specifier
    #
    ^


✅ Librerías instaladas correctamente para Windows



[notice] A new release of pip is available: 25.1.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip
ERROR: Invalid requirement: '#': Expected package name at the start of dependency specifier
    #
    ^


# 2. Configurar MongoDB para Windows

**OPCIÓN A: MongoDB Atlas (Recomendado - Gratuito)**
- Crear cuenta en https://www.mongodb.com/cloud/atlas
- Crear cluster gratuito
- Obtener string de conexión

**OPCIÓN B: MongoDB Local**
- Descargar MongoDB Community desde: https://www.mongodb.com/try/download/community
- Instalar con configuración por defecto
- El servicio se ejecuta automáticamente

**OPCIÓN C: Docker (Si tienes Docker Desktop)**
- Ejecutar: `docker run -d -p 27017:27017 --name mongodb mongo:latest`

In [3]:
# Verificar disponibilidad de MongoDB
import subprocess
import sys

def verificar_mongodb():
    try:
        # Verificar si MongoDB está disponible localmente
        import pymongo
        client = pymongo.MongoClient('localhost', 27017, serverSelectionTimeoutMS=2000)
        client.server_info()
        print("✅ MongoDB local detectado en puerto 27017")
        return 'localhost', 27017
    except:
        print("❌ MongoDB local no disponible")
        print("\n🔧 Opciones disponibles:")
        print("1. Instalar MongoDB Community Server")
        print("2. Usar MongoDB Atlas (gratuito)")
        print("3. Usar Docker: docker run -d -p 27017:27017 mongo")
        return None, None

host, port = verificar_mongodb()

❌ MongoDB local no disponible

🔧 Opciones disponibles:
1. Instalar MongoDB Community Server
2. Usar MongoDB Atlas (gratuito)
3. Usar Docker: docker run -d -p 27017:27017 mongo


In [6]:
# Configuración de conexión flexible para Windows
def conectar_mongodb():
    """
    Intenta conectar a MongoDB con diferentes opciones
    """
    from pymongo import MongoClient
    
    # Opción 1: MongoDB local
    try:
        client = MongoClient('localhost', 27017, serverSelectionTimeoutMS=2000)
        client.server_info()
        print("✅ Conectado a MongoDB local")
        return client
    except:
        pass
    
    # Opción 2: Docker
    try:
        client = MongoClient('localhost', 27017, serverSelectionTimeoutMS=2000)
        client.server_info()
        print("✅ Conectado a MongoDB en Docker")
        return client
    except:
        pass
    
    # Opción 3: Atlas (requiere configuración manual)
    print("❌ No se pudo conectar automáticamente")
    print("💡 Configura MongoDB Atlas o instala MongoDB local")
    return None

# Intentar conexión
client = conectar_mongodb()

✅ Conectado a MongoDB local


## 2.1 Configurar directorio de trabajo en Windows

In [4]:
# Configurar directorio de trabajo en Windows
import os
from pathlib import Path

# Crear directorio para el proyecto
proyecto_dir = Path.home() / "MongoDB_Taller"
proyecto_dir.mkdir(exist_ok=True)

print(f"📁 Directorio del proyecto: {proyecto_dir}")
print(f"✅ Configuración completada para Windows")

📁 Directorio del proyecto: C:\Users\efren\MongoDB_Taller
✅ Configuración completada para Windows


In [5]:
# Configurar variables del proyecto
import os
from pathlib import Path

# Directorio para datos del proyecto
data_dir = proyecto_dir / "data"
data_dir.mkdir(exist_ok=True)

# Directorio para descargas
downloads_dir = proyecto_dir / "downloads"
downloads_dir.mkdir(exist_ok=True)

print(f"📊 Directorio de datos: {data_dir}")
print(f"⬇️  Directorio de descargas: {downloads_dir}")

📊 Directorio de datos: C:\Users\efren\MongoDB_Taller\data
⬇️  Directorio de descargas: C:\Users\efren\MongoDB_Taller\downloads


In [7]:
# Verificar estado de la conexión
if client is not None:
    try:
        # Verificar conexión
        info = client.server_info()
        print("🎉 MongoDB está funcionando correctamente")
        print(f"📊 Versión de MongoDB: {info.get('version', 'Desconocida')}")
        
        # Listar bases de datos existentes
        dbs = client.list_database_names()
        print(f"🗄️  Bases de datos disponibles: {dbs}")
        
    except Exception as e:
        print(f"❌ Error de conexión: {e}")
else:
    print("⚠️  MongoDB no está conectado. Revisa la configuración anterior.")

🎉 MongoDB está funcionando correctamente
📊 Versión de MongoDB: 8.2.0
🗄️  Bases de datos disponibles: ['admin', 'config', 'local']


# 3. inicializar nuestro servidor mongoDB

In [8]:
from pymongo import MongoClient
client = MongoClient('localhost',27017)

## 3.1 crear una base de datos

In [9]:
db = client['estudiantes_Ucentral']

In [10]:
# crear colecciones
coleccion_profes = db['profesores']
coleccion_cursos = db['cursos']

## 3.2 funciones DML (insertar, borrar, actualizar)

In [11]:
def buscar_documentos(db, coleccion_nombre, filtro={}, limite=10):
  if db is not None:
      coleccion = db[coleccion_nombre]
      resultados = coleccion.find(filtro).limit(limite)
      for doc in resultados:
          print(doc)
  else:
      print("No hay conexión a la base de datos.")

def insertar_documento(db, coleccion_nombre, documento):
      if db is not None:
          coleccion = db[coleccion_nombre]
          resultado = coleccion.insert_one(documento)
          print(f"Documento insertado con ID: {resultado.inserted_id}")
      else:
          print("No hay conexión a la base de datos.")

def actualizar_un_documento(db, coleccion_nombre, filtro, actualizacion):
        if db is not None:
            coleccion = db[coleccion_nombre]
            resultado = coleccion.update_one(filtro, {'$set': actualizacion})
            if resultado.modified_count > 0:
                print(f"Documentos modificados: {resultado.modified_count}")
            else:
                print("No se encontraron documentos para modificar.")
        else:
            print("No hay conexión a la base de datos.")
def actualizar_varios_documentos(db, coleccion_nombre, filtro, actualizacion):
        if db is not None:
            coleccion = db[coleccion_nombre]
            resultado = coleccion.update_many(filtro, {'$set': actualizacion})
            if resultado.modified_count > 0:
                print(f"Documentos modificados: {resultado.modified_count}")
            else:
                print("No se encontraron documentos para modificar.")
        else:
            print("No hay conexión a la base de datos.")
def eliminar_varios_documentos(db, coleccion_nombre, filtro):
        if db is not None:
            coleccion = db[coleccion_nombre]
            resultado = coleccion.delete_many(filtro)
            if resultado.deleted_count > 0:
                print(f"Documentos eliminados: {resultado.deleted_count}")
            else:
                print("No se encontraron documentos para eliminar.")
        else:
            print("No hay conexión a la base de datos.")

In [12]:
documentoProfe1={"nombre":"luisfdo","apellidos":"castellanos guarin"}
documentoProfe2={"nombre":"pepito","apellidos":"perez","fechaNacimiento":"1980-05-05"}
insertar_documento(db,'profesores',documentoProfe1)
insertar_documento(db,'profesores',documentoProfe2)

Documento insertado con ID: 68cb8ffdd69e5bba69ab0285
Documento insertado con ID: 68cb8ffdd69e5bba69ab0286


In [17]:
buscar_documentos(db,'profesores')

{'_id': ObjectId('68cb8ffdd69e5bba69ab0285'), 'nombre': 'luisfdo', 'apellidos': 'castellanos guarin'}


In [14]:
actualizar_varios_documentos(db,'profesores',{"nombre":"pepito"},{"nombre":"Pedro Patricio"})

Documentos modificados: 1


In [16]:
eliminar_varios_documentos(db,'profesores',{"apellidos":"perez"})

Documentos eliminados: 1


In [24]:
client.close()

#4 descargar y descomprimir zip

In [18]:
def descargar_y_descomprimir_zip(url, carpeta_destino, tipoArchivo=''):
  import os
  import io
  import zipfile
  import requests
  os.makedirs(carpeta_destino, exist_ok=True)  #cree la carpeta sino existe
  response = requests.get(url)
  zip_file = zipfile.ZipFile(io.BytesIO(response.content))
  if (tipoArchivo == ''):
    zip_file.extractall(carpeta_destino) #exportar .zip a la carpeta
  else:
    for nombre_archivo in zip_file.namelist():
      if nombre_archivo.endswith(tipoArchivo):
        zip_file.extract(nombre_archivo, carpeta_destino)


In [19]:
# Configurar directorio de descarga y descargar datos
carpeta_destino = downloads_dir
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/00320/student.zip"

print(f"⬇️  Descargando desde: {url}")
print(f"📁 Guardando en: {carpeta_destino}")

# Ejecutar descarga
descargar_y_descomprimir_zip(url, str(carpeta_destino))
print("✅ Descarga completada")

⬇️  Descargando desde: https://archive.ics.uci.edu/ml/machine-learning-databases/00320/student.zip
📁 Guardando en: C:\Users\efren\MongoDB_Taller\downloads
✅ Descarga completada
✅ Descarga completada


# 5.Procesar data descargada y cargar a una coleccion

In [20]:
import re
def procesar_txt_diccionario_separados_por_espacio(data_diccionario):
  lineas=data_diccionario.strip().split('\n')
  #---listar
  documentos=[]
  for linea in lineas:
    match = re.match('^\d+\s+(.+?)\s*-\s*(.+)$',linea)
    if match:
      clave= match.group(1)
      valor= match.group(2)
      documentos.append({"clave":clave, "valor":valor})
  return documentos

  match = re.match('^\d+\s+(.+?)\s*-\s*(.+)$',linea)


In [21]:
# Procesar archivo descargado con rutas de Windows
archivo_student = downloads_dir / 'student.txt'

if archivo_student.exists():
    with open(archivo_student, 'r', encoding='utf-8') as archivo:
        data_diccionario = archivo.read()
    
    documentos = procesar_txt_diccionario_separados_por_espacio(data_diccionario)
    print(f"📊 Documentos procesados: {len(documentos)}")
    print("🔍 Primeros 3 documentos:")
    for i, doc in enumerate(documentos[:3]):
        print(f"  {i+1}. {doc}")
else:
    print(f"❌ Archivo no encontrado: {archivo_student}")
    documentos = []

📊 Documentos procesados: 33
🔍 Primeros 3 documentos:
  1. {'clave': 'school', 'valor': 'student\'s school (binary: "GP" - Gabriel Pereira or "MS" - Mousinho da Silveira)'}
  2. {'clave': 'sex', 'valor': 'student\'s sex (binary: "F" - female or "M" - male)'}
  3. {'clave': 'age', 'valor': "student's age (numeric: from 15 to 22)"}


In [22]:
# Insertar documentos en MongoDB si hay conexión y datos
if client is not None and documentos:
    db = client['estudiantes_Ucentral']
    coleccion_estudiantes = db['estudiantes']
    
    print(f"📤 Insertando {len(documentos)} documentos...")
    for i, documento in enumerate(documentos, 1):
        insertar_documento(db, 'estudiantes', documento)
        if i % 10 == 0:  # Progreso cada 10 documentos
            print(f"✅ Insertados {i}/{len(documentos)} documentos")
    
    print("🎉 Todos los documentos han sido insertados")
else:
    if client is None:
        print("❌ No hay conexión a MongoDB")
    if not documentos:
        print("❌ No hay documentos para insertar")

📤 Insertando 33 documentos...
Documento insertado con ID: 68cb9136d69e5bba69ab0287
Documento insertado con ID: 68cb9136d69e5bba69ab0288
Documento insertado con ID: 68cb9136d69e5bba69ab0289
Documento insertado con ID: 68cb9136d69e5bba69ab028a
Documento insertado con ID: 68cb9136d69e5bba69ab028b
Documento insertado con ID: 68cb9136d69e5bba69ab028c
Documento insertado con ID: 68cb9136d69e5bba69ab028d
Documento insertado con ID: 68cb9136d69e5bba69ab028e
Documento insertado con ID: 68cb9136d69e5bba69ab028f
Documento insertado con ID: 68cb9136d69e5bba69ab0290
✅ Insertados 10/33 documentos
Documento insertado con ID: 68cb9136d69e5bba69ab0291
Documento insertado con ID: 68cb9136d69e5bba69ab0292
Documento insertado con ID: 68cb9136d69e5bba69ab0293
Documento insertado con ID: 68cb9136d69e5bba69ab0294
Documento insertado con ID: 68cb9136d69e5bba69ab0295
Documento insertado con ID: 68cb9136d69e5bba69ab0296
Documento insertado con ID: 68cb9136d69e5bba69ab0297
Documento insertado con ID: 68cb9136d69

In [23]:
buscar_documentos(db,'estudiantes')

{'_id': ObjectId('68cb9136d69e5bba69ab0287'), 'clave': 'school', 'valor': 'student\'s school (binary: "GP" - Gabriel Pereira or "MS" - Mousinho da Silveira)'}
{'_id': ObjectId('68cb9136d69e5bba69ab0288'), 'clave': 'sex', 'valor': 'student\'s sex (binary: "F" - female or "M" - male)'}
{'_id': ObjectId('68cb9136d69e5bba69ab0289'), 'clave': 'age', 'valor': "student's age (numeric: from 15 to 22)"}
{'_id': ObjectId('68cb9136d69e5bba69ab028a'), 'clave': 'address', 'valor': 'student\'s home address type (binary: "U" - urban or "R" - rural)'}
{'_id': ObjectId('68cb9136d69e5bba69ab028b'), 'clave': 'famsize', 'valor': 'family size (binary: "LE3" - less or equal to 3 or "GT3" - greater than 3)'}
{'_id': ObjectId('68cb9136d69e5bba69ab028c'), 'clave': 'Pstatus', 'valor': 'parent\'s cohabitation status (binary: "T" - living together or "A" - apart)'}
{'_id': ObjectId('68cb9136d69e5bba69ab028d'), 'clave': 'Medu', 'valor': "mother's education (numeric: 0 - none,  1 - primary education (4th grade), 2 