**🚀EXTRACCIÓN DE DATOS DESDE GOOGLE SHEETS (EXCEL VIRTUAL)**


**Proyecto: Seguridad Operativa mediante GPS (Empresa: Transportes El Lorito)**

Instalar la librería pandas (opcional en Google Colab, pero lo incluimos por compatibilidad)

In [None]:
!pip install --quiet gspread pandas gspread_dataframe

Nota:

Autenticación con Google (solo necesario si no usas un archivo público):

Si el archivo es público, puedes acceder con gspread sin autenticación compleja.

CELDA 1 – Código base general (solo ejecutar una vez al inicio)



In [None]:
# Importamos la librería pandas, que permite trabajar con datos en forma de tablas (DataFrames)
import pandas as pd

# Definimos el ID único del archivo de Google Sheets
sheet_id = "1HBwyjBG0zH1AGpIXnKyFC26rGhSsIOF744vc6aSjfLE"

# Creamos una función para leer, mostrar y analizar una hoja específica del documento
def analizar_hoja(nombre_hoja, gid):
    """
    Esta función realiza:
    1. Construye el enlace CSV de exportación a partir del ID de hoja (gid)
    2. Lee el contenido como un DataFrame de pandas
    3. Muestra todos los datos completos de la hoja
    4. Muestra análisis básico como:
       - Total de filas y columnas
       - Nombres de las columnas
       - Tipo de datos por columna
       - Cantidad de valores faltantes por columna
    """

    # Construimos la URL directa para exportar la hoja como CSV
    url = f"https://docs.google.com/spreadsheets/d/{sheet_id}/export?format=csv&gid={gid}"

    # Leemos los datos desde la URL en formato CSV
    df = pd.read_csv(url)

    # Encabezado visual para identificar la hoja
    print("="*100)
    print(f"📋 HOJA: {nombre_hoja}")
    print("="*100)

    # Mostramos todos los datos completos (Google Colab los puede visualizar con display)
    print("🔹 Todos los datos:")
    display(df)

    # Mostramos dimensiones: cuántas filas y columnas tiene
    print(f"\n🔹 Filas: {df.shape[0]} | Columnas: {df.shape[1]}")

    # Mostramos el nombre de cada columna
    print("🔹 Columnas:", list(df.columns))

    # Mostramos el tipo de dato de cada columna (texto, número, fecha, etc.)
    print("\n🔹 Tipos de datos:")
    print(df.dtypes)

    # Mostramos cuántos valores vacíos hay por columna
    print("\n🔹 Valores nulos por columna:")
    print(df.isnull().sum())

✅ CELDAS SIGUIENTES – Una por cada hoja

📄 Cronograma

In [None]:
analizar_hoja("Cronograma", "1002874041")

📋 HOJA: Cronograma
🔹 Todos los datos:


Unnamed: 0,cronograma_id,operador_id,fecha
0,1,OP-048,2025-01-01 0:00:00
1,2,OP-022,2025-01-01 0:00:00
2,3,OP-068,2025-01-01 0:00:00
3,4,OP-018,2025-01-01 0:00:00
4,5,OP-093,2025-01-01 0:00:00
...,...,...,...
13135,13136,OP-092,2025-12-31 0:00:00
13136,13137,OP-040,2025-12-31 0:00:00
13137,13138,OP-042,2025-12-31 0:00:00
13138,13139,OP-007,2025-12-31 0:00:00



🔹 Filas: 13140 | Columnas: 3
🔹 Columnas: ['cronograma_id', 'operador_id', 'fecha']

🔹 Tipos de datos:
cronograma_id     int64
operador_id      object
fecha            object
dtype: object

🔹 Valores nulos por columna:
cronograma_id    0
operador_id      0
fecha            0
dtype: int64


📄 Rutas

In [None]:
analizar_hoja("Rutas", "0")

📋 HOJA: Rutas
🔹 Todos los datos:


Unnamed: 0,ruta_id,codigo_ruta,nombre
0,1,2535,Santa Rosa
1,2,4541,Consorcio
2,3,6905,Polo



🔹 Filas: 3 | Columnas: 3
🔹 Columnas: ['ruta_id', 'codigo_ruta', 'nombre']

🔹 Tipos de datos:
ruta_id         int64
codigo_ruta     int64
nombre         object
dtype: object

🔹 Valores nulos por columna:
ruta_id        0
codigo_ruta    0
nombre         0
dtype: int64


📄 Buses

In [None]:
analizar_hoja("Buses", "1857142461")

📋 HOJA: Buses
🔹 Todos los datos:


Unnamed: 0,bus_id,padron,placa,combustible,marca,chip (GPS),sede,estado_bus
0,1,100,A7B392,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta
1,2,101,C2D581,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta
2,3,102,F4G147,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta
3,4,103,H9J206,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta
4,5,104,K1L358,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta
5,6,105,M6N474,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta
6,7,106,P3Q982,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta
7,8,107,R8S215,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta
8,9,108,T5U639,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta
9,10,109,V2W174,GNV,GOLDEN DRAGON GNV ACCESO,si,Huaycan,En ruta



🔹 Filas: 36 | Columnas: 8
🔹 Columnas: ['bus_id', 'padron', 'placa', 'combustible', 'marca', 'chip (GPS)', 'sede', 'estado_bus']

🔹 Tipos de datos:
bus_id          int64
padron          int64
placa          object
combustible    object
marca          object
chip (GPS)     object
sede           object
estado_bus     object
dtype: object

🔹 Valores nulos por columna:
bus_id         0
padron         0
placa          0
combustible    0
marca          0
chip (GPS)     0
sede           0
estado_bus     0
dtype: int64


📄 Falta

In [None]:
analizar_hoja("Falta", "1817979550")

📋 HOJA: Falta
🔹 Todos los datos:


Unnamed: 0,falta_id,código_falta,nombre,descripción,gravedad
0,1,A-01,PRESENTACIÓN PERSONAL,Corte de cabello inadecuado o descuido de aseo...,LEVE
1,2,A-02,NECESIDADES FISIOLÓGICAS INADECUADAS,Por hacer sus necesidades fisiológicas en la z...,LEVE
2,3,A-03,ARROJAR BASURA,Por arrojar basura en la zona de estacionamien...,LEVE
3,4,A-04,FALTA DE RESPETO AL PERSONAL,Por hacer caso omiso a las indicaciones del Je...,MUY GRAVE
4,5,A-05,NO OBEDECER INDICACIONES,Por hacer caso omiso a las indicaciones del de...,MUY GRAVE
...,...,...,...,...,...
65,66,A-66,TRABAJO PARA LA COMPETENCIA,Desempeñar funciones para empresas rivales dur...,MUY GRAVE
66,67,A-67,COACCIONES O AMENAZAS,Intimidar a compañeros o superiores para obten...,MUY GRAVE
67,68,A-68,MAL USO DE FONDOS,Utilizar recursos económicos de la institución...,MUY GRAVE
68,69,A-69,REINCIDENCIA EN FALTAS,"Cometer reiteradamente faltas, aun después de ...",MUY GRAVE



🔹 Filas: 70 | Columnas: 5
🔹 Columnas: ['falta_id', 'código_falta', 'nombre', 'descripción', 'gravedad']

🔹 Tipos de datos:
falta_id         int64
código_falta    object
nombre          object
descripción     object
gravedad        object
dtype: object

🔹 Valores nulos por columna:
falta_id        0
código_falta    0
nombre          0
descripción     0
gravedad        0
dtype: int64


📄 Inspector

In [None]:
analizar_hoja("Inspector", "540056938")

📋 HOJA: Inspector
🔹 Todos los datos:


Unnamed: 0,inspector_id,codigo_inspector,apellido_paterno,apellido_materno,nombres,estado
0,1,INS001,ALVARADO,CHINCHAY,ALEJANDRO IVAN,trabajando
1,2,INS002,ANAYA,PALOMINO,JOEL HENRY,trabajando
2,3,INS003,AQUINO,ROJAS,EVER JUAN,trabajando
3,4,INS004,AVILA,CUBA,RICHARD ANDRES,trabajando
4,5,INS005,BASURTO,MIRANDA,AVENCIO,trabajando
...,...,...,...,...,...,...
100,101,INS101,OSCCO,MUÃ‘OZ,NILVER,trabajando
101,102,INS102,VELA,TAHUA,RICK JEYSSON,trabajando
102,103,INS103,LEON,VILCHEZ,MIGUEL ANTONIO,trabajando
103,104,INS104,SOTO,APUMAYTA,ROLANDO JAIME,trabajando



🔹 Filas: 105 | Columnas: 6
🔹 Columnas: ['inspector_id', 'codigo_inspector', 'apellido_paterno', 'apellido_materno', 'nombres', 'estado']

🔹 Tipos de datos:
inspector_id         int64
codigo_inspector    object
apellido_paterno    object
apellido_materno    object
nombres             object
estado              object
dtype: object

🔹 Valores nulos por columna:
inspector_id        0
codigo_inspector    0
apellido_paterno    0
apellido_materno    0
nombres             0
estado              0
dtype: int64


📄 Operador

In [None]:
analizar_hoja("Operador", "2013202462")

📋 HOJA: Operador
🔹 Todos los datos:


Unnamed: 0,operador_id,codigo_operador,apellido_paterno,apellido_materno,nombres
0,1,OP-001,Pérez,Gómez,Juan
1,2,OP-002,Ramírez,Sánchez,Carlos
2,3,OP-003,Díaz,Fernández,Luis
3,4,OP-004,Torres,Mendoza,Miguel
4,5,OP-005,Flores,Castro,José
...,...,...,...,...,...
95,96,OP-096,Torres,Fernández,Víctor
96,97,OP-097,Castillo,Vásquez,Julio
97,98,OP-098,Figueroa,Sánchez,Eduardo
98,99,OP-099,Bravo,López,Leonardo



🔹 Filas: 100 | Columnas: 5
🔹 Columnas: ['operador_id', 'codigo_operador', 'apellido_paterno', 'apellido_materno', 'nombres']

🔹 Tipos de datos:
operador_id          int64
codigo_operador     object
apellido_paterno    object
apellido_materno    object
nombres             object
dtype: object

🔹 Valores nulos por columna:
operador_id         0
codigo_operador     0
apellido_paterno    0
apellido_materno    0
nombres             0
dtype: int64


📄 Paradero

In [None]:
analizar_hoja("Paradero", "1205843695")

📋 HOJA: Paradero
🔹 Todos los datos:


Unnamed: 0,paradero_id,codigo_paradero,nombre
0,1,PAR001,FAMESA
1,2,PAR002,CESAR VALLEJO
2,3,PAR003,SANTA CLARA
3,4,PAR004,ESCUELA
4,5,PAR005,COPRODELI
5,6,PAR006,PARIHUELA
6,7,PAR007,Villa Sol
7,8,PAR008,Escuela de Policia
8,9,PAR009,Primera de Pro
9,10,PAR010,Tottus



🔹 Filas: 51 | Columnas: 3
🔹 Columnas: ['paradero_id', 'codigo_paradero', 'nombre']

🔹 Tipos de datos:
paradero_id         int64
codigo_paradero    object
nombre             object
dtype: object

🔹 Valores nulos por columna:
paradero_id        0
codigo_paradero    0
nombre             0
dtype: int64


📄 Sanciones

In [None]:
analizar_hoja("Sanciones", "511629238")

📋 HOJA: Sanciones
🔹 Todos los datos:


Unnamed: 0,sancion_id,codigo_sancion,descripcion
0,1,S001,Suspendido por 2 dias
1,2,S002,Suspendido por 4 dias
2,3,S003,Suspendido por 6 dias
3,4,S004,Suspendido por 8 dias
4,5,S005,Suspendido por 10 dias
5,6,S006,Retirado del servicio
6,7,S007,Ir a capacitacion
7,8,S008,Suspendido por 2 dias
8,9,S009,Suspendido por 4 dias
9,10,S010,Suspendido por 6 dias



🔹 Filas: 12 | Columnas: 3
🔹 Columnas: ['sancion_id', 'codigo_sancion', 'descripcion']

🔹 Tipos de datos:
sancion_id         int64
codigo_sancion    object
descripcion       object
dtype: object

🔹 Valores nulos por columna:
sancion_id        0
codigo_sancion    0
descripcion       0
dtype: int64


📄 Sentido

In [None]:
analizar_hoja("Sentido", "1534440589")

📋 HOJA: Sentido
🔹 Todos los datos:


Unnamed: 0,sentido_id,descripcion
0,1,OESTE - ESTE
1,2,ESTE - OESTE
2,3,SUR - NORTE
3,4,NORTE - SUR



🔹 Filas: 4 | Columnas: 2
🔹 Columnas: ['sentido_id', 'descripcion']

🔹 Tipos de datos:
sentido_id      int64
descripcion    object
dtype: object

🔹 Valores nulos por columna:
sentido_id     0
descripcion    0
dtype: int64


📄 Detalle_sancion2024

In [None]:
analizar_hoja("Detalle_sancion2024", "351620038")

📋 HOJA: Detalle_sancion2024
🔹 Todos los datos:


Unnamed: 0,detalle_sancion_id,falta_fk,sancion_fk,operador,descripcion,fecha
0,1,1,5,3,Suspendido por 10 días,2024-07-01
1,2,19,8,6,Suspendido por 2 días,2024-07-22
2,3,9,6,82,Retirado del servicio,2024-08-03
3,4,12,5,28,Suspendido por 10 días,2024-05-15
4,5,10,2,59,Suspendido por 4 días,2024-06-26
...,...,...,...,...,...,...
1995,1996,15,5,32,Suspendido por 10 días,2024-05-07
1996,1997,10,8,58,Suspendido por 2 días,2024-05-13
1997,1998,2,5,40,Suspendido por 10 días,2024-05-14
1998,1999,4,1,32,Suspendido por 2 días,2024-04-21



🔹 Filas: 2000 | Columnas: 6
🔹 Columnas: ['detalle_sancion_id', 'falta_fk', 'sancion_fk', 'operador', 'descripcion', 'fecha']

🔹 Tipos de datos:
detalle_sancion_id     int64
falta_fk               int64
sancion_fk             int64
operador               int64
descripcion           object
fecha                 object
dtype: object

🔹 Valores nulos por columna:
detalle_sancion_id    0
falta_fk              0
sancion_fk            0
operador              0
descripcion           0
fecha                 0
dtype: int64


📄 Bd_Faltas2024

In [None]:
analizar_hoja("Bd_Faltas2024", "177512124")

📋 HOJA: Bd_Faltas2024
🔹 Todos los datos:


Unnamed: 0,detalle_falta_id,bus_fk,falta_fk,operador_fk,ruta_fk,paradero_fk,inspector_fk,sentido_fk,fecha,hora,comentario
0,1,41,20.0,49,3,50,82,2.0,2024-04-19,0:11:00,"PASAJERA PAGO HASTA TOTTUS AL CONDUCTOR,Y ESTE..."
1,2,24,20.0,92,3,31,10,4.0,2024-04-19,0:14:00,AL ESTARABORDO E LA UNIDAD SUBE UNA PASJERA EN...
2,3,60,45.0,22,3,46,20,4.0,2024-04-19,0:48:00,ESTAMOS LLEGANDO A GLORIA EL CHOFER EMPIEZA A ...
3,4,57,21.0,21,3,34,48,4.0,2024-04-19,1:06:00,al subir a al unidad y hacer milabor encuentro...
4,5,69,21.0,51,3,51,69,4.0,2024-04-19,1:10:00,al realizar mi labor encuentro un usuarioque d...
...,...,...,...,...,...,...,...,...,...,...,...
3100,3101,68,41.0,91,1,2,96,2.0,2024-07-31,21:58:00,Al encontrarme en el paradero visualizo acerca...
3101,3102,38,21.0,98,1,22,18,1.0,2024-07-31,21:28:00,al estar haciendo mi inspección encuentro a un...
3102,3103,57,41.0,59,1,42,60,1.0,2024-07-31,9:30:00,al estar en el paradero me percato que unidad ...
3103,3104,68,41.0,4,1,17,22,1.0,2024-07-31,9:30:00,al estar en el paradero esperando se ve a lo l...



🔹 Filas: 3105 | Columnas: 11
🔹 Columnas: ['detalle_falta_id', 'bus_fk', 'falta_fk', 'operador_fk', 'ruta_fk', 'paradero_fk', 'inspector_fk', 'sentido_fk', 'fecha', 'hora', 'comentario']

🔹 Tipos de datos:
detalle_falta_id      int64
bus_fk                int64
falta_fk            float64
operador_fk           int64
ruta_fk               int64
paradero_fk           int64
inspector_fk          int64
sentido_fk          float64
fecha                object
hora                 object
comentario           object
dtype: object

🔹 Valores nulos por columna:
detalle_falta_id    0
bus_fk              0
falta_fk            7
operador_fk         0
ruta_fk             0
paradero_fk         0
inspector_fk        0
sentido_fk          3
fecha               2
hora                7
comentario          8
dtype: int64


Fuente 2: MongoDB (NoSQL)

In [None]:
!pip install pymongo --quiet

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/1.4 MB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━━━━━━━━[0m [32m0.9/1.4 MB[0m [31m28.2 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.4/1.4 MB[0m [31m23.7 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/313.6 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m313.6/313.6 kB[0m [31m22.1 MB/s[0m eta [36m0:00:00[0m
[?25h

 Estrategias de Limpieza