In [None]:
import pandas as pd
import sqlalchemy
import os
from tqdm import tqdm
from dotenv import load_dotenv
import time  # Importar el módulo time para pausar

# Cargar las variables de entorno desde el archivo .env
load_dotenv()

# Obtener las credenciales de la base de datos desde las variables de entorno
db_user = os.getenv('DB_USER')
db_password = os.getenv('DB_PASSWORD')
db_host = os.getenv('DB_HOST')
db_port = os.getenv('DB_PORT')
db_name = os.getenv('DB_NAME')

# Función para conectar a la base de datos
def connect_to_db():
    try:
        engine = sqlalchemy.create_engine(
            f'mysql+pymysql://{db_user}:{db_password}@{db_host}:{db_port}/{db_name}'
        )
        connection = engine.connect()
        print("Conexión a la base de datos establecida con éxito.")
        return engine, connection
    except Exception as e:
        print(f"Error al conectar a la base de datos: {e}")
        raise

# Conectar a MySQL utilizando las credenciales del archivo .env
engine, connection = connect_to_db()

# Ruta de la carpeta con los archivos
folder_path = 'D:\\GitHub\\Proyecto Final\\Proyecto_final_Henry\\Dataset'

# Columnas a mantener para green_tripdata
columns_to_keep_green = [
    'lpep_pickup_datetime', 'lpep_dropoff_datetime',
    'PULocationID', 'DOLocationID',
    'trip_distance', 'total_amount'
]

# Columnas a mantener para yellow_tripdata
columns_to_keep_yellow = [
    'tpep_pickup_datetime', 'tpep_dropoff_datetime',
    'PULocationID', 'DOLocationID',
    'trip_distance', 'total_amount'
]

# Columnas a mantener para fhv_tripdata
columns_to_keep_fhv = [
    'pickup_datetime', 'dropOff_datetime',
    'PUlocationID', 'DOlocationID',
    'Affiliated_base_number'
]

# Leer todos los archivos en la carpeta y estandarizar las columnas
for filename in os.listdir(folder_path):
    if filename.endswith('.parquet'):
        file_path = os.path.join(folder_path, filename)

        try:
            # Leer archivo .parquet
            print(f"\nLeyendo archivo {file_path}")
            df = pd.read_parquet(file_path)

            # Verificar si es green_tripdata, yellow_tripdata o fhv_tripdata
            if 'green' in filename.lower():
                columns_to_keep = columns_to_keep_green
                source_value = 'green_tripdata'
            elif 'yellow' in filename.lower():
                columns_to_keep = columns_to_keep_yellow
                source_value = 'yellow_tripdata'
            elif 'fhv' in filename.lower():
                columns_to_keep = columns_to_keep_fhv
                source_value = 'fhv_tripdata'
            else:
                print(f"El archivo {filename} no es ni 'green', 'yellow' ni 'fhv'. Saltando.")
                continue

            # Verificar si el archivo contiene todas las columnas necesarias
            if all(column in df.columns for column in columns_to_keep):
                print(f"El archivo {filename} contiene todas las columnas necesarias. Procesando...")

                # Seleccionar columnas necesarias
                df = df[columns_to_keep]

                # Renombrar columnas según sea necesario
                if 'yellow' in filename.lower():
                    df.rename(columns={
                        'tpep_pickup_datetime': 'Pickup_datetime',
                        'tpep_dropoff_datetime': 'DropOff_datetime',
                        'trip_distance': 'trip_miles',
                        'total_amount': 'driver_pay'
                    }, inplace=True)
                elif 'green' in filename.lower():
                    df.rename(columns={
                        'lpep_pickup_datetime': 'Pickup_datetime',
                        'lpep_dropoff_datetime': 'DropOff_datetime',
                        'trip_distance': 'trip_miles',
                        'total_amount': 'driver_pay'
                    }, inplace=True)
                elif 'fhv' in filename.lower():
                    df.rename(columns={
                        'pickup_datetime': 'Pickup_datetime',
                        'dropOff_datetime': 'DropOff_datetime',
                        'PUlocationID': 'PULocationID',
                        'DOlocationID': 'DOLocationID'
                    }, inplace=True)
                    df['trip_miles'] = 0.0  # Agregar columna trip_miles con valores por defecto
                    df['driver_pay'] = 0.0  # Agregar columna driver_pay con valores por defecto

                # Añadir la columna 'source'
                df['source'] = source_value

                # Calcular trip_time como la diferencia entre DropOff_datetime y Pickup_datetime
                df['Pickup_datetime'] = pd.to_datetime(df['Pickup_datetime'])
                df['DropOff_datetime'] = pd.to_datetime(df['DropOff_datetime'])
                df['trip_time'] = (df['DropOff_datetime'] - df['Pickup_datetime']).dt.total_seconds()

                # Dividir el DataFrame en bloques de 5,000 filas
                chunk_size = 150000  # Tamaño del chunk a 5,000 filas
                num_chunks = len(df) // chunk_size + 1
                chunk_counter = 0  # Contador de chunks procesados

                for i in tqdm(range(num_chunks), desc=f"Procesando {filename}", unit="chunk"):
                    chunk = df[i * chunk_size:(i + 1) * chunk_size]
                    try:
                        chunk.to_sql(name='taxi_fhv_data', con=engine, if_exists='append', index=False)
                        print(f"Chunk {i+1}/{num_chunks} del archivo {filename} cargado exitosamente.")
                    except sqlalchemy.exc.OperationalError as e:
                        print(f"Error al cargar chunk {i+1}: {e}. Intentando reconectar...")
                        engine, connection = connect_to_db()
                        chunk.to_sql(name='taxi_fhv_data', con=engine, if_exists='append', index=False)
                        print(f"Chunk {i+1} del archivo {filename} cargado exitosamente tras reconexión.")

                    chunk_counter += 1

                    # Cada 20 chunks, esperar 15 segundos y reconectar
                    if chunk_counter % 30 == 0:
                        print("Esperando 15 segundos...")
                        time.sleep(30)
                        print("Reconectando a la base de datos...")
                        connection.close()
                        engine.dispose()
                        engine, connection = connect_to_db()
                        print("Reconexión exitosa.")

                print(f"Datos del archivo {filename} cargados exitosamente.")
            else:
                print(f"El archivo {filename} no contiene todas las columnas necesarias. Saltando.")

        except FileNotFoundError:
            print(f"Archivo {file_path} no encontrado. Saltando.")
        except KeyError as e:
            print(f"Error de columna en {file_path}: {e}. Saltando.")
        except Exception as e:
            print(f"Error al procesar el archivo {filename}: {e}")


try:
    # Leer archivo .parquet
    df = pd.read_parquet(file_path)

    # Mostrar las columnas del archivo
    print(f"\nColumnas del archivo {file_to_inspect}:")
    print(df.columns.tolist())

except Exception as e:
    print(f"Error al leer {file_path}: {e}")

print("\nProceso de estandarización y carga completo.")


Exception during reset or similar
Traceback (most recent call last):
  File "C:\Users\kcasi\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.12_qbz5n2kfra8p0\LocalCache\local-packages\Python312\site-packages\sqlalchemy\pool\base.py", line 986, in _finalize_fairy
    fairy._reset(
  File "C:\Users\kcasi\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.12_qbz5n2kfra8p0\LocalCache\local-packages\Python312\site-packages\sqlalchemy\pool\base.py", line 1432, in _reset
    pool._dialect.do_rollback(self)
  File "C:\Users\kcasi\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.12_qbz5n2kfra8p0\LocalCache\local-packages\Python312\site-packages\sqlalchemy\engine\default.py", line 699, in do_rollback
    dbapi_connection.rollback()
  File "C:\Users\kcasi\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.12_qbz5n2kfra8p0\LocalCache\local-packages\Python312\site-packages\pymysql\connections.py", line 493, in rollback
    self._read_ok_packet()
  File "C:\Users\kcasi\Ap

Conexión a la base de datos establecida con éxito.

Leyendo archivo D:\GitHub\Proyecto Final\Proyecto_final_Henry\Dataset\yellow_tripdata_2024-01.parquet
El archivo yellow_tripdata_2024-01.parquet contiene todas las columnas necesarias. Procesando...


Procesando yellow_tripdata_2024-01.parquet:   5%|▌         | 1/20 [00:22<07:07, 22.49s/chunk]

Chunk 1/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  10%|█         | 2/20 [00:40<05:52, 19.60s/chunk]

Chunk 2/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  15%|█▌        | 3/20 [00:59<05:32, 19.58s/chunk]

Chunk 3/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  20%|██        | 4/20 [01:19<05:14, 19.67s/chunk]

Chunk 4/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  25%|██▌       | 5/20 [01:39<04:56, 19.79s/chunk]

Chunk 5/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  30%|███       | 6/20 [02:00<04:44, 20.31s/chunk]

Chunk 6/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  35%|███▌      | 7/20 [02:23<04:32, 20.99s/chunk]

Chunk 7/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  40%|████      | 8/20 [02:48<04:29, 22.45s/chunk]

Chunk 8/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  45%|████▌     | 9/20 [03:15<04:21, 23.73s/chunk]

Chunk 9/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  50%|█████     | 10/20 [03:43<04:11, 25.13s/chunk]

Chunk 10/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  55%|█████▌    | 11/20 [04:09<03:49, 25.51s/chunk]

Chunk 11/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  60%|██████    | 12/20 [04:31<03:14, 24.28s/chunk]

Chunk 12/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  65%|██████▌   | 13/20 [05:02<03:04, 26.38s/chunk]

Chunk 13/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  70%|███████   | 14/20 [05:34<02:48, 28.10s/chunk]

Chunk 14/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  75%|███████▌  | 15/20 [06:03<02:21, 28.33s/chunk]

Chunk 15/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  80%|████████  | 16/20 [06:36<01:58, 29.66s/chunk]

Chunk 16/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  85%|████████▌ | 17/20 [07:07<01:30, 30.02s/chunk]

Chunk 17/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  90%|█████████ | 18/20 [07:36<00:59, 29.85s/chunk]

Chunk 18/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet:  95%|█████████▌| 19/20 [08:11<00:31, 31.28s/chunk]

Chunk 19/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-01.parquet: 100%|██████████| 20/20 [08:36<00:00, 25.83s/chunk]

Chunk 20/20 del archivo yellow_tripdata_2024-01.parquet cargado exitosamente.
Datos del archivo yellow_tripdata_2024-01.parquet cargados exitosamente.

Leyendo archivo D:\GitHub\Proyecto Final\Proyecto_final_Henry\Dataset\yellow_tripdata_2024-02.parquet





El archivo yellow_tripdata_2024-02.parquet contiene todas las columnas necesarias. Procesando...


Procesando yellow_tripdata_2024-02.parquet:   5%|▍         | 1/21 [00:32<10:43, 32.16s/chunk]

Chunk 1/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  10%|▉         | 2/21 [01:04<10:14, 32.36s/chunk]

Chunk 2/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  14%|█▍        | 3/21 [01:34<09:21, 31.19s/chunk]

Chunk 3/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  19%|█▉        | 4/21 [02:05<08:48, 31.07s/chunk]

Chunk 4/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  24%|██▍       | 5/21 [02:36<08:18, 31.16s/chunk]

Chunk 5/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  29%|██▊       | 6/21 [03:08<07:52, 31.53s/chunk]

Chunk 6/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  33%|███▎      | 7/21 [03:38<07:12, 30.91s/chunk]

Chunk 7/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  38%|███▊      | 8/21 [04:12<06:53, 31.80s/chunk]

Chunk 8/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  43%|████▎     | 9/21 [04:46<06:30, 32.50s/chunk]

Chunk 9/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  48%|████▊     | 10/21 [05:20<06:02, 32.95s/chunk]

Chunk 10/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  52%|█████▏    | 11/21 [05:52<05:26, 32.69s/chunk]

Chunk 11/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  57%|█████▋    | 12/21 [06:28<05:04, 33.83s/chunk]

Chunk 12/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  62%|██████▏   | 13/21 [07:09<04:47, 35.88s/chunk]

Chunk 13/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  67%|██████▋   | 14/21 [07:39<03:58, 34.01s/chunk]

Chunk 14/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  71%|███████▏  | 15/21 [08:07<03:14, 32.43s/chunk]

Chunk 15/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  76%|███████▌  | 16/21 [08:36<02:37, 31.44s/chunk]

Chunk 16/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  81%|████████  | 17/21 [09:11<02:09, 32.37s/chunk]

Chunk 17/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  86%|████████▌ | 18/21 [09:48<01:41, 33.69s/chunk]

Chunk 18/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  90%|█████████ | 19/21 [10:24<01:09, 34.57s/chunk]

Chunk 19/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet:  95%|█████████▌| 20/21 [10:59<00:34, 34.69s/chunk]

Chunk 20/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-02.parquet: 100%|██████████| 21/21 [11:02<00:00, 31.57s/chunk]

Chunk 21/21 del archivo yellow_tripdata_2024-02.parquet cargado exitosamente.
Datos del archivo yellow_tripdata_2024-02.parquet cargados exitosamente.

Leyendo archivo D:\GitHub\Proyecto Final\Proyecto_final_Henry\Dataset\yellow_tripdata_2024-03.parquet





El archivo yellow_tripdata_2024-03.parquet contiene todas las columnas necesarias. Procesando...


Procesando yellow_tripdata_2024-03.parquet:   4%|▍         | 1/24 [00:49<18:51, 49.20s/chunk]

Chunk 1/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:   8%|▊         | 2/24 [01:33<17:02, 46.47s/chunk]

Chunk 2/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  12%|█▎        | 3/24 [02:11<14:51, 42.48s/chunk]

Chunk 3/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  17%|█▋        | 4/24 [02:48<13:23, 40.15s/chunk]

Chunk 4/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  21%|██        | 5/24 [03:22<12:04, 38.12s/chunk]

Chunk 5/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  25%|██▌       | 6/24 [03:57<11:08, 37.15s/chunk]

Chunk 6/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  29%|██▉       | 7/24 [04:31<10:11, 35.99s/chunk]

Chunk 7/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  33%|███▎      | 8/24 [05:17<10:25, 39.12s/chunk]

Chunk 8/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  38%|███▊      | 9/24 [06:02<10:17, 41.16s/chunk]

Chunk 9/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  42%|████▏     | 10/24 [06:47<09:49, 42.08s/chunk]

Chunk 10/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  46%|████▌     | 11/24 [07:24<08:46, 40.52s/chunk]

Chunk 11/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  50%|█████     | 12/24 [08:06<08:13, 41.12s/chunk]

Chunk 12/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  54%|█████▍    | 13/24 [08:54<07:53, 43.08s/chunk]

Chunk 13/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  58%|█████▊    | 14/24 [09:32<06:56, 41.68s/chunk]

Chunk 14/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  62%|██████▎   | 15/24 [10:15<06:17, 41.92s/chunk]

Chunk 15/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  67%|██████▋   | 16/24 [11:00<05:42, 42.85s/chunk]

Chunk 16/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  71%|███████   | 17/24 [11:48<05:10, 44.38s/chunk]

Chunk 17/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  75%|███████▌  | 18/24 [12:36<04:34, 45.69s/chunk]

Chunk 18/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  79%|███████▉  | 19/24 [13:15<03:38, 43.75s/chunk]

Chunk 19/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  83%|████████▎ | 20/24 [14:23<03:23, 50.77s/chunk]

Chunk 20/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  88%|████████▊ | 21/24 [15:15<02:33, 51.31s/chunk]

Chunk 21/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  92%|█████████▏| 22/24 [16:00<01:38, 49.28s/chunk]

Chunk 22/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet:  96%|█████████▌| 23/24 [16:47<00:48, 48.59s/chunk]

Chunk 23/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-03.parquet: 100%|██████████| 24/24 [17:20<00:00, 43.36s/chunk]

Chunk 24/24 del archivo yellow_tripdata_2024-03.parquet cargado exitosamente.
Datos del archivo yellow_tripdata_2024-03.parquet cargados exitosamente.

Leyendo archivo D:\GitHub\Proyecto Final\Proyecto_final_Henry\Dataset\yellow_tripdata_2024-04.parquet





El archivo yellow_tripdata_2024-04.parquet contiene todas las columnas necesarias. Procesando...


Procesando yellow_tripdata_2024-04.parquet:   4%|▍         | 1/24 [00:37<14:12, 37.08s/chunk]

Chunk 1/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:   8%|▊         | 2/24 [01:17<14:13, 38.80s/chunk]

Chunk 2/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  12%|█▎        | 3/24 [01:55<13:28, 38.50s/chunk]

Chunk 3/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  17%|█▋        | 4/24 [02:35<13:03, 39.18s/chunk]

Chunk 4/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  21%|██        | 5/24 [03:18<12:47, 40.41s/chunk]

Chunk 5/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  25%|██▌       | 6/24 [04:08<13:06, 43.72s/chunk]

Chunk 6/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  29%|██▉       | 7/24 [05:05<13:40, 48.24s/chunk]

Chunk 7/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  33%|███▎      | 8/24 [05:46<12:14, 45.92s/chunk]

Chunk 8/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  38%|███▊      | 9/24 [06:37<11:52, 47.51s/chunk]

Chunk 9/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  42%|████▏     | 10/24 [07:19<10:39, 45.66s/chunk]

Chunk 10/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  46%|████▌     | 11/24 [08:01<09:38, 44.51s/chunk]

Chunk 11/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  50%|█████     | 12/24 [08:40<08:34, 42.85s/chunk]

Chunk 12/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  54%|█████▍    | 13/24 [09:25<07:59, 43.61s/chunk]

Chunk 13/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  58%|█████▊    | 14/24 [10:09<07:16, 43.62s/chunk]

Chunk 14/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  62%|██████▎   | 15/24 [10:54<06:37, 44.19s/chunk]

Chunk 15/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  67%|██████▋   | 16/24 [11:40<05:57, 44.63s/chunk]

Chunk 16/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  71%|███████   | 17/24 [12:32<05:27, 46.79s/chunk]

Chunk 17/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  75%|███████▌  | 18/24 [13:16<04:37, 46.20s/chunk]

Chunk 18/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  79%|███████▉  | 19/24 [14:05<03:54, 46.93s/chunk]

Chunk 19/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  83%|████████▎ | 20/24 [14:52<03:08, 47.01s/chunk]

Chunk 20/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  88%|████████▊ | 21/24 [15:40<02:21, 47.19s/chunk]

Chunk 21/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  92%|█████████▏| 22/24 [16:29<01:35, 47.78s/chunk]

Chunk 22/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet:  96%|█████████▌| 23/24 [17:21<00:49, 49.11s/chunk]

Chunk 23/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-04.parquet: 100%|██████████| 24/24 [17:41<00:00, 44.23s/chunk]

Chunk 24/24 del archivo yellow_tripdata_2024-04.parquet cargado exitosamente.
Datos del archivo yellow_tripdata_2024-04.parquet cargados exitosamente.

Leyendo archivo D:\GitHub\Proyecto Final\Proyecto_final_Henry\Dataset\yellow_tripdata_2024-05.parquet





El archivo yellow_tripdata_2024-05.parquet contiene todas las columnas necesarias. Procesando...


Procesando yellow_tripdata_2024-05.parquet:   4%|▍         | 1/25 [00:43<17:14, 43.09s/chunk]

Chunk 1/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-05.parquet:   8%|▊         | 2/25 [01:34<18:24, 48.02s/chunk]

Chunk 2/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-05.parquet:  12%|█▏        | 3/25 [02:31<19:06, 52.12s/chunk]

Chunk 3/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-05.parquet:  16%|█▌        | 4/25 [03:25<18:29, 52.85s/chunk]

Chunk 4/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-05.parquet:  20%|██        | 5/25 [04:18<17:40, 53.01s/chunk]

Chunk 5/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-05.parquet:  24%|██▍       | 6/25 [05:16<17:20, 54.75s/chunk]

Chunk 6/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-05.parquet:  28%|██▊       | 7/25 [06:12<16:30, 55.03s/chunk]

Chunk 7/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-05.parquet:  32%|███▏      | 8/25 [07:14<16:11, 57.13s/chunk]

Chunk 8/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-05.parquet:  36%|███▌      | 9/25 [08:07<14:52, 55.79s/chunk]

Chunk 9/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.


Procesando yellow_tripdata_2024-05.parquet:  40%|████      | 10/25 [10:32<20:51, 83.46s/chunk]

Chunk 10/25 del archivo yellow_tripdata_2024-05.parquet cargado exitosamente.
