In [None]:
import pandas as pd
import numpy as np # type: ignore
import time
import os
import concurrent.futures
from tqdm import tqdm # type: ignore
from openai import OpenAI # type: ignore

client = OpenAI(api_key="")

input_csv = "/content/drive/MyDrive/Doukt/Goftino/NLP/colab/embedd/preproces.csv"
output_csv = "/content/drive/MyDrive/Doukt/Goftino/NLP/colab/embedd/embeddings.csv"
output_parquet = "/content/drive/MyDrive/Doukt/Goftino/NLP/colab/embedd/embeddings.parquet"

# Set chunk size for better performance
chunksize = 1000
first_chunk = True
chunk_counter = 0
total_processed = 0

# Number of concurrent requests
max_workers = 5

# Remove output files if they already exist
if os.path.exists(output_csv):
    os.remove(output_csv)

print(f"Starting to process file {input_csv} with chunk size {chunksize} and {max_workers} concurrent requests...")

def get_embedding(text_data, max_retries=3, base_delay=1):
    text, idx, original_idx = text_data
    retries = 0

    while retries < max_retries:
        try:
            if pd.isna(text) or text.strip() == "":
                return None, idx, original_idx

            response = client.embeddings.create(
                model="text-embedding-3-large",
                input=text
            )

            return response.data[0].embedding, idx, original_idx

        except Exception as e:
            retries += 1
            error_msg = str(e).lower()

            if "rate_limit" in error_msg:
                delay = 30
            else:
                delay = base_delay * (2 ** (retries - 1))

            if retries < max_retries:
                print(f"Error at index {original_idx} (attempt {retries} of {max_retries}): {e}")
                print(f"Retrying after {delay} seconds...")
                time.sleep(delay)
            else:
                print(f"Final error at index {original_idx} after {max_retries} attempts: {e}")
                return None, idx, original_idx

    return None, idx, original_idx

# Keep track of the total number of rows processed across all chunks
base_index = 0

for chunk in pd.read_csv(input_csv, chunksize=chunksize):
    chunk_counter += 1
    if "preprocessed" not in chunk.columns:
        print("'preprocessed' column not found.")
        exit(1)

    # Prepare data for parallel processing with original index
    # For each row in the chunk, store: (preprocessed_text, position_in_chunk, original_position_in_csv)
    texts_with_indices = []
    for i, row in chunk.iterrows():
        # Calculate original index in the whole CSV
        original_idx = base_index + (i - chunk.index[0])
        texts_with_indices.append((row["preprocessed"], i, original_idx))

    results = [None] * len(texts_with_indices)
    original_indices_for_results = [None] * len(texts_with_indices)

    print(f"Processing chunk {chunk_counter} with {len(texts_with_indices)} records...")

    with concurrent.futures.ThreadPoolExecutor(max_workers=max_workers) as executor:
        future_to_idx = {executor.submit(get_embedding, item): i for i, item in enumerate(texts_with_indices)}

        for future in tqdm(concurrent.futures.as_completed(future_to_idx), total=len(texts_with_indices), desc=f"Processing chunk {chunk_counter}"):
            idx = future_to_idx[future]
            try:
                embedding, _, original_idx = future.result()
                if embedding is not None:
                    results[idx] = embedding
                    original_indices_for_results[idx] = original_idx
            except Exception as e:
                print(f"Error while processing: {e}")

    # Remove None results while keeping original indices
    valid_results = [(emb, idx) for emb, idx in zip(results, original_indices_for_results) if emb is not None]
    if valid_results:
        embeddings, indices = zip(*valid_results)

        # Convert list of embeddings to DataFrame with numeric columns
        arr = np.array(embeddings, dtype=np.float32)
        df_emb = pd.DataFrame(arr, columns=[f"dim_{i}" for i in range(arr.shape[1])])

        # Add original index column
        df_emb.insert(0, 'original_index', indices)

        # Save to CSV file (append mode)
        if first_chunk:
            df_emb.to_csv(output_csv, index=False, mode='w')
            first_chunk = False
        else:
            df_emb.to_csv(output_csv, index=False, mode='a', header=False)

        total_processed += len(embeddings)
        print(f"✅ Chunk {chunk_counter} with {len(embeddings)} records processed and appended to CSV")

        # Free memory
        del arr, df_emb, embeddings, indices, valid_results

    # Update the base_index for the next chunk
    # We add the length of the current chunk to our running total
    base_index += len(chunk)

print(f"\nProcessing of {total_processed} records in {chunk_counter} chunks completed")
print(f"CSV file saved at {output_csv}")

# Convert CSV file to Parquet
print("\nConverting CSV to Parquet...")

# Read CSV in small chunks and convert to Parquet
csv_chunksize = 5000
first_parquet_chunk = True

for csv_chunk in tqdm(pd.read_csv(output_csv, chunksize=csv_chunksize), desc="Converting to Parquet"):
    if first_parquet_chunk:
        csv_chunk.to_parquet(output_parquet, compression="snappy", index=False)
        first_parquet_chunk = False
    else:
        # For simplicity and reliability, we'll use the append method with a temporary file
        temp_parquet = output_parquet + ".temp"

        # Read the existing parquet
        existing_df = pd.read_parquet(output_parquet)

        # Combine with new chunk
        combined_df = pd.concat([existing_df, csv_chunk], ignore_index=True)

        # Save to temp file
        combined_df.to_parquet(temp_parquet, compression="snappy", index=False)

        # Replace original with temp
        os.replace(temp_parquet, output_parquet)

        # Clean up
        del existing_df, combined_df

print(f"✅ Successfully converted to Parquet. Final file saved at {output_parquet}")
print(f"\n✅ All done! {total_processed} records processed. Both CSV and Parquet files saved:")
print(f"- CSV file: {output_csv}")
print(f"- Parquet file: {output_parquet}")


شروع پردازش فایل /content/drive/MyDrive/Doukt/Goftino/NLP/colab/embedd/preproces.csv با اندازه چانک 1000 و 5 درخواست همزمان...
پردازش چانک 1 با 1000 رکورد...


پردازش چانک 1: 100%|██████████| 1000/1000 [01:13<00:00, 13.65it/s]


✅ چانک 1 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 2 با 1000 رکورد...


پردازش چانک 2: 100%|██████████| 1000/1000 [01:15<00:00, 13.25it/s]


✅ چانک 2 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 3 با 1000 رکورد...


پردازش چانک 3: 100%|██████████| 1000/1000 [01:06<00:00, 15.06it/s]


✅ چانک 3 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 4 با 1000 رکورد...


پردازش چانک 4: 100%|██████████| 1000/1000 [01:09<00:00, 14.48it/s]


✅ چانک 4 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 5 با 1000 رکورد...


پردازش چانک 5: 100%|██████████| 1000/1000 [01:18<00:00, 12.71it/s]


✅ چانک 5 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 6 با 1000 رکورد...


پردازش چانک 6: 100%|██████████| 1000/1000 [01:13<00:00, 13.60it/s]


✅ چانک 6 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 7 با 1000 رکورد...


پردازش چانک 7: 100%|██████████| 1000/1000 [01:07<00:00, 14.77it/s]


✅ چانک 7 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 8 با 1000 رکورد...


پردازش چانک 8: 100%|██████████| 1000/1000 [01:13<00:00, 13.65it/s]


✅ چانک 8 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 9 با 1000 رکورد...


پردازش چانک 9: 100%|██████████| 1000/1000 [01:12<00:00, 13.85it/s]


✅ چانک 9 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 10 با 1000 رکورد...


پردازش چانک 10: 100%|██████████| 1000/1000 [01:22<00:00, 12.09it/s]


✅ چانک 10 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 11 با 1000 رکورد...


پردازش چانک 11: 100%|██████████| 1000/1000 [01:20<00:00, 12.44it/s]


✅ چانک 11 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 12 با 1000 رکورد...


پردازش چانک 12: 100%|██████████| 1000/1000 [01:13<00:00, 13.69it/s]


✅ چانک 12 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 13 با 1000 رکورد...


پردازش چانک 13: 100%|██████████| 1000/1000 [01:09<00:00, 14.48it/s]


✅ چانک 13 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 14 با 1000 رکورد...


پردازش چانک 14: 100%|██████████| 1000/1000 [01:16<00:00, 13.05it/s]


✅ چانک 14 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 15 با 1000 رکورد...


پردازش چانک 15: 100%|██████████| 1000/1000 [01:11<00:00, 14.00it/s]


✅ چانک 15 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 16 با 1000 رکورد...


پردازش چانک 16: 100%|██████████| 1000/1000 [01:10<00:00, 14.26it/s]


✅ چانک 16 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 17 با 1000 رکورد...


پردازش چانک 17: 100%|██████████| 1000/1000 [01:12<00:00, 13.84it/s]


✅ چانک 17 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 18 با 1000 رکورد...


پردازش چانک 18: 100%|██████████| 1000/1000 [01:09<00:00, 14.30it/s]


✅ چانک 18 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 19 با 1000 رکورد...


پردازش چانک 19: 100%|██████████| 1000/1000 [01:08<00:00, 14.56it/s]


✅ چانک 19 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 20 با 1000 رکورد...


پردازش چانک 20: 100%|██████████| 1000/1000 [01:05<00:00, 15.22it/s]


✅ چانک 20 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 21 با 1000 رکورد...


پردازش چانک 21: 100%|██████████| 1000/1000 [01:08<00:00, 14.66it/s]


✅ چانک 21 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 22 با 1000 رکورد...


پردازش چانک 22: 100%|██████████| 1000/1000 [01:13<00:00, 13.62it/s]


✅ چانک 22 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 23 با 1000 رکورد...


پردازش چانک 23: 100%|██████████| 1000/1000 [01:12<00:00, 13.70it/s]


✅ چانک 23 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 24 با 1000 رکورد...


پردازش چانک 24: 100%|██████████| 1000/1000 [01:12<00:00, 13.84it/s]


✅ چانک 24 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 25 با 1000 رکورد...


پردازش چانک 25: 100%|██████████| 1000/1000 [01:18<00:00, 12.77it/s]


✅ چانک 25 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 26 با 1000 رکورد...


پردازش چانک 26: 100%|██████████| 1000/1000 [01:07<00:00, 14.82it/s]


✅ چانک 26 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 27 با 1000 رکورد...


پردازش چانک 27: 100%|██████████| 1000/1000 [01:15<00:00, 13.25it/s]


✅ چانک 27 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 28 با 1000 رکورد...


پردازش چانک 28: 100%|██████████| 1000/1000 [01:27<00:00, 11.47it/s]


✅ چانک 28 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 29 با 1000 رکورد...


پردازش چانک 29: 100%|██████████| 1000/1000 [01:05<00:00, 15.30it/s]


✅ چانک 29 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 30 با 1000 رکورد...


پردازش چانک 30: 100%|██████████| 1000/1000 [01:13<00:00, 13.57it/s]


✅ چانک 30 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 31 با 1000 رکورد...


پردازش چانک 31: 100%|██████████| 1000/1000 [01:10<00:00, 14.19it/s]


✅ چانک 31 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 32 با 1000 رکورد...


پردازش چانک 32: 100%|██████████| 1000/1000 [01:04<00:00, 15.56it/s]


✅ چانک 32 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 33 با 1000 رکورد...


پردازش چانک 33: 100%|██████████| 1000/1000 [01:06<00:00, 15.02it/s]


✅ چانک 33 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 34 با 1000 رکورد...


پردازش چانک 34: 100%|██████████| 1000/1000 [01:52<00:00,  8.90it/s]


✅ چانک 34 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 35 با 1000 رکورد...


پردازش چانک 35: 100%|██████████| 1000/1000 [01:09<00:00, 14.42it/s]


✅ چانک 35 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 36 با 1000 رکورد...


پردازش چانک 36: 100%|██████████| 1000/1000 [01:08<00:00, 14.62it/s]


✅ چانک 36 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 37 با 1000 رکورد...


پردازش چانک 37: 100%|██████████| 1000/1000 [01:15<00:00, 13.31it/s]


✅ چانک 37 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 38 با 1000 رکورد...


پردازش چانک 38: 100%|██████████| 1000/1000 [01:12<00:00, 13.87it/s]


✅ چانک 38 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 39 با 1000 رکورد...


پردازش چانک 39: 100%|██████████| 1000/1000 [01:12<00:00, 13.72it/s]


✅ چانک 39 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 40 با 1000 رکورد...


پردازش چانک 40: 100%|██████████| 1000/1000 [01:18<00:00, 12.68it/s]


✅ چانک 40 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 41 با 1000 رکورد...


پردازش چانک 41: 100%|██████████| 1000/1000 [01:09<00:00, 14.46it/s]


✅ چانک 41 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 42 با 1000 رکورد...


پردازش چانک 42: 100%|██████████| 1000/1000 [01:12<00:00, 13.87it/s]


✅ چانک 42 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 43 با 1000 رکورد...


پردازش چانک 43: 100%|██████████| 1000/1000 [01:14<00:00, 13.43it/s]


✅ چانک 43 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 44 با 1000 رکورد...


پردازش چانک 44: 100%|██████████| 1000/1000 [01:11<00:00, 14.04it/s]


✅ چانک 44 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 45 با 1000 رکورد...


پردازش چانک 45: 100%|██████████| 1000/1000 [01:13<00:00, 13.62it/s]


✅ چانک 45 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 46 با 1000 رکورد...


پردازش چانک 46: 100%|██████████| 1000/1000 [01:13<00:00, 13.61it/s]


✅ چانک 46 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 47 با 1000 رکورد...


پردازش چانک 47: 100%|██████████| 1000/1000 [01:09<00:00, 14.32it/s]


✅ چانک 47 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 48 با 1000 رکورد...


پردازش چانک 48: 100%|██████████| 1000/1000 [01:11<00:00, 13.91it/s]


✅ چانک 48 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 49 با 1000 رکورد...


پردازش چانک 49: 100%|██████████| 1000/1000 [01:04<00:00, 15.58it/s]


✅ چانک 49 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 50 با 1000 رکورد...


پردازش چانک 50: 100%|██████████| 1000/1000 [01:05<00:00, 15.37it/s]


✅ چانک 50 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 51 با 1000 رکورد...


پردازش چانک 51: 100%|██████████| 1000/1000 [01:21<00:00, 12.29it/s]


✅ چانک 51 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 52 با 1000 رکورد...


پردازش چانک 52: 100%|██████████| 1000/1000 [01:32<00:00, 10.82it/s]


✅ چانک 52 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 53 با 1000 رکورد...


پردازش چانک 53: 100%|██████████| 1000/1000 [01:13<00:00, 13.56it/s]


✅ چانک 53 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 54 با 1000 رکورد...


پردازش چانک 54: 100%|██████████| 1000/1000 [01:07<00:00, 14.92it/s]


✅ چانک 54 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 55 با 1000 رکورد...


پردازش چانک 55: 100%|██████████| 1000/1000 [01:10<00:00, 14.19it/s]


✅ چانک 55 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 56 با 1000 رکورد...


پردازش چانک 56: 100%|██████████| 1000/1000 [01:08<00:00, 14.60it/s]
پردازش چانک 57: 100%|██████████| 1000/1000 [01:16<00:00, 13.01it/s]


✅ چانک 57 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 58 با 1000 رکورد...


پردازش چانک 58: 100%|██████████| 1000/1000 [01:07<00:00, 14.92it/s]


✅ چانک 58 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 59 با 1000 رکورد...


پردازش چانک 59: 100%|██████████| 1000/1000 [01:15<00:00, 13.32it/s]


✅ چانک 59 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 60 با 1000 رکورد...


پردازش چانک 60: 100%|██████████| 1000/1000 [01:13<00:00, 13.60it/s]


✅ چانک 60 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 61 با 1000 رکورد...


پردازش چانک 61: 100%|██████████| 1000/1000 [01:12<00:00, 13.78it/s]


✅ چانک 61 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 62 با 1000 رکورد...


پردازش چانک 62: 100%|██████████| 1000/1000 [01:15<00:00, 13.20it/s]


✅ چانک 62 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 63 با 1000 رکورد...


پردازش چانک 63: 100%|██████████| 1000/1000 [01:12<00:00, 13.80it/s]


✅ چانک 63 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 64 با 1000 رکورد...


پردازش چانک 64: 100%|██████████| 1000/1000 [01:07<00:00, 14.85it/s]


✅ چانک 64 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 65 با 1000 رکورد...


پردازش چانک 65: 100%|██████████| 1000/1000 [01:43<00:00,  9.63it/s]


✅ چانک 65 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 66 با 1000 رکورد...


پردازش چانک 66: 100%|██████████| 1000/1000 [01:10<00:00, 14.26it/s]


✅ چانک 66 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 67 با 1000 رکورد...


پردازش چانک 67: 100%|██████████| 1000/1000 [01:16<00:00, 13.12it/s]


✅ چانک 67 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 68 با 1000 رکورد...


پردازش چانک 68: 100%|██████████| 1000/1000 [01:07<00:00, 14.88it/s]


✅ چانک 68 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 69 با 1000 رکورد...


پردازش چانک 69: 100%|██████████| 1000/1000 [01:19<00:00, 12.54it/s]


✅ چانک 69 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 70 با 1000 رکورد...


پردازش چانک 70: 100%|██████████| 1000/1000 [01:13<00:00, 13.54it/s]


✅ چانک 70 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 71 با 1000 رکورد...


پردازش چانک 71: 100%|██████████| 1000/1000 [01:10<00:00, 14.15it/s]


✅ چانک 71 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 72 با 1000 رکورد...


پردازش چانک 72: 100%|██████████| 1000/1000 [01:09<00:00, 14.42it/s]


✅ چانک 72 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 73 با 1000 رکورد...


پردازش چانک 73: 100%|██████████| 1000/1000 [01:07<00:00, 14.82it/s]


✅ چانک 73 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 74 با 1000 رکورد...


پردازش چانک 74: 100%|██████████| 1000/1000 [01:16<00:00, 13.07it/s]


✅ چانک 74 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 75 با 1000 رکورد...


پردازش چانک 75: 100%|██████████| 1000/1000 [01:32<00:00, 10.76it/s]


✅ چانک 75 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 76 با 1000 رکورد...


پردازش چانک 76: 100%|██████████| 1000/1000 [01:06<00:00, 15.14it/s]


✅ چانک 76 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 77 با 1000 رکورد...


پردازش چانک 77: 100%|██████████| 1000/1000 [01:19<00:00, 12.50it/s]


✅ چانک 77 با 1000 رکورد پردازش و به فایل CSV اضافه شد
پردازش چانک 78 با 224 رکورد...


پردازش چانک 78: 100%|██████████| 224/224 [00:18<00:00, 12.13it/s]


✅ چانک 78 با 224 رکورد پردازش و به فایل CSV اضافه شد

پردازش 77224 رکورد در 78 چانک به پایان رسید
فایل CSV در /content/drive/MyDrive/Doukt/Goftino/NLP/colab/embedd/embeddings.csv ذخیره شد

در حال تبدیل فایل CSV به Parquet...


تبدیل به Parquet: 14it [16:06, 107.91s/it]