In [1]:
import os
import json5
from tqdm import tqdm
import boto3
import yaml
from datetime import datetime
from botocore.exceptions import NoCredentialsError, ClientError

In [2]:
print("Current working directory:", os.getcwd())

Current working directory: C:\github_repos\BIU_LLM_Project


In [3]:
def load_config(config_file):
    # Load configuration from the YAML file
    with open(config_file, 'r') as file:
        config = yaml.safe_load(file)
    return config

In [4]:
# Load configuration
config_file = 'config/config.yaml'
config = load_config(config_file)

In [5]:
def write_log(log_file_name, log_text, config):
    # Extract parameters from the configuration
    region_name = config['aws']['region_name']
    log_bucket_name = config['aws']['log_bucket_name']
    log_path = config['aws']['log_path']
    aws_access_key_id = config['aws']['aws_access_key_id']
    aws_secret_access_key = config['aws']['aws_secret_access_key']

    # Create an S3 client with the specified credentials
    s3_client = boto3.client(
        's3',
        aws_access_key_id=aws_access_key_id,
        aws_secret_access_key=aws_secret_access_key,
        region_name=region_name
    )

    # Construct the S3 key for the log file
    s3_key = f"{log_path}/{log_file_name}"

    # Get the current system time
    current_time = datetime.now().strftime("%Y/%m/%d %H:%M:%S")

    # Create a CSV row with the current time and log text
    log_row = [current_time, log_text]
    
    # Try to download the existing log file, if it exists
    try:
        # Read the existing log file from S3
        response = s3_client.get_object(Bucket=log_bucket_name, Key=s3_key)
        existing_log = response['Body'].read().decode('utf-8')
        
        # Append the new log row to the existing log content
        log_content = existing_log + "\n" + ",".join(log_row)

    except s3_client.exceptions.NoSuchKey:
        # If the file does not exist, create a new log content with headers
        log_content = "Start Log\n" + ",".join(log_row)

    # Write the updated log content back to S3
    try:
        # Convert log content to bytes and upload it
        s3_client.put_object(Bucket=log_bucket_name, Key=s3_key, Body=log_content.encode('utf-8'))
        #print(f"Log entry added to {log_bucket_name}/{s3_key}")
    except (NoCredentialsError, ClientError) as e:
        print(f"Failed to write log entry to {log_bucket_name}/{s3_key}: {e}") 

In [6]:
def upload_folders_to_s3(folder_name, config):
    # Extract parameters from the configuration
    region_name = config['aws']['region_name']
    upload_bucket_name = config['aws']['upload_bucket_name']
    upload_path = config['aws']['upload_path']
    aws_access_key_id = config['aws']['aws_access_key_id']
    aws_secret_access_key = config['aws']['aws_secret_access_key']
    
    # Create an S3 client with the specified credentials
    s3_client = boto3.client(
        's3',
        aws_access_key_id=aws_access_key_id,
        aws_secret_access_key=aws_secret_access_key,
        region_name=region_name
    )

    # Progress bar class for tracking each file
    class ProgressPercentage(object):
        def __init__(self, filename):
            self._filename = filename
            self._seen_so_far = 0
            self._total = os.path.getsize(filename)
            # Initialize the tqdm progress bar for the current file
            print(f"Uploading {filename}:")
            self._pbar = tqdm(total=self._total, unit='B', unit_scale=True)

        def __call__(self, bytes_amount):
            # Update progress
            self._seen_so_far += bytes_amount
            self._pbar.update(bytes_amount)
            # Close the progress bar when done
            if self._seen_so_far >= self._total:
                self._pbar.close()

    # Traverse through all files and subfolders in the given folder
    for root, dirs, files in os.walk(folder_name):
        for file in files:
            # Full path of the file
            local_file_path = os.path.join(root, file)
            
            # Construct the S3 key by replacing the base folder path with the upload_path in S3
            relative_path = os.path.relpath(local_file_path, folder_name)
            s3_key = os.path.join(upload_path, relative_path).replace("\\", "/")
            try:
                # Upload the file with progress callback
                s3_client.upload_file(
                    local_file_path,
                    upload_bucket_name,
                    s3_key,
                    Callback=ProgressPercentage(local_file_path)
                )
                # Log the successful upload
                log_text = f"{upload_bucket_name},{s3_key},{file},Success"
                write_log("upload.csv", log_text, config)
            except FileNotFoundError:
                print(f"The file {local_file_path} was not found")
                # Log the failure
                log_text = f"{upload_bucket_name},{s3_key},{file},FileNotFoundError"
                write_log("upload.csv", log_text, config)
            except NoCredentialsError:
                print("Credentials not available")
                # Log the failure
                log_text = f"{upload_bucket_name},{s3_key},{file},NoCredentialsError"
                write_log("upload.csv", log_text, config)
            except ClientError as e:
                print(f"Failed to upload {local_file_path} to {upload_bucket_name}/{s3_key}: {e}")
                # Log the failure with error message
                log_text = f"{upload_bucket_name},{s3_key},{file},ClientError: {e}"
                write_log("upload.csv", log_text, config)
            print()

In [7]:
# Load configuration
config_file = 'config/config.yaml'
config = load_config(config_file)

In [8]:
# call the folder upload function
folder_name = config['local']['source_folder_name']

upload_folders_to_s3(folder_name, config)

Uploading L:/My Drive/Source_Files\lior_test.txt:


100%|████████████████████████████████████████████████████████████████████████████████| 27.0/27.0 [00:00<00:00, 90.8B/s]



Uploading L:/My Drive/Source_Files\desktop.ini:


100%|█████████████████████████████████████████████████████████████████████████████████| 244/244 [00:00<00:00, 6.56kB/s]



Uploading L:/My Drive/Source_Files\JPG\AWS Solution Architect Sylabus.jpg:


100%|█████████████████████████████████████████████████████████████████████████████| 1.23M/1.23M [00:00<00:00, 11.7MB/s]



Uploading L:/My Drive/Source_Files\JPG\CISSP Sylabus.jpg:


100%|█████████████████████████████████████████████████████████████████████████████| 2.63M/2.63M [00:00<00:00, 21.4MB/s]



Uploading L:/My Drive/Source_Files\JPG\CC Sylabus.jpg:


100%|█████████████████████████████████████████████████████████████████████████████| 2.16M/2.16M [00:00<00:00, 30.5MB/s]



Uploading L:/My Drive/Source_Files\JPG\AWS Practitioner Sylabus.jpg:


100%|█████████████████████████████████████████████████████████████████████████████| 3.22M/3.22M [00:00<00:00, 24.7MB/s]



Uploading L:/My Drive/Source_Files\JPG\FinOps Sylabus.jpg:


100%|█████████████████████████████████████████████████████████████████████████████| 1.30M/1.30M [00:00<00:00, 15.0MB/s]



Uploading L:/My Drive/Source_Files\JPG\CCNA Sylabus.jpg:


100%|█████████████████████████████████████████████████████████████████████████████| 1.35M/1.35M [00:00<00:00, 9.65MB/s]



Uploading L:/My Drive/Source_Files\JPG\DPO Sylabus.jpg:


100%|█████████████████████████████████████████████████████████████████████████████| 2.62M/2.62M [00:00<00:00, 24.5MB/s]



Uploading L:/My Drive/Source_Files\JPG\CCSP Sylabus.jpg:


100%|█████████████████████████████████████████████████████████████████████████████| 2.10M/2.10M [00:00<00:00, 13.4MB/s]



Uploading L:/My Drive/Source_Files\JPG\Fortinet NSE Sylabus.jpg:


100%|█████████████████████████████████████████████████████████████████████████████| 1.08M/1.08M [00:00<00:00, 11.6MB/s]



Uploading L:/My Drive/Source_Files\JPG\desktop.ini:


100%|█████████████████████████████████████████████████████████████████████████████████| 244/244 [00:00<00:00, 8.50kB/s]



Uploading L:/My Drive/Source_Files\DOC\BI Fin Ops Sylabus.docx:


100%|█████████████████████████████████████████████████████████████████████████████| 3.76M/3.76M [00:00<00:00, 26.2MB/s]



Uploading L:/My Drive/Source_Files\DOC\DevSecOps Sylabus.docx:


100%|█████████████████████████████████████████████████████████████████████████████| 2.07M/2.07M [00:00<00:00, 19.2MB/s]



Uploading L:/My Drive/Source_Files\DOC\DMP Sylabus.docx:


100%|█████████████████████████████████████████████████████████████████████████████| 1.38M/1.38M [00:00<00:00, 9.99MB/s]



Uploading L:/My Drive/Source_Files\DOC\Product Management Sylabus.docx:


100%|█████████████████████████████████████████████████████████████████████████████| 1.74M/1.74M [00:00<00:00, 16.0MB/s]



Uploading L:/My Drive/Source_Files\DOC\Data Science Sylabus.docx:


100%|█████████████████████████████████████████████████████████████████████████████| 1.76M/1.76M [00:00<00:00, 16.4MB/s]



Uploading L:/My Drive/Source_Files\DOC\QA Sylabus.docx:


100%|█████████████████████████████████████████████████████████████████████████████| 2.27M/2.27M [00:00<00:00, 29.3MB/s]



Uploading L:/My Drive/Source_Files\DOC\CDAIO-CDO Sylabus.docx:


100%|█████████████████████████████████████████████████████████████████████████████| 5.08M/5.08M [00:00<00:00, 44.2MB/s]



Uploading L:/My Drive/Source_Files\DOC\CND Sylabus.docx:


100%|█████████████████████████████████████████████████████████████████████████████| 6.17M/6.17M [00:00<00:00, 36.7MB/s]



Uploading L:/My Drive/Source_Files\DOC\CISO Sylabus.docx:


100%|█████████████████████████████████████████████████████████████████████████████| 1.37M/1.37M [00:00<00:00, 12.9MB/s]



Uploading L:/My Drive/Source_Files\DOC\desktop.ini:


100%|█████████████████████████████████████████████████████████████████████████████████| 244/244 [00:00<00:00, 8.61kB/s]



Uploading L:/My Drive/Source_Files\PDF\CDAIO-CDO Intro.pdf:


100%|█████████████████████████████████████████████████████████████████████████████| 2.53M/2.53M [00:00<00:00, 16.8MB/s]



Uploading L:/My Drive/Source_Files\PDF\BI Fin Ops Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 699k/699k [00:00<00:00, 5.79MB/s]



Uploading L:/My Drive/Source_Files\PDF\CDAIO-CDO Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 900k/900k [00:00<00:00, 8.47MB/s]



Uploading L:/My Drive/Source_Files\PDF\QA Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 753k/753k [00:00<00:00, 7.47MB/s]



Uploading L:/My Drive/Source_Files\PDF\Product Management Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 815k/815k [00:00<00:00, 13.7MB/s]



Uploading L:/My Drive/Source_Files\PDF\DS & AI for Managers Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 112k/112k [00:00<00:00, 1.26MB/s]



Uploading L:/My Drive/Source_Files\PDF\CISCO CCNA Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 214k/214k [00:00<00:00, 2.17MB/s]



Uploading L:/My Drive/Source_Files\PDF\Check Point CCSA Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 168k/168k [00:00<00:00, 1.68MB/s]



Uploading L:/My Drive/Source_Files\PDF\Data Science Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 735k/735k [00:00<00:00, 5.67MB/s]



Uploading L:/My Drive/Source_Files\PDF\DMP Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 583k/583k [00:00<00:00, 10.2MB/s]



Uploading L:/My Drive/Source_Files\PDF\DevSecOps Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 873k/873k [00:00<00:00, 7.73MB/s]



Uploading L:/My Drive/Source_Files\PDF\CND Sylabus.pdf:


100%|█████████████████████████████████████████████████████████████████████████████| 1.14M/1.14M [00:00<00:00, 9.16MB/s]



Uploading L:/My Drive/Source_Files\PDF\CISO Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 832k/832k [00:00<00:00, 5.92MB/s]



Uploading L:/My Drive/Source_Files\PDF\Advanced Project Management Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 127k/127k [00:00<00:00, 2.85MB/s]



Uploading L:/My Drive/Source_Files\PDF\FinOps Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 184k/184k [00:00<00:00, 2.42MB/s]



Uploading L:/My Drive/Source_Files\PDF\AWS Solution Architect Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 200k/200k [00:00<00:00, 1.80MB/s]



Uploading L:/My Drive/Source_Files\PDF\AWS Practitioner Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 147k/147k [00:00<00:00, 1.79MB/s]



Uploading L:/My Drive/Source_Files\PDF\CC Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 152k/152k [00:00<00:00, 2.19MB/s]



Uploading L:/My Drive/Source_Files\PDF\CCNA Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 209k/209k [00:00<00:00, 2.54MB/s]



Uploading L:/My Drive/Source_Files\PDF\CCSP Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 169k/169k [00:00<00:00, 2.16MB/s]



Uploading L:/My Drive/Source_Files\PDF\CISSP Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 185k/185k [00:00<00:00, 1.36MB/s]



Uploading L:/My Drive/Source_Files\PDF\DPO Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 153k/153k [00:00<00:00, 3.79MB/s]



Uploading L:/My Drive/Source_Files\PDF\Fortinet NSE Sylabus.pdf:


100%|███████████████████████████████████████████████████████████████████████████████| 188k/188k [00:00<00:00, 1.95MB/s]



Uploading L:/My Drive/Source_Files\PDF\desktop.ini:


100%|█████████████████████████████████████████████████████████████████████████████████| 244/244 [00:00<00:00, 9.71kB/s]



