In [None]:
import subprocess
import sys
import os
import papermill as pm
import re
import time

REMOTE_FOLDER = "excel files" # 클라우드 폴더명
LOCAL_FOLDER = "C:/GoogleCloud" #로컬 엑셀파일 저장경로
TEMPLATE_NOTEBOOK = "C:/jupyter_project/ipynb_folder(papermill)/template.ipynb" # 템플릿 쥬피터파일 




def get_new_files(remote_folder, local_folder):
    """
클라우드 폴더로부터 새로 업로드된 엑셀파일을 감지 및 리스트 추출
    """

    #  클라우드 폴더에 있는 csv파일리스트 추출
    list_cloud = subprocess.run(
        ["C:/rclone/rclone", "lsf", f"remote:{remote_folder}"],
        capture_output=True,
        text=True,
    )
    
    cloud_directories =[i for i in list_cloud.stdout.split('\n') if re.search('.csv$',i)]
    
    

    # 로컬폴더에 있는 파트리스트 추출 (LOCAL_FOLDER)
    list_local = subprocess.run(
        ["C:/rclone/rclone","lsf", local_folder], capture_output=True, text=True
    )
    
    local_directories =[i for i in list_local.stdout.split('\n') if i] 
    
    

    # 일치하지 않는 파일 리스트 추출
    new_files = list(set(cloud_directories).difference(set(local_directories))) #차집합
#     new_files = list(set(cloud_directories) - set(local_directories))
    
    
    
    return new_files #클라우드 폴더에 새로 업로드 된 파일리스트 리턴






def sync_directories(remote_folder, local_folder):
    """
    클라우드 폴더와 로컬폴더를 동기화시켜 두 폴더간의 파일을 일치시킨다. (클라우드폴더는 수정되지않는다.)
    """
    sync = subprocess.run(
        ["C:/rclone/rclone", "sync", f"remote:{remote_folder}", local_folder]
    )

    print("Syncing local directory with cloud....")
    return sync.returncode






def run_notebook(excel_report):
    """
새로 업로드된 csv파일을 쥬피터파일(ipynb)을 생성
    """
    
    notebook_template = os.path.split(TEMPLATE_NOTEBOOK)[0]  # 템플릿 디렉터리 추출


    excel_report_path = LOCAL_FOLDER+'/'+ excel_report      ## csv파일 저장경로 설정 , C:/GoogleCloud/sales_february_test1.xlsx


    file_name = excel_report.split(".")[0]          ## csv파일명 추출

    notebook_tamplate_path = notebook_template+'/'+file_name+'.ipynb'   ## 쥬피터파일(ipynb) 저장경로 , C:/jupyter_project/ipynb_folder(papermill)/sales_february_test1.ipynb


    # papermill 기능 실행. 템플릿 코드,데이터를 기반으로 새로운 쥬피터파일을 생성

    pm.execute_notebook(
        TEMPLATE_NOTEBOOK,
        notebook_tamplate_path,
        parameters=dict(filename=excel_report_path)
    )


    return notebook_tamplate_path   #쥬피터파일 저장경로 리턴

    
    




def generate_html_report(notebook_tamplate_path):
    """
    쥬피터파일을 html파일로 변환
    """
    #nbconvert 프로그램을 사용하여 쥬피터 파일을 html파일로 변환
    generate = subprocess.run(
        ["jupyter", "nbconvert", notebook_tamplate_path, "--to=html"]
    )
    print("HTML Report was generated")
    
    html_path =notebook_tamplate_path.split('.')[0] + '.html' # html파일 저장경로
    
    
    return html_path # html파일 저장경로 리턴





def push_to_cloud(remote_folder, html_path):
    """
    html파일을 클라우드폴더로 push하는 함수.
    """
    # html파일을 클라우드 폴더로 copy
    push = subprocess.run(
        ["C:/rclone/rclone", "copy", html_path, f"remote:{remote_folder}"]
    )
    print("Report Published!!!")



while True:
    
    new_files = get_new_files( remote_folder=REMOTE_FOLDER, local_folder=LOCAL_FOLDER ) #새로업로드된 csv파일 리스트 추출



    if not new_files:
        print("Everything is synced. No new files.")
#         sys.exit()


    else:

        for new_file in new_files: # csv파일리스트를 순서대로 연동작업

            print("There are files missing.")
            print(new_file)


            # 로컬 디렉터리와 클라우드 폴더의 동기화 . 로컬 디렉터리의 파일을 클라우드 폴더 파일과 일치시킨다.( 클라우드 폴더파일들은 수정되지않음)
            sync_directories(remote_folder=REMOTE_FOLDER, local_folder=LOCAL_FOLDER)    
        #     subprocess.run( ["C:/rclone/rclone", "copy", f"remote:{REMOTE_FOLDER} --include /*.csv", LOCAL_FOLDER]  ) 

            # 쥬피터파일 생성하고 저장경로를 담는다.
            notebook_path = run_notebook(new_file)

            # html파일을 생성하고 저장경로를 담는다.
            html_path = generate_html_report(notebook_path)


            # html파일을 copy하여 클라우드 폴더에 push.
            push_to_cloud(html_path = html_path, remote_folder=REMOTE_FOLDER)


            print("Updater finished.")
        
    time.sleep(60)

Everything is synced. No new files.
Everything is synced. No new files.
