# RPA

## Settings

#### Environment Variables

In [12]:
# To avoid alert pop up, need to set security module path
SECURE_MODULE_PATH = "./security_module/FilePathCheckerModuleExample.dll"       
REGISTERY_KEY_NAME = "AutomationModule"     

# Directory
INPUT_DIR = "./input"   
TEMP_DIR = "./output/temp"  
OUPUT_DIR = "./output"

LIST_FILE_PATH = "./input/Mapping.txt"                                          

#### Load Libraries

In [13]:
import pandas as pd
from tqdm import tqdm
import os
from rpa import RPA     # custom module

#### RPA Module

- craete rpa instance
- remove cache

In [14]:
rpa = RPA()
rpa.remove_cache("C:\\Users\\N\\AppData\\Local\\Temp\\gen_py")

#### Create Folders

In [15]:
for dir in [TEMP_DIR, OUPUT_DIR]:
    os.makedirs(dir, exist_ok=True)

### Read Mapping List

#### Mapping List

In [16]:
df = pd.read_csv(LIST_FILE_PATH, sep='\t')
print(f"{df.shape[0]} rows are loaded")
df.head()

14 rows are loaded


Unnamed: 0,주계약상품명,주계약파일명,독립특약상품명,독립특약파일명
0,무배당 알파Plus보장보험,"001_6ACIO,6ACIP_무배당 알파Plus보장보험2401_사업방법서 별지_v1...",무배당 갱신형 암 검사및치료추가보장 특별약관,"001_6ACNB,6ACNC_무배당 갱신형 암 검사및치료추가보장 특별약관2401_사..."
1,무배당 알파Plus보장보험,"001_6ACIO,6ACIP_무배당 알파Plus보장보험2401_사업방법서 별지_v1...",무배당 3대질병진단비보장(A) 특별약관,"001_6ACND,6ACNE_무배당 3대질병진단비보장(A) 특별약관2401_사업방법..."
2,무배당 알파Plus보장보험,"001_6ACIO,6ACIP_무배당 알파Plus보장보험2401_사업방법서 별지_v1...","무배당 수술비(1_7종, 연간3회한)(질병)보장 특별약관","001_6ACOH-L_무배당 수술비(1~7종, 연간3회한)(질병)보장 특별약관240..."
3,무배당 알파Plus보장보험,"001_6ACIO,6ACIP_무배당 알파Plus보장보험2401_사업방법서 별지_v1...",무배당 2대질환수술비보장 특별약관,001_6ACOS-OW_무배당 2대질환수술비보장 특별약관2401_사업방법서 별지_v...
4,무배당 알파Plus보장보험,"001_6ACIO,6ACIP_무배당 알파Plus보장보험2401_사업방법서 별지_v1...",무배당 갱신형 간병인지원 일반상해입원일당(Ⅱ)(1일이상 180일한도)보장 특별약관,001_6ACLX-Z_무배당 갱신형 간병인지원 일반상해입원일당(Ⅱ)(1일이상 180...


In [17]:
fn_dict = {}
for row in df[['주계약상품명', '주계약파일명']].values:
    fn_dict[row[0]] = row[1]
for row in df[['독립특약상품명', '독립특약파일명']].values:
    fn_dict[row[0]] = row[1]

In [18]:
prod_mapping = {}
df = df[['주계약상품명', '독립특약상품명']]
for row in df.values:
    main_prod, ind_prod = row
    if not main_prod in prod_mapping.keys():
        prod_mapping[main_prod] = [main_prod]
    if ind_prod != '-':
        prod_mapping[main_prod].append(ind_prod)

In [19]:
print(fn_dict)
print("\n")
print(prod_mapping)

{'무배당 알파Plus보장보험': '001_6ACIO,6ACIP_무배당 알파Plus보장보험2401_사업방법서 별지_v1.0.hwp', '무배당 갱신형 암 검사및치료추가보장 특별약관': '001_6ACNB,6ACNC_무배당 갱신형 암 검사및치료추가보장 특별약관2401_사업방법서 별지_v1.0.hwp', '무배당 3대질병진단비보장(A) 특별약관': '001_6ACND,6ACNE_무배당 3대질병진단비보장(A) 특별약관2401_사업방법서 별지_v1.0.hwp', '무배당 수술비(1_7종, 연간3회한)(질병)보장 특별약관': '001_6ACOH-L_무배당 수술비(1~7종, 연간3회한)(질병)보장 특별약관2401_사업방법서 별지_v1.0.hwp', '무배당 2대질환수술비보장 특별약관': '001_6ACOS-OW_무배당 2대질환수술비보장 특별약관2401_사업방법서 별지_v1.0.hwp', '무배당 갱신형 간병인지원 일반상해입원일당(Ⅱ)(1일이상 180일한도)보장 특별약관': '001_6ACLX-Z_무배당 갱신형 간병인지원 일반상해입원일당(Ⅱ)(1일이상 180일한도)보장 특별약관2401_사업방법서별지_v1.0.hwp', '무배당 갱신형 간병인지원 질병입원일당(Ⅱ)(1일이상 180일한도)보장 특별약관': '001_6ACMA-C_무배당 갱신형 간병인지원 질병입원일당(Ⅱ)(1일이상 180일한도)보장 특별약관2401_사업방법서별지_v1.0.hwp', '무배당 가전제품 고장수리비용보장 특별약관': '001_6ACMF,G_무배당 가전제품 고장수리비용보장 특별약관2401_사업방법서별지_v1.0.hwp', '무배당 갱신형 산정특례 진단비보장 특별약관': '001_6ACQG,6ACQH,6ACQI_무배당 갱신형 산정특례 진단비보장 특별약관2401_사업방법서 별지_v1.0.hwp', '무배당 갱신형 6대심장질환진단비보장 특별약관': '001_6ACQZ_무배당 갱신형 6대심장질환진단비보장 특별약관2401_사업방법서별지_v1.0.hwp', '무배당 운전자 비용 및 상해보장 특별약관': '001_6

## RPA Job

#### Check Whether Document Exists Or Not 

In [20]:
for (prod_name, file_name) in fn_dict.items():
    if not os.path.exists(f"{INPUT_DIR}/{file_name}"):
        raise FileNotFoundError(f"[ERROR] No document for [{prod_name}]")

#### Convert hwp doc to pdf

In [21]:
for prod_name in tqdm(fn_dict):

    # path to save pdf
    file_name = fn_dict[prod_name]
    file_path = f"{INPUT_DIR}/{file_name}"
    save_path = f"{TEMP_DIR}/{file_name}".replace('hwp', 'pdf')

    # open hwp document
    hwp_doc = rpa.open_hwp_doc(file_path, is_visible=True)

    # change its color to black
    rpa.change_text_color(hwp_doc)

    # convet from hwp to pdf and save it
    rpa.convert_hwp_to_pdf(hwp_doc, save_path)

    # close hwp document without save
    rpa.close_hwp_doc(hwp_doc)

100%|██████████| 15/15 [01:15<00:00,  5.03s/it]


#### Merge Pdf

In [23]:
for main_prod in tqdm(prod_mapping):
    pdf_files = [f'{TEMP_DIR}/{fn_dict[prod_name]}'.replace('hwp', 'pdf')  for prod_name in prod_mapping[main_prod]]
    pdf_files = [os.path.abspath(pf) for pf in pdf_files]
    rpa.merge_pdf(save_file_path=f'{OUPUT_DIR}/{main_prod}.pdf', pdf_files=pdf_files)

100%|██████████| 1/1 [00:00<00:00,  1.11it/s]


$ The \quad End $