In [31]:
import numpy as np
import pandas as pd
import openpyxl
from openpyxl.styles import Font, Alignment, PatternFill, Color, Border, Side

import warnings
warnings.filterwarnings('ignore')

## 매뉴얼

#### 순서
1. 각 나라별 틀이 갖춰진 검수할 URL이 적혀있는 엑셀 파일이 필요하다.
2. 검수 Raw파일과 hreflang Raw 파일을 다운로드 하고 각 폴더에 집어 넣는다.
2. 파일명을 알맞게 바꾼다.(저장파일, 검수 Raw, hreflang Raw 파일)
3. 프로그램을 실행한다.

#### 주의사항
1. 검수할 URL주소를 2차, 3차 음성 검색 콘텐츠 라이브 이후 검수(AW).xlsx 파일의 검수 sheet에 URL 주소를 넣는다.
2. 1.URL 구조에서는 ',",.,: 은 잡아낼 수 없다.(나머지 특수기호는 추가하면 됨)
3. 6.twitter 이미지, twitter 카드, Schema(Breadcrumb) 은 글자가 있으면 O, 없으면 X로 거른다.
4. 4.디스크립션, 8.H tag, 10.CTA, 11.내비게이션, 12.콘텐츠는 직접 확인해야 함
5. hreflang은 raw파일에서 X로 표시 된 것을 확인한다.


## 검수 국가 설정

In [4]:
countrys = ["FJ","KW","HK"]

## 경로설정

In [5]:
start_address = "F:/OneDrive/12. 라이브 이후 검수/check file"
raw_address = "F:/OneDrive/12. 라이브 이후 검수/Raw"
href_raw_address = "F:/OneDrive/12. 라이브 이후 검수/Raw/Herflang RAW"
save_address = "F:/OneDrive/12. 라이브 이후 검수"

## 전처리(Raw 데이터 정리)

In [4]:
count_num = 0

for country in countrys:
    # 불러오기 1차(Raw, check Raw, ckeck)
    after_raw = pd.read_excel(raw_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+
                              country+")_Raw.xlsx")
    
    after_check = pd.read_excel(start_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("
                                +country+").xlsx", sheet_name ="검수")
    
    # 불러오기 2차
    after_check_raw_wb = openpyxl.load_workbook(start_address+"/"+
                                                "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    after_check_raw_ws = after_check_raw_wb['검수 Raw']
    
    # 전처리
    for i in range(after_check.shape[0]):
        if i < after_raw.shape[0]:
            url_index = after_raw[after_check['URL'][i] == after_raw['Address']].index[0]
        
            # 1.URL
            after_check_raw_ws['B'+str(i+2)] = after_raw['Address'][url_index]

            # 2.URL 구조
            after_check_raw_ws['C'+str(i+2)] = after_raw['Address'][url_index]

            # 3.캐노니컬
            after_check_raw_ws['D'+str(i+2)] = after_raw['Canonical Link Element 1'][url_index]

            # 4.타이틀
            after_check_raw_ws['E'+str(i+2)] = after_raw['Title 1'][url_index]

            # 5.디스크립션
            after_check_raw_ws['F'+str(i+2)] = after_raw['Meta Description 1'][url_index]
            
            # 6.OG
            after_check_raw_ws['G'+str(i+2)] = after_raw['OG : Site Name 1'][url_index]
            after_check_raw_ws['H'+str(i+2)] = after_raw['OG : Type 1'][url_index]
            after_check_raw_ws['I'+str(i+2)] = after_raw['OG : Title 1'][url_index] 
            after_check_raw_ws['J'+str(i+2)] = after_raw['OG : Description 1'][url_index] 
            after_check_raw_ws['K'+str(i+2)] = after_raw['OG : URL 1'][url_index]

            # 7.Twitter
            after_check_raw_ws['L'+str(i+2)] = after_raw['Twitter : Site 1'][url_index]
            after_check_raw_ws['M'+str(i+2)] = after_raw['Twitter : Title 1'][url_index]
            after_check_raw_ws['N'+str(i+2)] = after_raw['Twitter : Description 1'][url_index]
            after_check_raw_ws['O'+str(i+2)] = after_raw['Twitter : URL 1'][url_index]
            after_check_raw_ws['P'+str(i+2)] = after_raw['Twitter : Image 1'][url_index]
            after_check_raw_ws['Q'+str(i+2)] = after_raw['Twitter : Cards 1'][url_index]

            # 8.Schema
            after_check_raw_ws['R'+str(i+2)] = after_raw['Schema : Name 1'][url_index]
            after_check_raw_ws['S'+str(i+2)] = after_raw['Schema : Description 1'][url_index]
            after_check_raw_ws['T'+str(i+2)] = after_raw['Schema : URL 1'][url_index]
            after_check_raw_ws['U'+str(i+2)] = after_raw['BreadcrumbList 1'][url_index]
            after_check_raw_ws['V'+str(i+2)] = after_raw['Schema : Type Json 1'][url_index]

            # 9.H tag
            after_check_raw_ws['W'+str(i+2)] = after_raw['H1-1'][url_index]
            after_check_raw_ws['X'+str(i+2)] = after_raw['H2-1'][url_index]
            after_check_raw_ws['Y'+str(i+2)] = after_raw['H2-2'][url_index]
            
            # 0.국가명
            after_check_raw_ws['A'+str(i+2)] = country
            
        else :
            break
            
    # 저장
    after_check_raw_wb.save(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")

    # 결과
    count_num += 1
    print(count_num,". {} 의, 검수 Raw 파일 생성이 완료되었습니다.".format(country))

1 . FJ 의, 검수 Raw 파일 생성이 완료되었습니다.
2 . KW 의, 검수 Raw 파일 생성이 완료되었습니다.
3 . HK 의, 검수 Raw 파일 생성이 완료되었습니다.


## 1. URL 구조

In [5]:
count_num = 0

for country in countrys:
    
    # 불러오기 1차
    url_after_check_raw = pd.read_excel(save_address+"/"+
                                        "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx",
                                        sheet_name ="검수 Raw")
    
    # 불러오기 2차
    url_after_check_wb = openpyxl.load_workbook(save_address+"/"+
                                                 "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    url_after_check_ws = url_after_check_wb['검수']

    # 검수
    s_char='=+,#?:^$.@*"※~&%ㆍ!』\‘|()[]<>`…》'
    for i in range(url_after_check_raw.shape[0]):
        url_pre = url_after_check_raw['URL'][i]
        url_pre_1 = url_pre.replace("/","")
        url_pre_2 = url_pre_1.replace("-","")
        url_pre_3 = url_pre_2.replace(".","")
        url_pre_4 = url_pre_3.replace(":","")
        if any(url_string in url_pre_4 for url_string in s_char):
            url_after_check_ws['C'+str(i+2)] = "X"
        else:
            url_after_check_ws['C'+str(i+2)] = "O"
    
    # 저장
    url_after_check_wb.save(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    
    # 결과
    count_num += 1
    print(count_num,". {} 의, URL 구조 항목 검수가 완료되었습니다.".format(country))

1 . FJ 의, URL 구조 항목 검수가 완료되었습니다.
2 . KW 의, URL 구조 항목 검수가 완료되었습니다.
3 . HK 의, URL 구조 항목 검수가 완료되었습니다.


## 2. 캐노니컬

In [6]:
count_num = 0

for country in countrys:
    
    # 불러오기 1차
    cano_after_check_raw = pd.read_excel(save_address+"/"+
                                        "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx",
                                        sheet_name ="검수 Raw")
    
    # 불러오기 2차
    cano_after_check_wb = openpyxl.load_workbook(save_address+"/"+
                                                 "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    cano_after_check_ws = cano_after_check_wb['검수']

    # 검수
    for i in range(cano_after_check_raw.shape[0]):
        cano_equal = cano_after_check_raw['URL'][i] == cano_after_check_raw['캐노니컬'][i]
        if cano_equal == True: 
            cano_after_check_ws['D'+str(i+2)] = "O"
        else:
            cano_after_check_ws['D'+str(i+2)] = "X"
            
    # 저장
    cano_after_check_wb.save(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    
    # 결과
    count_num += 1
    print(count_num,". {} 의, 캐노니컬 항목 검수가 완료되었습니다.".format(country))

1 . FJ 의, 캐노니컬 항목 검수가 완료되었습니다.
2 . KW 의, 캐노니컬 항목 검수가 완료되었습니다.
3 . HK 의, 캐노니컬 항목 검수가 완료되었습니다.


## 3. 타이틀

In [7]:
count_num = 0

for country in countrys:
    
    # 불러오기 1차
    title_after_check_raw = pd.read_excel(save_address+"/"+
                                        "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx",
                                        sheet_name ="검수 Raw")
    
    # 불러오기 2차
    title_after_check_wb = openpyxl.load_workbook(save_address+"/"+
                                                 "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    title_after_check_ws = title_after_check_wb['검수']

    # 검수
    for i in range(title_after_check_raw.shape[0]):
        title_equal = title_after_check_raw['URL'][i]
        title_equal_1 = title_equal.replace("https://www.kia.com/"+country.lower()+"/discover-kia/ask/","")
        title_equal_2 = title_equal_1.replace(".html","")
        title_equal_3 = title_equal_2.replace("-"," ").lower()
        if title_equal_3 in title_after_check_raw['타이틀'][i].lower(): 
            title_after_check_ws['E'+str(i+2)] = "O"
        else:
            title_after_check_ws['E'+str(i+2)] = "X"
            
    # 저장
    title_after_check_wb.save(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    
    # 결과
    count_num += 1
    print(count_num,". {} 의, 타이틀 항목 검수가 완료되었습니다.".format(country))

1 . FJ 의, 타이틀 항목 검수가 완료되었습니다.
2 . KW 의, 타이틀 항목 검수가 완료되었습니다.
3 . HK 의, 타이틀 항목 검수가 완료되었습니다.


## 4. 디스크립션 - 직접 타이틀과 비교해서 진행해야 함

## 5. OG(site name, Type, Title, Description, URL)

In [8]:
count_num = 0

for country in countrys:
    
    # 불러오기 1차
    og_after_check_raw = pd.read_excel(save_address+"/"+
                                        "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx",
                                        sheet_name ="검수 Raw")
    
    # 불러오기 2차
    og_after_check_wb = openpyxl.load_workbook(save_address+"/"+
                                                 "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    og_after_check_ws = og_after_check_wb['검수']

    # Site name 검수
    for i in range(og_after_check_raw.shape[0]):
        if og_after_check_raw['OG(Site name)'][i].lower() in og_after_check_raw['타이틀'][i].lower():
            og_after_check_ws['G'+str(i+2)] = "O"
        else:
            og_after_check_ws['G'+str(i+2)] = "X"
            
    # Type 검수
    for i in range(og_after_check_raw.shape[0]):
        if og_after_check_raw['OG(Type)'][i] == 'website':
            og_after_check_ws['H'+str(i+2)] = "O"
        else:
            og_after_check_ws['H'+str(i+2)] = "X"
    
    # Title 검수
    for i in range(og_after_check_raw.shape[0]):
        if og_after_check_raw['OG(Title)'][i] == og_after_check_raw['타이틀'][i]:
            og_after_check_ws['I'+str(i+2)] = "O"
        else:
            og_after_check_ws['I'+str(i+2)] = "X"
    
    # Description 검수
    for i in range(og_after_check_raw.shape[0]):
        if og_after_check_raw['OG(Description)'][i] == og_after_check_raw['디스크립션'][i]:
            og_after_check_ws['J'+str(i+2)] = "O"
        else:
            og_after_check_ws['J'+str(i+2)] = "X"
    
    # URL 검수
    for i in range(og_after_check_raw.shape[0]):
        if og_after_check_raw['OG(URL)'][i] == og_after_check_raw['URL'][i]:
            og_after_check_ws['K'+str(i+2)] = "O"
        else:
            og_after_check_ws['K'+str(i+2)] = "X"
    
    # 저장
    og_after_check_wb.save(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    
    # 결과
    count_num += 1
    print(count_num,". {} 의, OG 항목 검수가 완료되었습니다.".format(country))

1 . FJ 의, OG 항목 검수가 완료되었습니다.
2 . KW 의, OG 항목 검수가 완료되었습니다.
3 . HK 의, OG 항목 검수가 완료되었습니다.


## 6. Twitter(Site, Title, Description, URL, Image, Twitter Card)

In [9]:
count_num = 0

for country in countrys:
    
    # 불러오기 1차
    twitter_after_check_raw = pd.read_excel(save_address+"/"+
                                        "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx",
                                        sheet_name ="검수 Raw")
    
    # 불러오기 2차
    twitter_after_check_wb = openpyxl.load_workbook(save_address+"/"+
                                                 "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    twitter_after_check_ws = twitter_after_check_wb['검수']

    # Site 검수
    for i in range(twitter_after_check_raw.shape[0]):
        if twitter_after_check_raw['Twitter(Site)'][i] in twitter_after_check_raw['타이틀'][i]:
            twitter_after_check_ws['L'+str(i+2)] = "O"
        else:
            twitter_after_check_ws['L'+str(i+2)] = "X"
            
    # Title 검수
    for i in range(twitter_after_check_raw.shape[0]):
        if twitter_after_check_raw['Twitter(Title)'][i] == twitter_after_check_raw['타이틀'][i]:
            twitter_after_check_ws['M'+str(i+2)] = "O"
        else:
            twitter_after_check_ws['M'+str(i+2)] = "X"
    
    # Description 검수
    for i in range(twitter_after_check_raw.shape[0]):
        if twitter_after_check_raw['Twitter(Description)'][i] == twitter_after_check_raw['디스크립션'][i]:
            twitter_after_check_ws['N'+str(i+2)] = "O"
        else:
            twitter_after_check_ws['N'+str(i+2)] = "X"
            
    # URL 검수
    for i in range(twitter_after_check_raw.shape[0]):
        if twitter_after_check_raw['Twitter(URL)'][i] == twitter_after_check_raw['URL'][i]:
            twitter_after_check_ws['O'+str(i+2)] = "O"
        else:
            twitter_after_check_ws['O'+str(i+2)] = "X"
            
    # Image 검수
    for i in range(twitter_after_check_raw.shape[0]):
        if twitter_after_check_raw['Twitter(Image)'].isna()[i] == False:
            twitter_after_check_ws['P'+str(i+2)] = "O"
        else:
            twitter_after_check_ws['P'+str(i+2)] = "X"
            
    # Twitter Card
    for i in range(twitter_after_check_raw.shape[0]):
        if twitter_after_check_raw['Twitter(Twitter Card)'].isna()[i] == False:
            twitter_after_check_ws['Q'+str(i+2)] = "O"
        else:
            twitter_after_check_ws['Q'+str(i+2)] = "X"
    
    # 저장
    twitter_after_check_wb.save(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    
    # 결과
    count_num += 1
    print(count_num,". {} 의, Twitter 항목 검수가 완료되었습니다.".format(country))

1 . FJ 의, Twitter 항목 검수가 완료되었습니다.
2 . KW 의, Twitter 항목 검수가 완료되었습니다.
3 . HK 의, Twitter 항목 검수가 완료되었습니다.


## 7. Schema(Name, Description, URL, Breadcrumb, type)

In [10]:
count_num = 0

for country in countrys:
    
    # 불러오기 1차
    schema_after_check_raw = pd.read_excel(save_address+"/"+
                                        "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx",
                                        sheet_name ="검수 Raw")
    
    # 불러오기 2차
    schema_after_check_wb = openpyxl.load_workbook(save_address+"/"+
                                                 "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    schema_after_check_ws = schema_after_check_wb['검수']

    # Name 검수
    for i in range(schema_after_check_raw.shape[0]):
        if schema_after_check_raw['Schema(Name)'][i] == schema_after_check_raw['타이틀'][i]:
            schema_after_check_ws['R'+str(i+2)] = "O"
        else:
            schema_after_check_ws['R'+str(i+2)] = "X"

    # Description 검수
    for i in range(schema_after_check_raw.shape[0]):
        if schema_after_check_raw['Schema(Description)'][i] == schema_after_check_raw['디스크립션'][i]:
            schema_after_check_ws['S'+str(i+2)] = "O"
        else:
            schema_after_check_ws['S'+str(i+2)] = "X"
            
    # URL 검수
    for i in range(schema_after_check_raw.shape[0]):
        if schema_after_check_raw['Schema(URL)'][i] == schema_after_check_raw['URL'][i]:
            schema_after_check_ws['T'+str(i+2)] = "O"
        else:
            schema_after_check_ws['T'+str(i+2)] = "X"
    
    # Breadcrumb 검수
    for i in range(schema_after_check_raw.shape[0]):
        if schema_after_check_raw['Schema(Breadcrumb)'][i] == 'BreadcrumbList':
            schema_after_check_ws['U'+str(i+2)] = "O"
        else:
            schema_after_check_ws['U'+str(i+2)] = "X"
    
    # type 검수
    for i in range(schema_after_check_raw.shape[0]):
        if schema_after_check_raw['Schema(type)'][i] == 'WebPage':
            schema_after_check_ws['V'+str(i+2)] = "O"
        else:
            schema_after_check_ws['V'+str(i+2)] = "X"
    
    # 저장
    schema_after_check_wb.save(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    
    # 결과
    count_num += 1
    print(count_num,". {} 의, schema 항목 검수가 완료되었습니다.".format(country))

1 . FJ 의, schema 항목 검수가 완료되었습니다.
2 . KW 의, schema 항목 검수가 완료되었습니다.
3 . HK 의, schema 항목 검수가 완료되었습니다.


## 8. H tag(H1, H2_1, H2_2) - 직접 싸이트에 들어가서 확인

In [11]:
count_num = 0

for country in countrys:
    
    # 불러오기 1차
    htag_after_check_raw = pd.read_excel(save_address+"/"+
                                        "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx",
                                        sheet_name ="검수 Raw")
    
    # 불러오기 2차
    htag_after_check_wb = openpyxl.load_workbook(save_address+"/"+
                                                 "2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    htag_after_check_ws = htag_after_check_wb['검수']
    
    # H1 tag 검수
    for i in range(htag_after_check_raw.shape[0]):
        if htag_after_check_raw['H tag(H1)'].isna()[i] == False:
            htag_after_check_ws['W'+str(i+2)] = "O"
        else:
            htag_after_check_ws['W'+str(i+2)] = "X"
    
    # H2-1 tag 검수
    for i in range(htag_after_check_raw.shape[0]):
        if htag_after_check_raw['H tag(H2-1)'].isna()[i] == False:
            htag_after_check_ws['X'+str(i+2)] = "O"
        else:
            htag_after_check_ws['X'+str(i+2)] = "X"
    
    # H2-2 tag 검수
    for i in range(htag_after_check_raw.shape[0]):
        if htag_after_check_raw['H tag(H2-2)'].isna()[i] == False:
            htag_after_check_ws['Y'+str(i+2)] = "O"
        else:
            htag_after_check_ws['Y'+str(i+2)] = "X"
            
    # 저장
    htag_after_check_wb.save(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx")
    
    # 결과
    count_num += 1
    print(count_num,". {} 의, H tag 항목 검수가 완료되었습니다.".format(country))

1 . FJ 의, H tag 항목 검수가 완료되었습니다.
2 . KW 의, H tag 항목 검수가 완료되었습니다.
3 . HK 의, H tag 항목 검수가 완료되었습니다.


## 9. Hreflang(preprocessing)

In [12]:
count_num = 0

for country in countrys:
    
    # 불러오기 1차
    href_after_raw = pd.read_excel(href_raw_address+"/"+country+" hreflang_all.xlsx",
                                   sheet_name = "1 - All")

    
    # 불러오기 2차
    after_check = pd.read_excel(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("
                                +country+").xlsx", sheet_name ="검수")
    
    
    # null 행 제거
    not_null_index = href_after_raw['Sitemap hreflang 1 URL'].dropna().index
    not_null_raw = href_after_raw.iloc[not_null_index]
    
    # index 재설정
    not_null_raw = not_null_raw.reset_index().drop('index', axis=1)
    
    # 포함하지 않는 URL 찾기
    drop_idx = []
    for idx in range(not_null_raw.shape[0]):
        not_null_raw_true = not_null_raw['Address'][idx] == after_check['URL']
        not_null_raw_sum = not_null_raw_true.sum()
        if not_null_raw_sum == 0:
            drop_idx.append(idx)
    
    # 포함하지 않는 URL 제거 후 
    not_null_raw = not_null_raw.drop(index=drop_idx)
    
    # index 재설정
    not_null_raw = not_null_raw.reset_index().drop('index', axis=1)
    
    # 검수 전 column명 저장하기
    all_cols = not_null_raw.columns
    
    # HTML hreflang 1 URL 검수
    not_null_raw['HTML hreflang 1 check'] = not_null_raw['HTML hreflang 1 URL'] == \
    'https://www.kia.com/worldwide/main.do'            
    
    # HTML hreflang 2 URL 검수
    not_null_raw['HTML hreflang 2 check'] = not_null_raw['HTML hreflang 2 URL'] == \
    'https://www.kia.com/'+country.lower()+'/main.html'
    
    # Sitemap hreflang URL 검수
    for i in range(1,31):
        
        as_href = not_null_raw['Sitemap hreflang '+str(i)].str.split('-', n=1, expand=True).iloc[0,1]
        
        if i == 19:
            as_href = 'om/en' 
        elif i == 20:
            as_href = 'om/ar'
        elif i == 21: 
            as_href = 'sa/en'
        elif i == 22:
            as_href = 'sa/ar' 
        elif i == 23:
            as_href = 'sd/en'
        elif i == 24:
            as_href = 'sd/ar'
            
        for j in range(not_null_raw.shape[0]):
            # Address URL과 Sitemap hreflang URL 비교
            address_url_equal = not_null_raw['Address'][j].replace("https://www.kia.com/"+
                                                                   country.lower()+"/discover-kia/ask/", "")
            address_url_equal_1 = address_url_equal.replace(".html","")

            sitemap_hreflang_equal = not_null_raw['Sitemap hreflang '+
                                                  str(i)+' URL'][j].replace("https://www.kia.com/"+
                                                                            as_href+"/discover-kia/ask/","")
            sitemap_hreflang_equal_1 =  sitemap_hreflang_equal.replace(".html","")

            # Address URL과 Sitemap hreflang URL 검수
            if address_url_equal_1 == sitemap_hreflang_equal_1:
                not_null_raw['Sitemap hreflang '+str(i)+'URL check'] = "O"
            else:
                not_null_raw['Sitemap hreflang '+str(i)+'URL check'] = "X"
    
    # columns 정리
    all_cols = all_cols.drop('Address')
    not_null_raw = not_null_raw.drop(not_null_raw[all_cols], axis=1)
    
    # 저장 1차
    not_null_raw.to_excel(href_raw_address+"/"+country+" hreflang_all_raw_check.xlsx",
                          sheet_name='hreflang 검수')
    
    # raw 파일 저장
    with pd.ExcelWriter(href_raw_address+"/"+country+" hreflang_all_raw_check.xlsx",
                        mode='a', engine='openpyxl') as writer:
        href_after_raw.to_excel(writer, sheet_name='1 - All', index=False)
        
    # 결과
    count_num += 1
    print(count_num,". {} 의, hreflang raw 항목 검수가 완료되었습니다.".format(country))

1 . FJ 의, hreflang raw 항목 검수가 완료되었습니다.
2 . KW 의, hreflang raw 항목 검수가 완료되었습니다.
3 . HK 의, hreflang raw 항목 검수가 완료되었습니다.


## 10. CTA - 직접 싸이트에 들어가서 확인

## 11. 내비게이션 버튼 - 직접 싸이트에 들어가서 확인

## 12. 콘텐츠

## 파일 합치기 및 꾸미기

In [54]:
# 불러오기 1차(하나하나 불러와서 넣어야 함)
fj_check = pd.read_excel(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 (FJ).xlsx",sheet_name="검수")
hk_check = pd.read_excel(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 (HK).xlsx",sheet_name="검수")
kw_check = pd.read_excel(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 (KW).xlsx",sheet_name="검수")

# 합치기
total_check = pd.concat([fj_check, hk_check, kw_check], axis=0, join="outer")

# 저장 1차
total_check.to_excel(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수.xlsx",
                     sheet_name="검수", index=False, engine='openpyxl')

# 불러오기 2차
total_check_wb = openpyxl.load_workbook(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수.xlsx")
total_check_ws = total_check_wb["검수"]

# 수정하기
total_check_ws.insert_rows(1)

# 1행
total_check_ws.merge_cells('A1:A2')
total_check_ws['A1'] = "국가명"
total_check_ws['A1'].font = Font(size=11, bold=True)
total_check_ws['A1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('B1:B2')
total_check_ws['B1'] = "URL"
total_check_ws['B1'].font = Font(size=11, bold=True)
total_check_ws['B1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('C1:C2')
total_check_ws['C1'] = "URL 구조"
total_check_ws['C1'].font = Font(size=11, bold=True)
total_check_ws['C1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('D1:D2')
total_check_ws['D1'] = "캐노니컬"
total_check_ws['D1'].font = Font(size=11, bold=True)
total_check_ws['D1'].alignment = Alignment(horizontal='center', vertical='center')


total_check_ws.merge_cells('E1:E2')
total_check_ws['E1'] = "타이틀"
total_check_ws['E1'].font = Font(size=11, bold=True)
total_check_ws['E1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('F1:F2')
total_check_ws['F1'] = "디스크립션"
total_check_ws['F1'].font = Font(size=11, bold=True)
total_check_ws['F1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('G1:K1')
total_check_ws['G1'] = "OG"
total_check_ws['G1'].font = Font(size=11, bold=True)
total_check_ws['G1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('L1:Q1')
total_check_ws['L1'] = "Twitter"
total_check_ws['L1'].font = Font(size=11, bold=True)
total_check_ws['L1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('R1:V1')
total_check_ws['R1'] = "Schema"
total_check_ws['R1'].font = Font(size=11, bold=True)
total_check_ws['R1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('W1:Y1')
total_check_ws['W1'] = "H tag"
total_check_ws['W1'].font = Font(size=11, bold=True)
total_check_ws['W1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('Z1:Z2')
total_check_ws['Z1'] = "Hreflang"
total_check_ws['Z1'].font = Font(size=11, bold=True)
total_check_ws['Z1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('AA1:AA2')
total_check_ws['AA1'] = "CTA"
total_check_ws['AA1'].font = Font(size=11, bold=True)
total_check_ws['AA1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('AB1:AB2')
total_check_ws['AB1'] = "내비게이션 버튼"
total_check_ws['AB1'].font = Font(size=11, bold=True)
total_check_ws['AB1'].alignment = Alignment(horizontal='center', vertical='center')

total_check_ws.merge_cells('AC1:AC2')
total_check_ws['AC1'] = "콘텐츠"
total_check_ws['AC1'].font = Font(size=11, bold=True)
total_check_ws['AC1'].alignment = Alignment(horizontal='center', vertical='center')

# 2행
col = ['A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S','T','U','V','W','X','Y','Z']

for i in col[6:25]:
    total_check_ws[str(i)+'2'].font = Font(size=11, bold=False)
# total_check_ws['AA2:AC2']

# 색 채워넣기
for i in col:
    total_check_ws[str(i)+'1'].fill = PatternFill(patternType='solid', fgColor=Color('ddebf7'))
    total_check_ws[str(i)+'2'].fill = PatternFill(patternType='solid', fgColor=Color('ddebf7'))
total_check_ws['AA1'].fill = PatternFill(patternType='solid', fgColor=Color('ddebf7'))
total_check_ws['AB1'].fill = PatternFill(patternType='solid', fgColor=Color('ddebf7'))
total_check_ws['AC1'].fill = PatternFill(patternType='solid', fgColor=Color('ddebf7'))


# 크기 조정
total_check_ws.column_dimensions['A'].width = 6.25
total_check_ws.column_dimensions['B'].width = 83
total_check_ws.column_dimensions['C'].width = 8.5
total_check_ws.column_dimensions['D'].width = 8.08
total_check_ws.column_dimensions['E'].width = 6.25
total_check_ws.column_dimensions['F'].width = 10
total_check_ws.column_dimensions['G'].width = 13
total_check_ws.column_dimensions['H'].width = 8.42
total_check_ws.column_dimensions['I'].width = 7.92
total_check_ws.column_dimensions['J'].width = 14.17
total_check_ws.column_dimensions['K'].width = 7.67
total_check_ws.column_dimensions['L'].width = 10.67
total_check_ws.column_dimensions['M'].width = 11.17
total_check_ws.column_dimensions['N'].width = 17.5
total_check_ws.column_dimensions['O'].width = 10.83
total_check_ws.column_dimensions['P'].width = 12.83
total_check_ws.column_dimensions['Q'].width = 18.42
total_check_ws.column_dimensions['R'].width = 13.33
total_check_ws.column_dimensions['S'].width = 18.17
total_check_ws.column_dimensions['T'].width = 11.58
total_check_ws.column_dimensions['U'].width = 18.83
total_check_ws.column_dimensions['V'].width = 12
total_check_ws.column_dimensions['W'].width = 8.75
total_check_ws.column_dimensions['X'].width = 10.58
total_check_ws.column_dimensions['Y'].width = 10.58
total_check_ws.column_dimensions['Z'].width = 8.33
total_check_ws.column_dimensions['AA'].width = 8.25
total_check_ws.column_dimensions['AB'].width = 14.58
total_check_ws.column_dimensions['AC'].width = 8.08

# 고정
total_check_ws.freeze_panes = "B3"

# 저장 2차
total_check_wb.save(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수.xlsx")

## 전처리(나라별 파일 생성) - Frog로 다운로드 전

In [13]:
# count_num = 0

# # 불러오기 1차
# after_check = pd.read_excel(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 (국가).xlsx",
#                             sheet_name ="검수")

# after_check_raw = pd.read_excel(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 (국가).xlsx",
#                                 sheet_name ="검수 Raw")

# # 변경할 나라이름 생성
# rep_countrys = ['AW']
# rep_countrys.extend(countrys)

# # URL 생성
# for country, rep_country in zip(countrys, rep_countrys):
#     for i in range(after_check.shape[0]):
#         # 파일 생성
#         after_check['URL'][i] = after_check['URL'][i].replace('/'+rep_country.lower()+'/', '/'+country.lower()+'/')
        
#     # 저장 및 생성(engine을 openpyxl로 하면 하이퍼링크가 제거되서 나옴)
#     after_check.to_excel(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx",
#                          index=False, sheet_name='검수')
    
#     # 검수 raw sheet 추가하기
#     with pd.ExcelWriter(save_address+"/"+"2차, 3차 음성 검색 콘텐츠 라이브 이후 검수 ("+country+").xlsx",
#                         mode='a', engine='openpyxl') as writer:
#         after_check_raw.to_excel(writer, sheet_name='검수 Raw', index=False)

#     # 결과
#     count_num += 1
#     print(count_num,". {} 의, 나라별 파일 생성이 완료되었습니다.".format(country))