# Tariff profile

- [1. 집중성 마진과 확장성 마진](#1.-집중성-마진과-확장성-마진)
- [2. 간단한 숫자 예](#2.-간단한-숫자-예)
- [3. 2022년 상품 수출 데이터](#3.-2022년-상품-수출-데이터)
- [4. 주요국 집중성 마진과 확장성 마진](#4.-주요국-집중성-마진과-확장성-마진)

### MODULE 1 - THEME 2 - ANALYZING TARIFF PROFILES  - APPLICATION 1


* 선택된 국가는 2008년 기준 캐나다입니다.  

* 데이터 출처:  
  - WTO [TAO](http://tao.wto.org)에서 제공하는 Bound Concessions, Tariff and Trade details(양허 관세, 관세 및 무역 세부사항) 
  - TAO: WTO's Integrated Data Base (IDB) and Consolidated Tariff Schedules (CTS) database on-line
  - 참고: 명령어는 [WITS](https://wits.worldbank.org/)에서 제공되는 데이터에 약간 수정하여 적용할 수 있습니다.  

* 사용된 데이터:  
  - DutyDetails.txt  
  - HS96Complete.dta  
  - ProdGrp_hs96at6dig.dta  
  - ProdGrp_hs07at6dig.dta  

* 저장된 데이터:  
  - DutyDetails.dta  
  - TradeDetails.dta  
  - TariffDetails.dta  
  - Bounds.dta  

- 관세 양허(Concession of Tariff)란 국가 간 관세 적용에 관한 협상에서 협상 당사국이 특정 품목의 관세를 일정 수준 이상으로 부과하지 않겠다고 약속하는 것을 의미한다. 관세 양허의 결과는 당해 국가의 양허관세표(Tariff Schedule) 형태로 협정문에 부속시키며, 일단 관세 양허된 품목의 세율에 대해서는 상대방의 동의 없이는 변경할 수 없다.

### 데이터베이스 가져오기 

* TAO/IDB에서 제공된 파일(txt 형식)을 Stata로 가져옵니다.  
* 데이터를 Excel에서 가져온 경우, 각 워크시트를 별도의 워크시트로 저장한 후 .txt 또는 .csv 파일로 저장해야 합니다.  
* 양허 데이터(Bound Data)의 경우 일부 관측치가 다음 줄로 이동되는 문제가 발생할 수 있습니다. 이 문제를 수정하는 do 파일이 이 핸드북에 제공됩니다.

* 캐나다(CAN)의 최혜국(MFN) 적용 관세율 및 양허 관세율을 가져옵니다.  


In [20]:
import pandas as pd
df = pd.read_stata("../Data/openness.dta")

FileNotFoundError: [Errno 2] No such file or directory: '../Data/openness.dta'

In [16]:
df = pd.read_csv("../Data/AIS_2024.csv")

FileNotFoundError: [Errno 2] No such file or directory: '../Data/AIS_2024.csv'

In [13]:
import pandas as pd
import os

# Function to import data from ../Data/ folder
def import_data(grp, file):
    df = pd.read_csv(f"../Data/Chapter2/CAN08_{grp}_{file}_TL.txt", delimiter='\t')
    df.sort_values(by='tl', inplace=True)
    df.to_stata(f"CAN_{grp}_{file}.dta", write_index=False)

def convert_to_string(df):
    df = df.astype(str)
    return df

# Import MFN applied and bound tariff rates for CAN
for grp in ['AG', 'NAG']:
    for file in ['DutyDetails', 'TradeDetails', 'TariffDetails']:
        import_data(grp, file)

FileNotFoundError: [Errno 2] No such file or directory: '../Data/Chapter2/CAN08_AG_DutyDetails_TL.txt'

In [None]:
import pandas as pd
import os

# Function to import data from ../Data/ folder
def import_data(grp, file):
    df = pd.read_csv(f"../Data/CAN08_{grp}_{file}_TL.txt", delimiter='\t')
    df.sort_values(by='tl', inplace=True)
    df.to_stata(f"CAN_{grp}_{file}.dta", write_index=False)

def convert_to_string(df):
    df = df.astype(str)
    return df

# Import MFN applied and bound tariff rates for CAN
for grp in ['ag', 'nag']:
    for file in ['DutyDetails', 'TradeDetails', 'TariffDetails']:
        import_data(grp, file)

    # Convert all variables in string to allow append later and avoid issues
    df_bounds = pd.read_csv(f"../Data/CAN_{grp}_Concession_CO.txt", delimiter='\t')
    df_bounds = convert_to_string(df_bounds)
    df_bounds.to_stata(f"CAN_{grp}_Bounds.dta", write_index=False)

# Append the agricultural and non-agricultural datasets
def append_datasets(file):
    df_nag = pd.read_stata(f"CAN_nag_{file}.dta")
    df_ag = pd.read_stata(f"CAN_ag_{file}.dta")
    df = pd.concat([df_nag, df_ag], ignore_index=True)
    
    # Check for potential duplicates
    df.drop_duplicates(inplace=True)
    df.sort_values(by='tl', inplace=True)
    df.to_stata(f"CAN_{file}.dta", write_index=False)

for file in ['DutyDetails', 'TradeDetails', 'TariffDetails', 'Bounds']:
    append_datasets(file)

# Correct database when data is shifted due to problem with original file
def import_and_correct_shifted_data(grp):
    df = pd.read_csv(f"../Data/CAN_{grp}_Concession_CO.txt", delimiter='\t')
    df['agr'] = grp
    df.to_stata(f"CAN_{grp}_Bounds.dta", write_index=False)
    
for grp in ['ag', 'nag']:
    import_and_correct_shifted_data(grp)

# Append the agricultural and non-agricultural datasets for bounds
df_ag_bounds = pd.read_stata("CAN_ag_Bounds.dta")
df_nag_bounds = pd.read_stata("CAN_nag_Bounds.dta")
df_bounds = pd.concat([df_ag_bounds, df_nag_bounds], ignore_index=True)
df_bounds.drop_duplicates(inplace=True)

# Perform necessary transformations and corrections
df_bounds = df_bounds[df_bounds['basenomenclature'] != ""]
df_bounds['lgth'] = df_bounds['basenomenclature'].str.len()
df_bounds['id'] = range(1, len(df_bounds) + 1)

# Save temporary file
df_bounds.to_stata("Bndstemp.dta", write_index=False)

# Further steps to correct the shifted data and make adjustments
# Rename variables, drop unnecessary lines, and clean the data
def rename_and_clean_data(df):
    df = df.rename(columns=lambda x: x.replace("boundduty", "bndd")
                                      .replace("odcduty", "od")
                                      .replace("bound", "bnd")
                                      .replace("description", "des")
                                      .replace("other", "ot")
                                      .replace("binding", "bi")
                                      .replace("nature", "nt")
                                      .replace("status", "st")
                                      .replace("safeguard", "safg")
                                      .replace("baseduty", "bd")
                                      .replace("implementation", "imp")
                                      .replace("present", "pr")
                                      .replace("text", "tx")
                                      .replace("instrument", "ins")
                                      .replace("information", "if")
                                      .replace("classification", "cls")
                                      .replace("special", "spe")
                                      .replace("product", "pd")
                                      .replace("earlierin", "ein")
                                      .replace("base", "bs")
                                      .replace("nomenclature", "nom")
                                      .replace("reporter", "rep")
                                      .replace("code", "cod"))
    df = df.rename(columns={'queryname': 'qr', 'year': 'yr', 'certified': 'cert', 'source': 'so'})
    return df

df_bounds = rename_and_clean_data(df_bounds)

# Final adjustments and saving the cleaned data
df_bounds.to_stata("ShiftedData.dta", write_index=False)

# Append shifted data with original data
df_bndstemp = pd.read_stata("Bndstemp.dta")
df_shifted_data = pd.read_stata("ShiftedData.dta")
df_bndstemp = df_bndstemp[df_bndstemp['lgth'] == 22]
df_combined = pd.concat([df_bndstemp, df_shifted_data], ignore_index=True)

# Final data cleaning and saving
df_combined.drop(columns=['productdescription'], inplace=True)
df_combined['basenomenclature'] = df_combined['basenomenclature'].unique()[0]
df_combined['reportercode'] = df_combined['reportercode'].unique()[0]
df_combined['reporter'] = df_combined['reporter'].unique()[0]
df_combined['year'] = df_combined['year'].unique()[0]

df_combined['productclassification'] = df_combined.apply(
    lambda row: "HS - WTO Agricultural Products Definition" if row['agr'] == "ag" and row['productclassification'] == "" else (
        "HS - WTO Non-agricultural Products Definition" if row['agr'] == "nag" and row['productclassification'] == "" else row['productclassification']), axis=1
)
df_combined = df_combined[df_combined['tl'] != ""]
df_combined['queryname'] = df_combined['queryname'].apply(lambda x: "" if x != "" else x)
df_combined.sort_values(by='id', inplace=True)

# Destring numerical variables
numerical_vars = ['bounddutyav', 'odcdutyav', 'basedutyav', 'implementationfrom', 'implementationto']
for var in numerical_vars:
    df_combined[var] = pd.to_numeric(df_combined[var], errors='coerce')

# Save the final cleaned dataset
df_combined.to_stata("CAN_Bounds.dta", write_index=False)

# Erase temporary files
os.remove("Bndstemp.dta")
os.remove("ShiftedData.dta")

# Erase construction files
for grp in ['ag', 'nag']:
    for file in ['DutyDetails', 'TradeDetails', 'TariffDetails']:
        os.remove(f"CAN_{grp}_{file}.dta")

for file in ["CAN_ag_Bounds.dta", "CAN_Nag_Bounds.dta", "CAN_TariffDetails.dta"]:
    os.remove(file)
