In [72]:
import pandas as pd
import numpy as np
import matplotlib as plt

csv_flit = "Resources/female_literacy.csv"
csv_mlit = "Resources/male_literacy.csv"
csv_mort = "Resources/mortality_under5.csv"

# Labor force participation rate, female (% of female population ages 15+) 
fem_lit = pd.read_csv(csv_flit)
male_lit = pd.read_csv(csv_mlit)
mort_data = pd.read_csv(csv_mort)

In [74]:
#ALL WB GROUPS including world
#Fem literacy data has no value for 2017, but keeping it to compare with other indicators

world_groups = ['EAS','ECS','FCS','HPC','LCN','LDC','LIC','LMC','MEA','MIC','SAS','SSF','UMC','WLD','EUU']
                
def clean_df(df):
    df.index = df['Country Code']
    df = df[df['Country Code'].isin(world_groups)]
    df = df.drop(columns=['Indicator Code', 'Country Code',
       '1960', '1961', '1962', '1963', '1964', '1965', '1966', '1967', '1968',
       '1969', '1970', '1971', '1972', '1973', '1974', '1975', '1976', '1977',
       '1978', '1979', '1980', '1981', '1982', '1983', '1984', '1985', '1986',
       '1987', '1988', '1989'])
    df = df.dropna(how='any', thresh=3)
    return df

fem_lit_world= clean_df(fem_lit)
male_lit_world= clean_df(male_lit)
mortdata_world= clean_df(mort_data)

In [63]:
#Regional groups and world - check excel file 'WB Groupings List' for info on groupings

regional_groups = ['EAS','ECS','LCN','MEA','SAS','SSF','WLD']
                
def cleanregion_df(df):
    df.index = df['Country Code']
    df = df[df['Country Code'].isin(regional_groups)]
    df = df.drop(columns=['Indicator Code', 'Country Code',
       '1960', '1961', '1962', '1963', '1964', '1965', '1966', '1967', '1968',
       '1969', '1970', '1971', '1972', '1973', '1974', '1975', '1976', '1977',
       '1978', '1979', '1980', '1981', '1982', '1983', '1984', '1985', '1986',
       '1987', '1988', '1989'])
    df = df.dropna(how='any', thresh=3)
    return df

fem_lit_reg = cleanregion_df(fem_lit)
male_lit_reg = cleanregion_df(male_lit)

In [64]:
#Income groups and world. The EU will be used as an indicator for HICs as field for HICs in WB csv is empty.

income_groups = ['LIC','LMC','MIC','UMC','WLD','EUU']
                
def cleanincome_df(df):
    df.index = df['Country Code']
    df = df[df['Country Code'].isin(income_groups)]
    df = df.drop(columns=['Indicator Code', 'Country Code',
       '1960', '1961', '1962', '1963', '1964', '1965', '1966', '1967', '1968',
       '1969', '1970', '1971', '1972', '1973', '1974', '1975', '1976', '1977',
       '1978', '1979', '1980', '1981', '1982', '1983', '1984', '1985', '1986',
       '1987', '1988', '1989'])
    df = df.dropna(how='any', thresh=3)
    return df

fem_lit_inc = cleanincome_df(fem_lit)
male_lit_inc = cleanincome_df(male_lit)

In [65]:
#Fragile and conflict affected, Heavily indebted poor countries, Least Developed countries, and world
other_groups = ['FCS', 'HPC', 'LDC', 'WLD']

def cleanotr_df(df):
    df.index = df['Country Code']
    df = df[df['Country Code'].isin(other_groups)]
    df = df.drop(columns=['Indicator Code', 'Country Code',
       '1960', '1961', '1962', '1963', '1964', '1965', '1966', '1967', '1968',
       '1969', '1970', '1971', '1972', '1973', '1974', '1975', '1976', '1977',
       '1978', '1979', '1980', '1981', '1982', '1983', '1984', '1985', '1986',
       '1987', '1988', '1989'])
    df = df.dropna(how='any', thresh=3)
    return df

fem_lit_otr = cleanotr_df(fem_lit)
male_lit_otr = cleanotr_df(male_lit)

In [66]:
#Ratios

In [67]:
#ALL WB Groups - Male and Female Ratio

litall_ratio = fem_lit_world[['1990', '1991', '1992', '1993', '1994', '1995',
       '1996', '1997', '1998', '1999', '2000', '2001', '2002', '2003', '2004',
       '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013',
       '2014', '2015', '2016', '2017']] / male_lit_world[['1990', '1991', '1992', '1993', '1994', '1995',
       '1996', '1997', '1998', '1999', '2000', '2001', '2002', '2003', '2004',
       '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013',
       '2014', '2015', '2016', '2017']]

#litall_ratio

In [68]:
#By Regional Groups - Male and Female Ratio

litreg_ratio = fem_lit_reg[['1990', '1991', '1992', '1993', '1994', '1995',
       '1996', '1997', '1998', '1999', '2000', '2001', '2002', '2003', '2004',
       '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013',
       '2014', '2015', '2016', '2017']] / male_lit_reg[['1990', '1991', '1992', '1993', '1994', '1995',
       '1996', '1997', '1998', '1999', '2000', '2001', '2002', '2003', '2004',
       '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013',
       '2014', '2015', '2016', '2017']]

#litreg_ratio

In [69]:
#By Income - Male and Female Ratio. EU is included to stand for HICs.

litinc_ratio = fem_lit_inc[['1990', '1991', '1992', '1993', '1994', '1995',
       '1996', '1997', '1998', '1999', '2000', '2001', '2002', '2003', '2004',
       '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013',
       '2014', '2015', '2016', '2017']] / male_lit_inc[['1990', '1991', '1992', '1993', '1994', '1995',
       '1996', '1997', '1998', '1999', '2000', '2001', '2002', '2003', '2004',
       '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013',
       '2014', '2015', '2016', '2017']]

#litinc_ratio

In [60]:
#Other groupings - Male and Female Ratio

litotr_ratio = fem_lit_otr[['1990', '1991', '1992', '1993', '1994', '1995',
       '1996', '1997', '1998', '1999', '2000', '2001', '2002', '2003', '2004',
       '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013',
       '2014', '2015', '2016', '2017']] / fem_lit_otr[['1990', '1991', '1992', '1993', '1994', '1995',
       '1996', '1997', '1998', '1999', '2000', '2001', '2002', '2003', '2004',
       '2005', '2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013',
       '2014', '2015', '2016', '2017']]

#litotr_ratio

In [76]:
litall_ratio.to_csv("litall_ratio.csv")
# litreg_ratio.to_csv("litreg_ratio.csv")
# litinc_ratio.to_csv("litinc_ratio.csv")
# litotr_ratio.to_csv("litotr_ratio.csv")
#mortdata_world.to_csv("mortdata_world.csv")