# Libraries and Functions

## Import relevant libraries

In [1]:
import pandas as pd

## Useful functions

In [2]:
def split_frame(df):
    """ Clean data frame by splitting it into multiple data frames.
    
        This function will find all the indicies where the column 'd%'
        contains 'd%' and then will create a list of data frames from those
        indicies.
    """
    
    # find index
    filt = df['d%'] == 'd%'
    idx = filt[filt==True].index
    
    # create frames
    df_list = []
    # start
    df_list.append(df.iloc[:idx[0]])
    # med
    for i in range(len(idx)-1):
        df_list.append(df.iloc[idx[i]+1:idx[i+1]])
    # end
    df_list.append(df.iloc[idx[-1]+1:])
    
    return df_list

In [17]:
def save_data(df_list, category, names):
    """ export all data frame to csv """
    
    for df, name in zip(df_list, names):
        df.to_csv('clean_data/' + category + '/' + name + '.csv', sep=',', index=False)

# Anelli

In [4]:
df = pd.read_csv('data/Anelli_1.csv')
df

Unnamed: 0,d%,Anello minore inferiore,Prezzo,Peso,Fonte,Unnamed: 5,Unnamed: 6
0,01-07,Anello della Prigione del Prigioniero,Anello minore inferiore,Anello,250 mo,-,Guida del Giocatore
1,08-16,Anello dei Sigilli Arcani,Anello minore inferiore,Anello,1.000 mo,-,Guida del Giocatore
2,17-23,Anello della Conoscenza degli Incantesimi I,Anello minore inferiore,Anello,1.500 mo,-,Guida all'Equipaggiamento
3,26-40,Anello di Protezione +1,Anello minore inferiore,Anello,2.000 mo,-,Manuale di Gioco
4,41-47,Anello dell'Avida Tomba,Anello minore inferiore,Anello,2.000 mo,-,Guida all'Equipaggiamento
...,...,...,...,...,...,...,...
111,87-90,Anello dei Tre Desideri,Anello maggiore superiore,Anello,120.000 mo,-,Manuale di Gioco
112,91-93,Anello del Richiamo del Djinni,Anello maggiore superiore,Anello,125.000 mo,-,Manuale di Gioco
113,-,Anello della Psiche Nascosta,Anello maggiore superiore,Anello,160.000 mo,-,Avventure Occulte
114,94-97,Anello del Comando degli Elementi,Anello maggiore superiore,Anello,200.000 mo,-,Manuale di Gioco


In [5]:
d = {'d%':df['d%'], 'Oggetto':df['Anello minore inferiore'], 'Prezzo':df['Fonte'], 'Fonte':df['Unnamed: 6']}
clean_df = pd.DataFrame(d)
clean_df

Unnamed: 0,d%,Oggetto,Prezzo,Fonte
0,01-07,Anello della Prigione del Prigioniero,250 mo,Guida del Giocatore
1,08-16,Anello dei Sigilli Arcani,1.000 mo,Guida del Giocatore
2,17-23,Anello della Conoscenza degli Incantesimi I,1.500 mo,Guida all'Equipaggiamento
3,26-40,Anello di Protezione +1,2.000 mo,Manuale di Gioco
4,41-47,Anello dell'Avida Tomba,2.000 mo,Guida all'Equipaggiamento
...,...,...,...,...
111,87-90,Anello dei Tre Desideri,120.000 mo,Manuale di Gioco
112,91-93,Anello del Richiamo del Djinni,125.000 mo,Manuale di Gioco
113,-,Anello della Psiche Nascosta,160.000 mo,Avventure Occulte
114,94-97,Anello del Comando degli Elementi,200.000 mo,Manuale di Gioco


In [6]:
df_list = split_frame(clean_df)

In [19]:
names = ['Anelli_minori_inferiori', 'Anelli_minori_superiori', 'Anelli_medi_minori', 
        'Anelli_medi_superiori', 'Anelli_maggiori_inferiori', 'Anelli_maggiori_superiori']
save_data(df_list, 'Anelli', names)

# Bacchette

In [8]:
bacchette_df = []
for i in range(10):
    bacchette_df.append(pd.read_csv('data/Bacchette_' + str(i+1) +'.csv'))

In [20]:
# splitting not needed

# look at [8]
bacchette_df[8].tail()

Unnamed: 0,d%,Bacchetta comune,Prezzo,Fonte
41,96,Spezzare Incantamento,30.000 mo,Manuale di Gioco
42,97-98,Pelle di Pietra,33.500 mo,Manuale di Gioco
43,99,Alleato Planare Inferiore,46.000 mo,Manuale di Gioco
44,100,Ristorare *,71.000 mo,Manuale di Gioco
45,* PuÃ² dissolvere livelli negativi permanenti,* PuÃ² dissolvere livelli negativi permanenti,* PuÃ² dissolvere livelli negativi permanenti,* PuÃ² dissolvere livelli negativi permanenti


In [21]:
# remove the last row
bacchette_df[8] = bacchette_df[8].iloc[:-1]
bacchette_df[8].tail()

Unnamed: 0,d%,Bacchetta comune,Prezzo,Fonte
40,94-95,Ristorare,26.000 mo,Manuale di Gioco
41,96,Spezzare Incantamento,30.000 mo,Manuale di Gioco
42,97-98,Pelle di Pietra,33.500 mo,Manuale di Gioco
43,99,Alleato Planare Inferiore,46.000 mo,Manuale di Gioco
44,100,Ristorare *,71.000 mo,Manuale di Gioco


In [22]:
# change object name
for df in bacchette_df:
    df.columns = ['d%', 'Oggetto', 'Prezzo', 'Fonte']

In [27]:
# names
names1 = ['Bacchette_comuni_lv' + str(i) for i in range(5)]
names2 = ['Bacchette_non_comuni_lv' + str(i) for i in range(5)]

In [28]:
# save
save_data(bacchette_df[0::2], 'Bacchette', names1)
save_data(bacchette_df[1::2], 'Bacchette', names2)