# Generating Synthetic Data 

### Install libraries

In [93]:
#!pip install faker

In [94]:
#pip install sdv

### Loading the real data acquired by the form

In [1]:

import numpy as np
import pandas as pd
from sklearn.impute import KNNImputer

In [9]:
df = pd.read_csv("survey_data_clean.csv", index_col=0)
df.head(20)

df

Unnamed: 0,age,gender,time,type_route,cost,difficulty,company,transport,routes,route_id
0,18-35,Hombre,3 - 4 horas,Literaria,1-50 Euros,Alta,Solo,Pie,La barraca,11
1,35-45,Hombre,1 - 2 horas,Historica,Gratis,Baja,Pareja,Pie,Ruta de la Seda,13
2,18-35,Hombre,3 - 4 horas,Historica,Gratis,Baja,Solo,Bicicleta,Arbres monumentals i singulars,0
3,18-35,Hombre,3 - 4 horas,Patrimonio,Gratis,Baja,Pareja,Pie,Sant Agustí Pont de Fusta,18
4,18-35,Mujer,3 - 4 horas,Turistica,Gratis,Baja,Pareja,Bicicleta,Ruta Cultural Anell Ciclista,12
...,...,...,...,...,...,...,...,...,...,...
66,18-35,Mujer,1 - 2 horas,Turistica,Gratis,Baja,Pareja,Pie,Ruta Valencia en la Memòria,23
67,18-35,Mujer,1 - 2 horas,Turistica,Gratis,Baja,Pareja,Pie,Arbres: Un passeig per l’Albereda,3
68,35-45,Hombre,1 - 2 horas,Turistica,Gratis,Alta,Amigos,Bicicleta,Ruta València en bicicleta,17
69,35-45,Mujer,3 - 4 horas,Historica,1-50 Euros,Baja,Familia,Bicicleta,Arbres monumentals i singulars,0


### Creating fake data with random choices

In [15]:
# function to create a dataframe with fake values for our synthetic users
def make_users(num):
    
    fake_users = []

    for i in range(num): 
        # lists to randomly assign to users
        age	 = ['0-18', '18-35','35-45','+45']
        gender = ['Hombre', 'Mujer', 'Prefiero no decirlo']
        company = ['Solo','Pareja','Amigos','Familia']
        time = ['1 - 2','3 - 4','5 - 6','7 - 8']
        price = ['Gratis', '1-50 Euros', '+50 Euros']
        difficulty = ['Alta', 'Baja']
        transport = ['Pie', 'Bicicleta']
        type_route = ['Historica', 'Turistica', 'Literaria', 'Patrimonio']
        route_id = [None]

        

        fake_user = {
            
            'age':np.random.choice(age),
            'gender': np.random.choice(gender),
            'time': np.random.choice(time),
            'type_route': np.random.choice(type_route),
            'price': np.random.choice(price),
            'difficulty': np.random.choice(difficulty),
            'accompaniment': np.random.choice(company),
            'transport': np.random.choice(transport),
            'route_id': np.nan,
        
            }
        
        fake_users.append(fake_user)

    users_df = pd.DataFrame(fake_users)
    
    return users_df



In [17]:
df_fake = make_users(100)

In [36]:
df_fake.head()

Unnamed: 0,age,gender,time,type_route,price,difficulty,accompaniment,transport,route_id
0,0-18,Hombre,1 - 2,Literaria,+50 Euros,Baja,Amigos,Pie,
1,0-18,Mujer,7 - 8,Historica,Gratis,Baja,Solo,Bicicleta,
2,0-18,Prefiero no decirlo,5 - 6,Historica,+50 Euros,Baja,Familia,Pie,
3,+45,Hombre,5 - 6,Historica,1-50 Euros,Alta,Amigos,Pie,
4,+45,Prefiero no decirlo,1 - 2,Patrimonio,+50 Euros,Baja,Solo,Bicicleta,


In [28]:
df_2 = pd.read_csv("routes.csv", index_col=0)

In [41]:
df_2

Unnamed: 0,name,esp_resume,eng_resume,val_resume,duration,dificulty,start,end_point,image,url,transport,type,esp_description,val_description,eng_description
0,Arbres monumentals i singulars,Los Árboles Monumentales y Singulares reflejan...,The Monumental and Singular Trees reflect the ...,Els Arbres Monumentals i Singulars reflecteixe...,120.0,baja,Plaza del Ayuntamiento,Jardines de la Glorieta y Parterre,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/testigos-...,bicicleta,Històrica,La presencia de Árboles Monumentales y Singula...,La presència d'Arbres Monumentals i Singulars ...,The presence of Monumental and Singular Trees ...
1,Arbres: La volta al món,Ruta que contiene árboles originarios de todo ...,Route that contains trees originating from all...,Ruta que conté arbres originaris de tot el món...,30.0,baja,Entrada Jardines del Real (C/ San Pio V),Museo de Ciencias Naturales,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/arboles-l...,peu,Turística,La presencia de Árboles Monumentales y Singula...,La presència d’Arbres Monumentals i Singulars ...,The presence of Monumental and Singular Trees ...
2,Arbres: Els indians,Ruta por el barrio de Ayora que finaliza al Ja...,Route through the neighborhood of Ayora that e...,Ruta pel barri dAyora que finalitza al Jardí d...,60.0,baja,Av. de J. J. Dómine,Palacete de Ayora,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/arboles-l...,peu,Turística,La presencia de Árboles Monumentales y Singula...,La presència d’Arbres Monumentals i Singulars ...,The presence of Monumental and Singular Trees ...
3,Arbres: Un passeig per l’Albereda,Esta ruta nos traslada a este emblemático luga...,This route takes us to this emblematic place w...,Aquesta ruta ens trasllada a aquest emblemàtic...,60.0,baja,Plaza de Zaragoza,Avenida de Blasco Ibañez (Confederación hidrog...,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/arboles-u...,peu,Turística,La alameda nació con vocación de ser un paseo ...,L’albereda va nàixer amb vocació de ser un pas...,The alameda was born with the vocation of bein...
4,Arbres: Un viatge pel Mediterrani,La presencia de Árboles Monumentales y Singula...,The presence of Monumental and Singular Trees ...,La presència dArbres Monumentals i Singulars a...,60.0,baja,Parque Wangari Maathai,Centro Cultural la Rambleta,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/arboles-u...,peu,Turística,“Un viaje por el Mediterráneo” es una travesía...,“Un viatge pel Mediterrani” és una travessia p...,"""A journey through the Mediterranean"" is a jou..."
5,Ruta Carrer Russafa - la Llotja,La ruta que transcurre entre la Calle Ruzafa y...,The route that runs between Ruzafa Street and ...,La ruta que transcorre entre el Carrer *Ruzafa...,360.0,baja,Plaza de Toros,Iglesia de los Santos Juanes,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/carrer-ru...,peu,Patrimonial,La ruta que transcurre entre la Calle *Russafa...,La ruta que transcorre entre el Carrer Russafa...,The route that runs between Russafa Street and...
6,Contes Blasco Ibañez – Ruta 1,La primera ruta de Cuentos de Blasco Ibañez pe...,The first route of Tales of Blasco Ibañez allo...,La primera ruta de Contes de Blasco Ibañez per...,105.0,baja,Plaza de Toros,Casa natal de San Vicente Ferrer,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/cuentos-b...,peu,Literària,La primera ruta de Cuentos de Blasco Ibañez pe...,La primera ruta de Contes de Blasco Ibañez per...,The first route of Cuentos de Blasco Ibañez al...
7,Contes Blasco Ibañez – Ruta 2,"En este segundo itinerario, llegaremos hasta e...","In this second itinerary, we will arrive until...","En aquest segon itinerari, arribarem fins al c...",105.0,baja,Puente de San José,La Lonja,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/cuentos-b...,peu,Literària,El segundo itinerario de los cuentos de Blasco...,El segon itinerari dels contes de Blasco Ibañe...,The second itinerary of the stories of Blasco ...
8,Entre Naranjos,Ateniéndonos a lo narrado en la novela Entre n...,"Following the narration of the novel ""Entre na...",Atenint-nos al narrat en la novel·la Entre tar...,105.0,baja,Estación de Tren,Alameda,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/entre-nar...,peu,Literària,Ateniéndonos al narrado en la novela Entre *na...,Atenint-nos al narrat en la novel·la Entre nar...,Attening to the narrated one in the novel Betw...
9,Glorieta-Santa Catalina,Es un auténtico placer darse un paseo tranquil...,It is a real pleasure to take a leisurely stro...,És un autèntic plaer fer-se una passejada tran...,240.0,,Santa Catalina,Glorieta,https://cultural.valencia.es/wp-content/upload...,https://cultural.valencia.es/es/ruta/glorieta-...,peu,Patrimonial,Es un auténtico placer darse un paseo tranquil...,És un autèntic plaure fer-se una passejada tra...,"It is a real pleasure to take a leisurely, unh..."


In [44]:
df_2['type'] = df_2.type.str.strip()

In [45]:
df_2.type.unique()

array(['Històrica', 'Turística', 'Patrimonial', 'Literària'], dtype=object)

In [35]:
list(df_2.loc[df_2.transport == 'bicicleta', 'name'])

['Arbres monumentals i singulars',
 'Ruta Cultural Anell Ciclista',
 'Ruta València amb bicicleta']

In [46]:
list(df_2.loc[(df_2.transport == 'peu') & (df_2.type == 'Històrica'), 'name'])

['Ruta de la Seda',
 "Ruta dels Pecats a l'entorn del Mercat Central",
 "Ruta recinte enmurallat d'època islàmica",
 'Ruta Valencia en la Memòria']

In [None]:
def input_target(df):

    bike_routes = [ 'Arbres monumentals i singulars',
                    'Ruta Cultural Anell Ciclista',
                    'Ruta València amb bicicleta']

    walk_routes_hist = ['Ruta de la Seda',
                        "Ruta dels Pecats a l'entorn del Mercat Central",
                        "Ruta recinte enmurallat d'època islàmica",
                        'Ruta Valencia en la Memòria']

    for i in df.iterrows():
        if i[1].transport == 'Bicicleta':
            df_fake['route_id'] = np.random.choice(bike_routes)
        else:
            if i[1].type_route == 'Històrica':
                df_fake['route_id'] = np.random.choice(walk_routes_hist)


