<a href="https://colab.research.google.com/github/rmanzi13/Conserje_inteligente/blob/main/Modelo_conserje.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel

In [None]:
comidas = pd.read_csv("Comidas - comidas-villa-magna.csv")
usuarios = pd.read_csv("Usuarios - usuarios-villa-magna.csv")
bebidas = pd.read_csv("Bebidas - bebidas-villa-magna.csv")

In [None]:
usuarios.head(10)

Unnamed: 0,_Id,User_name,User_email,User_pass,Alimentacion,Apto_para_alérgicos
0,1,Ana_Martinez,ana.martinez@email.com,******,Vegana,No
1,2,Carlos_Rojas,carlos.rojas@email.com,******,Vegetariana,No
2,3,Luisa_Perez,luisa.perez@email.com,******,Sin gluten,Nueces
3,4,Jorge_Gomez,jorge.gomez@email.com,******,Halal,No
4,5,Sofia_Lopez,sofia.lopez@email.com,******,Kosher,Mariscos
5,6,Usuario_006,usuario_006@email.com,******,"Vegana, Sin gluten",No
6,7,Usuario_007,usuario_007@email.com,******,No,Lacteos
7,8,Usuario_008,usuario_008@email.com,******,Vegana,No
8,9,Usuario_009,usuario_009@email.com,******,Vegetariana,Gluten
9,10,Usuario_010,usuario_010@email.com,******,Sin gluten,No


In [None]:
usuarios.shape

(20, 6)

In [None]:
# Unimos todas las tablas en una sola
data_final = pd.concat([comidas, usuarios, bebidas])

In [None]:
data_final.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 182 entries, 0 to 61
Data columns (total 16 columns):
 #   Column               Non-Null Count  Dtype 
---  ------               --------------  ----- 
 0   _Id                  182 non-null    int64 
 1   Plato_name           100 non-null    object
 2   Plato_descripcion    100 non-null    object
 3   Plato_tipo           100 non-null    object
 4   Dieta_apto           100 non-null    object
 5   Apto_alergicos       100 non-null    object
 6   Tipo_de_comida       100 non-null    object
 7   User_name            20 non-null     object
 8   User_email           20 non-null     object
 9   User_pass            20 non-null     object
 10  Alimentacion         20 non-null     object
 11  Apto_para_alérgicos  20 non-null     object
 12  Bebida_name          62 non-null     object
 13  Bebida_descripcion   62 non-null     object
 14  Tipo_bebida          62 non-null     object
 15  Aptitud_bebida       28 non-null     object
dtypes: int64(

In [None]:
# Llenamos NaN en las columnas relevantes
data_final = data_final.fillna('')

In [None]:
data_final.head(3)

Unnamed: 0,_Id,Plato_name,Plato_descripcion,Plato_tipo,Dieta_apto,Apto_alergicos,Tipo_de_comida,User_name,User_email,User_pass,Alimentacion,Apto_para_alérgicos,Bebida_name,Bebida_descripcion,Tipo_bebida,Aptitud_bebida
0,101,Paella Valenciana,Tradicional paella con mariscos y pollo,Plato Principal,Normal,Mariscos,Española,,,,,,,,,
1,102,Gazpacho Andaluz,Sopa fría de tomates y vegetales,Entrada,"Vegetariana, Vegana, Sin gluten, Halal, Kosher",Si,Andaluza,,,,,,,,,
2,103,Tortilla Española,Tortilla de patatas,Plato Principal,Vegetariana,Si,Española,,,,,,,,,


In [None]:
# Creamos perfiles de usuario y elementos
perfiles_usuario = data_final[['User_name', 'Alimentacion']]
perfiles_elemento['Perfil'] = perfiles_elemento[['Plato_name', 'Plato_tipo', 'Bebida_name', 'Tipo_bebida']].apply(lambda x: ' '.join(str(val) for val in x), axis=1)

In [None]:
perfiles_usuario = perfiles_usuario.astype(str)
perfiles_elemento = perfiles_elemento.astype(str)

# Elimina duplicados
perfiles_elemento.drop_duplicates(subset='Perfil', inplace=True)

# Reemplazar NaN con una cadena vacía ('') antes de aplicar el vectorizador
perfiles_usuario['Alimentacion'].fillna('', inplace=True)
perfiles_elemento.fillna('', inplace=True)

In [None]:
# Hacer una copia explícita para evitar SettingWithCopyWarning
perfiles_usuario = perfiles_usuario.copy()
perfiles_elemento = perfiles_elemento.copy()

In [None]:
# Concatenamos las descripciones relevantes para el vectorizador TF-IDF
perfiles_usuario.loc[:, 'Perfil'] = perfiles_usuario['Alimentacion']
perfiles_elemento.loc[:, 'Perfil'] = perfiles_elemento.apply(lambda x: ' '.join(str(val) for val in x), axis=1)
# Selecciona solo las columnas relevantes
perfiles_elemento['Perfil'] = perfiles_elemento[['Plato_name', 'Plato_tipo', 'Bebida_name', 'Tipo_bebida']].apply(lambda x: ' '.join(str(val) for val in x), axis=1)


In [None]:
# Usamos el vectorizador TF-IDF para convertir las descripciones en vectores
vectorizer = TfidfVectorizer(stop_words='english')
perfil_matrix = vectorizer.fit_transform(perfiles_usuario['Perfil'])
elemento_matrix = vectorizer.transform(perfiles_elemento['Perfil'])

In [None]:
# Imprimimos algunas filas de perfiles_usuario y perfiles_elemento
print(perfiles_usuario.head())
print(perfiles_elemento.head())


  User_name Alimentacion Perfil
0                              
1                              
2                              
3                              
4                              
              Plato_name       Plato_tipo Bebida_name Tipo_bebida  \
0      Paella Valenciana  Plato Principal                           
1       Gazpacho Andaluz          Entrada                           
2      Tortilla Española  Plato Principal                           
3     Croquetas de Jamón   Acompañamiento                           
4  Ensalada Mediterránea          Entrada                           

                                Perfil  
0  Paella Valenciana Plato Principal    
1           Gazpacho Andaluz Entrada    
2  Tortilla Española Plato Principal    
3  Croquetas de Jamón Acompañamiento    
4      Ensalada Mediterránea Entrada    


In [None]:
# Calculamos similitud de coseno entre perfiles de usuario y elementos
cosine_similarities = linear_kernel(perfil_matrix, elemento_matrix)

In [None]:
# Creamos un DataFrame con las similitudes
similarity_df = pd.DataFrame(cosine_similarities, index=perfiles_usuario['User_name'], columns=perfiles_elemento.index)

In [None]:
perfiles_elemento.head(3)

Unnamed: 0,Plato_name,Plato_tipo,Bebida_name,Tipo_bebida,Perfil
0,Paella Valenciana,Plato Principal,,,Paella Valenciana Plato Principal
1,Gazpacho Andaluz,Entrada,,,Gazpacho Andaluz Entrada
2,Tortilla Española,Plato Principal,,,Tortilla Española Plato Principal


In [None]:
def recomendar_elementos(usuario, top_n=5):
    if usuario in similarity_df.index:
        recomendaciones_indices = similarity_df.loc[usuario].sort_values(ascending=False).head(top_n).index
        recomendaciones_nombres = perfiles_elemento.loc[recomendaciones_indices, 'Perfil']
        return recomendaciones_nombres
    else:
        return []

In [None]:
# Imprimo lista de usuarios
print("Usuarios disponibles:")
print(data_final['User_name'].unique())

Usuarios disponibles:
['' 'Ana_Martinez' 'Carlos_Rojas' 'Luisa_Perez' 'Jorge_Gomez'
 'Sofia_Lopez' 'Usuario_006' 'Usuario_007' 'Usuario_008' 'Usuario_009'
 'Usuario_010' 'Usuario_011' 'Usuario_012' 'Usuario_013' 'Usuario_014'
 'Usuario_015' 'Usuario_016' 'Usuario_017' 'Usuario_018' 'Usuario_019'
 'Usuario_020']


In [None]:
# Ejemplo de recomendación para un usuario específico
usuario_ejemplo = 'Usuario_009'
recomendaciones_usuario = recomendar_elementos(usuario_ejemplo)

print(f"Recomendaciones para {usuario_ejemplo}: {recomendaciones_usuario}")

Recomendaciones para Usuario_009: 20    Lasaña Vegetariana Plato Principal  
20                     Mint Julep Cócteles
0      Paella Valenciana Plato Principal  
0                                         
0                            Sangría Vinos
26            Mousse de Chocolate Postre  
26                  Cerveza Stout Cervezas
11            Falafel con Hummus Entrada  
11                Agua de Coco Sin alcohol
12               Ceviche Peruano Entrada  
12                    Whisky Sour Cócteles
Name: Perfil, dtype: object


In [None]:
# Ejemplo de recomendación para un usuario específico
usuario_ejemplo = 'Usuario_013'
recomendaciones_usuario = recomendar_elementos(usuario_ejemplo)

print(f"Recomendaciones para {usuario_ejemplo}: {recomendaciones_usuario}")

Recomendaciones para Usuario_013: 83             Tiramisú sin Gluten Postre  
8     Hamburguesa Clásica Plato Principal  
8              Refresco de Cola Sin alcohol
19        Arroz con Pollo Plato Principal  
19           Mocktail de Frutas Sin alcohol
9                 Quiche Lorraine Entrada  
9               Jugo de Naranja Sin alcohol
25                Tarta de Manzana Postre  
25               Lassi de Mango Sin alcohol
Name: Perfil, dtype: object


In [None]:
# Ejemplo de recomendación para un usuario específico
usuario_ejemplo = 'Usuario_020'
recomendaciones_usuario = recomendar_elementos(usuario_ejemplo)


print(f"Recomendaciones para {usuario_ejemplo}: {recomendaciones_usuario}")

Recomendaciones para Usuario_020: 0     Paella Valenciana Plato Principal  
0                                        
0                           Sangría Vinos
17        Tacos de Tofu Plato Principal  
17                   Cerveza IPA Cervezas
11           Falafel con Hummus Entrada  
11               Agua de Coco Sin alcohol
12              Ceviche Peruano Entrada  
12                   Whisky Sour Cócteles
13          Ratatouille Plato Principal  
13                             Té Chai Te
Name: Perfil, dtype: object


### Creao función para exportar el modelo

In [None]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import linear_kernel
import joblib  # Para exportar/importar el modelo

In [None]:
# Reemplazar NaN con una cadena vacía ('') antes de aplicar el vectorizador
perfiles_usuario['Alimentacion'].fillna('', inplace=True)
perfiles_elemento.fillna('', inplace=True)

# Concatenamos las descripciones relevantes para el vectorizador TF-IDF
perfiles_usuario.loc[:, 'Perfil'] = perfiles_usuario['Alimentacion']
perfiles_elemento['Perfil'] = perfiles_elemento[['Plato_name', 'Plato_tipo', 'Bebida_name', 'Tipo_bebida']].apply(lambda x: ' '.join(str(val) for val in x), axis=1)
perfiles_elemento.drop_duplicates(subset='Perfil', inplace=True)

In [None]:
def cargar_datos():
    comidas = pd.read_csv("Comidas - comidas-villa-magna.csv")
    usuarios = pd.read_csv("Usuarios - usuarios-villa-magna.csv")
    bebidas = pd.read_csv("Bebidas - bebidas-villa-magna.csv")

    # Unimos todas las tablas en una sola
    data_final = pd.concat([comidas, usuarios, bebidas])

    # Creamos perfiles de usuario y elementos
    perfiles_usuario = data_final[['User_name', 'Alimentacion']]
    perfiles_elemento = data_final[['Plato_name', 'Plato_tipo', 'Bebida_name', 'Tipo_bebida']]

    # Reemplazar NaN con una cadena vacía ('') antes de aplicar el vectorizador
    perfiles_usuario['Alimentacion'].fillna('', inplace=True)
    perfiles_elemento.fillna('', inplace=True)

    # Hacer una copia explícita para evitar SettingWithCopyWarning
    perfiles_usuario = perfiles_usuario.copy()
    perfiles_elemento = perfiles_elemento.copy()


    # Concatenamos las descripciones relevantes para el vectorizador TF-IDF
    perfiles_usuario.loc[:, 'Perfil'] = perfiles_usuario['Alimentacion']
   # Selecciona solo las columnas relevantes
    perfiles_elemento['Perfil'] = perfiles_elemento[['Plato_name', 'Plato_tipo', 'Bebida_name', 'Tipo_bebida']].apply(lambda x: ' '.join(str(val) for val in x), axis=1)

   # Elimina duplicados
    perfiles_elemento.drop_duplicates(subset='Perfil', inplace=True)


    # Usamos el vectorizador TF-IDF para convertir las descripciones en vectores
    vectorizer = TfidfVectorizer(stop_words='english')
    perfil_matrix = vectorizer.fit_transform(perfiles_usuario['Perfil'])
    elemento_matrix = vectorizer.transform(perfiles_elemento['Perfil'])

    # Calculamos similitud de coseno entre perfiles de usuario y elementos
    cosine_similarities = linear_kernel(perfil_matrix, elemento_matrix)

    # Creamos un DataFrame con las similitudes
    similarity_df = pd.DataFrame(cosine_similarities, index=perfiles_usuario['User_name'], columns=perfiles_elemento.index)

    return perfil_matrix, elemento_matrix, similarity_df

In [None]:
def exportar_modelo():
    perfil_matrix, elemento_matrix, similarity_df = cargar_datos()

    # Guardar el modelo utilizando joblib
    joblib.dump(perfil_matrix, 'perfil_matrix.pkl')
    joblib.dump(elemento_matrix, 'elemento_matrix.pkl')
    joblib.dump(similarity_df, 'similarity_df.pkl')

In [None]:

def recomendar_elementos(usuario, top_n=5):
    perfil_matrix, elemento_matrix, similarity_df = cargar_modelo()
    if usuario in similarity_df.index:
        recomendaciones_indices = similarity_df.loc[usuario].sort_values(ascending=False).head(top_n).index
        recomendaciones_nombres = perfiles_elemento.loc[recomendaciones_indices, 'Perfil']
        return recomendaciones_nombres
    else:
        return []


In [None]:
# Ejemplo de uso
if __name__ == "__main__":
    # Exportar el modelo
    exportar_modelo()

    # Ejemplo de recomendación
    usuario_ejemplo = 'Usuario_009'
    recomendaciones_usuario = recomendar_elementos(usuario_ejemplo)
    print(f"Recomendaciones para {usuario_ejemplo}: {recomendaciones_usuario}")

Recomendaciones para Usuario_009: 20    Lasaña Vegetariana Plato Principal  
20                     Mint Julep Cócteles
0      Paella Valenciana Plato Principal  
0                                         
0                            Sangría Vinos
26            Mousse de Chocolate Postre  
26                  Cerveza Stout Cervezas
11            Falafel con Hummus Entrada  
11                Agua de Coco Sin alcohol
12               Ceviche Peruano Entrada  
12                    Whisky Sour Cócteles
Name: Perfil, dtype: object


A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  perfiles_usuario['Alimentacion'].fillna('', inplace=True)
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  perfiles_elemento.fillna('', inplace=True)


In [None]:
from google.colab import files

# Supongamos que "perfil_matrix.pkl", "elemento_matrix.pkl" y "similarity_df.pkl" son los nombres de tus archivos
files.download("perfil_matrix.pkl")
files.download("elemento_matrix.pkl")
files.download("similarity_df.pkl")


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [None]:
pip  install flack



### Creación Servidor local

In [None]:
import http.server
import socketserver

PORT = 8000

Handler = http.server.SimpleHTTPRequestHandler

with socketserver.TCPServer(("", PORT), Handler) as httpd:
    print("serving at port", PORT)
    httpd.serve_forever()

### Uso Flask

In [None]:
from flask import Flask, redirect

app = Flask(__name__)

@app.route('/descargar_perfil_matrix')
def descargar_perfil_matrix():
    # Reemplazo 'ENLACE_DE_GOOGLE_DRIVE' con el enlace directo de Google Drive
    return redirect('/content/perfil_matrix.pkl')

if __name__ == '__main__':
    app.run(debug=True)

 * Serving Flask app '__main__'
 * Debug mode: on


 * Running on http://127.0.0.1:5000
INFO:werkzeug:[33mPress CTRL+C to quit[0m
INFO:werkzeug: * Restarting with stat


In [None]:
from flask import Flask, redirect

app = Flask(__name__)

@app.route('/descargar_elemento_matrix')
def descargar_perfil_matrix():
    # Reemplaza 'ENLACE_DE_GOOGLE_DRIVE' con el enlace directo de Google Drive
    return redirect('/content/elemento_matrix.pkl')

if __name__ == '__main__':
    app.run(debug=True)


In [None]:
from flask import Flask, redirect

app = Flask(__name__)

@app.route('/descargar_similarity_df')
def descargar_perfil_matrix():
    # Reemplaza 'ENLACE_DE_GOOGLE_DRIVE' con el enlace directo de Google Drive
    return redirect('/content/similarity_df.pkl')

if __name__ == '__main__':
    app.run(debug=True)


In [None]:
pip install gunicorn

Collecting gunicorn
  Downloading gunicorn-21.2.0-py3-none-any.whl (80 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/80.2 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━━[0m [32m61.4/80.2 kB[0m [31m2.0 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m80.2/80.2 kB[0m [31m1.5 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: gunicorn
Successfully installed gunicorn-21.2.0
