# Trabajo Práctico

Se requiere la relaización de un programa que interactúe con el usuario para recomendar lecturas. El programa ofrecerá tres opciones principales:

- Recomendación Directa:¿Qué tienes ganas de leer hoy? Mediante la clasificación de la respuesta el programa propondrá una lista de tres libros acordes a las temáticas mencionadas. Además deberá detallar el autor, género y una breve reseña de ese libro.

- Elección por Autor: Si el usuario busca por autor, el programa ofrecerá una lista de libros del autor especificado. En caso de que haya múltiples resultados, se basará en la similitud de los dos primeros resultados más relevantes, retornando dos títulos (con sus respectivas reseñas) del resultado más ercano y uno del segundo que se recomiendan para descargar.

- Elección por Género Literario: Similar a la búsqueda por autor, si el usuario elige buscar por género, el programa ofrecerá una lista de libros del género especificado. Aplicará la misma lógica de similitud para seleccionar y presentar los resultados.

<h3>Requisitos del dataset</h3>

El dataset debe tener de un mínimo de 100 libros con los siguientes datos:
-	género literario (mínimo 10)
-	autor
-	título
-	síntesis de cada libro


## Carga de la página

In [7]:
pagina = "https://ww3.lectulandia.com/"

## Librerias

In [8]:
import requests
from bs4 import BeautifulSoup

## Página bs4

Descubrimos que los la lista de géneros brindada por la página se encuentran en una estructura section cuyo id es "secgenero".

Luego, dentro de esa sección, los géneros se encuentran listados mediante los elementos li.

## Extracción de Géneros Literarios de Lectulandia

El siguiente código extrae los géneros literarios del sitio web [Lectulandia](https://ww3.lectulandia.com/):


In [9]:
url = "https://ww3.lectulandia.com/"

response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

#Buscamos el elemento section y su contenido
letra_div = soup.find('section', id='secgenero')

#obtenemos el contenido, específicamente los géneros
generos = letra_div.find_all('li')


## Enlaces a géneros

El siguiente proceso describe cómo extraer los géneros literarios del sitio web [Lectulandia](https://ww3.lectulandia.com/):

1. **Importación**: Se utilizan las librerías `requests` para realizar solicitudes HTTP y `BeautifulSoup` para parsear el HTML.

2. **Solicitud GET**: Se envía una solicitud GET al sitio web de Lectulandia para obtener su contenido HTML.

3. **Parseo**: Se convierte el contenido HTML en un objeto parseable utilizando `BeautifulSoup`.

4. **Búsqueda**: Se localiza la sección específica del HTML que contiene los géneros literarios buscando el elemento `<section>` con el ID `secgenero`.

5. **Extracción**: Se obtienen los géneros literarios dentro del elemento `<section>` extrayendo todos los elementos `<li>`.

6. **Enlaces**: Se extraen los enlaces de cada género literario buscando los elementos `<a>` dentro de los `<li>` y obteniendo sus atributos `href`, almacenándolos en una lista llamada `enlaces`.


La lista `enlaces` contendrá todos los enlaces a los géneros literarios disponibles en el sitio web de Lectulandia.

<span style="color:blue">**Nota**:</span> Este proceso permite tener una recopilación de los enlaces a los distintos géneros literarios que se encuentran en Lectulandia, facilitando la navegación y el acceso a los diferentes géneros.

In [10]:
enlaces = []

for genero in generos:
  enlace = genero.find('a')
  if enlace:
    href=enlace.get('href')
    enlaces.append(href)

enlaces

['/genero/arqueologia/',
 '/genero/arquitectura/',
 '/genero/arte/',
 '/genero/astrologia/',
 '/genero/astronomia/',
 '/genero/autoayuda/',
 '/genero/autobiografico/',
 '/genero/aventuras/',
 '/genero/biografia/',
 '/genero/biologia/',
 '/genero/belico/',
 '/genero/ciencia/',
 '/genero/ciencia-ficcion/',
 '/genero/ciencias-exactas/',
 '/genero/ciencias-naturales/',
 '/genero/ciencias-sociales/',
 '/genero/cine/',
 '/genero/cinematografia/',
 '/genero/clasico/',
 '/genero/comunicacion/',
 '/genero/costumbrista/',
 '/genero/critica/',
 '/genero/critica-y-teoria-literaria/',
 '/genero/cronica/',
 '/genero/cronicas/',
 '/genero/cuentos/',
 '/genero/cultura/',
 '/genero/comic/',
 '/genero/deporte/',
 '/genero/deportes/',
 '/genero/deportes-y-juegos/',
 '/genero/diccionarios-y-enciclopedias/',
 '/genero/didactico/',
 '/genero/distopia/',
 '/genero/divulgacion/',
 '/genero/divulgacion-cientifica/',
 '/genero/drama/',
 '/genero/ecologia/',
 '/genero/economia/',
 '/genero/educacion/',
 '/genero

## Sacamos tildes

El siguiente proceso describe cómo eliminar los acentos de una lista de enlaces utilizando Python:

1. **Importación**: Se utiliza la librería `unicodedata` para manejar la normalización de caracteres Unicode.

2. **Función `remove_accents`**:
   - **Propósito**: Elimina los acentos de una cadena de texto.
   - **Proceso**:
     - **Normalización**: Convierte la cadena de texto a su forma normalizada NFKD.
     - **Eliminación de Acentos**: Recorre la cadena y elimina los caracteres diacríticos (acentos).

3. **Uso de la Función**:
   - Se aplica la función `remove_accents` a cada enlace en la lista `enlaces` para eliminar los acentos.


La lista `enlaces` contendrá los enlaces originales pero con los acentos eliminados, facilitando su manejo y procesamiento posterior.

<span style="color:blue">**Nota**:</span> Este proceso es útil para normalizar textos y evitar problemas con caracteres especiales en enlaces o cualquier otro tipo de cadena de texto.


In [11]:
!pip install unicodedata2



In [12]:
import unicodedata

def remove_accents(input_str):
    nfkd_form = unicodedata.normalize('NFKD', input_str)
    return ''.join([c for c in nfkd_form if not unicodedata.combining(c)])

# Uso
for e in enlaces:
  remove_accents(e)

#enlaces

## Reemplazo de espacios por '-'

El siguiente proceso describe cómo reemplazar los espacios en una lista de enlaces utilizando Python:

1. **Reemplazo de Espacios**:
   - Se recorre cada enlace en la lista `enlaces` y se reemplazan los espacios (`" "`) por guiones (`"-"`).

Resultado

La lista `enlaces` contendrá los enlaces originales pero con los espacios reemplazados por guiones, facilitando su uso en URLs y evitando problemas de codificación de espacios.

<span style="color:blue">**Nota**:</span> Este proceso es útil para normalizar enlaces y hacerlos más adecuados para su uso en la web, donde los espacios pueden causar problemas de formato.

In [13]:
for e in enlaces:
  e.replace(" ", "-")

#enlaces

## Funcion para extraer libros de los géneros

El siguiente proceso describe cómo extraer información de libros desde una lista de enlaces utilizando Python:

1. **Definición de la Función `libro`**:
   - **Propósito**: Crear un diccionario con títulos de libros y sus correspondientes URLs y géneros.
   - **Parámetros**:
     - `url`: La URL base del sitio web.
     - `enlace`: La lista de enlaces a los géneros literarios.

2. **Proceso Dentro de la Función**:
   - **Inicialización**: Se crea un diccionario vacío `diccionario`.
   - **Iteración**: Se recorren los primeros 56 enlaces en la lista `enlace`.
     - **Solicitud GET**: Se envía una solicitud GET combinando la URL base y el enlace del género.
     - **Parseo del HTML**: Se convierte el contenido HTML en un objeto parseable usando `BeautifulSoup`.
     - **Extracción del Título**: Se busca el primer elemento `<a>` con la clase `title` y se extrae su texto y URL (`href`).
     - **Actualización del Diccionario**: Se agrega una nueva entrada al diccionario con el título del libro como clave, y un subdiccionario con la URL y el género como valor.

3. **Retorno del Diccionario**:
   - La función retorna el diccionario `diccionario` que contiene la información de los libros.

Resultado

La variable `dic` contendrá un diccionario con títulos de libros, sus URLs y géneros correspondientes.

<span style="color:blue">**Nota**:</span> Este proceso permite recopilar información estructurada de libros desde un sitio web, facilitando su análisis y procesamiento posterior.

In [14]:
def libro(url,enlace):
    diccionario = {}
    for gen in enlace[:56]:
        respuesta = requests.get(url+gen)
        titulo = BeautifulSoup(respuesta.text, 'html.parser').find('a', class_ = 'title')
        href = titulo.get('href')
        diccionario[titulo.text] = {'url': href,
                                    'genero': gen}
    return diccionario


In [15]:
dic = libro("https://ww3.lectulandia.com/", enlaces)

# Funcion extraer autor y sinopsis


Pasos

1. **Iteración sobre los Títulos**:
   - La función itera sobre los títulos del diccionario proporcionado.

2. **Construcción de la URL**:
   - Para cada título, se construye la URL completa del libro utilizando la URL base y la URL específica del libro obtenida del diccionario.

3. **Extracción de Autor y Sinopsis**:
   - Se realiza una solicitud GET a la URL del libro y se parsea el contenido HTML.
   - Se extraen el autor y la sinopsis del libro utilizando etiquetas específicas del HTML.

4. **Extracción de Género**:
   - El género se obtiene directamente del diccionario proporcionado.

5. **Construcción del Nuevo Diccionario**:
   - Se construye un nuevo diccionario donde las claves son los títulos de los libros y los valores son diccionarios con las llaves 'autor', 'sinopsis' y 'genero'
   
   
Resultado

El diccionario resultante, `dicAutor`, contendrá la información de autor, sinopsis y género para cada libro, listo para ser utilizado en análisis posteriores o en la creación de un dataset.

<span style="color:blue">**Nota**:</span> Este proceso facilita la extracción y organización de información de libros de una base de datos en línea para su posterior análisis o uso.

In [16]:
def autor_sinopsis(base_url, dic):
    dicAutor = {}
    titulos = dic.keys()
    for titulo in titulos:
        # Construir URL completa del libro
        libro_url = base_url + dic[titulo]['url']
        respuesta = requests.get(libro_url)
        soup = BeautifulSoup(respuesta.text, 'html.parser')

        # Extraer autor y sinopsis
        autor = soup.find('div', id='autor').find('a', class_='dinSource').text.strip()
        sinopsis = soup.find('div', id='sinopsis').text.strip()

        # Extraer género directamente del diccionario
        genero = dic[titulo]['genero'].strip()

        dicAutor[titulo.strip()] = {
            'autor': autor,
            'sinopsis': sinopsis,
            'genero': genero
        }

    return dicAutor


In [17]:
dicAutor = autor_sinopsis(pagina ,dic)
#dicAutor

# DataFrame


A continuación se crea un dataframe para utilizar posteriormente en la recomendacion de los libros.

1. **Importación**: Se utiliza la librería `pandas` para la creación del df.

2. **Creación del dataframe**:
   - **Propósito**: Unificar los datos en un solo dataframe
   - **Proceso**:
     - Cargamos el diccionario y lo convertimos en dataframe.
     - Renombramos una columna y mejoramos los valores de `genero`

In [18]:
import pandas as pd

In [19]:
# Convertir el diccionario en un DataFrame y añadir la columna "Libro"
df = pd.DataFrame.from_dict(dicAutor, orient='index').reset_index()
df = df.rename(columns={'index': 'Libro'})

In [20]:
df['genero'] = df['genero'].str.replace('/genero/', '')
df['genero'] = df['genero'].str.replace('/', '')

In [21]:
df.head()

Unnamed: 0,Libro,autor,sinopsis,genero
0,El mundo de la arqueología,C. W. Ceram,"Las maravillas de la tumba de Tutankamen, la T...",arqueologia
1,La ciudad invisible,Kurt Kohlstedt,La ciudad invisible nos invita a explorar de m...,arquitectura
2,La invención del cuerpo: arte y erotismo en el...,Carmen Sánchez Fernández,"En el mundo clásico, el pensamiento religioso,...",arte
3,Picatrix,Maslama Ibn Ahmad Al-Mayriti,El Picatrix es un antiguo grimorio árabe de as...,astrologia
4,En busca de Venus,Andrea Wulf,El emocionante relato de la primera colaboraci...,astronomia


# Recomendacion

## GloVe

Generación de Embeddings para Sinopsis de Libros

El siguiente proceso describe cómo generar embeddings para las sinopsis de libros utilizando GloVe pre-entrenado:

1. **Instalación y Descarga de Recursos**:
   - Se instala la librería Gensim (`!pip install gensim`).
   - Se descarga el archivo GloVe pre-entrenado desde [este enlace](http://nlp.stanford.edu/data/glove.6B.zip) utilizando `wget`.
   - Se descomprime el archivo GloVe descargado.

2. **Importación de Librerías**:
   - Se importan las librerías necesarias, incluyendo `KeyedVectors` de Gensim y `cosine_similarity` de `sklearn.metrics.pairwise`.

3. **Convertir GloVe a Word2Vec**:
   - Se convierte el archivo GloVe al formato Word2Vec utilizando la función `glove2word2vec` de Gensim.

4. **Cargar GloVe como Word2Vec**:
   - Se carga el archivo GloVe convertido como formato Word2Vec utilizando `KeyedVectors.load_word2vec_format`.

5. **Función para Obtener Embeddings**:
   - Se define la función `get_embedding(sentence)` que genera embeddings para una oración/sinopsis dada.
   - La función divide la sinopsis en palabras, busca el embedding de cada palabra en el modelo cargado, y calcula el promedio de los embeddings de las palabras presentes en la sinopsis.
   - Si ninguna palabra tiene un embedding, se devuelve un vector de ceros.

6. **Aplicación de la Función**:
   - Se aplica la función `get_embedding` a cada sinopsis en el DataFrame `df`.
   - Los embeddings resultantes se almacenan en una nueva columna llamada `embedding`.

Resultado

La columna `embedding` del DataFrame `df` contendrá los embeddings generados para cada sinopsis de libro, lo que facilita el análisis y la comparación de similitudes entre las sinopsis.

<span style="color:blue">**Nota**:</span> Este proceso utiliza embeddings pre-entrenados para convertir las sinopsis de libros en representaciones numéricas que pueden ser utilizadas en tareas de análisis de texto y minería de datos.


***Omitir estas proximas dos celdas si se tienen los archivos (Vienen en github)***

In [17]:
!pip install gensim



In [18]:
!wget http://nlp.stanford.edu/data/glove.6B.zip



--2024-06-04 21:06:13--  http://nlp.stanford.edu/data/glove.6B.zip
Resolving nlp.stanford.edu (nlp.stanford.edu)... 171.64.67.140
Connecting to nlp.stanford.edu (nlp.stanford.edu)|171.64.67.140|:80... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://nlp.stanford.edu/data/glove.6B.zip [following]
--2024-06-04 21:06:13--  https://nlp.stanford.edu/data/glove.6B.zip
Connecting to nlp.stanford.edu (nlp.stanford.edu)|171.64.67.140|:443... connected.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: https://downloads.cs.stanford.edu/nlp/data/glove.6B.zip [following]
--2024-06-04 21:06:14--  https://downloads.cs.stanford.edu/nlp/data/glove.6B.zip
Resolving downloads.cs.stanford.edu (downloads.cs.stanford.edu)... 171.64.64.22
Connecting to downloads.cs.stanford.edu (downloads.cs.stanford.edu)|171.64.64.22|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 862182613 (822M) [application/zip]
Saving to: ‘glove.6B.zip’


202

***Segui desde aca***

In [22]:
!unzip glove.6B.zip

"unzip" no se reconoce como un comando interno o externo,
programa o archivo por lotes ejecutable.


In [23]:
from gensim.models import KeyedVectors
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

In [24]:
from gensim.scripts.glove2word2vec import glove2word2vec
from gensim.models import KeyedVectors

# Convertir el archivo GloVe al formato Word2Vec
glove_input_file = 'glove.6B.100d.txt'
word2vec_output_file = 'glove.6B.100d.word2vec.txt'
glove2word2vec(glove_input_file, word2vec_output_file)

# Cargar el archivo GloVe directamente como formato Word2Vec
glove_input_file = 'glove.6B.100d.txt'
word_vectors = KeyedVectors.load_word2vec_format(glove_input_file, binary=False, no_header=True)

  glove2word2vec(glove_input_file, word2vec_output_file)


In [25]:
def get_embedding(sentence):
    words = sentence.split()
    embedding = []
    for word in words:
        if word in word_vectors.key_to_index:
            embedding.append(word_vectors[word])
    if embedding:
        return np.mean(embedding, axis=0)
    else:
        return np.zeros(100)  # Si ninguna palabra tiene embedding, devolvemos un vector de ceros

df['embedding'] = df['sinopsis'].apply(get_embedding)


# Correr en entorno local

### Recomendacion directa

Función de Recomendación Directa de Libros

La siguiente función, `recomendacion_directa`, permite recomendar libros basados en el género literario ingresado por el usuario:

Descripción

1. **Interacción con el Usuario**:
   - La función solicita al usuario que ingrese el género de libro que desea leer.

2. **Generación de Embedding**:
   - Se genera un embedding para la consulta del usuario utilizando una función llamada `get_embedding`.

3. **Cálculo de Similitud**:
   - Se calcula la similitud de coseno entre la consulta del usuario y las sinopsis de los libros en una base de datos (`df`).

4. **Recomendación de Libros**:
   - Se ordenan los libros por similitud y se recomiendan los tres más similares.

5. **Resultados**:
   - Se muestra al usuario las recomendaciones de libros, incluyendo título, autor, género y sinopsis de cada libro.

Resultado

La función `recomendacion_directa` proporciona al usuario recomendaciones de libros basadas en el género literario ingresado.

<span style="color:blue">**Nota**:</span> Es importante destacar que esta función es una herramienta útil para recomendar libros de manera directa, permitiendo al usuario explorar opciones dentro de su género literario preferido.


In [33]:
import tkinter as tk
from tkinter import simpledialog, messagebox
import pandas as pd
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity
from difflib import SequenceMatcher

In [34]:
def recomendacion_directa():
    consulta_usuario = simpledialog.askstring("¿Qué tenes ganas de leer hoy?", "Ingresa una breve frase de lo que te gustaría leer hoy:")

    if consulta_usuario is None:
        return

    consulta_embedding = get_embedding(consulta_usuario)

    if np.all(consulta_embedding == 0):
        messagebox.showerror("Error", "Mmmm algo hice mal, perdon profe.")
        return

    similarities = df['embedding'].apply(lambda x: cosine_similarity([consulta_embedding], [x])[0][0])

    libros_recomendados = df.iloc[similarities.nlargest(3).index]

    if libros_recomendados.empty:
        messagebox.showinfo("Sin resultados", "Me parece que no tengo ese género en mi base de datos, disculpame.")
    else:
        resultado = "\n¡Acá tienes algunas recomendaciones ( Igual, mejor es leer García Marquez )!\n"
        for index, libro in libros_recomendados.iterrows():
            resultado += f"\nTítulo: {libro['Libro']}\nAutor: {libro['autor']}\nGénero: {libro['genero']}\nSinopsis: {libro['sinopsis']}\n-----------------------------\n"
        messagebox.showinfo("Recomendaciones", resultado)

## Funcion recomendacion por autor

La siguiente función, `eleccion_por_autor`, permite recomendar libros basados en el autor literario seleccionado por el usuario:

Descripción

1. **Interacción con el Usuario**:
   - La función solicita al usuario que ingrese el nombre del autor cuyo libro desea leer.

2. **Filtrado por Autor**:
   - Se obtiene una lista única de autores disponibles en la base de datos (`df`).
   - Se verifica si el autor ingresado está en la lista de autores disponibles.

3. **Cálculo de Similitud**:
   - Se calcula la similitud entre el nombre del autor ingresado y los autores en la base de datos utilizando `SequenceMatcher`.

4. **Recomendación de Libros**:
   - Se filtran los libros por el autor seleccionado.
   - Se seleccionan los libros de los autores más similares y se agregan a los libros filtrados.

5. **Resultados**:
   - Se muestra al usuario las recomendaciones de libros, incluyendo título, autor, género y sinopsis de cada libro.

Resultado

La función `eleccion_por_autor` proporciona al usuario recomendaciones de libros basadas en el autor literario ingresado.

<span style="color:blue">**Nota**:</span> Esta función es ideal para usuarios que desean explorar más obras de un autor específico o descubrir autores similares.

In [35]:
def eleccion_por_autor():
    autores_disponibles = df['autor'].unique()

    if len(autores_disponibles) == 0:
        messagebox.showinfo("Sin autores", "Parece que me quede sin autores... Mejor pedile a ChatGPT que te escriba un libro!")
        return

    autor_usuario = simpledialog.askstring("¿De qué autor te gustaría buscar libros?", "Autores disponibles:\n" + "\n".join(autores_disponibles))

    if autor_usuario is None:
        return

    if autor_usuario not in autores_disponibles:
        messagebox.showerror("Error", "No tengo ese autor, mil disculpas...")
        return

    libros_filtrados = df[df['autor'] == autor_usuario]

    similarities = df['autor'].apply(lambda x: SequenceMatcher(None, x.lower(), autor_usuario.lower()).ratio())

    indices_similares = similarities.nlargest(2).index

    libros_recomendados = pd.concat([libros_filtrados, df.loc[indices_similares]])

    resultado = "\n¡Aquí tienes algunas recomendaciones para ti!\n"
    for index, libro in libros_recomendados.iterrows():
        resultado += f"\nTítulo: {libro['Libro']}\nAutor: {libro['autor']}\nGénero: {libro['genero']}\nSinopsis: {libro['sinopsis']}\n-----------------------------\n"
    messagebox.showinfo("Recomendaciones", resultado)

### Funcion por género

La siguiente función, `eleccion_por_genero`, permite recomendar libros basados en el género literario seleccionado por el usuario:

Descripción

1. **Interacción con el Usuario**:
   - La función solicita al usuario que ingrese el género de libro que desea leer.

2. **Filtrado por Género**:
   - Se obtiene una lista única de géneros disponibles en la base de datos (`df`).
   - Se verifica si el género ingresado está en la lista de géneros disponibles.

3. **Cálculo de Similitud**:
   - Se calcula la similitud entre el género ingresado y los géneros en la base de datos utilizando `SequenceMatcher`.

4. **Recomendación de Libros**:
   - Se filtran los libros por el género seleccionado.
   - Se seleccionan los libros de los géneros más similares y se agregan a los libros filtrados.

5. **Resultados**:
   - Se muestra al usuario las recomendaciones de libros, incluyendo título, autor, género y sinopsis de cada libro.

Resultado

La función `eleccion_por_genero` proporciona al usuario recomendaciones de libros basadas en el género literario ingresado.

<span style="color:blue">**Nota**:</span> Esta función es ideal para usuarios que desean explorar libros dentro de un género literario específico, permitiéndoles descubrir nuevas obras y autores dentro de sus intereses preferidos.

In [36]:
def eleccion_por_genero():
    generos_disponibles = df['genero'].unique()

    if len(generos_disponibles) == 0:
        messagebox.showinfo("Sin géneros", "Me quedé sin ideas, perdon.")
        return

    genero_usuario = simpledialog.askstring("¿Qué género literario te interesa?", "Géneros disponibles:\n" + "\n".join(generos_disponibles))

    if genero_usuario is None:
        return

    if genero_usuario not in generos_disponibles:
        messagebox.showerror("Error", "Mmmm chequea de nuevo...")
        return

    libros_filtrados = df[df['genero'] == genero_usuario]

    similarities = df['genero'].apply(lambda x: SequenceMatcher(None, x.lower(), genero_usuario.lower()).ratio())

    indices_similares = similarities.nlargest(2).index

    libros_recomendados = pd.concat([libros_filtrados, df.loc[indices_similares]])

    resultado = "\n¡Aquí tienes algunas recomendaciones para ti!\n"
    for index, libro in libros_recomendados.iterrows():
        resultado += f"\nTítulo: {libro['Libro']}\nAutor: {libro['autor']}\nGénero: {libro['genero']}\nSinopsis: {libro['sinopsis']}\n-----------------------------\n"
    messagebox.showinfo("Recomendaciones", resultado)

### Funcion main

La siguiente función, `recomendar_lectura`, crea una interfaz gráfica para recomendar libros basada en diferentes criterios (género, autor, etc.) usando Tkinter.

Descripción

1. **Creación de la Ventana Principal**:
   - Se crea una ventana principal con el título "Biblioteca Favorita" y dimensiones 300x200 píxeles.

2. **Etiqueta de Bienvenida**:
   - Se añade una etiqueta de bienvenida que indica al usuario que está en su biblioteca favorita y que puede pedir ayuda al bibliotecario.

3. **Botones de Opciones**:
   - **Botón 1**: "¿Qué tenes ganas de leer hoy?" - Llama a la función `recomendacion_directa`.
   - **Botón 2**: "Decime un autor que te guste!" - Llama a la función `eleccion_por_autor`.
   - **Botón 3**: "Elige un género!" - Llama a la función `eleccion_por_genero`.
   - **Botón 4**: "Salir" - Cierra la ventana principal.

4. **Ejecución de la Interfaz**:
   - La interfaz se mantiene en un bucle mediante `ventana.mainloop()` para que permanezca activa y esperando interacciones del usuario.

Resultado

La función `recomendar_lectura` proporciona una interfaz gráfica para que el usuario pueda solicitar recomendaciones de libros basadas en sus preferencias de género, autor, o simplemente explorar opciones disponibles.

<span style="color:blue">**Nota**:</span> Esta función utiliza Tkinter para crear una interfaz amigable que facilita la interacción del usuario con el sistema de recomendación de libros, mejorando la experiencia de búsqueda y descubrimiento de nuevas lecturas.

In [37]:
import tkinter as tk
from tkinter import simpledialog, messagebox
import pandas as pd
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity
from difflib import SequenceMatcher

In [40]:
def recomendar_lectura():
    ventana = tk.Tk()
    ventana.title("Biblioteca Favorita")
    ventana.geometry("300x200")

    label_bienvenida = tk.Label(ventana, text="¡Bienvenido a tu Biblioteca favorita!\nSoy el bibliotecario y estoy acá para ayudarte con lo que necesites.")
    label_bienvenida.pack(pady=10)

    boton_1 = tk.Button(ventana, text="¿Qué tenes ganas de leer hoy?", command=recomendacion_directa)
    boton_1.pack(pady=5)

    boton_2 = tk.Button(ventana, text="Decime un autor que te guste!", command=eleccion_por_autor)
    boton_2.pack(pady=5)

    boton_3 = tk.Button(ventana, text="Elige un género!", command=eleccion_por_genero)
    boton_3.pack(pady=5)

    boton_4 = tk.Button(ventana, text="Salir", command=ventana.destroy)
    boton_4.pack(pady=5)

    ventana.mainloop()

recomendar_lectura()

# Correr en colab

In [None]:
def recomendacion_directa():
    print("¿Qué tenes ganas de leer hoy?")
    consulta_usuario = input("Ingresa el género de libro: ")

    # Generar el embedding para la consulta del usuario
    consulta_embedding = get_embedding(consulta_usuario)

    if np.all(consulta_embedding == 0):
        print("Mmmm algo hice mal, perdon profe.")
        return

    # Calcular la similitud de coseno entre la consulta del usuario y las sinopsis de los libros
    similarities = df['embedding'].apply(lambda x: cosine_similarity([consulta_embedding], [x])[0][0])

    # Ordenar los libros por similitud y recomendar los tres más similares
    libros_recomendados = df.iloc[similarities.nlargest(3).index]

    if libros_recomendados.empty:
        print("Me parece que no tengo ese género en mi base de datos, disculpame.")
    else:
        print("--------------------------------------")
        print("\n¡Acá tienes algunas recomendaciones ( Igual, mejor es leer García Marquez )!\n")
        print("--------------------------------------")

        for index, libro in libros_recomendados.iterrows():
            print("Título:", libro['Libro'])
            print("Autor:", libro['autor'])
            print("Género:", libro['genero'])
            print("Sinopsis:", libro['sinopsis'])
            print("-----------------------------")


In [None]:
def eleccion_por_autor():
    print("¿De qué autor te gustaría buscar libros?")

    # Obtener una lista única de autores disponibles en el DataFrame
    autores_disponibles = df['autor'].unique()

    if len(autores_disponibles) == 0:
        print("--------------------------------------")
        print("Parece que me quede sin autores... Mejor pedile a ChatGPT que te escriba un libro!")
        print("--------------------------------------")

        return

    print("Autores disponibles:")
    for idx, autor in enumerate(autores_disponibles, start=1):
        print(f"{idx}. {autor}")

    # Solicitar al usuario que elija un autor de la lista
    opcion = input("Por favor, ingresa el número correspondiente al autor: ")

    try:
        opcion = int(opcion)
        if opcion < 1 or opcion > len(autores_disponibles):
            raise ValueError
        autor_usuario = autores_disponibles[opcion - 1]
    except (ValueError, IndexError):
        print("--------------------------------------")
        print("No tengo ese autor, mil disculpas...")
        print("--------------------------------------")
        return

    # Filtrar el DataFrame por el nombre del autor seleccionado por el usuario
    libros_filtrados = df[df['autor'] == autor_usuario]

    # Calcular la similitud de coseno entre el nombre del autor seleccionado y los nombres de autores en el DataFrame
    similarities = df['autor'].apply(lambda x: SequenceMatcher(None, x.lower(), autor_usuario.lower()).ratio())

    # Obtener los índices de los libros de los dos autores más similares
    indices_similares = similarities.nlargest(2).index

    # Seleccionar los libros de los autores más similares y agregarlos a los libros filtrados
    libros_recomendados = pd.concat([libros_filtrados, df.loc[indices_similares]])

    print("\n¡Aquí tienes algunas recomendaciones para ti!\n")
    for index, libro in libros_recomendados.iterrows():
        print("Título:", libro['Libro'])
        print("Autor:", libro['autor'])
        print("Género:", libro['genero'])
        print("Sinopsis:", libro['sinopsis'])
        print("-----------------------------")


In [None]:
def eleccion_por_genero():
    print("----------------------------------")
    print("¿Qué género literario te interesa?")
    print("----------------------------------")


    # Obtener una lista única de géneros disponibles en el DataFrame
    generos_disponibles = df['genero'].unique()

    if len(generos_disponibles) == 0:
        print("Me quedé sin ideas, perdon.")
        return

    print("Géneros disponibles:")
    for idx, genero in enumerate(generos_disponibles, start=1):
        print(f"{idx}. {genero}")

    # Solicitar al usuario que elija un género de la lista
    opcion = input("Por favor, ingresá el número correspondiente al género: ")

    try:
        opcion = int(opcion)
        if opcion < 1 or opcion > len(generos_disponibles):
            raise ValueError
        genero_usuario = generos_disponibles[opcion - 1]
    except (ValueError, IndexError):
        print("Mmmm chequea de nuevo...")
        return

    # Filtrar el DataFrame por el género literario seleccionado por el usuario
    libros_filtrados = df[df['genero'] == genero_usuario]

    # Calcular la similitud de coseno entre el género literario seleccionado y los géneros en el DataFrame
    similarities = df['genero'].apply(lambda x: SequenceMatcher(None, x.lower(), genero_usuario.lower()).ratio())

    # Obtener los índices de los libros de los dos géneros más similares
    indices_similares = similarities.nlargest(2).index

    # Seleccionar los libros de los géneros más similares y agregarlos a los libros filtrados
    libros_recomendados = pd.concat([libros_filtrados, df.loc[indices_similares]])

    print("\n¡Aquí tienes algunas recomendaciones para ti!\n")
    for index, libro in libros_recomendados.iterrows():
        print("Título:", libro['Libro'])
        print("Autor:", libro['autor'])
        print("Género:", libro['genero'])
        print("Sinopsis:", libro['sinopsis'])
        print("-----------------------------")


In [None]:
def recomendar_lectura():
    print("¡Bienvenido a tu Biblioteca favorita!\nSoy el bibliotecario y estoy acá para ayudarte con lo que necesites.")

    while True:
        print("\nOpciones:")
        print("1. ¿Qué tenes ganas de leer hoy?")
        print("2. Decime un autor que te guste!")
        print("3. Elige un género!")
        print("4. Salir")

        opcion = input("Por favor, elegí una opción (1-4): ")

        if opcion == "1":
            recomendacion_directa()
        elif opcion == "2":
            eleccion_por_autor()

        elif opcion == "3":
            eleccion_por_genero()
        elif opcion == "4":
            print("Nos vemos la próxima!")
            break
        else:
            print("---------------------------------------------------------------------------------------------")
            print("Todavía no soy un chatbot con APIKey de OpenAI, limitate a las posibles opciones, gracias...")
            print("---------------------------------------------------------------------------------------------")



In [None]:
recomendar_lectura()