In [13]:
# Data science
import pandas as pd
print(f"Pandas: {pd.__version__}")
import numpy as np
print(f"Numpy: {np.__version__}")

# Deep Learning 
import tensorflow as tf
print(f"Tensorflow: {tf.__version__}")
from tensorflow import keras
import sklearn
print(f"Sklearn: {sklearn.__version__}")

# NER
import spacy
print(f'spaCy: {spacy.__version__}')
import random
from spacy.training.example import Example

from sentence_transformers import SentenceTransformer, util
from transformers import pipeline

Pandas: 2.0.3
Numpy: 1.24.3
Tensorflow: 2.13.0
Sklearn: 1.3.2
spaCy: 3.7.4


In [14]:
data = [
    "Quisiera comprar una camiseta.",
    "Me gustaría pedir una camiseta.",
    "Necesito una camiseta nueva.",
    "Quiero una camiseta de algodón.",
    "Estoy buscando una camiseta en talla grande.",
    "Deseo comprar una camiseta con estampado.",
    "¿Puedo pedir una camiseta en color azul?",
    "Necesitaría una camiseta de manga corta.",
    "Estoy interesado en una camiseta deportiva.",
    "Quiero comprar una camiseta para correr.",
    "Me gustaría adquirir una camiseta negra.",
    "Necesito una camiseta para un regalo.",
    "Deseo pedir una camiseta en talla mediana.",
    "¿Podría tener una camiseta en oferta?",
    "Estoy buscando una camiseta con cuello en V.",
    "Quiero una camiseta personalizada.",
    "Quisiera ordenar una camiseta para el verano.",
    "Necesito una camiseta resistente al desgaste.",
    "Quiero adquirir un pantalón.",
    "¿Podría comprar unos zapatos?",
    "¿Tienes camisetas de mi talla?",
    "Estoy interesado en unos pantalones vaqueros.",
    "Busco una camiseta bonita.",
    "Quiero comprar ropa.",
    "Necesito una camiseta de manga corta para este verano.",
    "Quiero unos pantalones calentitos para el invierno.",
    "¿Hay zapatos de la talla 45?",
    "Estoy buscando una chaqueta a juego con mi outfit.",
    "Camiseta de manga larga.",
    "Necesito ropa para renovar mi armario.",
    "¿Puedo comprar una chaqueta bonita?",
    "Hay camisetas azules.",
    "Quiero obtener unos pantalones de esta marca.",
    "Quiero conseguir una chaqueta que me proteja bien del frío.",
    "Mi deseo es obtener una camiseta de tirantes.",
    "Comprar pantalón rojo.",
    "Buenas, me gustaría una camiseta negra básica.",
    "Quiero comprar una camiseta roja en talla S.",
    "Estoy interesado en adquirir unos pantalones negros.",
    "Deseo comprar un vestido azul en talla M.",
    "Necesito comprar una chaqueta gris.",
    "¿Cuánto cuesta una camisa verde en talla L?",
    "¿Tienes sudaderas en negro?",
    "Busco una falda azul.",
    "Estoy buscando un jersey blanco.",
    "Quiero comprar un abrigo gris.",
    "¿Tienes shorts en azul?",
    "¿Puedo comprar una bufanda verde?",
    "¿Dónde puedo comprar un gorro rojo?",
    "¿Tienes chalecos en negro?",
    "¿Dónde puedo comprar un traje blanco?",
    "¿Hay blusas azules disponibles?",
    "¿Dónde puedo encontrar ponchos verdes?",
    "Quiero comprar un cinturón negro.",
    "¿Venden calcetines rojos?",
    "¿Cuál es el precio de las camisetas rojas?",
    "¿Tienen vestidos azules disponibles?",
    "Necesito un pantalón de trabajo resistente.",
    "¿Tienen descuentos en camisetas de manga larga?",
    "Quiero ver los chalecos de lana que tienen.",
    "Busco una camisa de algodón 100%.",
    "¿Qué estilos de faldas tienen?",
    "Necesito una sudadera con capucha.",
    "¿Tienen abrigos en talla grande?",
    "Busco una camiseta con estampado gráfico.",
    "¿Cuál es el precio de este pantalón de mezclilla?",
    "Me interesa un chaleco acolchado para el frío.",
    "¿Tienen camisas de manga corta en oferta?",
    "Estoy buscando una falda para una ocasión especial.",
    "¿Qué colores de sudaderas tienen en stock?",
    "¿Cuánto cuesta este abrigo de piel?",
    "¿Tienen camisetas de equipos deportivos?",
    "Quiero un pantalón cómodo para estar en casa.",
    "¿Qué tipos de chalecos venden?",
    "Busco un abrigo elegante para salir.",
    "¿Tienen camisas formales para hombres?",
    "Estoy buscando una falda de verano ligera.",
    "¿Tienen sudaderas sin capucha?",
    "¿Cuál es el precio de los pantalones de vestir?",
    "Quiero ver la colección de abrigos para niños.",
    "¿Tienen camisetas de algodón orgánico?",
    "Busco un pantalón con bolsillos laterales.",
    "¿Qué modelos de chalecos para mujer tienen?",
    "Necesito un abrigo resistente a la lluvia.",
    "¿Tienen camisas a cuadros?",
    "Me gustaría una falda plisada.",
    "¿Qué talla de sudaderas tienen?",
    "Estoy buscando un pantalón de colores vivos.",
    "¿Tienen chalecos reflectantes?",
    "Quiero un abrigo largo hasta los tobillos.",
    "¿Tienen camisas de seda?",
    "Busco una falda con bolsillos.",
    "¿Qué estampados tienen para sudaderas?",
    "Necesito un pantalón para hacer ejercicio.",
    "¿Tienen chalecos térmicos?",
    "Quiero una camiseta para correr."
]


In [15]:
# Diccionario de entidades con categorías de prendas y colores
entidades = {
    "prenda": [
        "camiseta", "camisetas",
        "pantalón", "pantalones",
        "camisa", "camisas",
        "suéteres", "suéter",
        "chaqueta", "chaquetas",
        "falda", "faldas",
        "vestido", "vestidos",
        "sudadera", "sudaderas",
        "jersey", "jerséis",
        "abrigo", "abrigos",
        "shorts",
        "blusa", "blusas",
        "accesorios",
        "bufanda", "bufandas",
        "gorro", "gorros",
        "chaleco", "chalecos",
        "zapato", "zapatos",
        "poncho", "ponchos",
        "sombrero", "sombreros",
        "cinturón", "cinturones",
        "calcetín", "calcetines"
    ],
    # Lista de colores disponibles
    # "color": [
    #     "rojo", "rojos",
    #     "roja", "rojas",
    #     "azul", "azules",
    #     "negro", "negros",
    #     "negra", "negras",
    #     "verde", "verdes",
    #     "gris", "grises",
    #     "blanco", "blancos", 
    #     "blanca", "blancas", 
    #     "amarillo", "amarillos",
    #     "amarilla", "amarillas",
    #     "rosa", "rosas",
    #     "marrón", "marrones",
    #     "naranja", "naranjas",
    #     "celeste", "celestes",
    #     "añil", "añiles",
    #     "morado", "morados",
    #     "morada", "moradas"
    # ]
}


In [16]:
# Cargar spaCy
nlp = spacy.load("es_core_news_sm")

In [17]:
# Definir la lista para almacenar los datos procesados
training_data = []

# Iterar sobre cada frase y generar los datos de entrenamiento
for utterance in data:
    doc = nlp(utterance)  # Procesar la frase con spaCy
    entities = []  # Lista para almacenar las entidades encontradas en la frase
    
    # Iterar sobre cada palabra en la frase
    for token in doc:
        # Buscar si la palabra está presente en alguna de las listas de entidades
        for label, keywords in entidades.items():
            if token.text.lower() in keywords:
                # Agregar la entidad encontrada al formato requerido por spaCy
                entities.append((token.idx, token.idx + len(token.text), label))
    
    # Almacenar los datos de la frase junto con las entidades encontradas
    training_data.append((utterance, {'entities': entities}))


In [18]:
TRAINING_DATA = training_data
TRAINING_DATA

[('Quisiera comprar una camiseta.', {'entities': [(21, 29, 'prenda')]}),
 ('Me gustaría pedir una camiseta.', {'entities': [(22, 30, 'prenda')]}),
 ('Necesito una camiseta nueva.', {'entities': [(13, 21, 'prenda')]}),
 ('Quiero una camiseta de algodón.', {'entities': [(11, 19, 'prenda')]}),
 ('Estoy buscando una camiseta en talla grande.',
  {'entities': [(19, 27, 'prenda')]}),
 ('Deseo comprar una camiseta con estampado.',
  {'entities': [(18, 26, 'prenda')]}),
 ('¿Puedo pedir una camiseta en color azul?',
  {'entities': [(17, 25, 'prenda')]}),
 ('Necesitaría una camiseta de manga corta.',
  {'entities': [(16, 24, 'prenda')]}),
 ('Estoy interesado en una camiseta deportiva.',
  {'entities': [(24, 32, 'prenda')]}),
 ('Quiero comprar una camiseta para correr.',
  {'entities': [(19, 27, 'prenda')]}),
 ('Me gustaría adquirir una camiseta negra.',
  {'entities': [(25, 33, 'prenda')]}),
 ('Necesito una camiseta para un regalo.', {'entities': [(13, 21, 'prenda')]}),
 ('Deseo pedir una camise

In [19]:
def obtener_entidades(texto):

        # Inicializar un modelo de SpaCy
    nlp = spacy.blank("es")

    # Crear el pipeline de reconocimiento de entidades
    ner = nlp.add_pipe("ner")

    # Añadir las etiquetas al pipeline
    ner.add_label("PRENDA")

    # Inicializar el optimizador
    optimizer = nlp.begin_training()

    # Entrenar el modelo
    for epoch in range(10):
        random.shuffle(TRAINING_DATA)
        losses = {}
        for text, annotations in TRAINING_DATA:
            example = Example.from_dict(nlp.make_doc(text), annotations)
            nlp.update([example], drop=0.5, losses=losses)
        print(losses)

    # Cargar el modelo entrenado de spaCy
    nlp = spacy.load("modelo_entrenado_spacy")
    
    # Procesar el texto con el modelo entrenado
    doc = nlp(texto)
    
    # Inicializar el modelo de question-answering
    qa_model = pipeline("question-answering", "timpal0l/mdeberta-v3-base-squad2")
    
    # Definir las preguntas para obtener la talla y el color
    preguntas = ["¿Cuál es la talla?", "¿Cuál es el color?"]
    
    # Obtener las respuestas utilizando el modelo de question-answering
    respuestas = qa_model(question=preguntas, context=texto)
    
    # Extraer las entidades del texto procesado por spaCy
    entidades = [ent.text for ent in doc.ents]
    
    # Devolver un diccionario con las entidades extraídas
    return {
        "prenda": entidades[0] if entidades else None,
        "color": respuestas[1]["answer"] if respuestas else None,
        "talla": respuestas[0]["answer"] if respuestas else None
    }

In [20]:

# Ejemplo de uso
texto_ejemplo = "Quiero un abrigo verde de la talla XL."
entidades = obtener_entidades(texto_ejemplo)
print(entidades)


{'ner': 190.59094150730363}
{'ner': 74.55546625235266}
{'ner': 39.69498412222082}
{'ner': 21.97494329583796}
{'ner': 7.340664392110267}
{'ner': 15.661365258752726}
{'ner': 7.132945445727324}
{'ner': 1.736382833011065}
{'ner': 5.79055866606434}
{'ner': 2.6674798075276476}
{'prenda': 'abrigo', 'color': ' verde', 'talla': ' XL.'}
