# Realizando ingeniería de datos para realizar transformación y generación de nuevas variables

## 1.- Importamos las librerías necesarias y preparamos las funciones oportunas.

In [1]:
import pandas as pd
import numpy as np
import os
import re
import spacy
from nltk.stem.snowball import SnowballStemmer

nlp = spacy.load('es_core_news_lg')

Generamos funciones para el tratamiento de textos

In [2]:
def extraer_lemas(texto):
    '''
    Función que recibe un texto como entrada y devuelve una lista de los lemas de las palabras que se encuentran en el texto. 
    
    La lista de lemas resultante solo contiene las palabras que son alfabéticas, es decir, que no contienen caracteres numéricos o especiales.

    - Inputs:

        texto (str): Texto del cual se quieren extraer los lemas.

    - Outputs:

        lemas (list): Lista de los lemas de las palabras alfabéticas que se encuentran en el texto.
    '''
    doc = nlp(texto)
    lemas = [token.lemma_ for token in doc if token.is_alpha]
    return lemas

def eliminacion_acentos(text):
    '''
    Función que recibe un texto como entrada y devuelve el mismo texto pero sin los caracteres acentuados. 
    
    Para esto, se utiliza una expresión regular y un diccionario con los caracteres a reemplazar.

    - Inputs:

       text (str): Texto del cual se quieren eliminar los acentos.

    - Outputs:

        texto (str): Texto sin los caracteres acentuados.
         '''
    pattern = '[áéíóúÁÉÍÓÚ]'
    replace = {'á': 'a', 'é': 'e', 'í': 'i', 'ó': 'o', 'ú': 'u', 'Á': 'A', 'É': 'E', 'Í': 'I', 'Ó': 'O', 'Ú': 'U'}
    return re.sub(pattern, lambda match: replace[match.group()], text)

def spanish_stemmer(x):
    '''
    Función que recibe una cadena de texto como entrada y devuelve el texto procesado con un algoritmo de stemming en español. 
    
    El stemming es una técnica de NLP que busca reducir una palabra a su raíz. 
    
    En este caso, se utiliza el algoritmo SnowballStemmer de la librería NLTK.

    - Inputs:

        x (str): Texto que se quiere procesar con el algoritmo de stemming.

    - Outputs:

        str: Texto procesado con el algoritmo de stemming.
        '''
    stemmer = SnowballStemmer('spanish')
    return " ".join([stemmer.stem(word) for word in x.split()])


### Obtenemos los datos guardados.

In [2]:
path='Data\scrapped_data.csv'

In [3]:
os.chdir(os.path.split(os.getcwd())[0])
folder=os.getcwd()
folder

'd:\\Data_science\\Javier\\Repositorios\\Proyecto_tienda_online'

In [4]:
new_path=folder+'\\'+path
new_path

'd:\\Data_science\\Javier\\Repositorios\\Proyecto_tienda_online\\Data\\scrapped_data.csv'

In [5]:
dataframe=pd.read_csv(new_path)
dataframe

Unnamed: 0,Name,Description,Price,Reduced Price,date,User,Ratings,Comment
0,"TOBOGANE HOT RABBIT, el superventas de amantis...",Vuelve nuestro vibrador de doble estimulación ...,21.99,39.99,"['martes 22 noviembre, 2022', 'jueves 07 julio...","['Rossi', 'Marina', 'Jennifer', 'Noa', 'Karen'...","[5, 5, 5, 4, 3, 5, 5, 5, 5, 5, 4, 5, 5, 3, 5, ...","['Mi primera compra. Me encantó la textura, lo..."
1,"LIZO 2, Dildo de suave silicona en 3 tamaños","En un azulejo de la cocina, en una puerta, en ...",21.99,17.99,"['domingo 12 marzo, 2023', 'martes 10 enero, 2...","['Iria', 'Barney', 'Sara', 'Aida', 'Lucas', 'a...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, ...",['Al no tener tope viene perfecto para usar co...
2,"FOXTAIL, plug anal cola de zorro de 35cm",Deja volar la imaginación y saca tu lado más s...,21.99,9.99,"['jueves 26 enero, 2023', 'jueves 05 enero, 20...","['Jonatan', 'Irene', 'Ainara', 'Ignacio', 'and...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 4]","['Un buen plug, muy suave, aunque con el lubri..."
3,"TOBOGANE, el vibrador doble más vendido","Por favor, desabróchense los cinturones de seg...",21.99,36.99,"['lunes 06 marzo, 2023', 'sábado 04 marzo, 202...","['Teresa', 'Alicia', 'María', 'Sara', 'Raquel'...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 5, ...",['Fue el primer vibrador que compré. Me lo rec...
4,"MENEO sube y baja, placer realista con control...","Si te gusta que te metan un buen meneo, hazte ...",21.99,44.99,"['miércoles 14 diciembre, 2022', 'miércoles 09...","['Francisco', 'Maria', 'Jose Javier', 'Carlos'...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4]",['Quería saber cuantos cm tiene la longitud qu...
...,...,...,...,...,...,...,...,...
571,JUSTISSE NECK - collar + bloqueadores de muñecas,"Muy a menudo, las parejas se quejan de que la ...",21.99,23.99,"['domingo 08 noviembre, 2020']",['Alejandro'],[5],['Es un poco engorroso a la hora de ponerlo so...
572,MS-VULVAN. Estimulador Total de Vulva (Cabezal...,La orgásmica colección de accesorios para acop...,21.99,8.99,"['jueves 02 agosto, 2018', 'martes 17 julio, 2...","['Inma', 'yulema', 'Cristina', 'Veturian', 'Pi...","[5, 5, 3, 5, 5, 4, 3]","['Es uno de mis cabezales estrella, es muy com..."
573,"AVATAR SIMON PRIDE, Orgulloso dildo de silicona",¿Quién dijo que en el mundo de los dildos no h...,21.99,34.99,"['martes 06 agosto, 2019']",['Javier'],[4],['A mi chica no le gustaba la típica aparienci...
574,"TSUNAMI FORMAS, Fundas de silicona para TSUNAM...",¿Has echado un vistazo a nuestro productazo la...,21.99,14.99,"['miércoles 11 noviembre, 2020', 'miércoles 01...","['Christian', 'Carmen', 'Meritxell', 'Esther',...","[5, 5, 4, 5, 5]",['Imprescindibles para disfrutar del Tsunami c...


## 2.- Generamos los tags para procesado de datos.

Definimos la lista de tags que queremos asignar. 

Esto lo haremos generando listas con los nombres lemmatizados.

También hay que dejar el texto utilizado en minúscula.

In [None]:
juguetes=['dildo','plug','vibrador','masturbador','cabezal','estimulador']
BDSM=['latex','bdsm','arnes','strap','cera','ligadura','cuerda','cuero','sumision','dominacion','latigo']
muebles=['columpio','sillon','sillones']
lenceria=['body','panties','arnes',]
anal=['anal']
masculino=['hombre','masculino']
femenino=['mujer','femenino']

In [None]:
df_engineer=dataframe.iloc[:,:2]
df_engineer

#### Pasamos todos los caracteres a minúsculas y eliminamos los acentos.

In [None]:
df_engineer['Description'] = df_engineer['Description'].str.lower()
df_engineer['Description'] = df_engineer['Description'].apply(eliminacion_acentos)
df_engineer

In [None]:
df_engineer['lenceria'] = df_engineer['Description'].apply(lambda x: any(lematizado in lenceria for lematizado in extraer_lemas(x)))
df_engineer['juguetes'] = df_engineer['Description'].apply(lambda x: any(lematizado in juguetes for lematizado in extraer_lemas(x)))
df_engineer['Description'] = df_engineer['Description'].apply(spanish_stemmer)

df_engineer

Necesito  ver qué tipo de datos hay en la columna Description.

In [None]:
df_engineer['juguetes']=df_engineer['Description'].str.contains('|'.join(juguetes))
# dataframe['juguetes']=df_engineer['Subname'].str.contains('|'.join(juguetes))
df_engineer['BDSM']=df_engineer['Description'].str.contains('|'.join(BDSM))
df_engineer['muebles']=df_engineer['Description'].str.contains('|'.join(muebles))
df_engineer['lenceria']=df_engineer['Description'].str.contains('|'.join(lenceria))
df_engineer['anal']=df_engineer['Description'].str.contains('|'.join(anal))
df_engineer['masculino']=df_engineer['Description'].str.contains('|'.join(masculino))
df_engineer['femenino']=df_engineer['Description'].str.contains('|'.join(femenino))




df_engineer.head(10)


## 3.- Descomponemos las variables *Name* y *Description*.

Vamos a crear 2 nuevas columnas a partir de *Name* y *Description*, donde dejaremos el nombre del producto y su slogan por un lado y por otro la descripción y las características por otro.

En principio son variables que no necesitaremos para estos estudios pero las guardaremos por si hay que hacer algún estudio posterior de las mismas (comparativas de productos similares de esta página web o de otras páginas web, por ejemplo).

#### Generación de slogan.

Primeramente vamos a realizar un visionado de los datos que tienen para discernir donde se puede realizar la separación.

Por un lado extraeremos el Name en una nueva columna y varias columnas para ir separando el resto. 

In [7]:
dataframe['Name']

0      TOBOGANE HOT RABBIT, el superventas de amantis...
1           LIZO 2, Dildo de suave silicona en 3 tamaños
2               FOXTAIL, plug anal cola de zorro de 35cm
3                TOBOGANE, el vibrador doble más vendido
4      MENEO sube y baja, placer realista con control...
                             ...                        
571     JUSTISSE NECK - collar + bloqueadores de muñecas
572    MS-VULVAN. Estimulador Total de Vulva (Cabezal...
573      AVATAR SIMON PRIDE, Orgulloso dildo de silicona
574    TSUNAMI FORMAS, Fundas de silicona para TSUNAM...
575             Cabezal para masaje-sexy, Triple Acción!
Name: Name, Length: 576, dtype: object

In [6]:
dataframe['Name'] = dataframe['Name'].str.replace(r'-(?=\w)', '_')
dataframe[['Product', 'Slogan']] = dataframe['Name'].str.split('[,-.]', 1, expand=True)
dataframe['Product'] = dataframe['Product'].str.strip()
dataframe['Slogan'] = dataframe['Slogan'].str.strip()
dataframe

  dataframe['Name'] = dataframe['Name'].str.replace(r'-(?=\w)', '_')
  dataframe[['Product', 'Slogan']] = dataframe['Name'].str.split('[,-.]', 1, expand=True)


Unnamed: 0,Name,Description,Price,Reduced Price,date,User,Ratings,Comment,Product,Slogan
0,"TOBOGANE HOT RABBIT, el superventas de amantis...",Vuelve nuestro vibrador de doble estimulación ...,21.99,39.99,"['martes 22 noviembre, 2022', 'jueves 07 julio...","['Rossi', 'Marina', 'Jennifer', 'Noa', 'Karen'...","[5, 5, 5, 4, 3, 5, 5, 5, 5, 5, 4, 5, 5, 3, 5, ...","['Mi primera compra. Me encantó la textura, lo...",TOBOGANE HOT RABBIT,el superventas de amantis ¡mejorado!
1,"LIZO 2, Dildo de suave silicona en 3 tamaños","En un azulejo de la cocina, en una puerta, en ...",21.99,17.99,"['domingo 12 marzo, 2023', 'martes 10 enero, 2...","['Iria', 'Barney', 'Sara', 'Aida', 'Lucas', 'a...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, ...",['Al no tener tope viene perfecto para usar co...,LIZO 2,Dildo de suave silicona en 3 tamaños
2,"FOXTAIL, plug anal cola de zorro de 35cm",Deja volar la imaginación y saca tu lado más s...,21.99,9.99,"['jueves 26 enero, 2023', 'jueves 05 enero, 20...","['Jonatan', 'Irene', 'Ainara', 'Ignacio', 'and...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 4]","['Un buen plug, muy suave, aunque con el lubri...",FOXTAIL,plug anal cola de zorro de 35cm
3,"TOBOGANE, el vibrador doble más vendido","Por favor, desabróchense los cinturones de seg...",21.99,36.99,"['lunes 06 marzo, 2023', 'sábado 04 marzo, 202...","['Teresa', 'Alicia', 'María', 'Sara', 'Raquel'...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 5, ...",['Fue el primer vibrador que compré. Me lo rec...,TOBOGANE,el vibrador doble más vendido
4,"MENEO sube y baja, placer realista con control...","Si te gusta que te metan un buen meneo, hazte ...",21.99,44.99,"['miércoles 14 diciembre, 2022', 'miércoles 09...","['Francisco', 'Maria', 'Jose Javier', 'Carlos'...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4]",['Quería saber cuantos cm tiene la longitud qu...,MENEO sube y baja,placer realista con control remoto
...,...,...,...,...,...,...,...,...,...,...
571,JUSTISSE NECK - collar + bloqueadores de muñecas,"Muy a menudo, las parejas se quejan de que la ...",21.99,23.99,"['domingo 08 noviembre, 2020']",['Alejandro'],[5],['Es un poco engorroso a la hora de ponerlo so...,JUSTISSE NECK,collar + bloqueadores de muñecas
572,MS_VULVAN. Estimulador Total de Vulva (Cabezal...,La orgásmica colección de accesorios para acop...,21.99,8.99,"['jueves 02 agosto, 2018', 'martes 17 julio, 2...","['Inma', 'yulema', 'Cristina', 'Veturian', 'Pi...","[5, 5, 3, 5, 5, 4, 3]","['Es uno de mis cabezales estrella, es muy com...",MS_VULVAN,Estimulador Total de Vulva (Cabezal Masaje_Sex...
573,"AVATAR SIMON PRIDE, Orgulloso dildo de silicona",¿Quién dijo que en el mundo de los dildos no h...,21.99,34.99,"['martes 06 agosto, 2019']",['Javier'],[4],['A mi chica no le gustaba la típica aparienci...,AVATAR SIMON PRIDE,Orgulloso dildo de silicona
574,"TSUNAMI FORMAS, Fundas de silicona para TSUNAM...",¿Has echado un vistazo a nuestro productazo la...,21.99,14.99,"['miércoles 11 noviembre, 2020', 'miércoles 01...","['Christian', 'Carmen', 'Meritxell', 'Esther',...","[5, 5, 4, 5, 5]",['Imprescindibles para disfrutar del Tsunami c...,TSUNAMI FORMAS,Fundas de silicona para TSUNAMI POWER


#### Separación entre Description y Characteristics.

Primeramente vamos a realizar un visionado de los datos que tienen para discernir donde se puede realizar la separación.

Por un lado extraeremos las características en una nueva columna, dejando la Description en la misma. 

In [7]:
# pd.set_option('display.max_colwidth', None)
dataframe['Description']

0      Vuelve nuestro vibrador de doble estimulación ...
1      En un azulejo de la cocina, en una puerta, en ...
2      Deja volar la imaginación y saca tu lado más s...
3      Por favor, desabróchense los cinturones de seg...
4      Si te gusta que te metan un buen meneo, hazte ...
                             ...                        
571    Muy a menudo, las parejas se quejan de que la ...
572    La orgásmica colección de accesorios para acop...
573    ¿Quién dijo que en el mundo de los dildos no h...
574    ¿Has echado un vistazo a nuestro productazo la...
575    El Masaje-Sexy de amantis es uno de nuestros m...
Name: Description, Length: 576, dtype: object

In [8]:
dataframe['Characteristics'] = dataframe['Description'].str.split('Ver características y medidas', 1).str[1]
dataframe['Description'] = dataframe['Description'].str.split('Ver características y medidas', 1).str[0].str.strip()
dataframe


  dataframe['Characteristics'] = dataframe['Description'].str.split('Ver características y medidas', 1).str[1]
  dataframe['Description'] = dataframe['Description'].str.split('Ver características y medidas', 1).str[0].str.strip()


Unnamed: 0,Name,Description,Price,Reduced Price,date,User,Ratings,Comment,Product,Slogan,Characteristics
0,"TOBOGANE HOT RABBIT, el superventas de amantis...",Vuelve nuestro vibrador de doble estimulación ...,21.99,39.99,"['martes 22 noviembre, 2022', 'jueves 07 julio...","['Rossi', 'Marina', 'Jennifer', 'Noa', 'Karen'...","[5, 5, 5, 4, 3, 5, 5, 5, 5, 5, 4, 5, 5, 3, 5, ...","['Mi primera compra. Me encantó la textura, lo...",TOBOGANE HOT RABBIT,el superventas de amantis ¡mejorado!,"Medidas: 19cm (11cm insertables) y 3,3cm/ 2,2c..."
1,"LIZO 2, Dildo de suave silicona en 3 tamaños","En un azulejo de la cocina, en una puerta, en ...",21.99,17.99,"['domingo 12 marzo, 2023', 'martes 10 enero, 2...","['Iria', 'Barney', 'Sara', 'Aida', 'Lucas', 'a...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, ...",['Al no tener tope viene perfecto para usar co...,LIZO 2,Dildo de suave silicona en 3 tamaños,Material: silicona médica de máxima calidadDim...
2,"FOXTAIL, plug anal cola de zorro de 35cm",Deja volar la imaginación y saca tu lado más s...,21.99,9.99,"['jueves 26 enero, 2023', 'jueves 05 enero, 20...","['Jonatan', 'Irene', 'Ainara', 'Ignacio', 'and...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 4]","['Un buen plug, muy suave, aunque con el lubri...",FOXTAIL,plug anal cola de zorro de 35cm,Tamaño plug S: 6.6cm Max Dia.: 2.8cmCola de pe...
3,"TOBOGANE, el vibrador doble más vendido","Por favor, desabróchense los cinturones de seg...",21.99,36.99,"['lunes 06 marzo, 2023', 'sábado 04 marzo, 202...","['Teresa', 'Alicia', 'María', 'Sara', 'Raquel'...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 5, ...",['Fue el primer vibrador que compré. Me lo rec...,TOBOGANE,el vibrador doble más vendido,"Vibrador con doble motor.\rMedidas: 19cm, (11..."
4,"MENEO sube y baja, placer realista con control...","Si te gusta que te metan un buen meneo, hazte ...",21.99,44.99,"['miércoles 14 diciembre, 2022', 'miércoles 09...","['Francisco', 'Maria', 'Jose Javier', 'Carlos'...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4]",['Quería saber cuantos cm tiene la longitud qu...,MENEO sube y baja,placer realista con control remoto,Dildo percutor y vibrador con control remoto3 ...
...,...,...,...,...,...,...,...,...,...,...,...
571,JUSTISSE NECK - collar + bloqueadores de muñecas,"Muy a menudo, las parejas se quejan de que la ...",21.99,23.99,"['domingo 08 noviembre, 2020']",['Alejandro'],[5],['Es un poco engorroso a la hora de ponerlo so...,JUSTISSE NECK,collar + bloqueadores de muñecas,Características:\r• Kit compuesto por un colla...
572,MS_VULVAN. Estimulador Total de Vulva (Cabezal...,La orgásmica colección de accesorios para acop...,21.99,8.99,"['jueves 02 agosto, 2018', 'martes 17 julio, 2...","['Inma', 'yulema', 'Cristina', 'Veturian', 'Pi...","[5, 5, 3, 5, 5, 4, 3]","['Es uno de mis cabezales estrella, es muy com...",MS_VULVAN,Estimulador Total de Vulva (Cabezal Masaje_Sex...,\r· Superficie de contacto de 8cm x 4.5cm\r· R...
573,"AVATAR SIMON PRIDE, Orgulloso dildo de silicona",¿Quién dijo que en el mundo de los dildos no h...,21.99,34.99,"['martes 06 agosto, 2019']",['Javier'],[4],['A mi chica no le gustaba la típica aparienci...,AVATAR SIMON PRIDE,Orgulloso dildo de silicona,Juguete de silicona 100%Dimensiones: 20 cm de ...
574,"TSUNAMI FORMAS, Fundas de silicona para TSUNAM...",¿Has echado un vistazo a nuestro productazo la...,21.99,14.99,"['miércoles 11 noviembre, 2020', 'miércoles 01...","['Christian', 'Carmen', 'Meritxell', 'Esther',...","[5, 5, 4, 5, 5]",['Imprescindibles para disfrutar del Tsunami c...,TSUNAMI FORMAS,Fundas de silicona para TSUNAMI POWER,Hechas en silicona de grado médicoSin ftalatos...


Se observan que hay *\r* dentro del texto generado en las nuevas columnas, por lo que vamos a proceder a sustituir esto por un espacio.

In [9]:
dataframe['Characteristics'] = dataframe['Characteristics'].str.replace('\r', ' ')
dataframe['Description'] = dataframe['Description'].str.replace('\r', ' ')
dataframe

Unnamed: 0,Name,Description,Price,Reduced Price,date,User,Ratings,Comment,Product,Slogan,Characteristics
0,"TOBOGANE HOT RABBIT, el superventas de amantis...",Vuelve nuestro vibrador de doble estimulación ...,21.99,39.99,"['martes 22 noviembre, 2022', 'jueves 07 julio...","['Rossi', 'Marina', 'Jennifer', 'Noa', 'Karen'...","[5, 5, 5, 4, 3, 5, 5, 5, 5, 5, 4, 5, 5, 3, 5, ...","['Mi primera compra. Me encantó la textura, lo...",TOBOGANE HOT RABBIT,el superventas de amantis ¡mejorado!,"Medidas: 19cm (11cm insertables) y 3,3cm/ 2,2c..."
1,"LIZO 2, Dildo de suave silicona en 3 tamaños","En un azulejo de la cocina, en una puerta, en ...",21.99,17.99,"['domingo 12 marzo, 2023', 'martes 10 enero, 2...","['Iria', 'Barney', 'Sara', 'Aida', 'Lucas', 'a...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, ...",['Al no tener tope viene perfecto para usar co...,LIZO 2,Dildo de suave silicona en 3 tamaños,Material: silicona médica de máxima calidadDim...
2,"FOXTAIL, plug anal cola de zorro de 35cm",Deja volar la imaginación y saca tu lado más s...,21.99,9.99,"['jueves 26 enero, 2023', 'jueves 05 enero, 20...","['Jonatan', 'Irene', 'Ainara', 'Ignacio', 'and...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 4]","['Un buen plug, muy suave, aunque con el lubri...",FOXTAIL,plug anal cola de zorro de 35cm,Tamaño plug S: 6.6cm Max Dia.: 2.8cmCola de pe...
3,"TOBOGANE, el vibrador doble más vendido","Por favor, desabróchense los cinturones de seg...",21.99,36.99,"['lunes 06 marzo, 2023', 'sábado 04 marzo, 202...","['Teresa', 'Alicia', 'María', 'Sara', 'Raquel'...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 5, ...",['Fue el primer vibrador que compré. Me lo rec...,TOBOGANE,el vibrador doble más vendido,"Vibrador con doble motor. Medidas: 19cm, (11c..."
4,"MENEO sube y baja, placer realista con control...","Si te gusta que te metan un buen meneo, hazte ...",21.99,44.99,"['miércoles 14 diciembre, 2022', 'miércoles 09...","['Francisco', 'Maria', 'Jose Javier', 'Carlos'...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4]",['Quería saber cuantos cm tiene la longitud qu...,MENEO sube y baja,placer realista con control remoto,Dildo percutor y vibrador con control remoto3 ...
...,...,...,...,...,...,...,...,...,...,...,...
571,JUSTISSE NECK - collar + bloqueadores de muñecas,"Muy a menudo, las parejas se quejan de que la ...",21.99,23.99,"['domingo 08 noviembre, 2020']",['Alejandro'],[5],['Es un poco engorroso a la hora de ponerlo so...,JUSTISSE NECK,collar + bloqueadores de muñecas,Características: • Kit compuesto por un collar...
572,MS_VULVAN. Estimulador Total de Vulva (Cabezal...,La orgásmica colección de accesorios para acop...,21.99,8.99,"['jueves 02 agosto, 2018', 'martes 17 julio, 2...","['Inma', 'yulema', 'Cristina', 'Veturian', 'Pi...","[5, 5, 3, 5, 5, 4, 3]","['Es uno de mis cabezales estrella, es muy com...",MS_VULVAN,Estimulador Total de Vulva (Cabezal Masaje_Sex...,· Superficie de contacto de 8cm x 4.5cm · Rea...
573,"AVATAR SIMON PRIDE, Orgulloso dildo de silicona",¿Quién dijo que en el mundo de los dildos no h...,21.99,34.99,"['martes 06 agosto, 2019']",['Javier'],[4],['A mi chica no le gustaba la típica aparienci...,AVATAR SIMON PRIDE,Orgulloso dildo de silicona,Juguete de silicona 100%Dimensiones: 20 cm de ...
574,"TSUNAMI FORMAS, Fundas de silicona para TSUNAM...",¿Has echado un vistazo a nuestro productazo la...,21.99,14.99,"['miércoles 11 noviembre, 2020', 'miércoles 01...","['Christian', 'Carmen', 'Meritxell', 'Esther',...","[5, 5, 4, 5, 5]",['Imprescindibles para disfrutar del Tsunami c...,TSUNAMI FORMAS,Fundas de silicona para TSUNAMI POWER,Hechas en silicona de grado médicoSin ftalatos...


Eliminamos *Nombre* y sustituimos por *Product*, *Slogan*, *Description* y *Characteristics*.

In [10]:
col_1 = dataframe.pop('Product')
col_2=dataframe.pop('Slogan')
col_3=dataframe.pop('Characteristics')
dataframe.drop(columns=['Name'],inplace=True)

dataframe.insert(loc= 0 , column= 'Product', value= col_1)
dataframe.insert(loc= 1 , column= 'Slogan', value= col_2)
dataframe.insert(loc= 3 , column= 'Characteristics', value= col_3)
dataframe.head()

Unnamed: 0,Product,Slogan,Description,Characteristics,Price,Reduced Price,date,User,Ratings,Comment
0,TOBOGANE HOT RABBIT,el superventas de amantis ¡mejorado!,Vuelve nuestro vibrador de doble estimulación ...,"Medidas: 19cm (11cm insertables) y 3,3cm/ 2,2c...",21.99,39.99,"['martes 22 noviembre, 2022', 'jueves 07 julio...","['Rossi', 'Marina', 'Jennifer', 'Noa', 'Karen'...","[5, 5, 5, 4, 3, 5, 5, 5, 5, 5, 4, 5, 5, 3, 5, ...","['Mi primera compra. Me encantó la textura, lo..."
1,LIZO 2,Dildo de suave silicona en 3 tamaños,"En un azulejo de la cocina, en una puerta, en ...",Material: silicona médica de máxima calidadDim...,21.99,17.99,"['domingo 12 marzo, 2023', 'martes 10 enero, 2...","['Iria', 'Barney', 'Sara', 'Aida', 'Lucas', 'a...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, ...",['Al no tener tope viene perfecto para usar co...
2,FOXTAIL,plug anal cola de zorro de 35cm,Deja volar la imaginación y saca tu lado más s...,Tamaño plug S: 6.6cm Max Dia.: 2.8cmCola de pe...,21.99,9.99,"['jueves 26 enero, 2023', 'jueves 05 enero, 20...","['Jonatan', 'Irene', 'Ainara', 'Ignacio', 'and...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 4]","['Un buen plug, muy suave, aunque con el lubri..."
3,TOBOGANE,el vibrador doble más vendido,"Por favor, desabróchense los cinturones de seg...","Vibrador con doble motor. Medidas: 19cm, (11c...",21.99,36.99,"['lunes 06 marzo, 2023', 'sábado 04 marzo, 202...","['Teresa', 'Alicia', 'María', 'Sara', 'Raquel'...","[5, 5, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 5, ...",['Fue el primer vibrador que compré. Me lo rec...
4,MENEO sube y baja,placer realista con control remoto,"Si te gusta que te metan un buen meneo, hazte ...",Dildo percutor y vibrador con control remoto3 ...,21.99,44.99,"['miércoles 14 diciembre, 2022', 'miércoles 09...","['Francisco', 'Maria', 'Jose Javier', 'Carlos'...","[5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4]",['Quería saber cuantos cm tiene la longitud qu...


#### Generación de tags.

Vamos a tratar un texto para ver como se puede generar tags de los mismos. Para ello vamos a cargar la librería *spaCy* y tratar un texto para tokenizar y demás ...

In [None]:
text = """
¿Encuentras placer en que te dominen? ¿Sientes que dominas tu desde la sumisión? Todo este juego de roles es altamente excitante, y desde amantis te invitamos a que lo explores.

Una buena manera de empezar, y uno de los símbolos más conocidos en la sumisión son los collares, digamos que sería el equivalente al anillo de compromiso cuando te casas. De hecho, existe una ceremonia llamada la coronización, en donde la persona sumisa acepta estar en una relación de confianza, estabilidad, lealtad y protección.

YOURS es un collar perteneciente a la categoría de sumisión de BDSM, y podremos usarlo tanto en público como en nuestras sesiones privadas con nuestro amo o ama. Tiene una potente hebilla con ocho agujeros, por lo que acepta todo tipo de tamaño de cuellos. A su vez, YOURS tiene un amarre en el centro por si quisiéramos llevarlo más allá de la simbología y quisieramos atarle una correa para que las persona que nos dirige sea dueña de nuestro movimientos.

A diferencia de otros collares tradicionalmente negros o rojos y de estética fetiche, este collar opta por otros colores abriendo más la gama de esta categoria. Además, YOURS apuesta por la comodidad, y el material del que está hecho es blando, estilo neopreno, que será más amable con nuestra piel permitiéndonos llevarlo más tiempo sin tener rozaduras.

Cada pieza tiene hebillas y agarres plateadas, y los que son amarres vienen con zona de agujeros que harán que puedas ajustarlas a la medidas que quieras.

Ten cuenta principio fundamental del BDSM, el SCCP (sexo seguro, sensato, consensuado y placentero) y no olvideis tener una palabra de seguridad que nos ayude a entender si algún límite está siendo sobrepasado."""

doc = nlp(text)

print(doc)

for num, sentence in enumerate(doc.sents):
  print(num, sentence)
