In [1]:
from vectorizer import *

Exemplo 1: Inicialização e Ajuste do Vetorizador
Primeiro, inicializamos o ProductVectorizer com configurações específicas e ajustamos o vetorizador a um conjunto de descrições de produtos e suas categorias correspondentes.

In [2]:
# Suponha que temos as seguintes descrições de produtos e suas categorias
descriptions = [
    "Smartphone Android tela 6.5 melhor preço",
    "Notebook i7 16GB RAM estado de novo",
    "Cafeteira elétrica programável com jarra de vidro",
    "Smart TV 4k 55 polegadas promoção",
    "Tênis de corrida masculino leve confortável"
]

categories = ["Eletrônicos", "Eletrônicos", "Eletrodomésticos", "Eletrônicos", "Vestuário"]

# Inicializando o ProductVectorizer
vectorizer = ProductVectorizer(method='tfidf', ngram_range=(1, 2), norm='l2')

# Ajustando o vetorizador às descrições e categorias
vectorizer.fit(descriptions, categories)


Exemplo 2: Obtendo a Matriz de Termos-Documento
Após ajustar o vetorizador, podemos obter a matriz de termos-documento para analisar quais termos são considerados importantes para cada categoria.


In [4]:
term_document_matrix = vectorizer.get_term_document_matrix()
display(term_document_matrix)


Unnamed: 0,Eletrônicos,Eletrodomésticos,Vestuário
16gb,0.162221,0.000000,0.000000
16gb ram,0.162221,0.000000,0.000000
4k,0.162221,0.000000,0.000000
4k 55,0.162221,0.000000,0.000000
5,0.162221,0.000000,0.000000
...,...,...,...
tenis,0.000000,0.000000,0.316228
tenis de,0.000000,0.000000,0.316228
tv,0.162221,0.000000,0.000000
tv 4k,0.162221,0.000000,0.000000


Exemplo 3: Transformação e Predição
Podemos também transformar novas descrições em vetores numéricos e realizar predições sobre a categoria a que pertencem.

In [5]:
new_descriptions = [
    "Smartphone 128GB câmera alta resolução",
    "Geladeira frost free 400 litros"
]

# Transformando novas descrições
transformed_descriptions = vectorizer.transform(new_descriptions)

# Realizando predições sobre as categorias das novas descrições
predicted_categories = vectorizer.predict(new_descriptions, out='name')
print(predicted_categories)


['Eletrônicos' 'Eletrônicos']


Exemplo 4: Predição de Escores
Se quisermos ver os escores de similaridade entre as novas descrições e as categorias existentes, podemos usar o método predict_score.

In [9]:
# Obtendo escores de similaridade
scores = vectorizer.predict_score(new_descriptions)
display(scores.toarray())


array([[0.16222142, 0.        ],
       [0.        , 0.        ],
       [0.        , 0.        ]])