In [1]:
import numpy as np
import re
import pandas as pd
from tqdm.notebook import tqdm
from datasets import load_dataset
import umap
import altair as alt
from sklearn.metrics.pairwise import cosine_similarity
from sentence_transformers import SentenceTransformer
from typing import List
import enum

from langchain_community.llms import Ollama
from langchain.output_parsers.regex_dict import RegexDictParser
from langchain.output_parsers import PydanticOutputParser
from langchain_core.messages import HumanMessage, SystemMessage, ChatMessage
from langchain.prompts import ChatPromptTemplate, PromptTemplate
from pydantic import BaseModel, Field, validator, create_model
from openai import AsyncOpenAI, OpenAI
import asyncio
import os

import requests
import json

import itertools
from copy import deepcopy
from tqdm.notebook import tqdm, trange
from sklearn.cluster import KMeans

import umap.umap_ as umap
#import umap
import hdbscan

from typing import Literal, Union
from pydantic.config import ConfigDict

from src.models import *

from src.utilities import *
from src.bubble import *

import openai
import instructor

Retrieved company Darty : 1707313014508x102198350946437700
Retrieved project Darty_trustpilot : 1707329196900x870734705097005300


In [2]:
prompts_path = "Prompts/fr/"

# Company informations

In [5]:
with open(prompts_path+'prompt_company_informations.txt') as f:
    template = PromptTemplate.from_template(f.read())
prompt_company_informations = template.invoke(context)

class CompanyContext(BaseModel):
    context: str = Field(description="Description du contexte de l'entreprise.")

    def __str__(self):
        return self.context

res = get_analysis(prompt_company_informations, CompanyContext)
context['context'] = res.context
print(res)

Darty est une chaîne de magasins française spécialisée dans la distribution de matériel électroménager, de produits informatiques et audiovisuels (TV, audio, photo). Fondée en 1957, l'entreprise a évolué au fil des années, devenant un acteur majeur dans son secteur en France. Récemment, Darty a continué à se développer en renforçant sa présence en ligne et en élargissant son offre de services, notamment avec des options de livraison améliorées et des services après-vente étendus. Elle fait face à une concurrence accrue de la part de grandes enseignes telles que Boulanger, Fnac, et des géants du e-commerce comme Amazon. Darty s'efforce de maintenir sa position sur le marché en mettant l'accent sur la qualité de service et l'expérience client.


# Categories creation

In [5]:
with open(prompts_path+'prompt_categories_creation.txt') as f:
    template = PromptTemplate.from_template(f.read())
prompt_categories_creation = template.invoke(context)

class InsightSubCategory(BaseModel):
    name: str = Field(description="Nom de la sous-catégorie.")
    #description: str = Field(description="Phrase de description de la sous-catégorie.")
    id: str
    def __str__(self):
        return '\n- ' + self.name #+ ": " + self.description

class InsightCategory(BaseModel):
    name: str = Field(description="Nom de la catégorie.")
    #description: str = Field(description="Phrase de description de la catégorie.")
    sub_categories: List[InsightSubCategory] = Field(description="Sous-catégories.")
    id: str

    def __str__(self):
        return self.name + " : " + ''.join([str(x) for x in self.sub_categories])

class InsightCategories(BaseModel):
    categories: List[InsightCategory] = Field(description="Liste des catégories parmi lesquels les insights pourront être classifiées.")

    def __str__(self):
        return '\n\n'.join([str(x) for x in self.categories])

res = get_analysis(prompt_categories_creation, InsightCategories)
print(res)

Service Client : 
- Accueil
- Conseil
- Support Technique
- Réclamation
- Suivi de Commande

Produits : 
- Qualité
- Disponibilité
- Variété
- Innovation
- Prix

Expérience d'Achat : 
- Processus de Commande
- Livraison
- Retour et Remboursement
- Promotions et Offres
- Paiement

Magasins et Installations : 
- Propreté
- Accessibilité
- Aménagement
- Sécurité
- Horaires d'Ouverture

Site Web et Application Mobile : 
- Facilité d'Utilisation
- Fonctionnalités
- Performance
- Sécurité
- Contenu


In [9]:
res.categories

[InsightCategory(name='Service Client', sub_categories=[InsightSubCategory(name='Accueil', id='1709742742758x904820259611806200'), InsightSubCategory(name='Conseil', id='1709742743194x267746950762261400'), InsightSubCategory(name='Support Technique', id='1709742743517x677944177104193000'), InsightSubCategory(name='Réclamation', id='1709742744160x406692257925758340'), InsightSubCategory(name='Suivi de Commande', id='1709742744490x120076632946914740')], id='1709742742431x183195198882836400'),
 InsightCategory(name='Produits', sub_categories=[InsightSubCategory(name='Qualité', id='1709742745544x943993500287889700'), InsightSubCategory(name='Disponibilité', id='1709742745853x405277061670714900'), InsightSubCategory(name='Variété', id='1709742746192x789697875218370600'), InsightSubCategory(name='Innovation', id='1709742746529x875603581429965800'), InsightSubCategory(name='Prix', id='1709742747167x724896519283476000')], id='1709742745125x814860238467315300'),
 InsightCategory(name="Expérienc

In [20]:
InsightCategory(name="", sub_categories=[InsightSubCategory(name="", id="")], id="")

InsightCategory(name='', sub_categories=[InsightSubCategory(name='', id='')], id='')

In [23]:
[res.categories]

[InsightCategory(name='Service Client', sub_categories=[InsightSubCategory(name='Accueil', id='1709742742758x904820259611806200'), InsightSubCategory(name='Conseil', id='1709742743194x267746950762261400'), InsightSubCategory(name='Support Technique', id='1709742743517x677944177104193000'), InsightSubCategory(name='Réclamation', id='1709742744160x406692257925758340'), InsightSubCategory(name='Suivi de Commande', id='1709742744490x120076632946914740')], id='1709742742431x183195198882836400'),
 InsightCategory(name='Produits', sub_categories=[InsightSubCategory(name='Qualité', id='1709742745544x943993500287889700'), InsightSubCategory(name='Disponibilité', id='1709742745853x405277061670714900'), InsightSubCategory(name='Variété', id='1709742746192x789697875218370600'), InsightSubCategory(name='Innovation', id='1709742746529x875603581429965800'), InsightSubCategory(name='Prix', id='1709742747167x724896519283476000')], id='1709742745125x814860238467315300'),
 InsightCategory(name="Expérienc

In [29]:
res.categories

[InsightCategory(name='Service Client', sub_categories=[InsightSubCategory(name='Accueil', id='1709742742758x904820259611806200'), InsightSubCategory(name='Conseil', id='1709742743194x267746950762261400'), InsightSubCategory(name='Support Technique', id='1709742743517x677944177104193000'), InsightSubCategory(name='Réclamation', id='1709742744160x406692257925758340'), InsightSubCategory(name='Suivi de Commande', id='1709742744490x120076632946914740'), InsightSubCategory(name='', id='')], id='1709742742431x183195198882836400'),
 InsightCategory(name='Produits', sub_categories=[InsightSubCategory(name='Qualité', id='1709742745544x943993500287889700'), InsightSubCategory(name='Disponibilité', id='1709742745853x405277061670714900'), InsightSubCategory(name='Variété', id='1709742746192x789697875218370600'), InsightSubCategory(name='Innovation', id='1709742746529x875603581429965800'), InsightSubCategory(name='Prix', id='1709742747167x724896519283476000'), InsightSubCategory(name='', id='')], 

In [28]:
res.categories.append(InsightCategory(name="", sub_categories=[InsightSubCategory(name="", id="")], id=""))
for categ in res.categories:
    categ.sub_categories.append(InsightSubCategory(name="", id=""))

In [30]:
for categorie in tqdm(res.categories):
    categorie.id = bubble_client.create(
        "Category",
        {
            "Company": COMPANY_ID,
            "Name": categorie.name,
            "Project": PROJECT_ID,
        })
    
    for sub_categorie in categorie.sub_categories:
        sub_categorie.id = bubble_client.create(
            "SubCategory",
            {
                "Company": COMPANY_ID,
                "Category": categorie.id,
                "Name": sub_categorie.name,
                "Project": PROJECT_ID,
                #"Description": sub_categorie.description,
            })

  0%|          | 0/6 [00:00<?, ?it/s]