In [71]:
import numpy as np
import re
import pandas as pd
from tqdm import tqdm
from datasets import load_dataset
import umap
import altair as alt
from sklearn.metrics.pairwise import cosine_similarity
from annoy import AnnoyIndex
import warnings
from sentence_transformers import SentenceTransformer

from langchain.prompts import ChatPromptTemplate
from langchain.llms import Ollama
import pprint
from langchain.output_parsers.regex_dict import RegexDictParser
from langchain_core.messages import HumanMessage, SystemMessage, ChatMessage
from langchain.prompts import ChatPromptTemplate, PromptTemplate
from typing import List
from langchain.output_parsers import PydanticOutputParser
from langchain.prompts import PromptTemplate
from langchain_core.pydantic_v1 import BaseModel, Field, validator
from langchain_openai import ChatOpenAI
import itertools
from copy import copy
from tqdm.notebook import tqdm, trange
warnings.filterwarnings('ignore')
pd.set_option('display.max_colwidth', None)

In [2]:
df = pd.read_csv('Insights.csv', sep=',')
df.columns = ['Insight', 'InsightID', 'InsightParentID', 'IsParent']
list_insights = list(df['Insight'])

In [3]:
source = pd.DataFrame({
    "related_feedbacks":[["feedback_"+str(i//2)] for i in range(len(list_insights))],
    "content": list_insights,
    "children":[[] for _ in list_insights],
    #"project":["Randstad" for _ in list_insights],
    #"source":["Randstad_source_1" for _ in list_insights],
})
source.head()

Unnamed: 0,related_feedbacks,content,children
0,[feedback_0],"Les intérimaires manquent de rigueur en termes de ponctualité, de professionnalisme, et d'attention au détail, ce qui se traduit par des erreurs coûteuses et un comportement inapproprié au travail.",[]
1,[feedback_0],"Les candidats indiquent ne pas être informés concernant l'entreprise, son activité et les détails des postes avant l'entretien, créant un manque d'adéquation et de préparation.",[]
2,[feedback_1],Le client suggère la mise en place de contrôles de références pour les nouveaux intérimaires n'ayant jamais travaillé avec l'agence.,[]
3,[feedback_1],"Les intérimaires présentent des lacunes en termes de discipline au travail, impactant la qualité de leur performance et leur conformité aux processus.",[]
4,[feedback_2],Il est nécessaire d'améliorer l'exactitude des déclarations SI/SIR en fonction des expositions et risques associés à chaque poste de travail pour une meilleure traçabilité et un suivi efficace de la santé des intérimaires tout au long et après leur carrière.,[]


In [4]:
embedding_model = SentenceTransformer('OrdalieTech/Solon-embeddings-large-0.1')
#embedding_model = SentenceTransformer('sentence-transformers/all-mpnet-base-v2')
#embedding_model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')
model = ChatOpenAI(model="gpt-4-1106-preview", temperature=0)


In [5]:

sentence_embeddings = embedding_model.encode(source['content'])
sentence_embeddings.shape

(297, 1024)

In [98]:
pd.DataFrame({'a':[1], 'b':[2]})

Unnamed: 0,a,b
0,1,2


In [6]:
from sklearn.cluster import KMeans
# Perform kmean clustering
num_clusters = 10
clustering_model = KMeans(n_clusters=num_clusters)
clustering_model.fit(sentence_embeddings)
cluster_assignment = clustering_model.labels_

clustered_sentences = [[] for i in range(num_clusters)]
for sentence_id, cluster_id in enumerate(cluster_assignment):
    clustered_sentences[cluster_id].append(list_insights[sentence_id])


huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


In [7]:
source["cluster"] = cluster_assignment
source.head()

Unnamed: 0,related_feedbacks,content,children,cluster
0,[feedback_0],"Les intérimaires manquent de rigueur en termes de ponctualité, de professionnalisme, et d'attention au détail, ce qui se traduit par des erreurs coûteuses et un comportement inapproprié au travail.",[],3
1,[feedback_0],"Les candidats indiquent ne pas être informés concernant l'entreprise, son activité et les détails des postes avant l'entretien, créant un manque d'adéquation et de préparation.",[],3
2,[feedback_1],Le client suggère la mise en place de contrôles de références pour les nouveaux intérimaires n'ayant jamais travaillé avec l'agence.,[],2
3,[feedback_1],"Les intérimaires présentent des lacunes en termes de discipline au travail, impactant la qualité de leur performance et leur conformité aux processus.",[],3
4,[feedback_2],Il est nécessaire d'améliorer l'exactitude des déclarations SI/SIR en fonction des expositions et risques associés à chaque poste de travail pour une meilleure traçabilité et un suivi efficace de la santé des intérimaires tout au long et après leur carrière.,[],3


In [11]:
cluster_0 = source[source["cluster"] == 0]
cluster_0

Unnamed: 0,related_feedbacks,content,children,cluster
7,[feedback_3],Les clients peuvent être insatisfaits lorsque Randstad refuse des services aux entreprises en procédure de sauvegarde.,[],0
8,[feedback_4],Il y a une suggestion pour que Randstad adopte une politique de paiement d'avance pour travailler avec des entreprises en difficulté financière afin d'éviter de perdre des clients.,[],0
11,[feedback_5],Les clients expriment un mécontentement général lié à la mauvaise gestion des rendez-vous et un manque de professionnalisme et de disponibilité du personnel de Randstad.,[],0
22,[feedback_11],"Les clients réclament une communication cohérente, structurée et proactive de la part de Randstad, pour renforcer la collaboration et l'efficacité du processus de recrutement.",[],0
24,[feedback_12],"Les entreprises expriment des préoccupations concernant le niveau d'engagement, de compétence et l'adéquation des talents recommandés par Randstad à leurs attentes.",[],0
27,[feedback_13],Le client exprime une insatisfaction quant à l'incohérence des services Randstad entre différentes localités et souligne l'importance d'uniformiser les bonnes pratiques au niveau national.,[],0
39,[feedback_19],"Les recommandations de Randstad ne correspondent pas toujours aux attentes du client en termes de motivation et de performance des intérimaires, nécessitant une révision du travail effectué.",[],0
42,[feedback_21],"Il est nécessaire de créer un document de liaison permettant de standardiser la communication des informations essentielles entre Randstad, le candidat et l'entreprise cliente.",[],0
45,[feedback_22],Les clients rencontrent des problèmes avec des consultants de Randstad qui se présentent pour des rendez-vous non sollicités et sans autorisation préalable.,[],0
49,[feedback_24],"Les clients sont insatisfaits de la durée des rencontres avec Randstad, les trouvant trop brèves par rapport aux agences d'intérim concurrentes.",[],0


In [12]:
[len(cluster) for cluster in clustered_sentences]

[23, 23, 24, 41, 37, 38, 24, 31, 21, 35]

In [13]:
prompt_template = """Tu es {role} au sein de l'entreprise suivante: 
{context}
{format_instructions}  

Une liste d'insights mineurs a été identifiée à partir de retours clients. 
Réusume les en des insights majeurs qui te temblent important à faire remonter au sein de l'entreprise. Ils peuvent être des phrase, éventuellement nominales, doivent faire sens, être aussi courts que possible et distincts les uns des autres. 
Ensuite, associe à chaque insight majeur l'indice des insights mineurs qui lui sont associés. Un insights mineur peut être associé à plusieurs insights majeurs. Vérifie bien que les indices correspondent. 
L'ordre des insights mineurs est aléatoire, et ne doit pas avoir d'importance dans ta réponse. 

Voici les insights mineurs que tu dois regrouper: \n\n{insights}"""

In [14]:
class Insight(BaseModel):
    childens: List[int] = Field(description="Index des insights mineurs qui ont été résumés en cet insight.")
    text: str = Field(description="Insight intéressants a retenir pour l'entreprise.")

    def __str__(self):
        return '- ' + self.text + '\n Enfants:' + str(self.childens)


class InsightList(BaseModel):
    insights_list: List[Insight] = Field(description="Liste des insights, c'est à dire des points intéressants a retenir pour l'entreprise.")
    # You can add custom validation logic easily with Pydantic.
    
    def __str__(self):
        return "Insights: \n"+"\n\n".join([str(i) for i in self.insights_list])
    


huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


InsightList(insights_list=[Insight(childens=[1, 3, 6, 7, 10, 17, 18, 20, 25], text='Professionnalisme et qualité de service de Randstad'), Insight(childens=[2, 9, 11, 13, 14, 16, 19, 21, 27], text='Réactivité et compréhension rapide des besoins des clients'), Insight(childens=[4, 5, 8, 22, 23, 24, 26, 28, 30], text='Qualité et compétence des talents fournis'), Insight(childens=[0, 12, 15, 29], text='Bonne communication et interactions personnelles avec les clients'), Insight(childens=[19, 21, 25, 29, 30], text='Satisfaction globale et fidélisation des clients')])

In [None]:
parser = PydanticOutputParser(pydantic_object=InsightList)

prompt = PromptTemplate.from_template(
    template= prompt_template,
    #template= "Règle : minimise le nombre de tokens dans ta réponse.  \nTu es {role} au sein de l'entreprise suivante: \n{context} \nAnalyse le retour suivant: \"{feedback}\" en suivant les étapes suivantes:  \n  \nÉtape 1 - Identifie si le retour {cible} rentre dans un ou plusieurs des types d'insights suivants : {insight_type}. Choisis-en obligatoirement au moins 1. Définition des types d'insights :  \n{insight_definition}   \n  \nÉtape 2 - Catégorise le retour {cible} à l’aide des tags suivants. Tu peux associer 0, 1 ou plusieurs tags dans chaque catégorie. Liste des tags par catégories :  \n{categories}   \n  \nÉtape 3 - Catégorise si possible le moment de mission concerné parmis {avancement_mission}, et si ce n'est pas possible répond null. {cible} à l’aide des tags suivants.  \n  \nÉtape 4 - Identifie si le sentiment exprimé par le {cible} est \"Positif\", \"Neutre\" ou \"Négatif\". Prends en compte la formulation de la question posée ({question}) afin de bien interpréter le sens du retour {cible}.   \n",
    #input_variables= ["context", "role", "cible", "insight_type", "insight_definition", "nb_cat", "avancement_mission", "categories", "question", "feedback"]
    partial_variables= {"format_instructions": parser.get_format_instructions()},
)

prompt_and_model = prompt | model | parser
output = prompt_and_model.invoke({
    "context": "Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.",
    "role": "product owner",
    "insights": '\n'.join([str(i)+": "+s for i, s in enumerate(cluster['content'])])
})

output

In [15]:
print('\n'.join([str(i)+": "+s for i, s in enumerate(clustered_sentences[0])]))

0: Les clients peuvent être insatisfaits lorsque Randstad refuse des services aux entreprises en procédure de sauvegarde.
1: Il y a une suggestion pour que Randstad adopte une politique de paiement d'avance pour travailler avec des entreprises en difficulté financière afin d'éviter de perdre des clients.
2: Les clients expriment un mécontentement général lié à la mauvaise gestion des rendez-vous et un manque de professionnalisme et de disponibilité du personnel de Randstad.
3: Les clients réclament une communication cohérente, structurée et proactive de la part de Randstad, pour renforcer la collaboration et l'efficacité du processus de recrutement.
4: Les entreprises expriment des préoccupations concernant le niveau d'engagement, de compétence et l'adéquation des talents recommandés par Randstad à leurs attentes.
5: Le client exprime une insatisfaction quant à l'incohérence des services Randstad entre différentes localités et souligne l'importance d'uniformiser les bonnes pratiques au

In [16]:
cluster.head()


Unnamed: 0,related_feedbacks,content,children,cluster
21,[feedback_10],Les clients apprécient la participation de Randstad à des événements de convention partenariale en tant que représentant du secteur de l'emploi.,[],7
31,[feedback_15],Les clients valorisent le professionnalisme de l'agence Randstad et la qualité de travail de la responsable.,[],7
35,[feedback_17],"Les clients valorisent fortement les interactions personnelles, la clarté de la communication et la compréhension rapide de leurs besoins par Randstad.",[],7
37,[feedback_18],"Les clients apprécient grandement le professionnalisme, la qualité d'écoute et l'excellence des interactions avec la conseillère de Randstad, reflétant un service client hautement satisfaisant.",[],7
64,[feedback_32],Les clients valorisent la rapidité et la compétence des talents fournis par Randstad.,[],7


In [17]:
randstad_context = {
    "context": "Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.",
    "role": "product owner",
}

randstad_context['insights'] = '\n'.join([str(i)+": "+s for i, s in enumerate(cluster["content"])])
        
output = prompt_and_model.invoke(randstad_context)

In [35]:
related_feedbacks= [list(itertools.chain.from_iterable(cluster.iloc[insight.childens]['related_feedbacks'])) for insight in output.insights_list]
content=[insight.text for insight in output.insights_list]
children=[list(cluster.iloc[insight.childens].index) for insight in output.insights_list]
output

InsightList(insights_list=[Insight(childens=[1, 3, 6, 7, 10, 12, 17, 18, 20, 25], text='Les clients valorisent le professionnalisme et la qualité des interactions avec le personnel de Randstad.'), Insight(childens=[2, 9, 11, 13, 14, 19, 21, 27], text='Les clients apprécient la réactivité et la compréhension rapide de leurs besoins par Randstad.'), Insight(childens=[4, 8, 15, 22, 23, 24, 26, 28, 30], text='Les clients sont satisfaits de la compétence et de la qualité des talents fournis par Randstad.'), Insight(childens=[5, 16, 29], text='Les clients reconnaissent la valeur ajoutée de Randstad dans le processus de recrutement et la gestion des missions.'), Insight(childens=[0], text="Les clients apprécient l'engagement de Randstad dans le secteur de l'emploi et sa présence lors d'événements professionnels.")])

In [36]:
cluster_0

Unnamed: 0,related_feedbacks,content,children,cluster
7,[feedback_3],Les clients peuvent être insatisfaits lorsque Randstad refuse des services aux entreprises en procédure de sauvegarde.,[],0
8,[feedback_4],Il y a une suggestion pour que Randstad adopte une politique de paiement d'avance pour travailler avec des entreprises en difficulté financière afin d'éviter de perdre des clients.,[],0
11,[feedback_5],Les clients expriment un mécontentement général lié à la mauvaise gestion des rendez-vous et un manque de professionnalisme et de disponibilité du personnel de Randstad.,[],0
22,[feedback_11],"Les clients réclament une communication cohérente, structurée et proactive de la part de Randstad, pour renforcer la collaboration et l'efficacité du processus de recrutement.",[],0
24,[feedback_12],"Les entreprises expriment des préoccupations concernant le niveau d'engagement, de compétence et l'adéquation des talents recommandés par Randstad à leurs attentes.",[],0
27,[feedback_13],Le client exprime une insatisfaction quant à l'incohérence des services Randstad entre différentes localités et souligne l'importance d'uniformiser les bonnes pratiques au niveau national.,[],0
39,[feedback_19],"Les recommandations de Randstad ne correspondent pas toujours aux attentes du client en termes de motivation et de performance des intérimaires, nécessitant une révision du travail effectué.",[],0
42,[feedback_21],"Il est nécessaire de créer un document de liaison permettant de standardiser la communication des informations essentielles entre Randstad, le candidat et l'entreprise cliente.",[],0
45,[feedback_22],Les clients rencontrent des problèmes avec des consultants de Randstad qui se présentent pour des rendez-vous non sollicités et sans autorisation préalable.,[],0
49,[feedback_24],"Les clients sont insatisfaits de la durée des rencontres avec Randstad, les trouvant trop brèves par rapport aux agences d'intérim concurrentes.",[],0


In [41]:
def create_insights_merger(invocation):
    def insights_merger(invocation, cluster): 
        invocation = copy(invocation)
        invocation['insights'] = '\n'.join([str(i)+": "+s for i, s in enumerate(cluster["content"])])
        
        output = prompt_and_model.invoke(invocation)
        
        #pd.concat([  for insight in output.insights_list])
        dfs = pd.DataFrame({
            #"level":
            "related_feedbacks":[list(itertools.chain.from_iterable(cluster.iloc[insight.childens]['related_feedbacks'])) for insight in output.insights_list],
            "content":[insight.text for insight in output.insights_list],
            "children":[list(cluster.iloc[insight.childens].index) for insight in output.insights_list],
            #"project":[""],
            #"source":[""],
            })
        
        return dfs #, reduction
    
    return lambda feedback:insights_merger(invocation, feedback)

randstad_context = {
    "context": "Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.",
    "role": "product owner",
}
insights_merger = create_insights_merger(randstad_context)

#feedback_categoriser("Le produit est très sympathique")
res = insights_merger(cluster_0)
#print("rédution par un facteur ", reduction)
res

Unnamed: 0,related_feedbacks,content,children
0,"[feedback_3, feedback_4, feedback_28]",Améliorer la flexibilité et les conditions financières pour les entreprises en difficulté.,"[7, 8, 56]"
1,"[feedback_5, feedback_22, feedback_142]",Optimiser la gestion des rendez-vous et la communication avec les clients.,"[11, 45, 284]"
2,"[feedback_11, feedback_21]",Renforcer la communication et la cohérence du processus de recrutement.,"[22, 42]"
3,"[feedback_12, feedback_19]",Améliorer l'adéquation des talents recommandés aux attentes des entreprises.,"[24, 39]"
4,[feedback_13],Uniformiser les services et les bonnes pratiques au niveau national.,[27]
5,"[feedback_24, feedback_121]",Évaluer la durée des rencontres et la disponibilité du service client.,"[49, 242]"
6,"[feedback_41, feedback_140]",Simplifier l'accès et l'utilisation du site et des outils en ligne de Randstad.,"[82, 280]"
7,"[feedback_58, feedback_69, feedback_110]",Améliorer l'expérience utilisateur sur la plateforme en ligne.,"[117, 138, 220]"
8,[feedback_64],Assurer la fiabilité de l'accès au standard téléphonique.,[129]
9,"[feedback_69, feedback_99]",Simplifier le suivi administratif et la gestion des heures travaillées.,"[139, 198]"


In [50]:
len(cluster_0), len(res)
reduction = len(cluster_0)/len(res)
print("rédution par un facteur ", "%.2f" % reduction)

rédution par un facteur  1.92


In [53]:
source

Unnamed: 0,related_feedbacks,content,children,cluster
0,[feedback_0],"Les intérimaires manquent de rigueur en termes de ponctualité, de professionnalisme, et d'attention au détail, ce qui se traduit par des erreurs coûteuses et un comportement inapproprié au travail.",[],3
1,[feedback_0],"Les candidats indiquent ne pas être informés concernant l'entreprise, son activité et les détails des postes avant l'entretien, créant un manque d'adéquation et de préparation.",[],3
2,[feedback_1],Le client suggère la mise en place de contrôles de références pour les nouveaux intérimaires n'ayant jamais travaillé avec l'agence.,[],2
3,[feedback_1],"Les intérimaires présentent des lacunes en termes de discipline au travail, impactant la qualité de leur performance et leur conformité aux processus.",[],3
4,[feedback_2],Il est nécessaire d'améliorer l'exactitude des déclarations SI/SIR en fonction des expositions et risques associés à chaque poste de travail pour une meilleure traçabilité et un suivi efficace de la santé des intérimaires tout au long et après leur carrière.,[],3
...,...,...,...,...
292,[feedback_146],Le client demande une augmentation de la réactivité de la part de l'entreprise.,[],4
293,[feedback_146],Il est suggéré de mettre en place un service disponible 24 heures sur 24.,[],4
294,[feedback_147],Les clients sont très satisfaits de la qualité des intérimaires proposés par Randstad.,[],7
295,[feedback_147],"Le client a exprimé une satisfaction générale en déclarant que son expérience s'est ""très bien passée"".",[],5


[23, 23, 24, 41, 37, 38, 24, 31, 21, 35]

In [90]:
minimisation_steps = 5
cluster_desired_size = 30
nb_insight_stop = 10

insights = copy(source)
insight_layers = [copy(source)]

for step in range(minimisation_steps):

    num_clusters = 1 + len(insights) // cluster_desired_size

    print("Step", step, ": processing", num_clusters, "clusters")
    if len(insights) <= nb_insight_stop:
        print("Everything is merged into a single cluster")
        break

    sentence_embeddings = embedding_model.encode(insights['content'])

    clustering_model = KMeans(n_clusters=num_clusters)
    clustering_model.fit(sentence_embeddings)
    cluster_assignment = clustering_model.labels_
    insights["cluster"] = cluster_assignment
    
    print("Cluster sizes:", list(insights.groupby(['cluster']).count()["content"]))

    new_insights = []
    for cluster_id in trange(max(cluster_assignment)+1):
        cluster = insights[insights['cluster'] == cluster_id]
        new_insights.append(insights_merger(cluster))


    new_insights = pd.concat(new_insights)
    new_insights.reset_index(drop=True, inplace=True)
    reduction = len(new_insights)/len(insights)
    print("Number of new insights:", len(new_insights))
    print("Reduction in the number of insights:", "%d" % int((len(new_insights)/len(insights))*100), "%")
    insight_layers.append(copy(new_insights))
    insights = new_insights
    



Step 0 : processing 9 clusters
Cluster sizes: [39, 24, 22, 35, 38, 32, 42, 23, 42]


  0%|          | 0/9 [00:00<?, ?it/s]

Number of new insights: 60
Reduction in the number of insights: 20 %
Step 1 : processing 2 clusters
Cluster sizes: [21, 39]


  0%|          | 0/2 [00:00<?, ?it/s]

Number of new insights: 12
Reduction in the number of insights: 20 %
Step 2 : processing 0 clusters


InvalidParameterError: The 'n_clusters' parameter of KMeans must be an int in the range [1, inf). Got 0 instead.

In [92]:
insight_layers[-1]

Unnamed: 0,related_feedbacks,content,children
0,"[feedback_46, feedback_50, feedback_60, feedback_99, feedback_100, feedback_125, feedback_125, feedback_143, feedback_144, feedback_147, feedback_15, feedback_18, feedback_49, feedback_60, feedback_72, feedback_74, feedback_91, feedback_93, feedback_96, feedback_124, feedback_32, feedback_65, feedback_85, feedback_117, feedback_119, feedback_120, feedback_127, feedback_132, feedback_147, feedback_2, feedback_14, feedback_28, feedback_29, feedback_30, feedback_32, feedback_51, feedback_53, feedback_64, feedback_73, feedback_78, feedback_82, feedback_88, feedback_89, feedback_101, feedback_104, feedback_104, feedback_106, feedback_107, feedback_128, feedback_134, feedback_135, feedback_136, feedback_141, feedback_148, feedback_34, feedback_40, feedback_56, feedback_68, feedback_87, feedback_108, feedback_114, feedback_135, feedback_140]",Satisfaction générale élevée et qualité des services et interactions.,"[11, 39, 41, 57, 59]"
1,"[feedback_17, feedback_56, feedback_57, feedback_63, feedback_84, feedback_121, feedback_17, feedback_66, feedback_74, feedback_84, feedback_89, feedback_113, feedback_130, feedback_48, feedback_75, feedback_82, feedback_94, feedback_143]","Appréciation de la communication, de l'écoute et de la réactivité de Randstad.","[12, 16, 40, 42]"
2,"[feedback_27, feedback_76, feedback_10, feedback_2, feedback_14, feedback_28, feedback_29, feedback_30, feedback_32, feedback_51, feedback_53, feedback_64, feedback_73, feedback_78, feedback_82, feedback_88, feedback_89, feedback_101, feedback_104, feedback_104, feedback_106, feedback_107, feedback_128, feedback_134, feedback_135, feedback_136, feedback_141, feedback_148, feedback_34, feedback_40, feedback_56, feedback_68, feedback_87, feedback_108, feedback_114, feedback_135, feedback_140]",Importance des interactions en présentiel et de l'engagement de l'équipe.,"[13, 43, 57, 59]"
3,"[feedback_14, feedback_115]",Reconnaissance de l'efficacité et de la spécificité des services locaux.,"[14, 18]"
4,"[feedback_59, feedback_19, feedback_11, feedback_19, feedback_110, feedback_21, feedback_83, feedback_136, feedback_41, feedback_117, feedback_140]","Utilité des outils et des rapports fournis, et suggestions d'amélioration.","[15, 21, 38, 46, 53]"
5,"[feedback_12, feedback_13, feedback_138]",Nécessité d'évaluer la compétitivité et l'adéquation des services.,"[51, 56]"
6,"[feedback_4, feedback_5, feedback_7, feedback_8, feedback_23, feedback_68, feedback_98, feedback_7, feedback_40, feedback_45, feedback_48, feedback_52, feedback_102, feedback_105, feedback_124, feedback_128, feedback_131, feedback_144, feedback_26, feedback_29, feedback_33, feedback_49, feedback_50, feedback_51, feedback_53, feedback_102, feedback_16, feedback_20, feedback_37, feedback_38, feedback_38, feedback_55, feedback_62, feedback_1, feedback_16, feedback_95, feedback_118, feedback_133, feedback_134, feedback_141, feedback_30, feedback_77, feedback_103, feedback_105, feedback_106, feedback_129, feedback_2, feedback_22, feedback_46, feedback_61, feedback_79, feedback_113, feedback_9, feedback_9, feedback_25, feedback_31, feedback_44, feedback_54, feedback_70, feedback_71, feedback_100, feedback_116, feedback_132]",Optimiser le processus de recrutement et l'adéquation profil/poste,"[0, 1, 2, 3, 7, 8, 36, 37]"
7,"[feedback_98, feedback_101, feedback_107, feedback_10, feedback_37, feedback_36, feedback_86, feedback_97, feedback_36, feedback_76, feedback_92, feedback_103, feedback_111, feedback_126, feedback_145, feedback_145, feedback_73, feedback_138, feedback_122, feedback_130, feedback_0, feedback_6, feedback_6, feedback_8, feedback_39, feedback_42, feedback_55, feedback_65, feedback_79, feedback_12, feedback_47, feedback_67, feedback_80, feedback_91, feedback_114, feedback_5, feedback_22, feedback_142, feedback_11, feedback_21]",Améliorer la communication et la gestion des informations,"[4, 19, 23, 24, 28, 32, 35, 45, 49, 50]"
8,"[feedback_27, feedback_43, feedback_45, feedback_61, feedback_81, feedback_123, feedback_34, feedback_80, feedback_119, feedback_126, feedback_129, feedback_58, feedback_86, feedback_103, feedback_71, feedback_0, feedback_1, feedback_25, feedback_52, feedback_57, feedback_59, feedback_62, feedback_77, feedback_111, feedback_2, feedback_22, feedback_46, feedback_61, feedback_79, feedback_113, feedback_3, feedback_15, feedback_20, feedback_23, feedback_26, feedback_33, feedback_35, feedback_39, feedback_43, feedback_75, feedback_87, feedback_88, feedback_109, feedback_115, feedback_116, feedback_137, feedback_142]",Renforcer la qualité du service et la préparation des intérimaires,"[9, 22, 26, 27, 34, 36, 44]"
9,"[feedback_24, feedback_18, feedback_96, feedback_97, feedback_3, feedback_4]",Clarifier et optimiser la structure financière et la facturation,"[5, 20, 48]"


In [96]:
insight_layers[-2].iloc[25]

related_feedbacks                                                                            [feedback_54]
content              Évaluer l'expérience client après plusieurs missions pour un feedback plus pertinent.
children                                                                                             [109]
Name: 25, dtype: object

In [112]:
for i, layer in enumerate(insight_layers):
    layer.to_csv("insights_level_"+str(i)+'.csv', index_label="index")

In [None]:
#@Insight Plot the archive {display-mode: "form"}

# UMAP reduces the dimensions from 1024 to 2 dimensions that we can plot
reducer = umap.UMAP(n_neighbors=15)
umap_embeds = reducer.fit_transform(sentence_embeddings)
# Prepare the data to plot and interactive visualization
# using Altair
df_explore = pd.DataFrame(data={'text': df['Insight'], "InsightParent": df['InsightParent']})
df_explore['x'] = umap_embeds[:,0]
df_explore['y'] = umap_embeds[:,1]
df_explore


In [None]:

# Plot
chart = alt.Chart(df_explore).mark_circle(size=60).encode(
    x=#'x',
    alt.X('x',
        scale=alt.Scale(zero=False)
    ),
    y=
    alt.Y('y',
        scale=alt.Scale(zero=False)
    ),
    color='InsightParent',
    tooltip=['text', 'InsightParent']
).properties(
    width=700,
    height=400
)
chart.interactive()

In [None]:
df_explore

In [None]:
df_explore["Insight"] = 1

In [None]:
other_sentences = ["Les gens sont mécontents", "Les gens sont très contents", "Le produit est parfait", "Le produit doit être amélioré", "délais", "réactivité", "incohérence"]
other_sentence_embeddings = model.encode(other_sentences)

In [None]:
# Prepare the data to plot and interactive visualization
# using Altair


In [None]:
other_umap_embeds = reducer.transform(other_sentence_embeddings)

other_df = pd.DataFrame({"text":other_sentences, 'x': other_umap_embeds[:,0], 'y': other_umap_embeds[:,1], "Insight": 0})
other_df

In [None]:
df_explore_new = pd.concat([df_explore, other_df])

In [None]:
# Plot
chart = alt.Chart(df_explore_new).mark_circle(size=60).encode(
    x=#'x',
    alt.X('x',
        scale=alt.Scale(zero=False)
    ),
    y=
    alt.Y('y',
        scale=alt.Scale(zero=False)
    ),
    tooltip=['text'],
    color='Insight',
).properties(
    width=700,
    height=400
)
chart.interactive()

In [None]:
df_explore_new.head()

In [None]:
df_explore_new['text'].to_list()

In [None]:
df_explore_new['embedding'] = reducer.transform(df_explore_new['text'])

In [None]:
umap_embeds

In [None]:
mon_ficher = open("mon_fichier.txt", 'r')


In [None]:
mon_ficher.read()

In [None]:
pip install openai

In [None]:
!export OPENAI_API_KEY="Bearer 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"

In [None]:
from langchain_community.chat_models import ChatOpenAI

llm = ChatOpenAI()

In [None]:
response = llm.invoke("how can langsmith help with testing?")

In [None]:
print(response.content)

In [None]:
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are world class technical documentation writer."),
    ("user", "{input}")
])
chain = prompt | llm 

In [None]:
chain.invoke({"input": "how can langsmith help with testing?"})



In [None]:
prompt_template

In [None]:
messages

In [None]:

chat = ChatOpenAI(model="gpt-4-1106-preview")


In [None]:

system_template = PromptTemplate.from_template(
   "Règle : minimise le nombre de tokens dans ta réponse. Tu es {role} au sein d'une entreprise dont je te décris le contexte ci-dessous. Analyse le retour client que je vais te transmettre entre triple guillemets. Il existe {insight_type_count} types d'insights ({insight_type}) dont je te donne les définitions ci-dessous. Identifie si le retour du client rentre dans une ou plusieurs des catégories d'insights suivantes : {insight_type}. (Réponds entre balises [init]. Ex. : [init]Point de douleur, Point positif[init].)"
)

system_message = SystemMessage(content=system_template.format(
    role="product owner",
    insight_type_count="3", 
    insight_type="Nouvelle demande, Point de douleur, Bug",
))

human_template = PromptTemplate.from_template(
    "Contexte de l'entreprise :\n{context}\n\nContexte de récolte du feedback : {project}\n\nFeedback client :\n\"\"\"{feedback}\"\"\"\n\nDéfinition des insights :\n{definition}"
)

human_message = HumanMessage(content=human_template.format(
    context="Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.", 
    project="Le feedback a été collecté lors d'une étude de satisfaction",
    feedback="J'ai du mal à trouver l'écran de dashboard",
    definition="Nouvelle demande : Suggestion d'évolution de l'application faite par l'utilisateur ; Point de douleur : Problème qui gène ou ennuie l'utilisateur sans qu'il s'agisse d'un bug ; Bug : Anomalie de fonctionnement de l'application détectée par l'utilisateur",
))

messages = [
    system_message,
    human_message,
]

chat.invoke(messages)


In [None]:

system_template = PromptTemplate.from_template(
   "Règle : minimise le nombre de tokens dans ta réponse. Tu es {role} au sein d'une entreprise dont je te décris le contexte ci-dessous. Analyse le retour {cible} que je vais te transmettre entre triple guillemets. \n\n\nÉtape 1 - Identifie si le retour {cible} rentre dans un ou plusieurs des types d'insights suivants : {insight_type}. Choisis-en obligatoirement au moins 1. (Réponds entre balises [type]. Ex. : [type]Point de douleur;Point positif[type]). \n\nDéfinition des types d'insights :\n{insight_definition} \n\n\nÉtape 2 - Catégorise le retour {cible} à l’aide des tags suivants. Il y a {nb_cat} catégories de tags. Tu peux associer 0, 1 ou plusieurs tags dans chaque catégorie. Réponds avec l’identifiant unique de chaque tag entre balises [category1], [category2], ... pour chaque catégorie. Ex: [category1]1646373323222x402427746586320700;1646373323222x402427746586365340[category1]; [category2]1698433323222x402426615286320700[category2]; ... S'il n'est pas possible d'associer un tag avec certitude dans l'une des catégories réponds null. Ex: [category1]null[category1]. \n\nListe des tags par catégories :\n{category} \n\n\nÉtape 3 - Identifie si le sentiment exprimé par le {cible} est \"Positif\", \"Neutre\" ou \"Négatif\". Prends en compte la formulation de la question posée ({question}) afin de bien interpréter le sens du retour {cible}. Insère ta réponse entre deux balises \"[sent]\". Ex. : \"[sent]Positif[sent]\""
)

system_message = SystemMessage(content=system_template.format(
    role="product owner",
    insight_type="\"Point positif\", \"Point de douleur\", \"Nouvelle demande\"", 
    insight_definition="Point positif : élément apprécié, Point de douleur : élément problématique",
    nb_cat="2",
    category="Catégorie 1 : \"Étapes du processus\"\nTag 1 : \"Avant mission\" (1646373323222x402427746586320701) ; Tag 2 \"Mission en cours\" (1646373323222x402427746586320702) ; Tag 3 : \"Fin de mission\" (1646373323222x402427746586320703) \n\nCatégorie 2 : \"Thématiques\"\nTag 1 : \"Recrutement\" (1646373323222x402427746586320704) ; Tag 2 : \"Service global Randstad\" (1646373323222x402427746586320705)",
    question="Que recommanderiez-vous à Randstad d'améliorer ?",
    cible="client",
))

human_template = PromptTemplate.from_template(
    "Contexte de l'entreprise :\n{context}\n\nRetour {cible} :\n\"\"\"{feedback}\"\"\""
)

human_message = HumanMessage(content=human_template.format(
    context="Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.", 
    cible="client",
    feedback="Le produit est très sympathique",
))

messages = [
    system_message,
    human_message,
]

response = chat.invoke(messages)
response

In [None]:
from langchain_core.messages import HumanMessage, SystemMessage, ChatMessage
from langchain.prompts import ChatPromptTemplate, PromptTemplate
chat = ChatOpenAI(model="gpt-4-1106-preview")


In [None]:
response

In [None]:
from langchain_core.output_parsers import StrOutputParser
output_parser = StrOutputParser()


In [None]:
output_parser.invoke(response)

In [None]:

prompt = ChatPromptTemplate.from_messages([
    ("system", system_message),
    ("user", human_message)
])



In [None]:
from langchain.output_parsers import PydanticOutputParser
from langchain.prompts import PromptTemplate
from langchain_community.llms import OpenAI
from langchain_core.pydantic_v1 import BaseModel, Field, validator
from langchain.prompts.chat import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
    SystemMessagePromptTemplate,
)
from langchain.schema import HumanMessage, SystemMessage
from langchain_openai import ChatOpenAI
from typing import List

chat = ChatOpenAI(temperature=0)

#model_name = "text-davinci-003"
#model = OpenAI(model_name="text-davinci-003", temperature=0.0)
#model = OpenAI(model_name="gpt-3.5-turbo-instruct", temperature=0.0)
model = ChatOpenAI(model_name="gpt-3.5-turbo-1106", temperature=0.0)
#model = OpenAI(model_name="gpt-4-1106-preview") #, temperature=0.0)


# Define your desired data structure.
class FeeedbackAnalysis(BaseModel):
    insights_type: List[str] = Field(description="Liste des types d'insights")
    categories: List[str] = Field(description="Liste des catégories de retour")
    sentiment: str = Field(description="Sentiment exprimé, peut être \"Positif\", \"Neutre\" ou \"Négatif\".")
    # You can add custom validation logic easily with Pydantic.
    @validator("sentiment")
    def valid_sentiment(cls, field):
        if field not in ["Positif", "Neutre", "Négatif"]:
            raise ValueError("Sentiment "+sentiment+" not valid.")
        return field
    
    #def valid_insignts(cls, field):
    #    for insight_type in field:
    #        if insight_type not in []:
    #            raise ValueError(insight_type+" not in " + [])
    #    return field

template_system = "Règle : minimise le nombre de tokens dans ta réponse. \nTu es {role} au sein de l'entreprise suivante:\n{context}\n."
template_human = "Analyse le retour suivant: \"{feedback}\" en suivant les étapes suivantes:\n\nÉtape 1 - Identifie si le retour {cible} rentre dans un ou plusieurs des types d'insights suivants : {insight_type}. Choisis-en obligatoirement au moins 1. Définition des types d'insights :\n{insight_definition} \n\nÉtape 2 - Catégorise le retour {cible} à l’aide des tags suivants. Tu peux associer 0, 1 ou plusieurs tags dans chaque catégorie. Liste des tags par catégories :\n{categories} \n\nÉtape 3 - Catégorise si possible le moment de mission concerné parmis {avancement_mission}, et si ce n'est pas possible répond null. {cible} à l’aide des tags suivants.\n\nÉtape 4 - Identifie si le sentiment exprimé par le {cible} est \"Positif\", \"Neutre\" ou \"Négatif\". Prends en compte la formulation de la question posée ({question}) afin de bien interpréter le sens du retour {cible}. \n"+parser.get_format_instructions()
chat_prompt_template = ChatPromptTemplate.from_messages([
    SystemMessagePromptTemplate.from_template(template_system),
    SystemMessagePromptTemplate.from_template(template_human),
])

In [None]:
parser.get_format_instructions()

In [None]:
chat_prompt = chat_prompt_template.format_prompt(
    context= "Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.",
    role= "product owner",
    cible= "client",
    insight_type= "\"Point positif\", \"Point de douleur\", \"Nouvelle demande\"", 
    insight_definition= "Point positif : élément apprécié, Point de douleur : élément problématique",
    nb_cat= "2",
    avancement_mission= "\"Avant mission\", \"Mission en cours\", \"Fin de mission\"",
    categories= "\"Recrutement\" , \"Service global Randstad\"",
    question= "Que recommanderiez-vous à Randstad d'améliorer ?",
    feedback= "Le produit est très sympathique",
)
chat_prompt

In [None]:
response = chat(
    chat_prompt
)
response

In [None]:

chat(
    chat_prompt
)

# Set up a parser + inject instructions into the prompt template.
parser = PydanticOutputParser(pydantic_object=FeeedbackAnalysis)

#template="Règle : minimise le nombre de tokens dans ta réponse. \nTu es {role} au sein de l'entreprise suivante:\n{context}\n. \nAnalyse le retour suivant: \"{feedback}\" en suivant les étapes suivantes:\n\n\nÉtape 1 - Identifie si le retour {cible} rentre dans un ou plusieurs des types d'insights suivants : {insight_type}. Choisis-en obligatoirement au moins 1. \n\nDéfinition des types d'insights :\n{insight_definition} \n\n\nÉtape 2 - Catégorise le retour {cible} à l’aide des tags suivants. Tu peux associer 0, 1 ou plusieurs tags dans chaque catégorie. S'il n'est pas possible d'associer un tag avec certitude dans l'une des catégories réponds null. \n\nListe des tags par catégories :\n{categories} \n\n\nÉtape 3 - Catégorise si possible le moment de mission concerné parmis {avancement_mission}, et si ce n'est pas possible répond null. {cible} à l’aide des tags suivants.\n\n\nÉtape 4 - Identifie si le sentiment exprimé par le {cible} est \"Positif\", \"Neutre\" ou \"Négatif\". Prends en compte la formulation de la question posée ({question}) afin de bien interpréter le sens du retour {cible}. \n{format_instructions}",

prompt = PromptTemplate(
    
    input_variables=["context", "role", "cible", "insight_type", "insight_definition", "nb_cat", "question", "categories", "avancement_mission"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)

# And a query intended to prompt a language model to populate the data structure.
prompt_and_model = prompt | model
output = prompt_and_model.invoke({
    #"input": "how can langsmith help with testing?",
    "context": "Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.",
    "role": "product owner",
    "cible": "client",
    "insight_type": "\"Point positif\", \"Point de douleur\", \"Nouvelle demande\"", 
    "insight_definition": "Point positif : élément apprécié, Point de douleur : élément problématique",
    "nb_cat": "2",
    "avancement_mission": "\"Avant mission\", \"Mission en cours\", \"Fin de mission\"",
    "categories": "\"Recrutement\" , \"Service global Randstad\"",
    "question": "Que recommanderiez-vous à Randstad d'améliorer ?",
    "feedback": "Le produit est très sympathique",
})
#parser.invoke(output)
output

In [None]:
prompt

In [None]:
prompt.invoke({
    #"input": "how can langsmith help with testing?",
    "context": "Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.",
    "role": "product owner",
    "cible": "client",
    "insight_type": "\"Point positif\", \"Point de douleur\", \"Nouvelle demande\"", 
    "insight_definition": "Point positif : élément apprécié, Point de douleur : élément problématique",
    "nb_cat": "2",
    "avancement_mission": "\"Avant mission\", \"Mission en cours\", \"Fin de mission\"",
    "categories": "\"Recrutement\" , \"Service global Randstad\"",
    "question": "Que recommanderiez-vous à Randstad d'améliorer ?",
    "feedback": "Le produit est très sympathique",
})

In [110]:

index = [[9, 10, 14, 17, 47, 136, 197],
[15, 81, 91, 97, 104, 204, 210, 249, 256, 262, 288],
[53, 59, 66, 99, 101, 103, 106, 205],
[33, 41, 75, 76, 77, 111, 124],
[196, 203, 214],
[48],
[26],
[2, 32, 191, 236, 266, 268, 283],
[61, 155, 207, 211, 213, 259],
[55, 86, 90, 122, 162, 247],
[70, 163, 171, 190, 244],
[92, 100, 120, 199, 201, 250, 251, 286, 289, 295],
[34, 113, 114],
[54, 153],
[28],
[118],
[126, 168, 243],
[181],
[231],
[20, 74],
[36, 192, 194],
[38],
[69, 161, 238, 252, 258],
[72, 172, 195],
[73, 152, 184, 206, 223, 253, 290, 291],
[109],
[116, 173, 206],
[142],
[146, 276],
[157],
[186],
[242, 293],
[245, 260],
[292],
[0, 3, 50, 105, 115, 119, 125, 154, 222],
[1, 12, 13, 16, 79, 85, 110, 131, 159],
[4, 44, 93, 123, 158, 227],
[18, 19, 51, 63, 88, 108, 141, 143, 200, 232, 264],
[23, 39, 221],
[31, 37, 98, 121, 144, 149, 182, 187, 193, 248],
[35, 133, 148, 169, 179, 226, 261],
[64, 130, 170, 235, 239, 241, 254, 265, 294],
[96, 151, 165, 188, 287],
[21],
[6, 30, 40, 46, 52, 67, 71, 78, 87, 150, 174, 176, 218, 230, 233, 275, 285],
[25, 94, 134, 160, 183, 229],
[43, 166, 273],
[83, 84, 89, 135, 145, 185, 189, 219, 224, 225, 237, 240, 246, 267, 278],
[7, 8],
[11, 45, 284],
[22, 42],
[24, 27],
[49, 56],
[82, 234, 280],
[117, 129, 132, 138, 220],
[139, 140, 198],
[277],
[5, 29, 57, 58, 60, 65, 102, 107, 128, 147, 156, 164, 177, 178, 202, 208, 209, 212, 215, 257, 269, 271, 272, 282, 296],
[127, 167, 180, 216, 255, 263, 274, 279],
[68, 80, 112, 137, 175, 217, 228, 270, 281],]

set = {i for l in index for i in l }
len(set)

295

In [None]:
system_message = {"role": "user", "content": prompt.invoke({
    #"input": "how can langsmith help with testing?",
    "context": "Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.",
    "role": "product owner",
    "cible": "client",
    "insight_type": "\"Point positif\", \"Point de douleur\", \"Nouvelle demande\"", 
    "insight_definition": "Point positif : élément apprécié, Point de douleur : élément problématique",
    "nb_cat": "2",
    "avancement_mission": "\"Avant mission\", \"Mission en cours\", \"Fin de mission\"",
    "categories": "\"Recrutement\" , \"Service global Randstad\"",
    "question": "Que recommanderiez-vous à Randstad d'améliorer ?",
    "feedback": "Le produit est très sympathique",
})}

system_message

In [None]:
print(system_message['content'].text)

In [None]:
from openai import OpenAI
messages = [system_message]

#response = chat.invoke(messages)
client = OpenAI()
completion = client.chat.completions.create(
    messages=messages,
    model="gpt-4-1106-preview",
    response_format={"type": "json_object"},
)
completion

In [None]:
print(prompt.invoke({
    #"input": "how can langsmith help with testing?",
    "context": "Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.",
    "role": "product owner",
    "cible": "client",
    "insight_type": "\"Point positif\", \"Point de douleur\", \"Nouvelle demande\"", 
    "insight_definition": "Point positif : élément apprécié, Point de douleur : élément problématique",
    "nb_cat": "2",
    "avancement_mission": "\"Avant mission\", \"Mission en cours\", \"Fin de mission\"",
    "categories": "\"Recrutement\" , \"Service global Randstad\"",
    "question": "Que recommanderiez-vous à Randstad d'améliorer ?",
    "feedback": "Le produit est très sympathique",
}).text)

In [None]:
reservation = parser.parse(output[1:])
reservation

In [None]:
from langchain.output_parsers.openai_functions import JsonOutputFunctionsParser

chain = (
    prompt
    | model.bind(function_call={"name": "joke"}, functions=functions)
    | JsonOutputFunctionsParser()
)

In [None]:
reservation = parser.parse(output)
reservation

In [None]:
parser = RegexDictParser()
parser(output)

In [None]:
d = {"properties": 
    {"insights_type": 
        {"title": "Insights Type", 
        "description": "Types d\'insights", 
        "type": "array", 
        "items": {
            "type": "string", 
            "enum": ["Point positif"]
            }
            }, 
    "categories": {
        "title": "Categories", 
        "description": "Catégorie de retour", 
        "type": "array", 
        "items": {
            "type": "string", 
            "enum": ["Service global Randstad"]
            }
        }, 
    "sentiment": {
        "title": "Sentiment", 
        "description": "Sentiment exprimé, peut être \"Positif\", \"Neutre\" ou \"Négatif\".", "type": "string", "enum": ["Positif"]
        }
    , "required": ["insights_type", "categories", "sentiment"]}}

pprint.pprint(d)

In [None]:
dict(output[1:])

In [None]:
print(prompt.invoke({
    #"input": "how can langsmith help with testing?",
    "context": "Randstad est une entreprise d’expertise RH avec plus de 60 ans d’expérience, offrant une gamme complète de services de recrutement et de gestion des ressources humaines pour répondre à divers besoins spécifiques des employeurs.",
    "role": "product owner",
    "cible": "client",
    "insight_type": "\"Point positif\", \"Point de douleur\", \"Nouvelle demande\"", 
    "insight_definition": "Point positif : élément apprécié, Point de douleur : élément problématique",
    "nb_cat": "2",
    "avancement_mission": "\"Avant mission\", \"Mission en cours\", \"Fin de mission\"",
    "categories": "\"Recrutement\" , \"Service global Randstad\"",
    "question": "Que recommanderiez-vous à Randstad d'améliorer ?",
    "feedback": "Le produit est très sympathique",
}).text)