In [1]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

In [7]:
def load_excel(file_path, sheet_name=0):
    return pd.read_excel(file_path, sheet_name=sheet_name)


def evaluate_ideas(ideas_df, criteria_df):
    criteria_weights = criteria_df.set_index('Critère')['Poids'].to_dict()
    
  
    idea_descriptions = ideas_df['Description'].tolist()
    
    
    tfidf_vectorizer = TfidfVectorizer()
    tfidf_matrix = tfidf_vectorizer.fit_transform(idea_descriptions)
    
    scores = []
    for i in range(len(idea_descriptions)):
        idea_vector = tfidf_matrix[i]
        total_score = 0
        for criterion, weight in criteria_weights.items():
            criterion_vector = tfidf_vectorizer.transform([criterion])
            similarity = cosine_similarity(idea_vector, criterion_vector)[0][0]
            total_score += similarity * weight
        scores.append(total_score)
    
   
    ideas_df['Score'] = scores
    
    
    ranked_ideas = ideas_df.sort_values(by='Score', ascending=False).reset_index(drop=True)
    return ranked_ideas


ideas_file = "/Users/adoumathurin/Desktop/Innovation/ideas.xlsx"
criteria_file = "/Users/adoumathurin/Desktop/Innovation/criteria.xlsx"

ideas_df = load_excel(ideas_file)
criteria_df = load_excel(criteria_file)


ranked_ideas = evaluate_ideas(ideas_df, criteria_df)


print("Classement des idées d'innovation :")
print(ranked_ideas[['Idée', 'Score']])


Classement des idées d'innovation :
                                            Idée     Score
0                     Calcul des primes éthiques  9.813567
1                  Système de parrainage d'idées  6.016521
2                    Application de co-voiturage  3.554670
3        Automatisation des processus financiers  1.943771
4                    Service de mentorat virtuel  1.839806
5               Système de formation automatisée  1.761207
6           Gestion de la diversité et inclusion  1.602218
7            Gestion des réunions et des agendas  1.445613
8               Visualisation de données avancée  1.440266
9               Recyclage des déchets numériques  1.432203
10           Optimisation de l’empreinte carbone  1.429522
11          Système de récompenses pour employés  1.379811
12     Surveillance des risques de cybersécurité  1.364373
13           Optimisation de l’espace de travail  1.324556
14             Service de brainstorming en ligne  1.276767
15               Pré

In [8]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

# Charger les données d'idées et de critères depuis les fichiers Excel
def load_excel(file_path, sheet_name=0):
    return pd.read_excel(file_path, sheet_name=sheet_name)

# Calculer le score de chaque idée en fonction des critères
def evaluate_ideas(ideas_df, criteria_df):
    criteria_weights = criteria_df.set_index('Critère')['Poids'].to_dict()
    
    # Concaténer les descriptions des idées pour utiliser TF-IDF
    idea_descriptions = ideas_df['Description'].tolist()
    
    # Transformer les descriptions en vecteurs TF-IDF
    tfidf_vectorizer = TfidfVectorizer()
    tfidf_matrix = tfidf_vectorizer.fit_transform(idea_descriptions)
    
    scores = []
    for i in range(len(idea_descriptions)):
        idea_vector = tfidf_matrix[i]
        total_score = 0
        for criterion, weight in criteria_weights.items():
            criterion_vector = tfidf_vectorizer.transform([criterion])
            similarity = cosine_similarity(idea_vector, criterion_vector)[0][0]
            total_score += similarity * weight
        # Arrondir le score total à l'entier le plus proche
        scores.append(round(total_score))
    
    # Ajouter les scores au DataFrame des idées
    ideas_df['Score'] = scores
    
    # Trier les idées par score décroissant
    ranked_ideas = ideas_df.sort_values(by='Score', ascending=False).reset_index(drop=True)
    return ranked_ideas

# Chargement des fichiers d'idées et des critères
ideas_file = "/Users/adoumathurin/Desktop/Innovation/ideas.xlsx"
criteria_file = "/Users/adoumathurin/Desktop/Innovation/criteria.xlsx"

ideas_df = load_excel(ideas_file)
criteria_df = load_excel(criteria_file)

# Évaluer et classer les idées
ranked_ideas = evaluate_ideas(ideas_df, criteria_df)

# Affichage du classement
print("Classement des idées d'innovation :")
print(ranked_ideas[['Idée', 'Score']])


Classement des idées d'innovation :
                                            Idée  Score
0                     Calcul des primes éthiques     10
1                  Système de parrainage d'idées      6
2                    Application de co-voiturage      4
3           Gestion de la diversité et inclusion      2
4        Automatisation des processus financiers      2
5               Système de formation automatisée      2
6                    Service de mentorat virtuel      2
7            Optimisation de l’espace de travail      1
8      Suivi des certifications professionnelles      1
9            Gestion des réunions et des agendas      1
10               Automatisation des processus RH      1
11             Service de brainstorming en ligne      1
12        Outil de création de KPI personnalisés      1
13         Prédiction des besoins de maintenance      1
14     Surveillance des risques de cybersécurité      1
15              Automatisation de la facturation      1
16          