# Classement des idées d'innovation
Ce notebook effectue une évaluation des idées d'innovation en fonction des critères définis, en utilisant la similarité cosinus avec une pondération basée sur TF-IDF.

In [1]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

## Fonction pour charger les fichiers Excel

In [2]:
def load_excel(file_path, sheet_name=0):
    """Charge un fichier Excel dans un DataFrame Pandas"""
    return pd.read_excel(file_path, sheet_name=sheet_name)

## Fonction d'évaluation des idées
Cette fonction utilise TF-IDF pour transformer les descriptions des idées et calcule un score pour chaque idée en fonction de critères pondérés.

In [3]:
def evaluate_ideas(ideas_df, criteria_df):
    criteria_weights = criteria_df.set_index('Critère')['Poids'].to_dict()
    idea_descriptions = ideas_df['Description'].tolist()
    
    # Transformer les descriptions en vecteurs TF-IDF
    tfidf_vectorizer = TfidfVectorizer()
    tfidf_matrix = tfidf_vectorizer.fit_transform(idea_descriptions)
    
    scores = []
    for i in range(len(idea_descriptions)):
        idea_vector = tfidf_matrix[i]
        total_score = 0
        for criterion, weight in criteria_weights.items():
            criterion_vector = tfidf_vectorizer.transform([criterion])
            similarity = cosine_similarity(idea_vector, criterion_vector)[0][0]
            total_score += similarity * weight
        scores.append(round(total_score))
    
    ideas_df['Score'] = scores
    ranked_ideas = ideas_df.sort_values(by='Score', ascending=False).reset_index(drop=True)
    return ranked_ideas

## Chargement des données d'idées et de critères
Remplacez les chemins de fichier par ceux de vos fichiers locaux.

In [4]:
# Chemins des fichiers
ideas_file = "path/to/ideas.xlsx"
criteria_file = "path/to/criteria.xlsx"

# Chargement des données
ideas_df = load_excel(ideas_file)
criteria_df = load_excel(criteria_file)

## Calcul et affichage du classement des idées

In [5]:
ranked_ideas = evaluate_ideas(ideas_df, criteria_df)
print("Classement des idées d'innovation :")
print(ranked_ideas[['Idée', 'Score']])

Classement des idées d'innovation :
                                            Idée  Score
0                     Calcul des primes éthiques     10
1                  Système de parrainage d'idées      6
...
