# Import spacy library and Tf-Idfvectorizor

In [2]:
import spacy
from sklearn.feature_extraction.text import TfidfVectorizer

# Load spaCy model
nlp = spacy.load("fr_core_news_sm")


# Preprocessing operations 

In [3]:
def preprocess_text(text):
    # Tokenize and preprocess the text using spaCy
    doc = nlp(text)
    return " ".join([token.lemma_ for token in doc if not token.is_stop])

# algorithme of the summarize 


In [4]:

def extractive_summarization(text, ratio=0.3):
    # Preprocess the text
    preprocessed_text = preprocess_text(text)

    # Use TF-IDF for feature extraction
    vectorizer = TfidfVectorizer()
    X = vectorizer.fit_transform([preprocessed_text])

    # Get feature names and scores
    feature_names = vectorizer.get_feature_names_out()
    tfidf_scores = X[0].toarray()[0]

    # Sort feature names based on scores
    sorted_indices = tfidf_scores.argsort()[::-1]

    # Calculate the number of sentences based on the specified ratio
    num_sentences = int(len(sorted_indices) * ratio)

    # Get top sentences
    top_sentence_indices = sorted_indices[:num_sentences]
    top_sentences = [sent.text for i, sent in enumerate(nlp(text).sents) if i in top_sentence_indices]

    return " ".join(top_sentences)


# USE case example

In [6]:
# Example usage
input_text =  """
Dans l'immensité de l'ère numérique, où l'information circule sans relâche, l'intersection entre la technologie et l'expérience humaine occupe le devant de la scène. Des royaumes animés des médias sociaux, où les liens prospèrent dans le paysage virtuel, aux algorithmes complexes qui alimentent l'intelligence artificielle, la révolution numérique remodèle le tissu de la société.

Dans le domaine de la santé, les technologies innovantes ouvrent la voie à la médecine personnalisée et aux percées dans le traitement. Les avancées génétiques promettent de percer les secrets de notre ADN, offrant des perspectives sans précédent sur la prévention des maladies et les thérapies ciblées. Pendant ce temps, la télémédecine comble les distances, offrant des solutions de santé accessibles aux coins reculés du globe.

Le paysage environnemental subit des transformations guidées par une prise de conscience croissante du changement climatique. Les pratiques durables, les sources d'énergie renouvelables et les innovations écologiques émergent comme des phares d'espoir. Les efforts de conservation, alimentés par l'urgence de préserver la biodiversité, rassemblent des communautés du monde entier pour protéger les espèces en voie de disparition et les écosystèmes fragiles.

Dans le monde de l'éducation en constante évolution, les plateformes numériques révolutionnent l'expérience d'apprentissage. Les cours en ligne, les salles de classe virtuelles et les technologies interactives démocratisent le savoir, transcendant les frontières géographiques. La quête du savoir devient un voyage dynamique et accessible pour les apprenants de tous âges, favorisant une communauté intellectuelle mondiale.

Alors que la toile culturelle tisse des récits de diversité, d'inclusivité et de justice sociale, les mouvements pour l'égalité prennent de l'ampleur. Les défenseurs du changement utilisent le pouvoir du récit, de l'art et des plateformes numériques pour amplifier les voix et défier les injustices systémiques. La quête d'un monde plus équitable résonne au-delà des frontières, favorisant le dialogue et la compréhension.

Dans la danse cosmique de l'exploration, les agences spatiales repoussent les limites de l'accomplissement humain. Les missions sur Mars, les explorations lunaires et la quête de vie extraterrestre captivent l'imagination collective. Les avancées en technologie spatiale promettent un avenir où les voyages interplanétaires deviennent une réalité, ouvrant de nouveaux horizons pour l'humanité.

Au milieu de ces récits, l'esprit humain persévère, résilient et adaptable. La convergence de la technologie, de la science et des aspirations sociétales façonne un avenir où les possibilités sont aussi infinies que le cosmos. Dans cette toile complexe du progrès, l'humanité navigue dans les territoires inexplorés de l'ère numérique, animée par la curiosité, la compassion et le désir collectif de forger un avenir meilleur."""
ratio = 0.5
summary = extractive_summarization(input_text, ratio=ratio)
print("Original Text:\n", input_text)
print("\nSummary:\n", summary)

Original Text:
 
Dans l'immensité de l'ère numérique, où l'information circule sans relâche, l'intersection entre la technologie et l'expérience humaine occupe le devant de la scène. Des royaumes animés des médias sociaux, où les liens prospèrent dans le paysage virtuel, aux algorithmes complexes qui alimentent l'intelligence artificielle, la révolution numérique remodèle le tissu de la société.

Dans le domaine de la santé, les technologies innovantes ouvrent la voie à la médecine personnalisée et aux percées dans le traitement. Les avancées génétiques promettent de percer les secrets de notre ADN, offrant des perspectives sans précédent sur la prévention des maladies et les thérapies ciblées. Pendant ce temps, la télémédecine comble les distances, offrant des solutions de santé accessibles aux coins reculés du globe.

Le paysage environnemental subit des transformations guidées par une prise de conscience croissante du changement climatique. Les pratiques durables, les sources d'éner