Copyright (c) 2023 Graphcore Ltd. All rights reserved.

# Text Generation on IPUs using mT5 - Inference

[mT5](https://huggingface.co/docs/transformers/model_doc/mt5) is the multilingual variant of [T5](https://huggingface.co/docs/transformers/model_doc/t5), an encoder-decoder transformer model. T5 leverages a unified text-to-text format that allows it to represent natural language problems such as summarization, question answering and text classification in the same way. For example, for the task of machine translation, the source language text input to the encoder can be represented as "Translate X to Y: token1 token2 token3.." where the translation prefix specifies the source and target languages. The T5 output from the decoder is then the translated text in the target language. Similarly, input text for text classification can be prefixed as "Classify: token1 token2 ..", and the output text is a string with token(s) corresponding to the classified text. The advantage of this representation is that a single model can target different tasks simply by using an appropriate task prefix with the input text. However, pre-trained checkpoints for T5 primarily support only English as the source text for any natural language task, so the majority of problems that T5 can solve are English to English tasks. 

mT5 uses the same architecture as T5 but the encoder is pre-trained on a dataset covering 101 languages. However, unlike T5, mT5's pre-training does not include any supervised training so mT5 pre-trained checkpoints have limited immediate use. To be performant on any downstream task like machine translation or sentiment analysis, mT5 needs to be fine-tuned.

This notebook shows how to easily use fine-tuned checkpoints for mT5 that target tasks such as language identification, translation and summarisation using the Graphcore IPU for **inference**. 

Note: No fine-tuning is performed in this notebook. Run the [fine-tuning-mT5](fine-tuning-mt5.ipynb) notebook to learn more about how to fine-tune mT5 for different tasks that use different languages.

|  Domain | Tasks | Model | Datasets | Workflow |   Number of IPUs   | Execution time |
|---------|-------|-------|----------|----------|--------------|--------------|
|   NLP   |  Text summarisation | mT5 | XL-Sum | Inference| recommended: 4 | 20Xmn (X1h20mn)   |

[![Join our Slack Community](https://img.shields.io/badge/Slack-Join%20Graphcore's%20Community-blue?style=flat-square&logo=slack)](https://www.graphcore.ai/join-community)


## Environment setup

The best way to run this demo is on Paperspace Gradient's cloud IPUs because everything is already set up for you.

[![Run on Gradient](images/gradient-badge.svg)](https://console.paperspace.com/github/<runtime-repo>?machine=Free-IPU-POD4&container=<dockerhub-image>&file=<path-to-file-in-repo>)  

To run the demo using other IPU hardware, you need to have the Poplar SDK enabled. Refer to the [Getting Started guide](https://docs.graphcore.ai/en/latest/getting-started.html#getting-started) for your system for details on how to do this. Also refer to the [Jupyter Quick Start guide](https://docs.graphcore.ai/projects/jupyter-notebook-quick-start/en/latest/index.html) for how to set up Jupyter to be able to run this notebook on a remote IPU machine.


## Dependencies and configuration

Install the dependencies the notebook needs.

In [1]:
!pip install ../optimum-graphcore-fork/ rouge nltk

Looking in indexes: https://mwizak%40graphcore.ai:****@artifactory.sourcevertex.net:443/api/pypi/pypi-virtual/simple, https://pypi.python.org/simple/
Processing /nethome/mwizak/optimum-graphcore-fork
  Installing build dependencies ... [?25ldone
[?25h  Getting requirements to build wheel ... [?25ldone
[?25h  Preparing metadata (pyproject.toml) ... [?25ldone
Collecting torch@ https://download.pytorch.org/whl/cpu/torch-1.13.1%2Bcpu-cp38-cp38-linux_x86_64.whl
  Using cached https://download.pytorch.org/whl/cpu/torch-1.13.1%2Bcpu-cp38-cp38-linux_x86_64.whl (199.1 MB)


Building wheels for collected packages: optimum-graphcore
  Building wheel for optimum-graphcore (pyproject.toml) ... [?25ldone
[?25h  Created wheel for optimum-graphcore: filename=optimum_graphcore-0.6.0.dev0-py3-none-any.whl size=193338 sha256=d4193cf03ef71daedc1032a06aeb8029b6a80eaae3d38f9952b54330dd2d5544
  Stored in directory: /nethome/mwizak/.cache/pip/wheels/7a/fd/c0/7273911a88f48c4195b1d61febe5c3f2cb51901875a0cdb05a
Successfully built optimum-graphcore
Installing collected packages: optimum-graphcore
  Attempting uninstall: optimum-graphcore
    Found existing installation: optimum-graphcore 0.6.0.dev0
    Uninstalling optimum-graphcore-0.6.0.dev0:
      Successfully uninstalled optimum-graphcore-0.6.0.dev0
Successfully installed optimum-graphcore-0.6.0.dev0


To enable cached execution with this notebook, a path to a directory to store cached executables can be configured through environment variables or directly in the notebook:

In [2]:
import os
executable_cache_dir=os.getenv("POPLAR_EXECUTABLE_CACHE_DIR", "/tmp/exe_cache")

## Running mT5 inference on the IPU

This notebook is built to run with most mT5 model checkpoints from the [ü§ó Model Hub](https://huggingface.co/models?search=mt5). [mT5](https://huggingface.co/docs/transformers/model_doc/mt5) has a selection of officially published model sizes ranging from small to XXL, where the size indicates the number of parameters in the model. The larger mT5 configurations offer a greater capacity of natural language understanding and can better support multiple tasks with a single model at the expense of requiring more memory and compute resource. However, smaller variants such as `mt5-small` and `mt5-base` still offer good language understanding.  

For inference, `mt5-small` and `mt5-base` are able to run using 4 IPUs. Larger mT5 configurations will need more IPUs due to memory constraints. To start off, we specify a `mt5-base` checkpoint fine-tuned on [44 languages](https://huggingface.co/datasets/csebuetnlp/xlsum) for the task of text summarisation. Refer to the research article [XL-Sum: Large-Scale Multilingual Abstractive Summarization for 44 Languages](https://aclanthology.org/2021.findings-acl.413/) for more information on the dataset. 

We define the model checkpoint so that we can use the ü§ó Transformers `pipeline` API to load the checkpoint from the ü§ó Hub. 

In [3]:
model_checkpoint = "csebuetnlp/mT5_multilingual_XLSum"

In order to run on the IPU, an IPU configuration (see [here]() for parameter documentation) is required that specifies attributes and configuration parameters to compile and put the model on the device. 

`mt5-base` has 12 encoder layers and 12 decoder layers. The first IPU is reserved for the embedding layer and the remaining IPUs are reserved for the encoder and decoder layers as well as the language modelling head. The decoder layers are sharded on the last 2 IPUs due to memory constraints.

In [4]:
from optimum.graphcore import IPUConfig

ipu_config = IPUConfig(
    inference_layers_per_ipu=[0, 12, 8, 4],
    executable_cache_dir=executable_cache_dir,
    embedding_serialization_factor=2,
)

Lastly, all we need to do is create a pipeline object by specifying the task, fine-tuned checkpoint and the IPU configuration. The task is set to `text2text-generation` due to the text-to-text format for T5 detailed previously. Below we use the `pipeline` interface from [ü§ó Optimum Graphcore](https://github.com/huggingface/optimum-graphcore) which is similar to the ü§ó Transformers [`pipeline`](https://huggingface.co/docs/transformers/main_classes/pipelines) but integrates support for the IPU. For more information on pipelines, please see [Pipelines for inference](https://huggingface.co/docs/transformers/pipeline_tutorial).

In [5]:
from optimum.graphcore import pipeline
pipe = pipeline(task="text2text-generation", model=model_checkpoint, ipu_config=ipu_config)



In [6]:
pipe.model.config

MT5Config {
  "_name_or_path": "csebuetnlp/mT5_multilingual_XLSum",
  "architectures": [
    "MT5ForConditionalGeneration"
  ],
  "d_ff": 2048,
  "d_kv": 64,
  "d_model": 768,
  "decoder_start_token_id": 0,
  "dense_act_fn": "gelu_new",
  "dropout_rate": 0.1,
  "eos_token_id": 1,
  "feed_forward_proj": "gated-gelu",
  "initializer_factor": 1.0,
  "is_encoder_decoder": true,
  "is_gated_act": true,
  "layer_norm_epsilon": 1e-06,
  "length_penalty": 0.6,
  "max_length": 84,
  "model_type": "mt5",
  "no_repeat_ngram_size": 2,
  "num_beams": 4,
  "num_decoder_layers": 12,
  "num_heads": 12,
  "num_layers": 12,
  "output_past": true,
  "pad_token_id": 0,
  "relative_attention_max_distance": 128,
  "relative_attention_num_buckets": 32,
  "tie_word_embeddings": false,
  "tokenizer_class": "T5Tokenizer",
  "transformers_version": "4.25.1",
  "use_cache": true,
  "vocab_size": 250112
}

In order to generate text summarisation predictions, we can simply pass an input string from an English article to the constructed pipeline object as shown below. Note that upon receiving the first input, the encoder and decoder models need to be compiled. This should take a few minutes. After that, the compiled models can be reused without recompilation.

In [7]:
eng_text = """Videos that say approved vaccines are dangerous and cause autism, cancer or infertility are among those that will be taken down, the company said.  The policy includes the termination of accounts of anti-vaccine influencers.  Tech giants have been criticised for not doing more to counter false health information on their sites.  In July, US President Joe Biden said social media platforms were largely responsible for people's scepticism in getting vaccinated by spreading misinformation, and appealed for them to address the issue.  YouTube, which is owned by Google, said 130,000 videos were removed from its platform since last year, when it implemented a ban on content spreading misinformation about Covid vaccines.  In a blog post, the company said it had seen false claims about Covid jabs "spill over into misinformation about vaccines in general". The new policy covers long-approved vaccines, such as those against measles or hepatitis B.  "We're expanding our medical misinformation policies on YouTube with new guidelines on currently administered vaccines that are approved and confirmed to be safe and effective by local health authorities and the WHO," the post said, referring to the World Health Organization."""
print(f"{eng_text=}", f"\nnum_tokens={len(eng_text.split())}")
summary_text = pipe(eng_text)
print(f"{summary_text=}")

eng_text='Videos that say approved vaccines are dangerous and cause autism, cancer or infertility are among those that will be taken down, the company said.  The policy includes the termination of accounts of anti-vaccine influencers.  Tech giants have been criticised for not doing more to counter false health information on their sites.  In July, US President Joe Biden said social media platforms were largely responsible for people\'s scepticism in getting vaccinated by spreading misinformation, and appealed for them to address the issue.  YouTube, which is owned by Google, said 130,000 videos were removed from its platform since last year, when it implemented a ban on content spreading misinformation about Covid vaccines.  In a blog post, the company said it had seen false claims about Covid jabs "spill over into misinformation about vaccines in general". The new policy covers long-approved vaccines, such as those against measles or hepatitis B.  "We\'re expanding our medical misinfo

Graph compilation: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚

summary_text=[{'generated_text': "The UK's vaccine agency has announced a crackdown on anti-virus vaccinations."}]


The generated summary text is not a good representation of the article. On inspection, it can be found that both the input text and generated text are constrained to be no longer than 50 tokens. This value of 50 tokens is the default maximum length for the `text2text-generation` pipeline. However, the article we used has 188 tokens, resulting in the input text sent to the encoder being truncated to 50 tokens. As a result, the entire context of the article is not visible to the decoder. Parameters to control the length of the input and output sequence can be configured by specifying: 

- `max_input_length`: the maximum length of the input text
- `max_length`: the maximum length of the generated text

A selection of other parameters that can also affect the generated output are given below. For more information on these parameters and others please see the blog post on [how to generate text](https://huggingface.co/blog/how-to-generate).

- `num_beams`
- `do_sample`
- `early_stopping`

Aside from these parameters, there are also [model and task specific pipeline parameters](https://huggingface.co/docs/transformers/pipeline_tutorial) that can be customised. However these are not necessarily specific for execution on the IPU. Try to experiment with changing the various values to see the impact on the generated text.

We now repeat the task of summarising the English article, but this time we override the default maximum input length and set `max_input_length=512`. We also specify `max_length=84`. The pipeline object is also reconstructed since the previous `pipe` object holds compiled models with sequence lengths limited to 50 instead. This is necessary because Graphcore's current PyTorch implementation only runs in static mode, so inputs are required to have static shapes. Therefore, changes to the number of inputs or their shapes requires recompilation. 

In [8]:
pipe = pipeline(task="text2text-generation", model=model_checkpoint, ipu_config=ipu_config)
max_input_length=512
max_length=84
summary_text = pipe(eng_text, max_length=max_length, max_input_length=max_input_length)

Graph compilation: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚

Now we see that the generated summary is a much better representation of the article text, given the longer context:

In [9]:
print(f"{summary_text=}")

summary_text=[{'generated_text': 'YouTube has banned thousands of videos spreading misinformation about Covid vaccines.'}]


## Approaches to inference using a dataset

If we have to summarise a large dataset of articles in different languages, we can simply iterate over the samples, generating the summaries serially. The source dataset can be in any form you wish, for example a ü§ó [Dataset](https://huggingface.co/docs/datasets/index), a PyTorch [Dataset](https://pytorch.org/docs/stable/data.html), a pandas [DataFrame](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html) or even as `list[str]`, so long as we are able to retrieve `str` or `list[str]` samples from the dataset. 

We now demonstrate two trivial ways of obtaining outputs generated from a collection of samples. We use the [xlsum](https://huggingface.co/datasets/csebuetnlp/xlsum) dataset which consists of article-summary pairs from the BBC covering 45 langauges. For simplicity, we pick only the French subset from the dataset, but you can select other languages, for example Gujarati, Korean, Hausa, Hindi, Igbo and Indonesian.

In [10]:
from datasets import load_dataset, load_metric

dataset = load_dataset("csebuetnlp/xlsum", "french", split="test[:50]")
dataset

Found cached dataset xlsum (/nethome/mwizak/.cache/huggingface/datasets/csebuetnlp___xlsum/french/2.0.0/518ab0af76048660bcc2240ca6e8692a977c80e384ffb18fdddebaca6daebdce)


Dataset({
    features: ['id', 'url', 'title', 'summary', 'text'],
    num_rows: 50
})

To get a sense of what the data looks like, the following function will show some samples picked randomly from the dataset:

In [11]:
import datasets
import random
import pandas as pd
from IPython.display import display, HTML

def show_random_elements(dataset, num_examples=5):
    assert num_examples <= len(dataset), "Can't pick more elements than there are in the dataset."
    picks = []
    for _ in range(num_examples):
        pick = random.randint(0, len(dataset)-1)
        while pick in picks:
            pick = random.randint(0, len(dataset)-1)
        picks.append(pick)
    
    df = pd.DataFrame(dataset[picks])
    for column, typ in dataset.features.items():
        if isinstance(typ, datasets.ClassLabel):
            df[column] = df[column].transform(lambda i: typ.names[i])
    display(HTML(df.to_html()))

In [12]:
show_random_elements(dataset.select_columns(["text", "summary"]))

Unnamed: 0,text,summary
0,"Les familles sont plong√©es dans la pauvret√© par la pand√©mie, for√ßant les filles √† se marier pr√©cocement (photo d'archive) Save the Children a d√©clar√© que Covid-19 avait mis 2,5 millions de filles suppl√©mentaires en danger de mariage pr√©coce d'ici 2025. La pand√©mie augmente la pauvret√©, obligeant les filles √† quitter l'√©cole et √† travailler ou √† se marier, a d√©clar√© l'organisation caritative. Dans certaines r√©gions d'Asie du Sud, d'Afrique et d'Am√©rique latine, les filles sont les plus vuln√©rables. L'organisation caritative britannique appelle les dirigeants du monde entier √† s'engager √† financer et √† soutenir davantage les efforts visant √† lutter contre le mariage des enfants et l'in√©galit√© entre les sexes. A ne pas manquer sur BBC Afrique : ""Ces mariages violent les droits des filles et les exposent √† un risque accru de d√©pression, de violence √† vie, de handicap et m√™me de mort"", a d√©clar√© Karen Flanagan, conseill√®re en protection de l'enfance pour Save the Children. Selon elle, 78,6 millions de mariages d'enfants ont √©t√© emp√™ch√©s au cours des 25 derni√®res ann√©es, mais les progr√®s pour mettre fin √† cette pratique ont ""ralenti"". Le mois dernier, Girls Not Brides, un groupe qui fait campagne pour mettre fin aux mariages d'enfants, a d√©clar√© √† la BBC qu'il observait √©galement cette tendance, provoqu√©e par le ralentissement des √©conomies et √† la fermeture des √©coles pendant la pand√©mie. Le Dr Faith Mwangi-Powell, directrice g√©n√©rale de Girls Not Brides, a d√©clar√© que l'√©ducation ""fournit un filet de s√©curit√© pour les filles"". Elle a ajout√© qu'il fallait davantage de soutien financier, de suivi et d'engagement communautaire pour garantir que les filles puissent aller √† l'√©cole. Quelle est l'ampleur du probl√®me ? Environ 12 millions de filles sont victimes de mariages pr√©coces chaque ann√©e, selon l'organisation caritative. Mais son rapport indique que ce nombre devrait augmenter sensiblement au cours des cinq prochaines ann√©es, car les cons√©quences √©conomiques de la pand√©mie se font sentir. Rien qu'en 2020, 500 000 autres filles risquent d'√™tre forc√©es de se marier et jusqu'√† un million d'autres devraient tomber enceintes, selon l'organisation caritative. Si aucune mesure n'est prise, il pourrait y avoir 61 millions de mariages d'enfants d'ici 2025, selon l'organisation caritative, mais cette estimation pourrait n'√™tre que ""la partie √©merg√©e de l'iceberg"". Guin√©e : des ados contre le mariage pr√©coce ""La pand√©mie pousse de plus en plus de familles dans la pauvret√©, obligeant de nombreuses filles √† travailler pour faire contribuer aux besoins de leur famille et √† abandonner l'√©cole - avec beaucoup moins de chances que les gar√ßons d'y retourner un jour"", a d√©clar√© Bill Chambers, le pr√©sident et directeur g√©n√©ral de l'organisation caritative. ""Un risque croissant de violence et d'exploitation sexuelle, combin√© √† une ins√©curit√© alimentaire et √©conomique croissante, signifie √©galement que de nombreux parents estiment n'avoir d'autre choix que de forcer leurs jeunes filles √† √©pouser des hommes plus √¢g√©s"". En avril, les Nations unies ont d√©clar√© qu'il pourrait y avoir jusqu'√† 13 millions de mariages d'enfants suppl√©mentaires dans le monde au cours de la prochaine d√©cennie en raison de la pand√©mie. 'Les filles livrent leur corps √† des hommes plus √¢g√©s' Pour son rapport, Save the Children s'est entretenu avec Esther, qui vit √† Kinshasa, la capitale de la R√©publique d√©mocratique du Congo. Des mesures de confinement visant √† emp√™cher la propagation du Covid-19 dans sa communaut√© ont entra√Æn√© la fermeture d'√©coles et de certains espaces publics. Pour l'instant, elle aide sa m√®re √† s'occuper des poulets de la famille, mais l'impact √©conomique de la pand√©mie se fait sentir - et en particulier chez les filles. ""De nombreux parents de mon quartier vendaient autrefois des marchandises au grand march√© en plein air. Mais √† cause du confinement, ils ne font plus rien. Les filles doivent se tourner vers des hommes plus √¢g√©s pour subvenir √† leurs besoins"", a d√©clar√© Esther. 'Je ne peux jamais compromettre mon √©ducation' L'organisation caritative a √©galement parl√© √† Abena, conseill√®re de Save the Children en √âthiopie, √¢g√©e de 16 ans . Abena a travaill√© avec les communaut√©s locales pour emp√™cher que les filles soient contraintes d'√©pouser des hommes plus √¢g√©s. Malgr√© cela, les parents d'Abena voulaient toujours qu'elle se marie √† 16 ans avec ""un homme √©duqu√© et ais√©"". Abena les a persuad√©s qu'elle devait poursuivre ses √©tudes. A lire aussi sur les mariages pr√©coces : Ma r√©ponse a √©t√© ""pas question"", a-t-elle dit. ""Je ne peux jamais compromettre mon √©ducation, et la demande de mariage elle-m√™me est une violation des droits d'une fille tant qu'elle a moins de 18 ans"". Le Global Girlhood Report 2020 de l'organisation caritative, publi√© jeudi, analyse les effets du Covid-19 sur l'√©galit√© des sexes dans le monde. Le rapport a √©galement constat√© que : A regarder : Pourquoi y a-t-il des mariages pr√©coces ?","La pand√©mie de coronavirus pourrait entra√Æner une forte hausse des mariages d'enfants dans le monde, remettant en cause 25 ans de progr√®s dans la lutte contre cette pratique, a averti une organisation caritative."
1,"Les mesures de pr√©vention continuent d‚Äô√™tre appliqu√©es en ce jour de rentr√©e au lyc√©e BW Harris. Les professeurs devront continuer de prendre la temp√©rature des √©l√®ves pour s‚Äôassurer qu'ils n‚Äôont pas la maladie Fermer les √©coles semble avoir √©t√© une mesure efficace parmi d‚Äôautres puisque l‚Äô√©pid√©mie semble reculer. En effet, le nombre de nouveaux cas d'Ebola chaque semaine est beaucoup plus faible aujourd'hui qu'il y a quelques mois. Isaac et Henry sont en derni√®re ann√©e. Henry est inquiet, il a peur d‚Äôattraper la maladie en classe et de repasser le virus √† sa famille. Isaac, quant √† lui, pense qu‚Äôil pourrait attraper la maladie des professeurs. N√©anmoins, les deux gar√ßons sont d√©termin√©s √† retourner √† l'√©cole d√®s que possible. Le Liberia √©tait le pays le plus touch√© avec pr√®s de 4 000 morts mais l‚Äô√©pid√©mie a √©galement eu des cons√©quences d√©vastatrices pour ses voisins la Sierra Leone et la Guin√©e. Plus d'un million d'enfants n‚Äôont pas pu aller en classe, les le√ßons ont √©t√© diffus√©es √† la radio pour leur permettre de continuer √† apprendre. Patrick √† 12 ans. Il veut aussi reprendre les cours. Mais Ebola a tout chang√©. En allant s‚Äôinscrire, Patrick et sa m√®re ont d√©couvert le nouveau r√®glement : pour limiter les risques d‚Äôinfection, le nombre d‚Äô√©tudiant est d√©sormais limit√© √† 50 par classe. Le nombre limite ayant √©t√© atteint, Patrick n‚Äôa pas pu s‚Äôinscrire. Bien qu'il existe encore quelques cas d'Ebola au Liberia, de nombreux enfants sont maintenant d√©sireux de retourner en classe. Mesure de pr√©vention Les √©l√®ves devront se laver soigneusement les mains pour se d√©sinfecter, et on devra prendre leur temp√©rature pour s‚Äôassurer qu'ils n‚Äôont pas la maladie. La maman et le papa d‚ÄôAdama (14 ans) sont tous les deux morts du virus Ebola. Elle aussi est tomb√©e malade mais elle a surv√©cu. ‚ÄúLorsque mon p√®re est mort, ma mere est tomb√©e malade. Quand ma m√®re est tomb√©e malade, les gens ont dit qu‚Äôils ne voulaient pas de moi √† cause d‚ÄôEbola‚Äú. C‚Äôest la tante d‚ÄôAdama qui s‚Äôoccupe d‚Äôelle √† pr√©sent. Elles vendent de l‚Äôeau dans des petits sacs plastique, ce qui leur rapporte peu d‚Äôargent. Adama aimerait aller √† l‚Äô√©cole. Mais sa tante pense que compte tenu la stigmatisation autour des survivants au virus, il est peut-√™tre trop t√¥t pour que sa ni√®ce retourne √† l‚Äô√©cole. Les √©coles sont √©galement invit√©es √† limiter le nombre d'enfants par classe pour √©viter la surpopulation. Certaines classes n‚Äôaccueilleront que 50 √©l√®ves, ce qui, au Liberia, repr√©sente une classe de petite taille. Plus de 9000 personnes ont √©t√© tu√©es par l‚Äô√©pid√©mie en Afrique de l'Ouest, mais selon les ONG engag√©es dans la lutte contre la maladie, la situation s'am√©liore.",Des centaines d‚Äô√©l√®ves ont repris le chemin des classes alors que les √©coles ont rouvert leurs portes cette semaine apr√®s une fermeture de six mois due √† l‚Äô√©pid√©mie du virus Ebola.
2,"En soutien √† Kaepernick, Rihanna ne chantera pas au Super Bowl Le quarterback de 30 ans a √©t√© le premier joueur √† s'agenouiller lors de l'hymne national am√©ricain. Il a ainsi lanc√© un mouvement de boycott de l'hymne am√©ricain en 2016 pour d√©noncer les violences polici√®res visant la population noire. Lire aussi: Une source proche de la chanteuse aurait d√©clar√© au magazine US Weekly que Rihanna ""n'est pas d'accord avec la position du NFL"". Le National Football League (NFL) a refus√© de commenter les informations. Le groupe ""Maroon 5"" sera √† l'affiche du spectacle qui aura lieu le 3 f√©vrier √† Atlanta, en G√©orgie. D√©noncer les violences polici√®res Kaepernick est sans √©quipe depuis qu'il a r√©sili√© son contrat avec les 49ers de San Francisco en mars 2017. D'autres joueurs avaient embo√Æt√© le pas √† Colin Kaepernick, ce qui avait provoqu√© des critiques du pr√©sident Donald Trump. Kaepernick est sans √©quipe depuis qu'il a r√©sili√© son contrat avec les 49ers de San Francisco en mars 2017. Il a d√©pos√© un grief contre les propri√©taires d'√©quipes de la NFL, qui aurait conspir√© pour ne pas l'engager √† cause de ses protestations. Il est devenu le visage d'une nouvelle campagne publicitaire de Nike. Lire aussi :",Rihanna aurait refus√© de jouer en premi√®re partie du spectacle du Super Bowl √† la mi-temps afin de soutenir Colin Kaepernick.
3,"La Ghouta orientale fait l'objet d'une offensive meurtri√®re du r√©gime syrien. ""Sur ordre du pr√©sident russe et dans le but d'√©viter les pertes parmi les civils de la Ghouta orientale, une tr√™ve humanitaire quotidienne sera instaur√©e √† partir du 27 f√©vrier de 09H00 √† 14H00"", a indiqu√© le ministre russe de la D√©fense, Sergue√Ø Cho√Øgou. ""Sur ordre du pr√©sident russe et dans le but d'√©viter les pertes parmi les civils de la Ghouta orientale, une tr√™ve humanitaire quotidienne sera instaur√©e √† partir du 27 f√©vrier de 09H00 √† 14H00"", a indiqu√© le ministre russe de la D√©fense, Sergue√Ø Cho√Øgou. Le fief rebelle de la Ghouta orientale fait l'objet d'une offensive meurtri√®re du r√©gime de Bachar al-Assad. Par ailleurs, la repr√©sentante de la diplomatie europ√©enne Federica Mogherini a demand√© lundi l'application imm√©diate de la tr√™ve de 30 jours r√©clam√©e dimanche par le Conseil de s√©curit√© de l'ONU. Cette tr√™ve doit permettre l'acheminement de l'aide humanitaire et les √©vacuations m√©dicales. L'accord d'Astana, sign√© le 4 mai 2017 par la Russie, l'Iran et la Turquie, pr√©voit la cr√©ation de quatre zones de cessez-le-feu en Syrie. La r√©gion de la Goutha orientale figure dans ces zones.","Vladimir Poutine a ordonn√© √† partir de mardi l'instauration d'une ""tr√™ve humanitaire"" quotidienne dans la Ghouta orientale en Syrie."
4,"Pas moins de 30 personnes avaient √©t√© appr√©hend√©es pour enl√®vement et autres activit√©s criminelles √† travers le pays. Pas moins de 30 personnes avaient √©t√© appr√©hend√©es pour enl√®vement et autres activit√©s criminelles √† travers le pays. Parmi eux se trouve un officier de l'arm√©e nig√©riane accus√© d'avoir dirig√© un gang de kidnappeurs dans l'Etat d'Edo au sud du Nigeria. Plusieurs membres d'un groupe de kidnappeurs tr√®s actif ont √©t√© arr√™t√©s durant le week-end √† Lagos. Osinbajo condamne les menaces contre les Igbos ""Buhari va mieux"" Cameroun : un soldat tu√© dans un attentat suicide Cela fait suite √† l'enl√®vement de 6 √©coliers √† Lagos il y a deux semaines. Leurs ravisseurs demandaient pr√®s d'un million de dollars de ran√ßon. 14 suspects ont un rapport avec ce que la police a d√©crit comme des ""activit√©s terroristes"" au centre et au nord-est du Nigeria. Un complice du commandant de Boko haram a √©t√© arr√™t√© √† Damaturu dans l'√©tat de Yobe tandis que deux insurg√©s pr√©sum√©s de Boko haram ont √©t√© appr√©hend√©s √† Abuja. La police secr√®te a assur√© que les personnes arr√™t√©es sont sous le coup d'une enqu√™te et seront pr√©sent√©es devant une cour prochainement.",La police secr√®te du Nig√©ria a annonc√© l'arrestation de plusieurs malfaiteurs dont des kidnappeurs suspect√©s d'op√©rer le long de la route d'Abuja-Kaduna.


To obtain summaries of all the text in our dataset, we can pass a `list[str]` to our constructed pipeline object by accessing the `text` feature of our dataset. Note that internally the input `list[str]` is serially processed, so that only a single sample is sent to be processed on the IPU at a time:

In [13]:
%%time
predictions = pipe(dataset["text"], max_input_length=max_input_length, max_length=max_length)
predictions_dataset = dataset.add_column("generated_summary", [p["generated_text"] for p in predictions])

CPU times: user 1h 17min 40s, sys: 12.4 s, total: 1h 17min 53s
Wall time: 52.3 s


This is a selection of the generated summaries:

In [14]:
show_random_elements(predictions_dataset.select_columns(["text", "summary", "generated_summary"]))

Unnamed: 0,text,summary,generated_summary
0,"Yasuke repr√©sent√© dans un livre pour enfants japonais par Kurusu Yoshio Il deviendra le premier homme n√© √† l'√©tranger √† obtenir le statut de guerrier samoura√Ø. Son histoire a inspir√© deux films produits par Hollywood. Connu sous le nom de Yasuke, cet homme √©tait un guerrier qui a atteint le rang de samoura√Ø sous le r√®gne d'Oda Nobunaga, un puissant seigneur f√©odal japonais du XVIe si√®cle qui fut le premier des trois unificateurs du Japon. En 1579, son arriv√©e √† Kyoto, la capitale √† l'√©poque, avait provoqu√© une telle sensation que les gens se bousculaient pour l'apercevoir et certains moururent m√™me √©cras√©s dans le mouvement de foule, selon l'historien Lawrence Winkler. En moins d'un an, Yasuke avait rejoint les √©chelons sup√©rieurs de la classe des guerriers japonais, les samoura√Øs. Peu de temps apr√®s, il parlait couramment le japonais et se battait aux c√¥t√©s de Nobunaga. ""Sa taille √©tait de 6 shaku 2 sun (environ 1,88m)... il √©tait noir, et sa peau √©tait comme du charbon de bois,"" un autre samoura√Ø, Matsudaira Letada, le d√©crit dans son journal en 1579. La taille moyenne d'un Japonais en 1900 √©tait de 1m57, ce qui fait que Yasuke aurait domin√© la plupart des Japonais au XVIe si√®cle. Lire aussi A l'√©poque, les gens √©taient g√©n√©ralement plus petits en raison d'une mauvaise alimentation. Fabrication d'un guerrier Il n'y a aucune trace de la date ou du pays de naissance de Yasuke. La plupart des historiens disent qu'il venait du Mozambique, mais certains ont sugg√©r√© d'autres pays comme l'Ethiopie ou le Nigeria. Ce que l'on sait, cependant, c'est que Yasuke est arriv√© au Japon avec un j√©suite italien du nom d'Alessandro Valignano lors d'une visite d'inspection, et n'appara√Æt dans l'histoire qu'entre 1579 et 1582. Certains experts disent qu'il √©tait un esclave, mais c'est difficile √† prouver. Floyd Webb et Deborah DeSnoo, cin√©astes travaillant sur un documentaire √† son sujet, croient que les affirmations selon lesquelles il √©tait un esclave sont au mieux des sp√©culations. ""Il aurait √©t√© impossible pour Yasuke de se hisser au rang de samoura√Ø en un an seulement sans un pass√© de guerrier "", dit Mme DeSnoo. Les samoura√Øs ont souvent commenc√© leur formation d√®s l'enfance. Amiti√© avec le seigneur de la guerre Yasuke a rencontr√© Nobunaga peu apr√®s son arriv√©e au Japon et il l'a int√©ress√©, disent les cin√©astes, en √©tant un talentueux d√©batteur. Yasuke parlait d√©j√† un peu japonais et les deux hommes s'entendaient bien, selon l'universitaire Thomas Lockey, qui a √©crit un livre sur Yasuke. Selon M. Lockey, Yasuke a diverti Nobunaga avec des contes d'Afrique et d'Inde, o√π M. Lockey pense que Yasuke avait pass√© quelque temps avant d'aller au Japon. M. Webb pense qu'en raison de sa ma√Ætrise de la langue japonaise, Yasuke avait d√©j√† un apriori favorable. Yasuke se bat aux c√¥t√©s d'Oda Nobunaga dans Kurusu Yoshio, livre pour enfants Kuro-suke. ""Il n'√©tait pas comme les J√©suites, qui avaient un programme religieux au Japon "", dit M. Webb. Selon certaines informations, Nobunaga aurait demand√© √† son neveu de donner une somme d'argent √† Yasuke lors de leur toute premi√®re rencontre. L'√©crivain franco-ivoirien Serge Bile √©tait si intrigu√© par l'extraordinaire ascension de Yasuke qu'il a √©crit un livre sur le guerrier. ""Cela fait partie du myst√®re qui entoure ce personnage. C'est pourquoi il me fascine"", a-t-il d√©clar√© √† la BBC. Le guerrier africain et le seigneur de guerre japonais avaient beaucoup en commun. Nobunaga √©tait un grand fan des arts martiaux et passait beaucoup de temps √† les pratiquer. C'√©tait aussi un excentrique qui, selon M. Webb, s'habillait souvent √† l'occidentale et recherchait la compagnie de personnes tr√®s disciplin√©es et intelligentes. Lire aussi ""Yasuke portait l'esprit guerrier"", dit M. Webb. Il comprenait le langage culturel du Japon et aimait danser et interpr√©ter l'Utenzi - une forme historique de po√©sie narrative swahilie c√©l√©brant des actes h√©ro√Øques, ajoute M. Webb. Cela sugg√®re que Yasuke √©tait peut-√™tre originaire du Mozambique, comme certains historiens le croient, √©tant donn√© que le swahili est encore parl√© dans certaines r√©gions du nord du pays. De m√™me, Nobunaga √©tait un amoureux du th√©√¢tre Noh - une forme de drame musical classique japonais - et il est largement rapport√© qu'il √©tait un m√©c√®ne des arts. Nobunaga s'est attach√© √† Yasuke et l'a trait√© comme un membre de sa famille. L'Africain faisait partie d'un groupe tr√®s s√©lectif de personnes autoris√©es √† d√Æner avec lui. ""Nobunaga a fait l'√©loge de la force et de la stature de Yasuke, d√©crivant sa puissance comme celle de 10 hommes,"" dit Mme DeSnoo. La l√©gende continue de vivre L'√©crivain franco-ivoirien Serge Bil√© est depuis longtemps fascin√© par Yasuke. Quand Nobunaga a conf√©r√© le rang de samoura√Ø √† Yasuke, l'id√©e d'un samoura√Ø non-japonais n'avait jamais √©t√© entendue. Plus tard, d'autres √©trangers obtiendront aussi le titre. En tant que premier samoura√Ø n√© √† l'√©tranger, Yasuke a livr√© d'importantes batailles aux c√¥t√©s d'Oda Nobunaga. Il √©tait √©galement pr√©sent la nuit fatidique o√π un des g√©n√©raux de Nobunaga, Akechi Mitsuhide, s'est retourn√© contre lui et a mis le feu au palais du seigneur de la guerre, pi√©geant Nobunaga dans une des pi√®ces. Nobunaga a mis fin √† sa vie en faisant un seppuku, un suicide rituel. Avant de se suicider, il a demand√© √† Yasuke de le d√©capiter et de porter sa t√™te et son √©p√©e √† son fils, selon l'historien Thomas Lockley. C'√©tait un signe de grande confiance. La l√©gende de Yasuke prend fin peu apr√®s, en 1582. La chute de Nobunaga aux mains d'un g√©n√©ral tra√Ætre a entra√Æn√© l'exil du premier samoura√Ø noir, peut-√™tre de retour dans une mission j√©suite √† Kyoto. Lire aussi Bien que son destin et les derni√®res ann√©es de sa vie demeurent inconnus, Yasuke a v√©cu dans l'imagination de nombreux Japonais qui ont grandi avec le livre pour enfants prim√© Kuro-suke (kuro qui signifie ""noir"" en japonais) de Kurusu Yoshio. Le livre, qui dramatise la vie de Yasuke, se termine sur une note douce-am√®re : apr√®s que Nobunaga s'est suicid√©, Kuro-suke (Yasuke) est conduit dans un temple o√π il r√™ve de ses parents en Afrique et pleure. Chadwick Boseman jouera Yasuke dans un prochain long m√©trage Le journal de l'industrie du divertissement Variety a rapport√© en mai que l'acteur de Black Panther, Chadwick Boseman, jouera Yasuke dans un prochain long m√©trage. Ce sera le deuxi√®me film hollywoodien en cours de d√©veloppement sur la vie de Yasuke. En 2017, le studio hollywoodien Lionsgate a annonc√© qu'il d√©veloppait un film sur la vie du samoura√Ø noir. Pr√®s de 500 ans plus tard, son parcours hors du commun continue d'√©merveiller et d'inspirer les gens. Voir aussi Au Japon, la princesse Mako, la petite fille a√Æn√©e de l'empereur Akihito va se marier.","Il y a pr√®s de 500 ans, un homme tr√®s grand de taille originaire d'Afrique est arriv√© au Japon.",Le Japon est l'un des premiers hommes √† avoir atteint le statut de guerrier samoura√Ø.
1,"R√©put√© g√©n√©reux et discret, il symbolisait le savoir-faire local face aux multinationales du secteur des BTP La CSE, qu'il a fond√© en 1970, est l'une des plus grandes entreprises de BTP (B√¢timent Travaux Publics) au S√©n√©gal et en Afrique de l'ouest avec un chiffre d'affaires estim√© en 2016 √† 100 milliards de FCFA. R√©put√© g√©n√©reux et discret, il symbolisait le savoir-faire local face aux multinationales du secteur. Le pr√©sident s√©n√©galais s'est dit pein√© par sa disparition dans un hommage qu'il lui a rendu. ""Avec le rappel √† Dieu de Aliou Sow, le S√©n√©gal perd une figure embl√©matique de son secteur priv√© national. Cr√©ateur d'entreprises et philanthrope engag√©, le fondateur de la CSE est un mod√®le de t√©nacit√© et de constance dans la qu√™te de l'excellence. Je salue sa m√©moire et pr√©sente √† sa famille mes condol√©ances √©mues. Paix √† son √¢me"", a d√©clar√© Macky Sall. LIRE AUSSI Faire carri√®re au S√©n√©gal S√©n√©gal : des prisonniers boulangers Un photomontage de Macky Sall cr√©e la pol√©mique Au S√©n√©gal, la voie de d√©gagement nord (VDN), l'h√¥tel Radisson Blu, √† Dakar, l'a√©roport international Blaise-Diagne de Diass (AIBD), la route Saint-Louis-Ndioum dans le nord du pays, le pont de Kolda en Casamance porte la signature de la CSE. La CSE est pr√©sente dans sept pays d'Afrique de l'ouest (Burkina Faso, Mali, Sierra Leone, Guin√©e, Niger, Gambie, Liberia) et en Afrique Centrale (Cameroun). Au S√©n√©gal, la voie de d√©gagement nord (VDN), l'h√¥tel Radisson Blu, √† Dakar, l'a√©roport international Blaise-Diagne de Diass (AIBD), la route Saint-Louis-Ndioum dans le nord du pays, le pont de Kolda en Casamance porte la signature de la CSE. Aliou Sow est le p√®re de Y√©rim Sow, un autre milliardaire , PDG du groupe Teyliom.","Aliou Ardo Sow, le fondateur de la Compagnie sah√©lienne d'entreprises (CSE), est d√©c√©d√© le 22 ao√ªt √† Paris √† 83 ans.","Le pr√©sident s√©n√©galais Macky Sall a annonc√© samedi la mort de son fondateur, l'ex-pr√©sident de la Conf√©d√©ration des Nations unies pour les travaux publics (CSE)."
2,"Guillaume Soro, le pr√©sident de l'Assembl√©e Nationale s'√©tait gard√© d'intervenir officiellement sur cette affaire de cache d'armes. Il a √©t√© envoy√© en prison apr√®s son audition dans le cadre de la d√©couverte en mai dernier d'une cache d'armes lors d'une mutinerie √† Bouak√©, dans le centre du pays. ''Une information judiciaire a √©t√© ouverte contre lui pour complot contre l'autorit√© de l'Etat'', selon le procureur. Dimanche, ses camarades de l'Alliance des Forces Nouvelles avaient publi√© un communiqu√© dans lequel ils se r√©servent le droit de ''lancer des mots d'ordre afin de pr√©server les libert√©s des Ivoiriens acquises de haute lutte'', selon leur porte-parole Sekongo F√©licien. Plus de 6 tonnes de diverses armes de guerre et des munitions ont √©t√© d√©couvertes dans une propri√©t√© de Souleymane Kamarate √† Bouak√©. Guillaume Soro, le pr√©sident de l'Assembl√©e Nationale s'√©tait gard√© d'intervenir officiellement sur cette affaire de cache d'armes.","Souleymane Kamarate, chef du protocole du pr√©sident de l'Assembl√©e Nationale, Guillaume Soro, a √©t√© √©crou√© lundi √† Abidjan.","Le pr√©sident de l'Assembl√©e Nationale ivoirienne, Souleymane Kamarate, a √©t√© plac√© en prison pour complot contre le gouvernement."
3,"L'√©tude a √©t√© r√©alis√©e par Fifpro et l'Universit√© de Manchester. Cette √©tude qui sera d√©voil√©e lundi prochain lors d'une conf√©rence √† Amsterdam souligne les √©carts de r√©mun√©rations entre le foot f√©minin et masculin notamment au niveau des primes. ""Nos recherches montrent combien il est dur m√™me pour une joueuse √©voluant dans une s√©lection nationale de faire carri√®re dans le football"", souligne le secr√©taire g√©n√©ral de la FifPro Theo van Seggelen, cit√© dans un communiqu√©. L'√©tude a √©t√© r√©alis√©e par Fifpro et l'Universit√© de Manchester. Il se base sur le t√©moignage de pr√®s de 3300 joueuses √©voluant dans 33 pays, dont les Etats-Unis, l'Allemagne, la France, l'Angleterre ou la Su√®de. ""Les r√©sultats de cette √©tude livrent un puissant t√©moignage sur les difficult√©s qu'√©prouvent les joueuses aujourd'hui"", rench√©rit Caroline Jonsson, responsable de la branche f√©minine de la FifPro. Lire aussi: Serena Williams contre l‚Äôin√©galit√© salariale Sierra Leone: bient√¥t une comp√©tition de foot f√©minin JO 2016 : le football f√©minin pour commencer Nig√©ria : les footballeuses sans primes Des carri√®res pro plus courtes Selon les premiers chiffres d√©voil√©s mardi, 87% des joueuses interrog√©es d√©clarent qu'elles pourraient r√©duire la dur√©e de leur carri√®re footballistique. Cette √©tude r√©v√®le que des centaines de joueuses de haut niveau d√©cident de mettre un terme √† leur carri√®re plus que t√¥t que pr√©vu ""afin de poursuivre une carri√®re plus viable ou fonder une famille"". Selon les premiers chiffres d√©voil√©s mardi, 87% des joueuses interrog√©es d√©clarent qu'elles pourraient r√©duire la dur√©e de leur carri√®re footballistique. L'une des causes de ce ph√©nom√®ne est la faible r√©mun√©ration du football f√©minin. Ainsi, 66% des joueuses √©voluant dans une √©quipe nationale se d√©clarent non-satisfaites par le niveau des primes, tandis que 35% d'entre elles ne sont tout simplement pas pay√©es lorsqu'elles repr√©sentent leurs pays. A titre de comparaison, l'ensemble des primes vers√©es lors de l'Euro-2016 masculin √† 24 √©quipes atteignait 301 millions d'euros, tandis que pour l'Euro-2017 f√©minin √† 16 √©quipes ce montant total devrait atteindre 8 millions d'euros, selon les chiffres de l'UEFA, organisateur des comp√©titions europ√©ennes.","La moiti√© des footballeuses ne sont pas pay√©es par leurs clubs, selon les premiers chiffres d'une √©tude la Fifpro, le syndicat mondial des footballeurs.","Les centaines de joueuses de haut niveau d√©cident de mettre un terme √† leur carri√®re footballistique plus que t√¥t que pr√©vu, selon une √©tude de la FifPro."
4,"Les initiatives de paix au Soudan du Sud ont toutes √©chou√© Le pr√©sident du Soudan du Sud Salva Kiir et l'ancien chef rebelle Riek Machar ont convenu de former un gouvernement d'unit√© avant l'expiration de la date limite du 22 f√©vrier. L'accord vise √† mettre fin √† un conflit meurtrier de six ans qui a fait plus 400 000 morts. Certaines questions restent en suspens, notamment celles relatives au partage du pouvoir et √† l'int√©gration des combattants. Les deux parties ont accept√© de traiter les autres questions ult√©rieurement. L'accord a √©t√© annonc√© quelques heures apr√®s la publication par l'ONU d'un rapport accablant accusant les deux parties d'avoir d√©lib√©r√©ment affam√© les civils pendant leur lutte pour le pouvoir.Lire aussi: Rapport accablant de l'ONU sur le Soudan du Sud Quels sont les enjeux de cet d'accord? On esp√®re que l'accord mettra fin √† la guerre civile d√©vastatrice qui s√©vit au Soudan du Sud depuis six ans. Ce conflit a tu√© quelque 400 000 personnes et d√©plac√© environ un tiers des 12 millions d'habitants. Le pr√©sident Kiir a exprim√© son d√©sir de voir la p√©riode transitoire de trois ans aboutir au retour des r√©fugi√©s et des d√©plac√©s. Si l'accord se concr√©tise, il pourrait annoncer un nouveau d√©part dans le plus jeune pays du monde. Lire aussi: Au Soudan du Sud, les rebelles rejettent la f√©d√©ration de 10 Etats Pourquoi ces combats? Le Soudan du Sud est devenu un √âtat ind√©pendant du Soudan en 2011, marquant la fin d'une longue guerre civile. Mais il n'a pas fallu longtemps pour que la promesse de paix s'effondre. Deux ans seulement apr√®s l'ind√©pendance, le pays est retomb√© dans un conflit violent en d√©cembre 2013, apr√®s que le pr√©sident Kiir a limog√© Machar, alors vice-pr√©sident. Why is South Sudan starving? Le pr√©sident Kiir avait accus√© M. Machar de pr√©parer un coup d'√âtat pour le renverser, ce que ce dernier a ni√©. La guerre a des origines politiques et ethniques avec des implications sur les relations de pouvoir. Les Dinka et les Nuer, les deux plus grands groupes ethniques du Sud-Soudan, auxquels appartiennent les deux dirigeants, ont √©t√© accus√©s de s'√™tre pris pour cible pendant la guerre, des atrocit√©s ayant √©t√© commises par toutes les parties. Pourquoi a-t-il √©t√© si difficile de parvenir √† un accord de paix ? Les parties n'avaient pas pu ou voulu s'entendre sur les modalit√©s de formation d'un gouvernement de transition, conform√©ment √† l'accord de paix revitalis√© de 2018. L'accord devait √™tre finalis√© en mai 2019 mais a √©t√© report√© √† deux reprises, la derni√®re √©ch√©ance √©tant le 22 f√©vrier. Riek Machar n'est plus √† Juba de fa√ßon permanente depuis 2016 Le conflit a pr√©cipit√© le pays dans une profonde crise humanitaire. Malgr√© la situation, il a √©t√© difficile pour les parties de parvenir et de maintenir un accord de paix qui pourrait stabiliser le pays. Les deux principaux dirigeants se m√©fient l'un de l'autre et il n'y a pas eu de relations de travail cordiales depuis que le pr√©sident Kiir a limog√© M. Machar en 2013. Riek Machar n'est jamais retourn√© d√©finitivement √† Juba, craignant pour sa s√©curit√© - depuis qu'il a fui le pays lorsque ses forces √©taient engag√©es dans des affrontements avec les troupes gouvernementales lors de l'effondrement de l'accord de paix de 2016. Lire aussi: Salva Kiir et Riek Machar s'engagent √† former un gouvernement A quoi ressemble la vie au Soudan du Sud ? Le Fonds mon√©taire international (FMI) classe le pays comme le plus pauvre du monde, en termes de PIB par habitant. Une grande partie du pays ne dispose pas d'infrastructures. Le pays n'a que 300 kilom√®tres de routes pav√©es, sur une superficie de plus de 600 000 kilom√®tres carr√©s. La plupart des r√©gions du pays situ√©es en dehors des centres urbains n'ont ni √©lectricit√© ni eau courante. World's youngest country 2011Gained independence 2013Civil war started 4.3mPeople forced from their homes 12mPeople in the country 82%Of people live on less than $1 a day 65%Of the population unable to read and write Le Soudan du Sud a √©galement l'un des taux d'alphab√©tisation les plus faibles au monde, 34,5 %, selon l'Unesco (2018). L'Unicef, l'organisation des Nations unies pour l'enfance, estime que 70 % (environ 2,2 millions) des enfants ne sont pas scolaris√©s - ce qui met en p√©ril leur avenir et celui de leur pays. Cela repr√©sente l'un des taux les plus √©lev√©s d'enfants non scolaris√©s dans le monde. Au niveau mondial, le Sud-Soudan se classe au quatri√®me rang des indices de d√©veloppement humain les plus bas, malgr√© son √©norme potentiel en ressources naturelles, telles que les terres agricoles fertiles, l'or, les diamants et le p√©trole. En 2019, plus de la moiti√© de la population avait besoin d'une aide humanitaire, avec des niveaux extr√™mes d'ins√©curit√© alimentaire dans tout le pays, selon la Banque mondiale. Le pays d√©pend presque exclusivement des revenus du p√©trole et il y a tr√®s peu d'investissements dans d'autres secteurs comme l'agriculture et les infrastructures. L'accord garantit-il une paix durable ? Il n'y a pas de garanties que cet accord favorisera une paix durable dans le pays. Les accords pr√©c√©dents ont √©t√© largement annonc√©s pour s'effondrer peu de temps apr√®s. Plus de dix accords et cessez-le-feu ont √©t√© conclus depuis 2013. Les deux dirigeant ont affich√© leur incapacit√© √† maintenir un quelconque accord, y compris sur le partage du pouvoir. Peter Adwok Nyaba, un activiste et ancien ministre du Soudan du Sud, d√©clare dans un avis de 2019 que l'accord ne traite pas compl√®tement les √©l√©ments conflictuels du nationalisme ethnique, des luttes de pouvoir et de la faiblesse des institutions de gouvernance, qui, selon lui, restent persistants malgr√© l'accord. ""C'est un cercle vicieux typique : pauvret√©-conflit-paix-absence de d√©veloppement, puis conflit"", dit-il.",L'ancien chef rebelle Riek Machar a pr√™t√© serment ce samedi en tant que premier vice-pr√©sident.,Les deux parties ont sign√© un accord pour mettre fin √† la guerre civile qui s√©vit au Soudan du Sud.


An alternative to passing an in-memory `list[str]` to our pipeline object is to use a generator object that allows us to load samples from our dataset on the fly. This is favourable to the in-memory approach especially in cases when we are not able to allocate the entire dataset in main memory:

In [15]:
%%time
def data(dataset):
    for i in range(len(dataset)):
        yield dataset[i]["text"]
   
# predictions = []
# for out in pipe(data(dataset), max_input_length=max_input_length, max_length=max_length):
#     predictions.append(out[0]["generated_text"])

CPU times: user 25 ¬µs, sys: 3 ¬µs, total: 28 ¬µs
Wall time: 56.3 ¬µs


## Batched inference on the IPU

As mentioned above, by default, a collection of samples provided to pipeline objects are processed serially. This is because the performance characterisation of batching depends on the specific problem being solved, as shown in the ü§ó documentation for [pipeline batching](https://huggingface.co/docs/transformers/main_classes/pipelines#pipeline-batching). In practice, the decision to enable batching on the IPU or any other device should be based on your own experiments.

To enable batching on the IPU, we simply need to use the `batch_size` parameter when passing a collection of samples to our pipeline object. Again, since the models attached to our pipeline object are compiled to process a single sample on the IPU, we redefine the pipeline object below so that recompilation takes the `batch_size` parameter into account.

In [16]:
pipe = pipeline(task="text2text-generation", model=model_checkpoint, ipu_config=ipu_config)
predictions = []
for out in pipe(data(dataset), max_input_length=max_input_length, max_length=max_length, batch_size=2):
    predictions.append(out[0]["generated_text"])

Graph compilation: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚

Below we see that sending 2 samples to the IPU is faster than sending a single sample!

In [17]:
%%time
predictions = []
for out in pipe(data(dataset), max_input_length=max_input_length, max_length=max_length, batch_size=2):
    predictions.append(out[0]["generated_text"])

CPU times: user 1h 1min 12s, sys: 0 ns, total: 1h 1min 12s
Wall time: 39 s


For `mt5-base` inference, batch sizes greater than 2 are unable to fit. To fit larger batch sizes, we can try to change the different maximum length parameters as well as `num_beams`. However, this introduces a trade-off between obtaining good text summaries with device throughput. By using more IPUs and sharding the encoder and decoder layers among them, we can fit larger batch sizes. If you have access to a POD16 machine on Paperspace, try using: `inference_layers_per_ipu=[0, 4, 4, 4, 2, 5, 5, 0]` and  `ipus_per_replica=8` with a new IPU configuration to try batch sizes greater than 2.

## Conclusion

In this notebook, we have demonstrated how to easily run inference workloads for mT5 given a model checkpoint from the Hugging Face Hub on the Graphcore IPU. Apart from specifying IPU configurations, we have shown that the interface to run inference is exactly the same as the default [ü§ó pipelines for inference](https://huggingface.co/docs/transformers/pipeline_tutorial). 

For other examples on how to do X on the IPU, see [resource](somewhere). Have a question? Please contact us on our [Graphcore community channel](https://www.graphcore.ai/join-community)