## Dependences

In [1]:
!pip install --upgrade google-api-python-client
!pip install bitsandbytes>=0.39.0
!pip install git+https://github.com/huggingface/transformers.git
!pip install git+https://github.com/huggingface/accelerate.git
!pip install tiktoken
!pip install torch
!pip install scipy

Collecting google-api-python-client
  Downloading google_api_python_client-2.92.0-py2.py3-none-any.whl (11.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m11.4/11.4 MB[0m [31m47.9 MB/s[0m eta [36m0:00:00[0m00:01[0m0:01[0m
[?25hCollecting httplib2<1.dev0,>=0.15.0 (from google-api-python-client)
  Downloading httplib2-0.22.0-py3-none-any.whl (96 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m96.9/96.9 kB[0m [31m9.6 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting google-auth<3.0.0.dev0,>=1.19.0 (from google-api-python-client)
  Downloading google_auth-2.21.0-py2.py3-none-any.whl (182 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m182.1/182.1 kB[0m [31m17.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting google-auth-httplib2>=0.1.0 (from google-api-python-client)
  Downloading google_auth_httplib2-0.1.0-py2.py3-none-any.whl (9.3 kB)
Collecting google-api-core!=2.0.*,!=2.1.*,!=2.2.*,!=2.3.0,<3.0.0.dev0,>=1.31.5 (from go

In [1]:
!nvidia-smi

Thu Jul 13 13:43:54 2023       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 530.41.03              Driver Version: 530.41.03    CUDA Version: 12.1     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                  Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf            Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|   0  NVIDIA GeForce RTX 3070         Off| 00000000:01:00.0 Off |                  N/A |
|  0%   55C    P8               16W / 220W|     15MiB /  8192MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                    

In [7]:
!free

              total        used        free      shared  buff/cache   available
Mem:      181108932    10473132    73337164     5609268    97298636   163382608
Swap:             0           0           0


## Imports

In [None]:
import os
import torch
import time
import datetime
import sys
import traceback
import gc

from transformers import (
    AutoConfig,
    AutoModelForCausalLM,
    AutoTokenizer,
    BitsAndBytesConfig,
)

## Loading the model

In [2]:
model_name = 'legendhasit/xgen-7b-8k-inst-8bit'

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16,
)

tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map="auto",
    trust_remote_code=True,
    quantization_config=bnb_config
)

Using unk_token, but it is not set yet.
Using unk_token, but it is not set yet.



Welcome to bitsandbytes. For bug reports, please run

python -m bitsandbytes

 and submit this information together with your error trace to: https://github.com/TimDettmers/bitsandbytes/issues
bin /workspace/.miniconda3/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cuda118_nocublaslt.so
CUDA SETUP: CUDA runtime path found: /usr/local/cuda/lib64/libcudart.so.11.0
CUDA SETUP: Highest compute capability among GPUs detected: 7.0
CUDA SETUP: Detected CUDA version 118
CUDA SETUP: Loading binary /workspace/.miniconda3/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cuda118_nocublaslt.so...


  warn(msg)
  warn(msg)
  warn(msg)
  warn(msg)
  warn(msg)
  warn(msg)
  warn(msg)


HBox(children=(HTML(value='Loading checkpoint shards'), FloatProgress(value=0.0, max=2.0), HTML(value='')))




## Inference

In [None]:
# Parameters:
# - DATASET_NAME
# - HEADER
# - PROMPT_TEMPLATE
# - samples in dataset 'input/<dataset_name>'
# - instructions in 'instructions.txt'

def mkdir(folder_path):
    try:
        os.mkdir(folder_path)
    except FileExistsError:
        pass

mkdir('input')
mkdir('intermediate')
mkdir('output')

# Define prompt template
# ==========================================================================================
HEADER = (
    "A chat between a curious human and an artificial intelligence assistant. "
    "The assistant gives helpful, detailed, and polite answers to the human's questions."
)

PROMPT_TEMPLATE = HEADER + """

### Human: {instruction}

{article}

### Assistant:"""

# Load samples from dataset
# ==========================================================================================
DATASET_NAME = 'fredsum'
samples = os.listdir('input/' + DATASET_NAME + '/texts')
n_samples = len(samples)
print('Found', n_samples, 'samples')

# Load instructions
# ==========================================================================================
instruction_file = open('instructions.txt', 'r', encoding='utf-8')
instructions = instruction_file.readlines()
instruction_file.close()
n_instructions = len(instructions)
for i in range(n_instructions):
    instructions[i] = instructions[i].replace('\n', '')
print('Found', n_instructions, 'instructions')

# Inference
# ==========================================================================================
initial_time = time.time()
skipped_samples = 0

print('Starting computation...')

# For each instruction
for instruction_n in range(n_instructions):

    # Read instruction and create prompt
    instruction = instructions[instruction_n]
    
    # For each sample in dataset
    for sample_n in range(n_samples):

        # Estimate completion and time.
        cur_samples = instruction_n * n_samples + sample_n - skipped_samples
        tot_samples = n_instructions * n_samples - skipped_samples
        progress = cur_samples / tot_samples
        pct = round(progress * 100, 1)
        print('Prompting instruction N' + str(instruction_n + 1) + '/' + str(n_instructions) + ' on sample N' + str(sample_n + 1) + '/' + str(n_samples))
        print('-- Completion: ' + str(pct) + '%')
        if cur_samples > 0:
            approx_total = (time.time() - initial_time) / cur_samples * tot_samples
            approx_remaining = approx_total * (1 - progress)
            print('-- Estimated Remaining Time: ' + str(datetime.timedelta(seconds=int(approx_remaining))) + ' (total ' + str(datetime.timedelta(seconds=int(approx_total))) + ')')
        
        # Read sample and generate prompt
        sample_file_path = 'input/' + DATASET_NAME + '/texts/' + samples[sample_n]
        sample_file = open(sample_file_path, 'r', encoding='utf-8')
        sample = sample_file.read()
        sample_file.close()
        prompt = PROMPT_TEMPLATE.format(instruction=instruction, article=sample)
        
        # Find target file
        target_file_path = 'intermediate/' + str(instruction_n + 1) + '_' + str(sample_n + 1) + '.txt'
        if os.path.isfile(target_file_path):
            print('-- Found intermediate result file \'' + target_file_path + '\', skipped.')
            skipped_samples += 1
            continue
            
        try:
        
            # Sample one answer
            input_ids = tokenizer(prompt, return_tensors="pt").to('cuda')
            sample = model.generate(**input_ids, do_sample=True, max_new_tokens=2048, top_k=100, eos_token_id=50256, temperature=0.3)
            output = tokenizer.decode(sample[0]).strip()
        
        except:
            print('Could not compute prompt:')
            print(prompt)
            traceback.print_exc()

        # Save answer in file
        target_file = open(target_file_path, 'w', encoding='utf-8')
        target_file.write(output)
        target_file.close()

        del input_ids
        del sample

        gc.collect()

delta = time.time() - initial_time
print('Done! Took', datetime.timedelta(seconds=int(delta)), 'seconds')

Found 10 samples
Found 6 instructions
Starting computation...
Prompting instruction N1/6 on sample N1/10
-- Completion: 0.0%
Could not compute prompt:
A chat between a curious human and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the human's questions.

### Human: Summarize the following text.

P1 : On va parler de natalité. On va parler sur la natalité et ça rejoint le droit des femmes. Attendez, s'il vous plaît, vous avez ouvert un débat qui était le chapitre suivant. Concernant les femmes. Vous avez notamment cité Franck Riester, hier, le ministre des Relâches avec le Parlement, qui expliquait effectivement que les femmes seront un peu pénalisées avec cette réforme. Mathilde Panot, est-ce que vous considérez. Qu'est-ce que vous dites ce soir, Olivier Véran? Est-ce que vous considérez que la réforme qui est en projet là est une réforme sexiste?
MP : Oui, c'est une réforme qui est anti-femme. Et je crois que quand un ministre lui-

Traceback (most recent call last):
  File "/tmp/ipykernel_594/4090526593.py", line 107, in <module>
    gc.collect()
NameError: name 'gc' is not defined


Could not compute prompt:
A chat between a curious human and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the human's questions.

### Human: Summarize the following text.

P2 : Et d'abord l'image du jour, le président Emmanuel Macron qui est à Kiev aujourd'hui, qui a rencontré Volodymyr Zelensky, on va voir l'image de leur accolade, voilà, Clémentine Autain, est-ce que c'était le bon moment pour y aller?

CA : C'était important en tout cas que le président de la République aille à Kiev affirmer le soutien de la France au peuple ukrainien qui est agressé par Vladimir Poutine. Est-ce que c'était le bon moment? C'est une vraie question, on s'interroge en effet sur ce calendrier à quelques jours du deuxième tour de l'élection législative. Ça a été prévu de longue date, alors est-ce qu'Emmanuel Macron pensait que c'était une simple formalité que ces élections législatives? Ou alors est-ce qu'il souhaite esquiver le débat? On voit bien qu

Traceback (most recent call last):
  File "/tmp/ipykernel_594/4090526593.py", line 107, in <module>
    gc.collect()
NameError: name 'gc' is not defined


Could not compute prompt:
A chat between a curious human and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the human's questions.

### Human: Summarize the following text.

M. CHIRAC : Une simple question, monsieur Mitterrand : vous parlez de l'Europe, avez-vous l'intention de poursuivre la politique de privatisation qui est conforme à ce qu'on fait dans toute l'Europe ou non ?

M. MITTERAND : Non, sûrement pas !

M. CHIRAC : Avez-vous l'intention de renationaliser ?

M. MITTERAND : Non, j'ai déjà dit "non" parce que je pense qu'on ne peut pas faire un remue-ménage permanent.

M. CHIRAC : Pensez-vous qu'il est logique de considérer qu'il n'y a qu'à rien toucher et que c'est cela qui va nous donner le dynamisme ? Eh bien, non, monsieur Mitterrand, non.

M. MITTERAND : Rien toucher à quoi ?

M. CHIRAC : A la situation actuelle.

M. MITTERAND : Que voulez-vous dire par là ?

M. CHIRAC : Les entreprises nationalisées nous ont coûté très,

Traceback (most recent call last):
  File "/tmp/ipykernel_594/4090526593.py", line 107, in <module>
    gc.collect()
NameError: name 'gc' is not defined


Could not compute prompt:
A chat between a curious human and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the human's questions.

### Human: Summarize the following text.

P2 : Alors, justement, juste un mot sur l'otan et l'union européenne. Euh, vous avez évoqué, euh, vladimir poutine. Euh, éric zemmour, est plutôt pour sortir du cadre de l'otan, du, en tous cas, du commandement militaire, intégré, de l'otan. Euh, est-ce que vous, vous considérez que, euh, l’otan est indispensable, et l'union européenne, aujourd'hui, est indispensable dans notre crise ? 

VP : Éric zemmour est un idéologue, il le revendique lui-même. Il considère que, il faut avoir une idéologie, mais son idéologie, euh, l'a conduit à, à se tromper, sur tout. Se tromper, sur vladimir poutine, sa dangerosité, parce que on avait des signes, on a compris, il y avait des signes avant-coureurs de la dérive de vladimir poutine. Tout ce qu’il a dit sur vladimir poutine, l

Traceback (most recent call last):
  File "/tmp/ipykernel_594/4090526593.py", line 107, in <module>
    gc.collect()
NameError: name 'gc' is not defined
This is a friendly reminder - the current text generation call will exceed the model's predefined maximum length (8192). Depending on the model, you may observe exceptions, performance degradation, or nothing at all.


Could not compute prompt:
A chat between a curious human and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the human's questions.

### Human: Summarize the following text.

M. VANNIER : Vous avez parlé de l'éducation, de la formation ; dans les problèmes de société, nous en avons dit un mot tout à l'heure, il faut également parler d'immigration. Il y a aujourd'hui environ 4,5 millions d'étrangers mais vivant en France, la question que nous vous posons est simple : faut-il stopper toute nouvelle immigration ? Croyez-vous qu'il soit souhaitable, peut-être, d'encourager le retour d'un certain nombre de ces travailleurs étrangers vers leur pays d'origine ?

M. MITTERAND : Il faut d'abord distinguer, c'est un problème qui a été vraiment exagéré et compliqué à plaisir. Il y a plusieurs catégories de personnes visées par le débat actuel, il y a d'abord ceux qui ne sont pas des immigrés, qui sont des enfants d'immigrés, qui sont des enfants 

Traceback (most recent call last):
  File "/tmp/ipykernel_594/4090526593.py", line 107, in <module>
    gc.collect()
NameError: name 'gc' is not defined


Could not compute prompt:
A chat between a curious human and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the human's questions.

### Human: Summarize the following text.

P1 : je vous propose de passer au thème suivant qui concerne l'économie et l'emploi. Ce qui nous a frappé quand on regarde vos programmes respectifs, ou ce qui était le programme de François Bayrou, c'est que vous même Ségolène Royal à villepinte, vous avez après avoir parlé à ceux que vous aviez rencontré lors des débats participatifs, vous avez dit je veux vous parler de la dette, le poids de la dette, la question de la dette est une question insupportable, insoutenable. Et vous François Bayrou dans votre programme vous disiez la lutte contre la dette est la priorité des priorités. Après on a le sentiment que vous ne traitiez pas exactement de la même manière, cette chose là. Et vous même François Bayrou l'autre jour dans votre conférence de presse vous avez att

Traceback (most recent call last):
  File "/tmp/ipykernel_594/4090526593.py", line 96, in <module>
    sample = model.generate(**input_ids, do_sample=True, max_new_tokens=2048, top_k=100, eos_token_id=50256, temperature=0.3)
  File "/workspace/.miniconda3/lib/python3.10/site-packages/torch/utils/_contextlib.py", line 115, in decorate_context
    return func(*args, **kwargs)
  File "/workspace/.miniconda3/lib/python3.10/site-packages/transformers/generation/utils.py", line 1588, in generate
    return self.sample(
  File "/workspace/.miniconda3/lib/python3.10/site-packages/transformers/generation/utils.py", line 2642, in sample
    outputs = self(
  File "/workspace/.miniconda3/lib/python3.10/site-packages/torch/nn/modules/module.py", line 1501, in _call_impl
    return forward_call(*args, **kwargs)
  File "/workspace/.miniconda3/lib/python3.10/site-packages/accelerate/hooks.py", line 165, in new_forward
    output = old_forward(*args, **kwargs)
  File "/workspace/.miniconda3/lib/python

In [9]:
del input_ids
del sample
del output

## Calculs de scores

In [None]:
!pip install rouge
!pip install evaluate
!pip install bert-score
!pip install sacrebleu

In [None]:
import evaluate
import numpy as np
from rouge import Rouge
from bert_score import score
from sacrebleu.metrics import BLEU, CHRF, TER

In [None]:
print('Starting scores computation...')
bleu = evaluate.load("bleu")

storage_file = open('output/scores.csv', 'w', encoding='utf-8')

# For each instruction
for instruction_n in range(n_instructions):

    # Read instruction and create prompt
    instruction = instructions[instruction_n]
    
    # For each sample in dataset
    for sample_n in range(n_samples):
        
        # Read sample and generate prompt -> Keep summary 
        summary_file_path = 'input/' + DATASET_NAME + '/summaries/' + samples[sample_n]
        summary_file = open(summary_file_path, 'r', encoding='utf-8')
        summary = summary_file.read()
        summary_file.close()
        
        # Find target file
        compute_hash = hash(instruction + sample)
        target_file_path = 'intermediate/' + str(instruction_hash) + '.txt'
        if not os.path.isfile(target_file_path): # A MODIFIER : SI UN RESUME N'A PAS ETE GENERE
            print('-- Did not Find intermediate result file \'' + target_file_path + '\', skipped.')
            continue

        # Access generated summary
        target_file = open(target_file_path, 'r', encoding='utf-8')
        output = target_file.read()
        target_file.close()

        answers = output.split("### Assistant:") # indice 0 : header + instruction + texte, indices suivants : réponses successives de l'assistant
        answer = ""
        for a in range(1, len(answers)):
            replica_brut = answers[a]
            replica = answerbrut[:-14] # Retirer le token end of text et le \n à la fin.
            answer+=replica

        # Compare summary and answer
        ligne = compute_hash + ";" + compare(summary, answer)
        storage_file.write(ligne + '\n') # REMARQUE SUR LE WRITE ?

print('Done!')


def compare(sum, ans):
    ligne = ""
    result_bleu = bleu.compute(predictions=[ans], references=[[sum]])
    result_rouge = rouge.get_scores(ans, sum)
    P_bert, R_bert, F1_bert = score(ans, sum, lang='en', verbose=True)# Bcp plus d'options possibles
    ligne += result_rouge[0]['rouge-2']['r'] + ";" + result_rouge[0]['rouge-2']['p'] + ";" + result_rouge[0]['rouge-2']['f'] # Stats recall, precision, f de rouge-2
    ligne += ";" + result_rouge[0]['rouge-l']['r'] + ";" + result_rouge[0]['rouge-l']['p'] + ";" + result_rouge[0]['rouge-l']['f'] # Stats recall, precision, f de rouge-l
    ligne += ";" + result_bleu.score # BLEU score
    ligne += ";" + str(R_bert[0].item()) + ";" + str(P_bert[0].item()) + ";" + str(F1_bert[0].item()) # Stats recall, precision, f de BERTScore
    return ligne