In [None]:
import torch
from transformers import PegasusForConditionalGeneration, PegasusTokenizer
model_name = 'tuner007/pegasus_qa'
torch_device = 'cuda' if torch.cuda.is_available() else 'cpu'
tokenizer = PegasusTokenizer.from_pretrained(model_name)
model = PegasusForConditionalGeneration.from_pretrained(model_name).to(torch_device)

def get_answer(question, context):
  input_text = "question: %s text: %s" % (question,context)
  batch = tokenizer.prepare_seq2seq_batch([input_text], truncation=True, padding='longest', return_tensors="pt").to(torch_device)
  translated = model.generate(**batch)
  tgt_text = tokenizer.batch_decode(translated, skip_special_tokens=True)
  return tgt_text[0]


In [3]:
import wikipedia
summary = wikipedia.summary("Volkswagen")
print(get_answer("Who founded Volkswagen",summary))

German Labour Front


In [8]:
from googlesearch import search
query = "Who founded Volkswagen"
search_result_list = search(query, num_results=5)
for i, search_result in enumerate(search_result_list):
  print(search_result)

https://en.wikipedia.org/wiki/Volkswagen
https://www.history.com/this-day-in-history/volkswagen-is-founded
https://www.volkswagenag.com/en/group/history/chronicle/1937_1945.html
https://golden.com/wiki/Volkswagen-DB9NB
https://www.volkswagen-newsroom.com/en/history-3693


In [7]:
from transformers import pipeline

qa = pipeline('question-answering', model='CATIE-AQ/QAmembert', tokenizer='CATIE-AQ/QAmembert')

result = qa({
    'question': "Combien de personnes utilisent le français tous les jours ?",
    'context': "Le français est une langue indo-européenne de la famille des langues romanes dont les locuteurs sont appelés francophones. Elle est parfois surnommée la langue de Molière.  Le français est parlé, en 2023, sur tous les continents par environ 321 millions de personnes : 235 millions l'emploient quotidiennement et 90 millions en sont des locuteurs natifs. En 2018, 80 millions d'élèves et étudiants s'instruisent en français dans le monde. Selon l'Organisation internationale de la francophonie (OIF), il pourrait y avoir 700 millions de francophones sur Terre en 2050."
})

if result['score'] < 0.1:
    print("La réponse n'est pas dans le contexte fourni.")
else :
    print(result['answer'])


Downloading (…)lve/main/config.json: 100%|██████████| 710/710 [00:00<?, ?B/s] 
Downloading pytorch_model.bin: 100%|██████████| 440M/440M [00:33<00:00, 13.3MB/s] 
Downloading (…)okenizer_config.json: 100%|██████████| 522/522 [00:00<?, ?B/s] 
Downloading (…)tencepiece.bpe.model: 100%|██████████| 811k/811k [00:00<00:00, 16.5MB/s]
Downloading (…)/main/tokenizer.json: 100%|██████████| 2.42M/2.42M [00:00<00:00, 10.6MB/s]
Downloading (…)cial_tokens_map.json: 100%|██████████| 354/354 [00:00<?, ?B/s] 


235 millions


In [None]:
text = "Who was Louis 14? </s> Louis 14 was a French King."



    

In [6]:
import torch
torch_device = 'cuda' if torch.cuda._is_compiled else 'cpu'
print(torch_device)

cuda


In [16]:
qa = pipeline("question-answering", model='distilbert-base-cased-distilled-squad', max_anwer_len=100, tokenizer='distilbert-base-cased-distilled-squad')

In [17]:

from transformers import T5Tokenizer, T5ForConditionalGeneration
import wikipedia

text = wikipedia.summary("Volkswagen")
question = "Who founded Volkswagen"
tokenizer = T5Tokenizer.from_pretrained("google/flan-t5-large")
model = T5ForConditionalGeneration.from_pretrained("google/flan-t5-large")

input_text = "answer as full sentence: %s context: %s " % (question, text)
input_ids = tokenizer(input_text, return_tensors="pt").input_ids

answer = model.generate(input_ids, max_length=1000, num_beams=4, early_stopping=True, min_length=50)
print(tokenizer.decode(answer[0]))

<pad> the German Labour Front under the Nazi Party and revived into a global brand post-World War II by the British Army Officer Ivan Hirst, it is known for the iconic Beetle and serves as the flagship brand of the Volkswagen Group</s>
