# 🤖 Load a pretrained GPT and generate text! 🤖


In [None]:
#@title #**DASHBOARD**
#@markdown ---
FOLDER_NAME = "GPTFox" #@param {type:"string"} 
MODEL_NAME = "GeppettoFox_1" #@param {type:"string"}
PRETRAINED = "LorenzoDeMattei/GePpeTto" #@param ["LorenzoDeMattei/GePpeTto"]

####################################
DRIVE_FOLDER = f"/content/gdrive/My Drive/{FOLDER_NAME}/"
DRIVE_OUTPUT_NAME = f"{DRIVE_FOLDER}outputs_{MODEL_NAME}.txt"
DRIVE_ARCHIVE_PATH = DRIVE_FOLDER + MODEL_NAME + ".zip"
LOCAL_MODEL_PATH = f"./{MODEL_NAME}"

#@markdown ---
#@markdown ##Text generation settings
PROMPTS = "Bilancia; Scorpione; Saggittario" #@param {type:"string"}
PROMPTS = PROMPTS.split(";")
SAMPLES_PER_PROMPT = 1 #@param {type:"number"}
MAX_LENGTH = "280 (Twitter max)" #@param ["280 (Twitter max)", 100]
MAX_LENGHT = int(MAX_LENGTH.split(" ")[0])

#@markdown ---
#@markdown ##Export settings
OUTPUT_FILE_NAME = f"{LOCAL_MODEL_PATH}/outputs_{MODEL_NAME}.txt"
SAVE_ON_DRIVE = True #@param {type:"boolean"}


####################################
print(f" SUMMARY:\n{'-'*100}")
print(f" Drive model archive path:        {DRIVE_ARCHIVE_PATH}")
print(f" Local model path:                {LOCAL_MODEL_PATH}")
print(f" Outputs file name (local):       {OUTPUT_FILE_NAME}")
print(f" Outputs file name (drive):       {DRIVE_OUTPUT_NAME.replace('./', '')}")
print(f" sample length                    {MAX_LENGHT}")
print(f" prompts: ")
PROMPTS = [f"{p.strip()}" for p in PROMPTS]
for p in PROMPTS:
  print(f"  > ", p)

 SUMMARY:
----------------------------------------------------------------------------------------------------
 Drive model archive path:        /content/gdrive/My Drive/GPTFox/GeppettoFox_1.zip
 Local model path:                ./GeppettoFox_1
 Outputs file name (local):       ./GeppettoFox_1/outputs_GeppettoFox_1.txt
 Outputs file name (drive):       /content/gdrive/My Drive/GPTFox/outputs_GeppettoFox_1.txt
 sample length                    280
 prompts: 
  >  Bilancia
  >  Scorpione
  >  Saggittario


## Setup

In [None]:
########################################################################
############################ S E T U P #################################
########################################################################
from google.colab import drive
import shutil

if SAVE_ON_DRIVE:
  drive.mount('/content/gdrive')
  print(f" unpacking archive {DRIVE_ARCHIVE_PATH}...")
  shutil.unpack_archive(DRIVE_ARCHIVE_PATH, LOCAL_MODEL_PATH)
  print(f" successfully unpacked in {LOCAL_MODEL_PATH}")


!pip install transformers
!nvidia-smi
from transformers import AutoModelWithLMHead, AutoTokenizer, pipeline

# importing model
model = AutoModelWithLMHead.from_pretrained(LOCAL_MODEL_PATH)
print(f"Model loaded: '{MODEL_NAME}'.")
tokenizer = AutoTokenizer.from_pretrained(PRETRAINED)
print("Tokenizer loaded.")

# clone git repository
import sys
!git clone "https://github.com/RiccardoCozzi96/italian_horoscope_generator"
sys.path.append(GITHUB_REPO_NAME+"/")

# utils function definition
def clean(text):
  a = text[:text.find("]")+1]
  b = text[text.find("]"):]
  c = b[:b.find("[")].replace("]", "")
  c = c.replace("\n", " ").strip()
  return (a[1:-1], c)

def format(sign_body):
  sign, body = sign_body
  return f"[{sign}]\n{body}"

Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).
 unpacking archive /content/gdrive/My Drive/GPTFox/GeppettoFox_1.zip...
 successfully unpacked in ./GeppettoFox_1
Sun Jan 31 17:29:49 2021       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.32.03    Driver Version: 418.67       CUDA Version: 10.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   39C    P8     9W /  70W |      0MiB / 15079MiB |      0%      Default |
|                               |                      |                 ERR! |
+--



Model loaded: 'GeppettoFox_1'.
Tokenizer loaded.


## Text generation

In [None]:
generator = pipeline('text-generation', model=LOCAL_MODEL_PATH, tokenizer=tokenizer, config={'max_length':800})
print("Generator created.")

# generate text
print(f"Generation on prompts {PROMPTS}...", end=" ")
samples_outputs = generator(
    PROMPTS,
    do_sample=True,
    max_length=MAX_LENGHT,
    top_k=50,
    top_p=0.95,
    num_return_sequences=SAMPLES_PER_PROMPT
)
print("completed")


Generator created.
Generation on prompts ['[Bilancia]', '[Scorpione]', '[Saggittario]']... completed


###Organize outputs

In [None]:
# save cleaned texts
outputs = []
for prompt, sample in zip(prompts, samples_outputs):
  text = clean(sample[0]["generated_text"].replace("\n", " "))
  line = f"{prompt} {text[1]}"
  outputs.append(line)

for output in outputs:
  print(output)

[Bilancia] non esiste, questo è la verità, ma l'ultimo anello che ho trovato in questa discussione era che l'oggetto dell'analisi del teorema di Pitagora era un altro.
[Scorpione] Azzurra, 18 anni, Torino (TO). (9 Febbraio 2005) Se fossi stato un'attrice avrei dovuto scrivere un fumetto, ma quando ho visto la sua versione mi sono trovato comunque molto bene. E' stato un grande piacere vederlo. A parte certi piccoli difetti che in questo forum ci sono e ci sono, sono un ottimo punto di partenza per iniziare a realizzare le altre storie. La grafica è molto piacevole e quindi ci sono parecchi punti che non fanno paura, è difficile trovare personaggi che mi fanno sorridere, ma per di sicuro non riuscire a vedere le situazioni ci vuole.  La prima storia del personaggio di Patammina è semplice è piuttosto un personaggio più divertente. Anche nelle sue caratteristiche che mi ha molto di una persona un personaggio, e lo è di grande. Questo è molto simile agli altri personaggi che è il fatto a 

### Export results

In [None]:
# save results in local
with open(OUTPUT_FILE_NAME, "w") as f:
  for output in outputs:
    f.write(output + "\n")
print(f"Results saved locally at \t{OUTPUT_FILE_NAME}")

# save results on drive
if SAVE_ON_DRIVE:
  shutil.copy(OUTPUT_FILE_NAME, DRIVE_OUTPUT_NAME)
  print(f"Results saved on drive at \t{DRIVE_OUTPUT_NAME}")

Results saved locally at 	./GeppettoFox_1/outputs_GeppettoFox_1.txt
Results saved on drive at 	/content/gdrive/My Drive/GPTFox/outputs_GeppettoFox_1.txt


## Done! Enjoy your generated texts 🤖

In [None]:
print("you can find your results at these locations:")
print(" [local]\t"+OUTPUT_FILE_NAME)
if SAVE_ON_DRIVE: 
  print(" [drive]\t"+DRIVE_OUTPUT_NAME)

you can find your results at these locations:
 [local]	./GeppettoFox_1/outputs_GeppettoFox_1.txt
 [drive]	/content/gdrive/My Drive/GPTFox/outputs_GeppettoFox_1.txt


In [None]:
with open(OUTPUT_FILE_NAME) as results:
  print(results.read())

[Bilancia] Ciٍ significa che il risultato e' solo quello, in cui le masse in gioco hanno la meglio. Questo succede in base al ragionamento. Si potrebbe pensare di utilizzare la calcolatrice come strumento per compiere azioni o agire con maggior attenzione ma non si puo' prevedere a priori che la strategia o il risultato di tale azione dipende dalle masse stesse. E' un'analisi, questa, che ci permette di porre un problema. Ci rendiamo conto del fatto che noi dobbiamo essere realistici a partire da questa considerazione. Infatti è necessario che ciascuno dia un contributo fondamentale alla propria idea e di cui vuole farcela. E' fare attenzione quando gli altri. E' cosa vuole farlo, ma non lo fa molto meglio. Che non sta nel momento in maniera giusta. Quando l' opera bene, se stessa, non si sente solo. Anche la stessa. Ora si fa' il risultato. Quando sta male. Se si sente meglio quando non si sente meglio che si capisce di continuare a farlo bene. Riprendono, senza la frase che lo sta ma