# Building a text generation pipeline

## Building a text generation pipeline

In [12]:
from transformers import pipeline 

gpt2_pipeline = pipeline(task="text-generation", model="openai-community/gpt2")

# Generate three text outputs with a maximum length of 10 tokens
results = gpt2_pipeline("What if AI", max_new_tokens=10, num_return_sequences=2)

for result in results:
    print(result['generated_text'])

Device set to use cpu
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


What if AI could make all the decisions, and then try to
What if AI had gone out of its way to help us all


## Inference providers

In [13]:
import os 
from huggingface_hub import InferenceClient

client = InferenceClient(
  provider="together",
  api_key=os.environ["HUGGING_FACE_TOKEN"], 
) 

completion = client.chat.completions.create(
  model="deepseek-ai/DeepSeek-V3",
  messages=[
    {
      "role": "user",
      "content": "What is the capital of France?"
    }
  ],
)

print(completion.choices[0].message)

ChatCompletionOutputMessage(role='assistant', content='The capital of France is **Paris**.  \n\nParis is known for its iconic landmarks such as the **Eiffel Tower**, **Louvre Museum**, and **Notre-Dame Cathedral**. It is also a major global hub for art, fashion, and culture.  \n\nWould you like more details about Paris or France? 😊', reasoning=None, tool_call_id=None, tool_calls=[])


# Hugging Face Datasets

## Loading datasets

In [14]:
from datasets import load_dataset

data = load_dataset("IVN-RIN/BioBERT_Italian", split="train")  # Filter for pattern " bella " 
filtered = data.filter(lambda row: " bella " in row['text']) 
print(filtered) 

Resolving data files:   0%|          | 0/55 [00:00<?, ?it/s]

Resolving data files:   0%|          | 0/55 [00:00<?, ?it/s]

Loading dataset shards:   0%|          | 0/55 [00:00<?, ?it/s]

Dataset({
    features: ['text'],
    num_rows: 1122
})


## Manipulating datasets

In [15]:
# Select the first two rows
sliced = filtered.select(range(2))
print(sliced)

# Extract the 'text' for the first row 
print(sliced[0]['text']) 

Dataset({
    features: ['text'],
    num_rows: 2
})
Peptidi mirati reiterati sulla superficie delle nanoparticelle promuovono in modo significativo la consegna mirata del gene del fattore di crescita endoteliale vascolare alle cellule staminali.I vettori di consegna genica non virale sono molto promettenti per il gene terapia a causa dei problemi di sicurezza con i vettori virali. Tuttavia, l'applicazione di vettori non virali è ostacolata dalla loro bassa efficienza di trasfezione. Qui, per affrontare questa sfida, abbiamo sviluppato un vettore non virale che integra lipidi, sistema di trasposoni della bella addormentata e 8-mer peptidi mirati alle cellule staminali per una consegna genica sicura ed efficiente alle cellule staminali mesenchimali (MSC) difficili da trasfettare. I peptidi mirati alle MSC 8-mer, quando reiterati sinteticamente in tre pieghe e presentati chimicamente sulla superficie, hanno promosso in modo significativo il lipide risultante nanoparticelle basate su nano