# Pokročilé elementy - Vytváření PDF dokumentů pomocí story

V tomto notebooku se naučíme vytvářet PDF dokumenty pomocí tzv. **story** - seznamu prvků, které se automaticky řadí do dokumentu.

## Story a její základní prvky

Doposud jsme používali nejjednodušší způsob vytváření PDF - přímé kreslení na stránku (`canvas`). Druhý způsob zahrnuje vytvoření tzv. **story** - seznamu prvků, které se přidávají do dokumentu v požadovaném pořadí. Tento přístup nám umožňuje nesoustředit se na přesné souřadnice a přechody na nové stránky - o to se postará knihovna automaticky.

In [1]:
from reportlab.lib.pagesizes import A4
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, Image
from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle

### Styly

In [2]:
# Načtení základních stylů
styles = getSampleStyleSheet()

In [7]:
styles['Normal']

<ParagraphStyle 'Normal'>

In [3]:
# Podívejme se, jaké styly máme k dispozici
print("Dostupné styly:")
styles.byName

Dostupné styly:


{'Normal': <ParagraphStyle 'Normal'>,
 'BodyText': <ParagraphStyle 'BodyText'>,
 'Italic': <ParagraphStyle 'Italic'>,
 'Heading1': <ParagraphStyle 'Heading1'>,
 'Title': <ParagraphStyle 'Title'>,
 'Heading2': <ParagraphStyle 'Heading2'>,
 'Heading3': <ParagraphStyle 'Heading3'>,
 'Heading4': <ParagraphStyle 'Heading4'>,
 'Heading5': <ParagraphStyle 'Heading5'>,
 'Heading6': <ParagraphStyle 'Heading6'>,
 'Bullet': <ParagraphStyle 'Bullet'>,
 'Definition': <ParagraphStyle 'Definition'>,
 'Code': <ParagraphStyle 'Code'>,
 'UnorderedList': <ListStyle 'UnorderedList'>,
 'OrderedList': <ListStyle 'OrderedList'>}

### Odsek

In [4]:
Paragraph('nejaky text')

Paragraph(
'caseSensitive': 1
'encoding': 'utf8'
'text': 'nejaky text'
'frags': [ParaFrag(__tag__='para', bold=0, fontName='Helvetica', fontSize=10, greek=0, italic=0, link=[], rise=0, text='nejaky text', textColor=Color(0,0,0,1), us_lines=[])]
'style': <ParagraphStyle 'paragraphImplicitDefaultStyle'>
'bulletText': None
'debug': 0
) #Paragraph

In [5]:
Paragraph('Lorem ipsum 1....', 
          styles["Title"])

Paragraph(
'caseSensitive': 1
'encoding': 'utf8'
'text': 'Lorem ipsum 1....'
'frags': [ParaFrag(__tag__='para', bold=1, fontName='Helvetica-Bold', fontSize=18, greek=0, italic=0, link=[], rise=0, text='Lorem ipsum 1....', textColor=Color(0,0,0,1), us_lines=[])]
'style': <ParagraphStyle 'Title'>
'bulletText': None
'debug': 0
) #Paragraph

In [8]:
ptext = 'Toto je normálny text, <font color="blue" size="14">toto je modrý a väčší text</font> a tu opäť pokračuje normálny.'
Paragraph(ptext, styles["Normal"])

Paragraph(
'caseSensitive': 1
'encoding': 'utf8'
'text': 'Toto je normálny text, <font color="blue" size="14">toto je modrý a väčší text</font> a tu opäť pokračuje normálny.'
'frags': [ParaFrag(__tag__='para', bold=0, fontName='Helvetica', fontSize=10, greek=0, italic=0, link=[], rise=0, text='Toto je normálny text, ', textColor=Color(0,0,0,1), us_lines=[]), ParaFrag(__tag__='font', bold=0, fontName='Helvetica', fontSize=14, greek=0, italic=0, link=[], rise=0, text='toto je modrý a väčší text', textColor=Color(0,0,1,1), us_lines=[]), ParaFrag(__tag__='para', bold=0, fontName='Helvetica', fontSize=10, greek=0, italic=0, link=[], rise=0, text=' a tu opäť pokračuje normálny.', textColor=Color(0,0,0,1), us_lines=[])]
'style': <ParagraphStyle 'Normal'>
'bulletText': None
'debug': 0
) #Paragraph

### Spacer

In [9]:
Spacer(1, 12)
# šírka, výška, 12 = cca 1 řádek

Spacer(1, 12)

## Vytvoření jednoduché story

In [10]:
# Inicializace prázdného seznamu pro prvky dokumentu
story = []

### Přidání textu s různými styly

In [11]:
story.append(Paragraph('<font color = "blue"> Lorem ipsum 1....</font>', 
                       styles["Title"]))

In [13]:
len(story)

1

In [14]:
story.append(Spacer(1, 12))

In [15]:
ptext = 'Lorem ipsum 2....'
story.append(Paragraph(ptext, styles["Normal"]))

In [16]:
story.append(Spacer(1, 12))

In [17]:
ptext = 'Lorem ipsum 3....'
story.append(Paragraph(ptext, styles["Italic"]))

story.append(Spacer(1, 12))

In [18]:
ptext = 'Lorem ipsum 4....'
story.append(Paragraph(ptext, styles["Definition"]))

story.append(Spacer(1, 12))

In [19]:
ptext = 'Lorem ipsum 5....'
story.append(Paragraph(ptext, styles["Code"]))

story.append(Spacer(1, 12))

In [20]:
ptext = 'Toto je normálny text, <font color="blue" size="14">toto je modrý a väčší text</font> a tu opäť pokračuje normálny.'
story.append(Paragraph(ptext, styles["Normal"]))

In [None]:
# zobraz story, prozkoumej prvky story, kolik jich je?

In [21]:
len(story)

11

In [22]:
story[4]

Paragraph(
'caseSensitive': 1
'encoding': 'utf8'
'text': 'Lorem ipsum 3....'
'frags': [ParaFrag(__tag__='para', bold=0, fontName='Helvetica-Oblique', fontSize=10, greek=0, italic=1, link=[], rise=0, text='Lorem ipsum 3....', textColor=Color(0,0,0,1), us_lines=[])]
'style': <ParagraphStyle 'Italic'>
'bulletText': None
'debug': 0
) #Paragraph

## Vytvoření dokumentu - `SimpleDocTemplate`

Třída **`SimpleDocTemplate`** vytváří instanci dokumentu.

**Parametry:**
- `filename` - cesta k výstupnímu PDF souboru
- `pagesize` - velikost stránky (A4, letter, A2...)
- `leftMargin, rightMargin, topMargin, bottomMargin` - velikosti okrajů
- `title` - titulek dokumentu

In [23]:
# Vytvoření dokumentu s nastavením okrajů
doc = SimpleDocTemplate("story_example.pdf",
                        pagesize=A4,
                        rightMargin=72,
                        leftMargin=72,
                        topMargin=72,
                        bottomMargin=18)

In [24]:
# Sestavení dokumentu
doc.build(story)

In [25]:
# Ukázka vytvoření dokumentu s různými parametry
from reportlab.lib.pagesizes import A4, letter, A3

# zkuste v předchozím dokumentu zmenit pagesize na letter, nebo pridat parametr title

doc_a4 = SimpleDocTemplate("doc_a4.pdf", pagesize=A4)
doc_letter = SimpleDocTemplate("doc_letter.pdf", pagesize=letter)
doc_custom = SimpleDocTemplate("doc_custom.pdf", 
                               pagesize=A4,
                               leftMargin=50,
                               rightMargin=50,
                               topMargin=100,
                               bottomMargin=30,
                               title="Můj dokument")

In [26]:
# Rozměry stránek
print(f"A4: {A4}")
print(f"Letter: {letter}")
print(f"A3: {A3}")

A4: (595.2755905511812, 841.8897637795277)
Letter: (612.0, 792.0)
A3: (841.8897637795277, 1190.5511811023623)


---
### Otázka 1
Co znamená hodnota `72` pro `rightMargin` v příkladu výše? (Nápověda: jednotky v reportlab)

## Všechny prvky story

Seznam prvků, které můžeme přidat do PDF dokumentu:

- **Paragraph** - nejdůležitější prvek, obsahuje jeden odstavec textu
- **Image** - obrázek
- **Spacer** - volný prostor mezi prvky
- **Table** - tabulka (bude probíráno samostatně)
- **PageBreak** - přechod na novou stránku

### Paragraph - odstavec

Třída `Paragraph` umožňuje umístit jeden odstavec textu. Lze ho stylovat dvěma způsoby:
1. Pomocí XML tagů v textu
2. Pomocí stylu `ParagraphStyle`

In [27]:
# Základní syntaxe Paragraph
# Paragraph(text, style, bulletText=None)

styles = getSampleStyleSheet()
p = Paragraph("Toto je ukázkový odstavec.", styles["Normal"])

In [28]:
p

Paragraph(
'caseSensitive': 1
'encoding': 'utf8'
'text': 'Toto je ukázkový odstavec.'
'frags': [ParaFrag(__tag__='para', bold=0, fontName='Helvetica', fontSize=10, greek=0, italic=0, link=[], rise=0, text='Toto je ukázkový odstavec.', textColor=Color(0,0,0,1), us_lines=[])]
'style': <ParagraphStyle 'Normal'>
'bulletText': None
'debug': 0
) #Paragraph

#### Úprava textu v odstavci pomocí XML tagů

Pomocí XML tagů můžeme ovlivnit vzhled textu:

- `<para>...</para>` - stylování celého odstavce
- `<font>...</font>` - změna písma pro část textu
- `<b>...</b>` - tučný text
- `<i>...</i>` - kurzíva
- `<u>...</u>` - podtržení
- `<super>...</super>` a `<sub>...</sub>` - horní a dolní index

#### `<para>...</para>`

Tag `<para>` musí obklopit celý text odstavce. Pomocí jeho atributů nastavujeme styl celému odstavci.

In [29]:
doc = SimpleDocTemplate("para_tag_example.pdf", pagesize=A4,
                        rightMargin=72, leftMargin=72,
                        topMargin=72, bottomMargin=18)

In [30]:
story = []

In [31]:
# Text s tagem <para> - nastavení okrajů, barvy pozadí a zarovnání
ptext = '<para borderWidth="1" backColor="yellow" borderColor="black" alignment="right">Lorem ipsum dolor sit amet...</para>'

story.append(Paragraph(ptext))

In [32]:
doc.build(story)

#### `<font>...</font>`

Tag `<font>` nastavuje styl pro text, který obsahuje - písmo, barvu, velikost.

In [34]:
doc = SimpleDocTemplate("font_tag_example.pdf", pagesize=A4,
                        rightMargin=72, leftMargin=72,
                        topMargin=72, bottomMargin=18)

In [35]:
story = []

In [36]:
# Kombinace <para> a <font>
ptext = '<para borderWidth="1">Lorem ipsum dolor sit amet, <font face="times" color="red" size="16">consectetur adipiscing elit</font>, sed do eiusmod tempor.</para>'

story.append(Paragraph(ptext))

In [37]:
doc.build(story)

#### Ostatní tagy - b, i, u, super, sub

In [38]:
doc = SimpleDocTemplate("other_tags_example.pdf", pagesize=A4,
                        rightMargin=72, leftMargin=72,
                        topMargin=72, bottomMargin=18)

In [39]:
story = []

In [40]:
# Ukázka různých tagů
ptext = '<u>Podtržený text</u>, <b>tučný text</b>, <i>kurzíva</i>'
story.append(Paragraph(ptext))

story.append(Spacer(1, 12))

# Horní a dolní index
ptext = 'H<sub>2</sub>O je vzorec vody, E=mc<super>2</super> je slavná rovnice.'
story.append(Paragraph(ptext))

In [41]:
doc.build(story)

---
#### Úloha 1 - Oprav chyby
V následujícím kódu jsou chyby. Opravte je.

In [44]:
# Opravte chyby v tomto kódu:
doc = SimpleDocTemplate("oprava1.pdf", pagesize=A4)
story = []

ptext = '<b>Tučný text</b>'  # Chyba: neodpovídající tagy
story.append(Paragraph(ptext))

ptext = '<font size="14">Text s velikostí</font>'  # Chyba: chybějící uvozovky u atributu
story.append(Paragraph(ptext))

doc.build(story)

#### Stylování celého odstavce - ParagraphStyle

Celý odstavec lze stylovat pomocí třídy `ParagraphStyle`. Knihovna poskytuje základní styly pomocí `getSampleStyleSheet()`:

- `Normal` - normální, základní text
- `Italic` - kurzíva
- `Heading1` až `Heading6` - různé styly nadpisů
- `Title` - styl pro titulek dokumentu

In [45]:
doc = SimpleDocTemplate("styles_example.pdf", pagesize=A4,
                        rightMargin=72, leftMargin=72,
                        topMargin=72, bottomMargin=18)
styles = getSampleStyleSheet()
story = []

# Použití různých stylů
story.append(Paragraph("Toto je Title", styles["Title"]))
story.append(Spacer(1, 12))
story.append(Paragraph("Toto je Heading1", styles["Heading1"]))
story.append(Spacer(1, 12))
story.append(Paragraph("Toto je Normal text.", styles["Normal"]))
story.append(Spacer(1, 12))
story.append(Paragraph("Toto je Italic text.", styles["Italic"]))

doc.build(story)
print("Soubor styles_example.pdf byl vytvořen.")

Soubor styles_example.pdf byl vytvořen.


#### Vytvoření vlastního stylu

### Image - obrázek

Třída `Image` přidává obrázek do dokumentu.

**Parametry:**
- `filename` - cesta nebo URL k obrázku
- `width` - šířka v pixelech (volitelné)
- `height` - výška v pixelech (volitelné)

Pokud `width` a `height` neurčíme, obrázek si zachová původní rozměry.

In [46]:
# Poznámka: Pro tento příklad potřebujeme lokální obrázek
# Vytvoříme jednoduchý testovací obrázek
from PIL import Image as PILImage

# Vytvoření jednoduchého testovacího obrázku
img = PILImage.new('RGB', (200, 100), color='blue')
img.save('test_image.png')

In [47]:
from reportlab.platypus import Image

doc = SimpleDocTemplate("image_example.pdf", pagesize=A4,
                        rightMargin=72, leftMargin=72,
                        topMargin=72, bottomMargin=18)
story = []

In [48]:
# Přidání obrázku s původní velikostí
im = Image('test_image.png')
story.append(im)
story.append(Spacer(1, 20))


In [49]:
im

<reportlab.platypus.flowables.Image at 0x271ffde9a90>

In [50]:
# Přidání obrázku se změněnou velikostí
im_resized = Image('test_image.png', 100, 50)
story.append(im_resized)

In [51]:
doc.build(story)

### Spacer - mezera

Třída `Spacer` přidává volný prostor mezi prvky.

**Parametry:**
- `width` - šířka mezery v pixelech
- `height` - výška mezery v pixelech

In [52]:
doc = SimpleDocTemplate("spacer_example.pdf", pagesize=A4,
                        rightMargin=72, leftMargin=72,
                        topMargin=72, bottomMargin=18)
story = []

In [53]:
ptext = 'První odstavec textu.'
story.append(Paragraph(ptext, styles["Normal"]))

# Velká mezera
space = Spacer(1, 100)
story.append(space)

ptext = 'Druhý odstavec textu - po velké mezeře.'
story.append(Paragraph(ptext, styles["Normal"]))


In [54]:
doc.build(story)

### PageBreak - zalomení stránky

Třída `PageBreak` přechází na novou stránku.

In [55]:
from reportlab.platypus import PageBreak

doc = SimpleDocTemplate("pagebreak_example.pdf", pagesize=A4,
                        rightMargin=72, leftMargin=72,
                        topMargin=72, bottomMargin=18)
story = []

In [56]:
# Stránka 1
story.append(Paragraph("Obsah na první stránce", styles["Title"]))
story.append(Paragraph("Nějaký text na první stránce.", styles["Normal"]))

In [57]:
# Přechod na novou stránku
story.append(PageBreak())

In [58]:
# Stránka 2
story.append(Paragraph("Obsah na druhé stránce", styles["Title"]))
story.append(Paragraph("Nějaký text na druhé stránce.", styles["Normal"]))

In [59]:
doc.build(story)

---
### Úloha 2 - Doplň kód
Doplňte chybějící části kódu pro vytvoření dokumentu se dvěma stránkami.

In [61]:
# Doplňte chybějící části kódu (nahraďte ___)

from reportlab.lib.pagesizes import A4
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, PageBreak
from reportlab.lib.styles import getSampleStyleSheet

doc = SimpleDocTemplate("uloha2.pdf", pagesize=A4)
styles = getSampleStyleSheet()
story = []

# Stránka 1: Nadpis a text
story.append(Paragraph("Stránka 1", styles['Title']))
story.append(Spacer(100,12))
story.append(Paragraph("Text na první stránce.", styles['Normal']))

# Přechod na stránku 2
story.append(PageBreak())

# Stránka 2: Nadpis a text
story.append(Paragraph("Stránka 2", styles['Title']))
story.append(Paragraph("Text na druhé stránce.", styles['Normal']))

doc.build(story)

---

## Praktické úlohy

### Úloha 3 - PDF se známkami studentů

V souboru **marks.csv** najdete data několika studentů: Jméno, Příjmení, Vyznamenání, Rok narození a seznam známek.

Vytvořte **jeden** soubor `data.pdf`, kde každý student bude prezentován na samostatné stránce:

```
[Student/Vynikající student - vyberte podle sloupce "Honors"] Jméno Příjmení - nadpis.
Rok narození - normální text

Známky: - menší nadpis
Language Arts - 6
Second Language English - 5
...
```

RESENI

In [1]:
import pandas as pd
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, PageBreak
from reportlab.lib.styles import getSampleStyleSheet
from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle

In [2]:
def elements_for_students(df, s):
    """
    parameters: df = daframe, s = radek v dataframu, ktery reprezentuje studenta
    return: list objektu do story
    """
    styles = getSampleStyleSheet()
    sstory = [] # sstory = story jenom pro jednoho studenta
    
    # Title
    if (df.loc[s,'Honors'] == 'Y'):
        title = 'Honoured student '
    else:
        title = 'Student '
    title = title + df.loc[s, 'Surname'] + ' ' + df.loc[s, 'Name']
    
    sstory.append(Paragraph(title, styles['Title'])) 
    sstory.append(Spacer(1, 12))

    # Birth
    birth = 'Birth year: ' + str(df.loc[s,'Birth Year'])
    
    sstory.append(Paragraph(birth, styles['Normal']))
    sstory.append(Spacer(1, 12))

    # Marks
    sstory.append(Paragraph('Marks:', styles['Heading2']))
    sstory.append(Spacer(1, 12))
    
    for subj in df.columns[4:]:
        sstory.append(Paragraph(f'<font color ="blue">{subj}</font> - {df.loc[s, subj]}'))
        
    return sstory

In [3]:
def spracuj(csv, pdf):
    """
    pro zadané csv vytvorí pdf
    
    """
  
    df = pd.read_csv(csv)

    # inicializace pdf
    doc = SimpleDocTemplate(pdf)
    story = []

    for row in range(len(df)):
        story_1_student = elements_for_students(df, row)
        story.extend(story_1_student)
        story.append(PageBreak())
    
    # ulozeni pdf
    doc.build(story)    

In [4]:
spracuj('Data/marks.csv', 'data.pdf')

### Úloha 4 - Protokol o předání vybavení

Napište skript, který vygeneruje jednoduchý dokument - protokol o předání vybavení zaměstnanci. Aktuální datum získejte automaticky, ostatní informace včetně IČO firmy (NIP), registračního čísla (REGON) a rodného čísla zaměstnance (PESEL) z níže definovaných proměnných. Jednotlivé prvky nastylujte podle vlastního uvážení. Uložte dokument jako `protocol.pdf`.

Vzor dokumentu:
```
                                MĚSTO, DATUM
            Dohoda o svěření pracovního vybavení

Zaměstnavatel:
NÁZEV SPOLEČNOSTI
ADRESA SPOLEČNOSTI
IČO: ...
DIČ: ...

Zaměstnanec:
JMÉNO A PŘÍJMENÍ
Rodné číslo: ...

Dne DATUM bylo předáno následující vybavení:
- POLOŽKA 1
- POLOŽKA 2
- POLOŽKA 3



................................
Datum a podpis zaměstnavatele





................................
Datum a podpis zaměstnance
```

In [None]:
# Vstupní data
CITY = 'Praha'
COMPANY_NAME = 'Ukázková společnost s.r.o.'
COMPANY_ADDRESS = 'Ulice 123, 110 00 Praha'
COMPANY_NIP = '12345678'
COMPANY_REGON = '87654321'

EMPLOYEE_NAME = 'Jan Novák'
EMPLOYEE_PESEL = '890515/1234'

HARDWARE = ['Notebook XYZ ABC, sériové číslo: RTY7890', 'Klávesnice', 'Myš']

In [None]:
# Vaše řešení zde:
from datetime import datetime
from reportlab.lib.pagesizes import A4
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer
from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle

# Získání aktuálního data
current_date = datetime.now().strftime("%d.%m.%Y")

# Zde pokračujte...


### Úloha 5 - Hromadné generování protokolů

Upravte skript z předchozí úlohy tak, aby generoval více PDF souborů na základě dat ze souboru `equipment.csv`. Nové soubory pojmenujte `protocol-1.pdf`, `protocol-2.pdf` atd.

In [None]:
# Vaše řešení zde:
import pandas as pd

# Načtení dat
df = pd.read_csv('equipment.csv')

# Zde pokračujte...


---

## Přehled použitých funkcí a metod

| Funkce/Třída | Použití |
|--------------|--------|
| `SimpleDocTemplate()` | Vytvoření šablony PDF dokumentu s nastavením velikosti stránky a okrajů |
| `Paragraph()` | Vytvoření odstavce textu se stylem |
| `Spacer()` | Vytvoření mezery mezi prvky |
| `Image()` | Vložení obrázku do dokumentu |
| `PageBreak()` | Přechod na novou stránku |
| `getSampleStyleSheet()` | Získání předdefinovaných stylů (Normal, Title, Heading1-6, Italic...) |
| `ParagraphStyle()` | Vytvoření vlastního stylu pro odstavce |
| `doc.build(story)` | Sestavení a uložení PDF dokumentu ze seznamu prvků |
| `story.append()` | Přidání prvku do seznamu story |

**XML tagy pro formátování textu v Paragraph:**

| Tag | Použití |
|-----|--------|
| `<para>` | Stylování celého odstavce (borderWidth, backColor, alignment...) |
| `<font>` | Změna písma, barvy, velikosti pro část textu |
| `<b>` | Tučný text |
| `<i>` | Kurzíva |
| `<u>` | Podtržený text |
| `<super>` | Horní index |
| `<sub>` | Dolní index |