# Markdown/Notebook naar PDF: integratie van terminal en Pandoc in JupyterLab

In dit bewijsstuk laat ik zien dat ik oefen met mijn nieuwe werkomgeving (JupyterLab) door mijn bewijsstukkken niet standaard in Word, maar in een Jupyter Notebook te schrijven. Omdat `.ipynb`-bestanden niet rechtstreeks kunnen worden ingeleverd in Portflow, ben ik gaan onderzoeken hoe ik deze kan omzetten naar een geschikt bestandsformaat zoals `.pdf`.

In Rstudio kon ik eenvoudig exporteren naar PDF, maar binnen JupyterLab bleek dit niet zo te zijn. Ik heb daarom zelf uitgezocht hoe dit conversieproces werkt, welke tools hiervoor nodig zijn, en hoe ik de tegengekomen problemen heb opgelost. 

Hiermee toon ik aan dat ik nieuwe kennis en vaardigheden heb toegepast in mijn werkomgeving (criterium 2) en dat ik zelfstandig verantwoordelijkheid neem voor mijn leerproces door actief oplossingen te zoeken en mijn werkomgeving beter te leren kennen (criterium 11). 

In derest van dit document beschrijf ik mijn aanpak, de installatie en integratie van Pandoc in Jupyter, de tests die ik heb uitgevoerd en de resultaten van deze werkwijze.

### Installatie en conversie
Ik heb twee verschillende methoden gevonden om Jupyter Notebooks naar PDF te converteren:

1. Pandoc - een commandline tool waarmee je verschillende bestandsformaten kunt omzetten.
2. Jupyter nbconvert - een ingebouwde Jupyter-functie die gebruikmaakt van LaTeX om PDF-bestanden te genereren

Na testen bleek `nbconvert` beter geschikt omdat dit ook codecellen en de bijbehorende uitvoer netjes mee neemt in het PDF-bestand. Via `pandoc` zie je uiteindelijk alleen de markdowncellen terug. 

### Controle installatie en eerste test met Pandoc

In [None]:
# controleer huidige directory (zorg er voor dat je in de map zit waar het bestand te vinden is dat je wilt converteren)
pwd

# controleer of Pandoc is geinstalleerd
pandoc --version

# converteer notebook naar PDF
pandoc -o converting_format.pdf converting_format.ipynb 

Het PDF-bestand werd succesvol aangemaakt, maar ik merkte dat de codecellen niet zichtbaar waren in het eindresultaat. Ook zag de opmaak er niet optimaal uit. Pandoc blijkt vooral bedoeld te zijn voor Markdown (.md) en niet voor de notebook structuur. 

### PDF export via Jupyter nbconvert

Tijdens het omzetten van het notebook naar PDF met `nbconvert` kwamen verschillende LaTeX-fouten voor. Eerst probeerde ik losse LaTeX-pakkette te installeren met behulp van chatGPT, maar er ontstonden fouten zoals:

- `! LaTex Error: File 'eurosym.sty' not found.`

- nog andere ontbrekende pakketten die nodig zijn voor notatie van tekens (bijvoorbeeld "€") en opmaak

Uiteindelijk kreeg ik het advies van ChatGPT om een volledige LaTeX-distributie te installeren (TinyTeX volledig), waardoor alle benodigde pakketten automatisch beschikbaar kwamen. Het is nu gelukt om een notebook om te zetten naar een pdf-bestand met het volgende commando:

In [None]:
### converteren met nbconvert
jupyter nbconvert --to pdf converting_format.ipynb

Het viel me direct op dat ook de opmaak veel beter is. De codecellen worden netjes weergegeven, er zijn geen grote lege ruimtes aan de zijkanten meer, en de inhoud wordt goed verdeeld over meerdere pagin's, wat het geheel overzichtelijker maakt.

De LaTeX-library die gebruikt wordt door `nbconvert` biedt ook veel mogelijkheden om de layout van het bestaande notebook aan te passen. Dit was eigenlijk het volgende punt waar ik naar wilde kijken. Denk bijvoorbeeld aan lettertype, grootte en kleur van tekst en code, maar ook aan stijlen voor tabellen, figuren en speciale elementen zoals formules.
