Skip to content

There is a problem with hyphenation with tinytex in the German language #5821

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Closed
Martin15135215 opened this issue Jun 5, 2023 · 1 comment
Labels
duplicate This issue or pull request already exists

Comments

@Martin15135215
Copy link

Bug description

When using tinytex to create the PDF, hyphenation is not applied. When I create the PDF with the tex distrubution from Debian, the hyphenation is correct.

Steps to reproduce

Here is my test Markdown file:

---
lang: de-DE
format:
  pdf:
    latex-tinytex: false
    keep-tex: true
---

# TEST

Lange zusammengesetzte Wörter sind ein faszinierendes Phänomen der deutschen Sprache. In kaum einer anderen Sprache gibt es so viele lange und komplizierte Wörter wie im Deutschen. Diese langen Wörter können für Kinder und Grundschüler eine echte Herausforderung darstellen, aber auch Erwachsene haben oft Schwierigkeiten damit. Das liegt vor allem daran, dass die deutsche Sprache eine Reihe von Regeln hat, die es erlauben, Wörter miteinander zu verbinden. So können zum Beispiel Substantive (Nomen) mit anderen Substantiven oder Adjektiven (Eigenschaftswörtern) zu einem langen Wort verbunden werden. Das Resultat sind oft lange und komplizierte Wörter, die manchmal schwer auszusprechen sind und auch für Muttersprachler eine Herausforderung darstellen können. Einige Beispiele für lange zusammengesetzte Wörter: - Donaudampfschifffahrtselektrizitätenhauptbetriebswerkbauunterbeamtengesellschaft - Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz - Bundesausbildungsförderungsgesetz Diese Beispiele zeigen deutlich, wie kompliziert und lang manche deutsche Wörter sein können. Dabei gibt es aber auch zahlreiche lustige lange Wörter, die jedermann zum Lachen bringen können. Wer kennt zum Beispiel nicht das berühmte Wort "Donaudampfschifffahrtskapitänsmütze"? Oder das etwas schwerer auszusprechende "Zuckerhutbefestigungsanlage"? Doch nicht alle lange zusammengesetzten Wörter sind lustig oder einfach zu merken. Es gibt auch zahlreiche komplizierte lange deutsche Wörter, die für Fremdsprachige und selbst Muttersprachler eine echte Herausforderung darstellen können. Hier sind ein paar Beispiele: - Antihumanimmundefizienzvirusserotherapie - Grundstücksverkehrsgenehmigungszuständigkeitsübertragungsverordnung - Röntgenstrahlenphotometrie Diese Wörter zeigen deutlich, dass die deutsche Sprache mitunter extrem kompliziert sein kann. Insbesondere für Ausländer, die Deutsch lernen, können diese langen und schweren Wörter eine echte Hürde darstellen. Aber auch im Schulunterricht können lange zusammengesetzte Nomen (Substantive) zur Herausforderung werden. Manchmal müssen Schülerinnen und Schüler beispielsweise in der Grundschule lange Zusammensetzungen von Nomen bilden oder schwierige Wortgebilde entziffern. Doch keine Angst: Auch wenn die deutsche Sprache manchmal etwas kompliziert erscheint, gibt es zahlreiche Tricks und Tipps, um lange Wortgebilde zu verstehen und auszusprechen. Wer zum Beispiel Schwierigkeiten damit hat, sich lange Zusammensetzungen zu merken, kann versuchen, sie in einzelne Bestandteile aufzuteilen und diese nacheinander zu lernen. Oft helfen auch Eselsbrücken oder kleine Geschichten dabei, sich schwierige Begriffe besser einzuprägen. Für Kinder und Grundschüler sind vor allem kurze und prägnante Wörter einfacher zu verstehen. Lange Wörter können dagegen schnell abschreckend wirken. Doch auch für Erwachsene kann es hilfreich sein, sich mit langen deutschen Wörtern auseinanderzusetzen. Insbesondere im Berufsleben oder im Studium können lange und komplizierte Begriffe wichtig sein. Wer sich also schon immer gefragt hat, was es mit der "Donaudampfschifffahrtselektrizitätenhauptbetriebswerkbauunterbeamtengesellschaft" auf sich hat, sollte sich die Zeit nehmen, diese faszinierende Sprache genauer zu erforschen. Fazit: Lange zusammengesetzte Wörter sind ein faszinierendes Phänomen der deutschen Sprache. Ob lustig oder kompliziert – sie bieten immer wieder neue Herausforderungen und sorgen für Verwunderung und Lachen. Und wer weiß: Vielleicht schafft es ja auch das eine oder andere lange Wort in den nächsten Duden?

If the option latex-tinytex is true, comes the following PDF, with the command quarto render Test.md:

Screenshot_20230605_211815

The command ouput is:

➤ quarto render Test.md
pandoc 
  to: latex
  output-file: Test.tex
  standalone: true
  pdf-engine: xelatex
  variables:
    graphics: true
    tables: true
  default-image-extension: pdf
  
metadata
  documentclass: scrartcl
  classoption:
    - DIV=11
    - numbers=noendperiod
  papersize: letter
  header-includes:
    - '\KOMAoption{captions}{tableheading}'
  block-headings: true
  lang: de-DE
  
running xelatex - 1
  This is XeTeX, Version 3.141592653-2.6-0.999995 (TeX Live 2023) (preloaded format=xelatex)
   restricted \write18 enabled.
  entering extended mode
  
running xelatex - 2
  This is XeTeX, Version 3.141592653-2.6-0.999995 (TeX Live 2023) (preloaded format=xelatex)
   restricted \write18 enabled.
  entering extended mode
  

Output created: Test.pdf

If the option latex-tinytex is false, comes the following PDF, with the command quarto render Test.md:

Screenshot_20230605_212045

It use the tex distrubution of debian

The command ouput is:

➤ quarto render Test.md
pandoc 
  to: latex
  output-file: Test.tex
  standalone: true
  pdf-engine: xelatex
  variables:
    graphics: true
    tables: true
  default-image-extension: pdf
  
metadata
  documentclass: scrartcl
  classoption:
    - DIV=11
    - numbers=noendperiod
  papersize: letter
  header-includes:
    - '\KOMAoption{captions}{tableheading}'
  block-headings: true
  lang: de-DE
  
running xelatex - 1
  This is XeTeX, Version 3.14159265-2.6-0.999992 (TeX Live 2020/Debian) (preloaded format=xelatex)
   restricted \write18 enabled.
  entering extended mode
  
running xelatex - 2
  This is XeTeX, Version 3.14159265-2.6-0.999992 (TeX Live 2020/Debian) (preloaded format=xelatex)
   restricted \write18 enabled.
  entering extended mode
  

Output created: Test.pdf

I also did compare the two tex file that was produced and there where no great differrence:

➤ diff *.tex
163c163
< \ifdefined\Shaded\renewenvironment{Shaded}{\begin{tcolorbox}[enhanced, interior hidden, borderline west={3pt}{0pt}{shadecolor}, frame hidden, boxrule=0pt, sharp corners, breakable]}{\end{tcolorbox}}\fi
---
> \ifdefined\Shaded\renewenvironment{Shaded}{\begin{tcolorbox}[breakable, frame hidden, boxrule=0pt, enhanced, borderline west={3pt}{0pt}{shadecolor}, sharp corners, interior hidden]}{\end{tcolorbox}}\fi

Expected behavior

I expect tinytex to do hyphenation normally as well.

Actual behavior

Currently there is no hyphenation with tinytex, so I use at the moment the debian tex.

Your environment

MX Linux (Debian 11) with Quarto installed with the deb package and tinytex installed with quarto. The debian tex was installed with the system package manager.

Quarto check output

➤ quarto check

[✓] Checking versions of quarto binary dependencies...
      Pandoc version 3.1.1: OK
      Dart Sass version 1.55.0: OK
[✓] Checking versions of quarto dependencies......OK
[✓] Checking Quarto installation......OK
      Version: 1.3.361
      Path: /opt/quarto/bin

[✓] Checking basic markdown render....OK

[✓] Checking Python 3 installation....OK
      Version: 3.9.2
      Path: /usr/bin/python3
      Jupyter: (None)

      Jupyter is not available in this Python installation.
      Install with python3 -m pip install jupyter

[✓] Checking R installation...........(None)

      Unable to locate an installed version of R.
      Install R from https://cloud.r-project.org/
@Martin15135215 Martin15135215 added the bug Something isn't working label Jun 5, 2023
@mcanouil
Copy link
Collaborator

mcanouil commented Jun 5, 2023

See #3844.
For short, it seems to be a LaTeX distribution issue and not really a Quarto/Pandoc one.

I am closing this in favour of the GitHub Discussion thread, but feel free to reopen if you feel it's really a bug in Quarto/Pandoc.

@mcanouil mcanouil added duplicate This issue or pull request already exists and removed bug Something isn't working labels Jun 5, 2023
@mcanouil mcanouil closed this as not planned Won't fix, can't repro, duplicate, stale Jun 5, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
duplicate This issue or pull request already exists
Projects
None yet
Development

No branches or pull requests

2 participants