   # TPC3: Conversor de MarkDown para HTML

In [131]:
import re

def markdownToHTML(text):
    # Converter cabeçalhos
    text = re.sub(r'^###\s*(.*)$', r'<h3>\1</h3>', text, flags=re.MULTILINE)
    text = re.sub(r'^##\s*(.*)$', r'<h2>\1</h2>', text, flags=re.MULTILINE)
    text = re.sub(r'^#\s*(.*)$', r'<h1>\1</h1>', text, flags=re.MULTILINE)

    # Converter bold
    text = re.sub(r'\*\*(.*?)\*\*', r'<b>\1</b>', text, flags=re.MULTILINE)

    # Converter italic
    text = re.sub(r'\*(.*?)\*', r'<i>\1</i>', text, flags=re.MULTILINE)

    # Converter listas
    def lis(match):
        shunk = match.group(0)
        elems = re.sub(r'^\d+\.\s*(.*)$', r'<li>\1</li>', shunk, flags=re.MULTILINE)
        return f'<ol>\n{elems}\n</ol>'
    
    text = re.sub(r'(^\d+\..*(?:\n\d+\..*)*)', lis, text, flags=re.MULTILINE)
    
    # Conveter imagem
    text = re.sub(r'!\[(.*?)\]\((.*?)\)',r'<img href="\2">\1</img>', text, flags=re.MULTILINE)

    # Conveter link
    text = re.sub(r'\[(.*?)\]\((.*?)\)',r'<a href="\2">\1</a>', text, flags=re.MULTILINE)
    
    return text




## Testes

In [132]:
teste1 = """# Título Principal

## Subtítulo de Nível 2

### Subtítulo de Nível 3

Este é um parágrafo com **texto em negrito** e também com *itálico*.  
Podemos combinar: **texto com *ênfase* interna**.  

Aqui temos um link: [página da UC](http://www.uc.pt)

E também uma imagem logo abaixo:

![coelho fofinho](http://www.coelho.com/imagem.jpg)

Agora, um exemplo de lista numerada:

1. Primeiro item
2. Segundo item
3. Terceiro item com **negrito** e *itálico*
4. Quarto item com [link](http://example.com)

Texto final fora da lista, com uma imagem inline:  
Como se vê em ![miniatura](http://img.com/thumb.png), tudo funciona.

"""

print(markdownToHTML(teste1))

<h1>Título Principal</h1>

<h2>Subtítulo de Nível 2</h2>

<h3>Subtítulo de Nível 3</h3>

Este é um parágrafo com <b>texto em negrito</b> e também com <i>itálico</i>.  
Podemos combinar: <b>texto com <i>ênfase</i> interna</b>.  

Aqui temos um link: <a href="http://www.uc.pt">página da UC</a>

E também uma imagem logo abaixo:

<img href="http://www.coelho.com/imagem.jpg">coelho fofinho</img>

Agora, um exemplo de lista numerada:

<ol>
<li>Primeiro item</li>
<li>Segundo item</li>
<li>Terceiro item com <b>negrito</b> e <i>itálico</i></li>
<li>Quarto item com <a href="http://example.com">link</a></li>
</ol>

Texto final fora da lista, com uma imagem inline:  
Como se vê em <img href="http://img.com/thumb.png">miniatura</img>, tudo funciona.




In [135]:
teste2 = """
# Guia Completo de Markdown

Markdown é uma linguagem de marcação **simples** que permite escrever texto estruturado de forma *clara* e *legível*.  
É amplamente usada para documentação, blogs, wikis e notas pessoais.

## Estrutura de Cabeçalhos

### Cabeçalhos de nível 3
Você pode criar cabeçalhos de diferentes níveis:

# Nível 1
## Nível 2
### Nível 3

## Texto com Formatação

Você pode usar **negrito**, *itálico* ou combinar **negrito e *itálico*** na mesma frase.  
Também é possível ter múltiplas ocorrências de formatação em uma linha: **exemplo 1**, *exemplo 2*, **exemplo 3 com *itálico***.

## Links e Imagens

Confira os seguintes links:  
1. [OpenAI](https://www.openai.com)  
1. [Python](https://www.python.org)  

E algumas imagens:

![Logo Python](https://www.python.org/static/img/python-logo.png)  
![Coelho fofo](http://www.coelho.com/coelho.jpg)

Você pode ter links e imagens na mesma linha:  
Como se vê em [site da UC](http://www.uc.pt) ou nesta imagem ![demo](http://www.example.com/img.png).

## Listas Numeradas

1. Primeiro item da lista  
2. Segundo item com **negrito**  
3. Terceiro item com *itálico*  
4. Quarto item com [link](http://example.com)  
5. Quinto item com ![imagem](http://example.com/image.png)  
6. Sexto item combinando **negrito e *itálico***  

Algumas listas podem ter muitas linhas seguidas para testar o parser.

## Texto Livre e Combinações

Este é um parágrafo livre com várias combinações:  
1. Texto simples  
2. Texto com **negrito**  
3. Texto com *itálico*  
4. Texto com **negrito e *itálico***  
5. Texto com [link](http://example.com)  
6. Texto com ![imagem](http://example.com/img.png)  

Também podemos misturar tudo em uma linha só:  
**Negrito**, *itálico*, [link](http://example.com), ![img](http://example.com/img.png) e **mais *itálico dentro do negrito***.

## Conclusão

Markdown é muito útil para escrever documentos estruturados sem precisar de HTML diretamente.  
Combinando cabeçalhos, listas, links, imagens, negrito e itálico, você consegue criar textos completos de forma rápida e legível.

"""

print(markdownToHTML(teste2))


<h1>Guia Completo de Markdown</h1>

Markdown é uma linguagem de marcação <b>simples</b> que permite escrever texto estruturado de forma <i>clara</i> e <i>legível</i>.  
É amplamente usada para documentação, blogs, wikis e notas pessoais.

<h2>Estrutura de Cabeçalhos</h2>

<h3>Cabeçalhos de nível 3</h3>
Você pode criar cabeçalhos de diferentes níveis:

<h1>Nível 1</h1>
<h2>Nível 2</h2>
<h3>Nível 3</h3>

<h2>Texto com Formatação</h2>

Você pode usar <b>negrito</b>, <i>itálico</i> ou combinar <b>negrito e <i>itálico</b></i> na mesma frase.  
Também é possível ter múltiplas ocorrências de formatação em uma linha: <b>exemplo 1</b>, <i>exemplo 2</i>, <b>exemplo 3 com <i>itálico</b></i>.

<h2>Links e Imagens</h2>

Confira os seguintes links:  
<ol>
<li><a href="https://www.openai.com">OpenAI</a>  </li>
<li><a href="https://www.python.org">Python</a>  </li>
</ol>

E algumas imagens:

<img href="https://www.python.org/static/img/python-logo.png">Logo Python</img>  
<img href="http://www.coelho