## TPC3: Conversor de MarkDown para HTML

Criar em Python um pequeno conversor de MarkDown para HTML para os elementos descritos na "Basic Syntax" da Cheat Sheet:

### Cabeçalhos: linhas iniciadas por "# texto", ou "## texto" ou "### texto"

In: `# Exemplo`

Out: `<h1>Exemplo</h1>`

### Bold: pedaços de texto entre "**":

In: `Este é um **exemplo** ...`

Out: `Este é um <b>exemplo</b> ...`

### Itálico: pedaços de texto entre "*":

In: `Este é um *exemplo* ...`

Out: `Este é um <i>exemplo</i> ...`

### Lista numerada:

In:
```
1. Primeiro item
2. Segundo item
3. Terceiro item
```

Out:
```
<ol>
<li>Primeiro item</li>
<li>Segundo item</li>
<li>Terceiro item</li>
</ol>
```

### Link: [texto](endereço URL)

In: `Como pode ser consultado em [página da UC](http://www.uc.pt)`

Out: `Como pode ser consultado em <a href="http://www.uc.pt">página da UC</a>`

### Imagem: ![texto alternativo](path para a imagem)

In: Como se vê na imagem seguinte: `![imagem dum coelho](http://www.coellho.com) ...`

Out: `Como se vê na imagem seguinte: <img src="http://www.coellho.com" alt="imagem dum coelho"/> ...`

## Resolução 




























































In [None]:

import re

def markdown_HTML(texto):
    # 1) imagens
    texto = re.sub(r'!\[([^\]]*)\]\(([^)]+)\)', r'<img src="\2" alt="\1"/>', texto)
    # 2) links
    texto = re.sub(r'\[([^\]]+)\]\(([^)]+)\)', r'<a href="\2">\1</a>', texto)
    # 3) bold 
    texto = re.sub(r'\*\*(.+?)\*\*', r'<b>\1</b>', texto)
    # 4) itálico
    texto = re.sub(r'(?<!\*)\*(?!\*)(.+?)(?<!\*)\*(?!\*)', r'<i>\1</i>', texto)
    return texto

def converter_markdown(markdown):
    linha_html = []
    in_ol = False

    for linha in markdown.splitlines():
        linha = linha.rstrip("\n")

        # Linha vazia: termina lista se aberta e mantém linha vazia
        if not linha.strip():
            if in_ol:
                linha_html.append('</ol>')
                in_ol = False
            linha_html.append('')
            continue

        # Títulos
        m = re.match(r'^(#{1,6})\s+(.*)$', linha)
        if m:
            level = len(m.group(1))
            content = markdown_HTML(m.group(2).strip())
            if in_ol:
                linha_html.append('</ol>')
                in_ol = False
            linha_html.append(f'<h{level}>{content}</h{level}>')
            continue

        # Lista numerada:
        m = re.match(r'^\s*\d+\.\s+(.*)$', linha)
        if m:
            if not in_ol:
                linha_html.append('<ol>')
                in_ol = True
            item = markdown_HTML(m.group(1).strip())
            linha_html.append(f'<li>{item}</li>')
            continue
        else:
            
            if in_ol:
                linha_html.append('</ol>')
                in_ol = False

        # Linha “normal” 
        linha_html.append(markdown_HTML(linha))

    # Fecha lista se o ficheiro acabar dentro de uma lista
    if in_ol:
        linha_html.append('</ol>')

    return "\n".join(linha_html)


texto = """
# Exemplo

Este é um **exemplo** e um *teste*.

1. Primeiro item
2. Segundo item
3. Terceiro item

Como pode ser consultado em [página da UC](http://www.uc.pt).

Como se vê na imagem seguinte: ![imagem dum coelho](http://www.coelho.com)
"""
print(converter_markdown(texto))


<h1>Exemplo</h1>

Este é um <b>exemplo</b> e um <i>teste</i>.

<ol>
<li>Primeiro item</li>
<li>Segundo item</li>
<li>Terceiro item</li>
</ol>

Como pode ser consultado em <a href="http://www.uc.pt">página da UC</a>.

Como se vê na imagem seguinte: <img src="http://www.coelho.com" alt="imagem dum coelho"/>
