## TPC3: Conversor de MarkDown para HTML

Criar em Python um pequeno conversor de MarkDown para HTML para os elementos descritos na "Basic Syntax" da Cheat Sheet:

### Cabeçalhos: linhas iniciadas por "# texto", ou "## texto" ou "### texto"

In: `# Exemplo`

Out: `<h1>Exemplo</h1>`

### Bold: pedaços de texto entre "**":

In: `Este é um **exemplo** ...`

Out: `Este é um <b>exemplo</b> ...`

### Itálico: pedaços de texto entre "*":

In: `Este é um *exemplo* ...`

Out: `Este é um <i>exemplo</i> ...`

### Lista numerada:

In:
```
1. Primeiro item
2. Segundo item
3. Terceiro item
```

Out:
```
<ol>
<li>Primeiro item</li>
<li>Segundo item</li>
<li>Terceiro item</li>
</ol>
```

### Link: [texto](endereço URL)

In: `Como pode ser consultado em [página da UC](http://www.uc.pt)`

Out: `Como pode ser consultado em <a href="http://www.uc.pt">página da UC</a>`

### Imagem: ![texto alternativo](path para a imagem)

In: Como se vê na imagem seguinte: `![imagem dum coelho](http://www.coellho.com) ...`

Out: `Como se vê na imagem seguinte: <img src="http://www.coellho.com" alt="imagem dum coelho"/> ...`

## Resolução 




























































In [1]:

import re

def md_para_html(conteudo):
    # 1) imagens
    conteudo = re.sub(r'!\[([^\]]*)\]\(([^)]+)\)', r'<img src="\2" alt="\1"/>', conteudo)
    # 2) hiperligações
    conteudo = re.sub(r'\[([^\]]+)\]\(([^)]+)\)', r'<a href="\2">\1</a>', conteudo)
    # 3) negrito
    conteudo = re.sub(r'\*\*(.+?)\*\*', r'<b>\1</b>', conteudo)
    # 4) itálico
    conteudo = re.sub(r'(?<!\*)\*(?!\*)(.+?)(?<!\*)\*(?!\*)', r'<i>\1</i>', conteudo)
    return conteudo


def converter_md(markdown_texto):
    linhas_html = []
    lista_aberta = False

    for linha in markdown_texto.splitlines():
        linha = linha.rstrip("\n")

        # Linha vazia → fecha lista se estiver aberta e mantém espaço
        if not linha.strip():
            if lista_aberta:
                linhas_html.append('</ol>')
                lista_aberta = False
            linhas_html.append('')
            continue

        # Cabeçalhos
        cab = re.match(r'^(#{1,6})\s+(.*)$', linha)
        if cab:
            nivel = len(cab.group(1))
            conteudo = md_para_html(cab.group(2).strip())
            if lista_aberta:
                linhas_html.append('</ol>')
                lista_aberta = False
            linhas_html.append(f'<h{nivel}>{conteudo}</h{nivel}>')
            continue

        # Lista numerada
        item_lista = re.match(r'^\s*\d+\.\s+(.*)$', linha)
        if item_lista:
            if not lista_aberta:
                linhas_html.append('<ol>')
                lista_aberta = True
            elemento = md_para_html(item_lista.group(1).strip())
            linhas_html.append(f'<li>{elemento}</li>')
            continue
        else:
            if lista_aberta:
                linhas_html.append('</ol>')
                lista_aberta = False

        # Linha “normal”
        linhas_html.append(md_para_html(linha))

    # Fecha lista se o ficheiro acabar dentro de uma lista
    if lista_aberta:
        linhas_html.append('</ol>')

    return "\n".join(linhas_html)


texto_exemplo = """
# Exemplo

Este é um **exemplo** e um *teste*.

1. Primeiro item
2. Segundo item
3. Terceiro item

Como pode ser consultado em [página da UC](http://www.uc.pt).

Como se vê na imagem seguinte: ![imagem dum coelho](http://www.coelho.com)
"""

print(converter_md(texto_exemplo))


<h1>Exemplo</h1>

Este é um <b>exemplo</b> e um <i>teste</i>.

<ol>
<li>Primeiro item</li>
<li>Segundo item</li>
<li>Terceiro item</li>
</ol>

Como pode ser consultado em <a href="http://www.uc.pt">página da UC</a>.

Como se vê na imagem seguinte: <img src="http://www.coelho.com" alt="imagem dum coelho"/>
