## TPC2: Conversor de MarkDown para HTML

Criar em Python um pequeno conversor de MarkDown para HTML para os elementos descritos na "Basic Syntax" da Cheat Sheet:

### Cabeçalhos: linhas iniciadas por "# texto", ou "## texto" ou "### texto"

In: `# Exemplo`

Out: `<h1>Exemplo</h1>`

### Bold: pedaços de texto entre "**":

In: `Este é um **exemplo** ...`

Out: `Este é um <b>exemplo</b> ...`

### Itálico: pedaços de texto entre "*":

In: `Este é um *exemplo* ...`

Out: `Este é um <i>exemplo</i> ...`

### Lista numerada:

In:
```
1. Primeiro item
2. Segundo item
3. Terceiro item
```

Out:
```
<ol>
<li>Primeiro item</li>
<li>Segundo item</li>
<li>Terceiro item</li>
</ol>
```

### Link: [texto](endereço URL)

In: `Como pode ser consultado em [página da UC](http://www.uc.pt)`

Out: `Como pode ser consultado em <a href="http://www.uc.pt">página da UC</a>`

### Imagem: ![texto alternativo](path para a imagem)

In: Como se vê na imagem seguinte: `![imagem dum coelho](http://www.coellho.com) ...`

Out: `Como se vê na imagem seguinte: <img src="http://www.coellho.com" alt="imagem dum coelho"/> ...`

In [130]:
import re

In [131]:
texto = """
# Meu TPC de Conversor Markdown para HTML

Este é um **teste completo** do conversor de Markdown.  
Vamos verificar se ele lida com *todos os elementos básicos* corretamente.

## Lista de Tarefas

1. Criar o conversor em Python
2. Testar cabeçalhos
3. Testar **negrito**
4. Testar *itálico*
5. Testar listas numeradas
6. Testar links e imagens

### Links e Imagens

Para mais informações, consulte [a página oficial da UC](http://www.uc.pt).  

E veja a imagem abaixo:  
![foto coelho](http://www.coelho.com)

**Fim do teste**

"""

In [132]:
def cabecalho(match):
    size = len(match.group(1))
    return f"<h{size}>{match.group(2)}</h{size}>"

texto = re.sub(r"^(#{1,3})\s+(.+)$", cabecalho, texto, flags=re.M)
#print(texto)

In [None]:
#Negrito
texto = re.sub(r"\*\*(.*)\*\*", r"<b>\1</b>", texto, flags=re.M)
#print(texto)

In [None]:
#Italico
texto = re.sub(r"\*([^\*]*)\*", r"<i>\1</i>", texto, flags=re.M)
#print(texto)

In [135]:
#Listas numeradas
def lista(match):
    if match.group(1) == '1':
        return f"<ol>\n<li>{match.group(2)}</li>\n"
    return f"<li>{match.group(2)}</li>\n"

texto = re.sub(r"(\d)+\.\s+(.*?)\n", lista, texto)
#print(texto)

In [136]:
#Listas numeradas
texto = re.sub(r"</li>\n[^<]", r"</li>\n</ol>\n\n", texto)
#print(texto)

### Link: [texto](endereço URL)

In: `Como pode ser consultado em [página da UC](http://www.uc.pt)`

Out: `Como pode ser consultado em <a href="http://www.uc.pt">página da UC</a>`

In [137]:
texto = re.sub(r"[^\!]\[(.*?)\]\((.*?)\)", r'<a href="\2">\1</a>', texto)
#print(texto)

In [139]:
texto = re.sub(r"\!\[(.*?)\]\((.*?)\)", r'<img src="\2" alt="\1"/>', texto)
print(texto)


<h1>Meu TPC de Conversor Markdown para HTML</h1>

Este é um <b>teste completo</b> do conversor de Markdown.  
Vamos verificar se ele lida com <i>todos os elementos básicos</i> corretamente.

<h2>Lista de Tarefas</h2>

<ol>
<li>Criar o conversor em Python</li>
<li>Testar cabeçalhos</li>
<li>Testar <b>negrito</b></li>
<li>Testar <i>itálico</i></li>
<li>Testar listas numeradas</li>
<li>Testar links e imagens</li>
</ol>

<h3>Links e Imagens</h3>

Para mais informações, consulte<a href="http://www.uc.pt">a página oficial da UC</a>.  

E veja a imagem abaixo:  
<img src="http://www.coelho.com" alt="foto coelho"/>

<b>Fim do teste</b>


