## TPC2: Conversor de MarkDown para HTML

Criar em Python um pequeno conversor de MarkDown para HTML para os elementos descritos na "Basic Syntax" da Cheat Sheet:

### Cabeçalhos: linhas iniciadas por "# texto", ou "## texto" ou "### texto"

In: `# Exemplo`

Out: `<h1>Exemplo</h1>`

### Bold: pedaços de texto entre "**":

In: `Este é um **exemplo** ...`

Out: `Este é um <b>exemplo</b> ...`

### Itálico: pedaços de texto entre "*":

In: `Este é um *exemplo* ...`

Out: `Este é um <i>exemplo</i> ...`

### Lista numerada:

In:
```
1. Primeiro item
2. Segundo item
3. Terceiro item
```

Out:
```
<ol>
<li>Primeiro item</li>
<li>Segundo item</li>
<li>Terceiro item</li>
</ol>
```

### Link: [texto](endereço URL)

In: `Como pode ser consultado em [página da UC](http://www.uc.pt)`

Out: `Como pode ser consultado em <a href="http://www.uc.pt">página da UC</a>`

### Imagem: ![texto alternativo](path para a imagem)

In: Como se vê na imagem seguinte: `![imagem dum coelho](http://www.coellho.com) ...`

Out: `Como se vê na imagem seguinte: <img src="http://www.coellho.com" alt="imagem dum coelho"/> ...`

In [74]:
texto = """# Título Principal
## Subtítulo
Este é um ***exemplo*** com *itálico*.
Como pode ser consultado em [página da UC](http://www.uc.pt)
![imagem dum coelho](http://www.coelho.com)
1. Primeiro item
2. **Segundo item**
3. *Terceiro item*
4. Quarto item"""


### Funções Auxiliares ###

def head_convert(m):
    return f"<h{len(m.group(1))}>{m.group(2)}</h>"

def bold_convert(m):
    return f"<b>{m.group(1)}</b>"

def italic_convert(m):
    return f"<i>{m.group(1)}</i>"

def lists_convert(m):
    return f"<li>{m.group(1)}</li>"

def bold_italic_convert(m):
    return f"<b><i>{m.group(1)}<i><b>"

def link_convert(m):
    return f'<a href="{m.group(2)}">{m.group(1)}</a>'

def image_convert(m):
    return f'<img src="{m.group(2)}" alt="{m.group(1)}"/>'


In [73]:
import re



def converter(text):

    out = []
    
    head = re.compile(r'^(#|##|###)\s+(.+)$')
    bold = re.compile(r'\*\*(.*?)\*\*')
    italic = re.compile(r'\*(.*?)\*')
    bold_italic = re.compile(r'\*\*\*(.*?)\*\*\*')
    link = re.compile(r'\[(.*?)\]\((.*?)\)')
    image = re.compile(r'!\[(.*?)\]\((.*?)\)')

    lists = re.compile(r'^\d+\.\s+(.+)')
    list_flag = 0


    lines = re.split(r'\n',text)

    for line in lines:

        list_match = lists.match(line)

        if not list_flag and list_match:
            print("<ol>")
            out.append("</ol>")
            
            list_flag = 1

        if list_flag and not list_match:
            print("</ol>")
            out.append("</ol>")

            list_flag = 0

        line = lists.sub(lists_convert,line)

        line = head.sub(head_convert,line)
        line = bold_italic.sub(bold_italic_convert,line)
        line = bold.sub(bold_convert,line)
        line = italic.sub(italic_convert,line)
        line = image.sub(image_convert,line)
        line = link.sub(link_convert,line)
        
        print(line)
        out.append(line)

    ## Fim do ciclo se acabar com uma lista
    if list_flag:
        print("</ol>")
        out.append("</ol>")

    return out  
        

    
out = converter(texto)
#print(out) 


<h1>Título Principal</h>
<h2>Subtítulo</h>
Este é um <b><i>exemplo<i><b> com <i>itálico</i>.
Como pode ser consultado em <a href="http://www.uc.pt">página da UC</a>
<img src="http://www.coelho.com" alt="imagem dum coelho"/>
<ol>
<li>Primeiro item</li>
<li><b>Segundo item</b></li>
<li><i>Terceiro item</i></li>
<li>Quarto item</li>
</ol>
