# TPC3: Conversor de Markdown para HTML
Neste notebook vamos criar um conversor simples de Markdown para HTML.
Vamos implementar o tratamento de cabeçalhos, negrito, itálico e listas numeradas.

In [None]:
import re

## 1. Função para converter Cabeçalhos

Converte linhas que começam com `#`, `##` ou `###` em tags HTML `<h1>`, `<h2>` ou `<h3>`.

In [None]:
def converter_cabecalhos(linha):
    """Converte cabeçalhos Markdown (#, ##, ###) para HTML (<h1>, <h2>, <h3>)"""
    match = re.match(r'^(#{1,3})\s+(.+)$', linha)
    if match:
        nivel = len(match.group(1))
        texto = match.group(2)
        return f'<h{nivel}>{texto}</h{nivel}>'
    return linha

### Teste da função de cabeçalhos

In [None]:
print(converter_cabecalhos("# Exemplo"))
print(converter_cabecalhos("## Subtítulo"))
print(converter_cabecalhos("### Subsubtítulo"))

## 2. Função para converter Negrito

Converte trechos entre `**` em tags `<b>`.

In [None]:
def converter_negrito(texto):
    """Converte **texto** para <b>texto</b>"""
    return re.sub(r'\*\*(.+?)\*\*', r'<b>\1</b>', texto)

### Teste da função de negrito

In [None]:
print(converter_negrito("Este é um **exemplo** de negrito"))
print(converter_negrito("**Tudo** em **negrito** aqui"))

## 3. Função para converter Itálico

Converte trechos entre `*` (mas não `**`) em tags `<i>`.

In [None]:
def converter_italico(texto):
    """Converte *texto* para <i>texto</i>"""
    # Cuidado: aplicar após negrito para evitar conflitos
    return re.sub(r'(?<!\*)\*(?!\*)(.+?)(?<!\*)\*(?!\*)', r'<i>\1</i>', texto)

### Teste da função de itálico

In [None]:
print(converter_italico("Este é um *exemplo* de itálico"))
print(converter_italico("*Tudo* em *itálico* aqui"))

## 4. Função para converter Listas Numeradas

Converte sequências de linhas que começam com `1.`, `2.`, etc. em listas HTML `<ol>` e `<li>`.

In [None]:
def converter_lista_numerada(linhas):
    """Converte lista numerada Markdown em HTML"""
    resultado = []
    em_lista = False
    
    for linha in linhas:
        # Verifica se é item de lista numerada
        match = re.match(r'^\d+\.\s+(.+)$', linha)
        
        if match:
            if not em_lista:
                resultado.append('<ol>')
                em_lista = True
            resultado.append(f'<li>{match.group(1)}</li>')
        else:
            if em_lista:
                resultado.append('</ol>')
                em_lista = False
            resultado.append(linha)
    
    # Fecha a lista se ainda estiver aberta
    if em_lista:
        resultado.append('</ol>')
    
    return resultado

### Teste da função de listas numeradas

In [None]:
teste_lista = [
    "1. Primeiro item",
    "2. Segundo item",
    "3. Terceiro item",
    "Texto normal após a lista"
]

for linha in converter_lista_numerada(teste_lista):
    print(linha)

## 5. Conversor Completo

Junta todas as funções anteriores num conversor que processa texto Markdown completo.

In [None]:
def markdown_para_html(texto_markdown):
    """Converte texto Markdown para HTML"""
    # Divide em linhas
    linhas = texto_markdown.split('\n')
    
    # Processa listas numeradas primeiro (trabalha com múltiplas linhas)
    linhas = converter_lista_numerada(linhas)
    
    # Processa cada linha
    resultado = []
    for linha in linhas:
        # Cabeçalhos
        linha = converter_cabecalhos(linha)
        
        # Negrito (antes de itálico para evitar conflitos)
        linha = converter_negrito(linha)
        
        # Itálico
        linha = converter_italico(linha)
        
        resultado.append(linha)
    
    return '\n'.join(resultado)

## 6. Teste Completo do Conversor

Vamos testar com um exemplo que combina todos os elementos.

In [None]:
texto_teste = """# Título Principal
Este é um parágrafo com **negrito** e *itálico*.

## Subtítulo
Mais um parágrafo com **texto em negrito** e *texto em itálico*.

### Lista de Tarefas
1. Primeiro item da lista
2. Segundo item com **negrito**
3. Terceiro item com *itálico*

Texto final após a lista."""

print("=== MARKDOWN ===")
print(texto_teste)
print("\n=== HTML ===")
print(markdown_para_html(texto_teste))