# **CIÊNCIA DE DADOS** - DCA3501

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE, NATAL/RN

DEPARTAMENTO DE ENGENHARIA DE COMPUTAÇÃO E AUTOMAÇÃO

(C) 2025-2026 CARLOS M D VIEGAS

https://github.com/cmdviegas

# III. Funções em Python e Essenciais do Jupyter Notebook

Este notebook aborda funções, parâmetros e argumentos, escopo de variáveis, bem como docstrings, anotações e dicas para Jupyter Notebook.
> **Como usar:** Execute célula por célula (Shift+Enter). Se algo falhar, releia a explicação e ajuste o código.


## Sumário
1. [Por que funções?](#why)
2. [Definindo funções (`def` e `return`)](#def)
3. [Parâmetros, argumentos e valores padrão](#params)
4. [`*args` e `**kwargs`](#varargs)
5. [Escopo: local e global](#scope)
6. [Docstrings, tipos e `help()`](#docs)
7. [Jupyter Notebook na prática](#jnb)
8. [Mini-projeto: limpando e sumarizando dados](#mini)
9. [Checklist e boas práticas](#bp)



## 1. Por que funções? <a id="why"></a>

Funções encapsulam **lógica reutilizável**: você escreve uma vez, chama várias. Elas:
- Evitam **repetição** de código;
- Tornam o programa mais **legível** e **testável**;
- Permitem **composição** de soluções (funções pequenas que resolvem partes do problema).


In [3]:
# Exemplo sem função (código repetido)
precos = [12.9, 10.0, 7.5, 0.0, 21.3]
descontos = []
for p in precos:
    if p > 0:
        descontos.append(p * 0.10)
    else:
        descontos.append(0.0)
descontos

[1.29, 1.0, 0.75, 0.0, 2.1300000000000003]

In [4]:
# Mesma ideia com função (reutilizável e testável)
def calcula_desconto(preco: float, taxa: float = 0.10) -> float:
    """Retorna o desconto (>= 0)."""
    if preco <= 0:
        return 0.0
    return preco * taxa

descontos_func = [calcula_desconto(p) for p in [12.9, 10.0, 7.5, 0.0, 21.3]]
descontos_func

[1.29, 1.0, 0.75, 0.0, 2.1300000000000003]


**Exercício — Reuso**  
Escreva uma função `preco_final(preco, taxa)` que retorne `preco * (1 - taxa)` quando `preco > 0`, caso contrário `0.0`. Use-a para calcular o preço final de `[10, 0, 25]` com taxa `0.15`.


In [11]:
# Espaço para respostas dos Exercícios propostos:

def preco_final(preco: float, taxa: float = 0.15) -> float:
    if preco <=0:
        return 0.0
    return preco * (1 - taxa)

analise_preco = [preco_final(p) for p in [10.0, 0.0, 25]]
analise_preco


[8.5, 0.0, 21.25]


<details>
<summary><strong>Gabarito sugerido</strong></summary>

```python
def preco_final(preco, taxa):
    if preco <= 0:
        return 0.0
    return preco * (1 - taxa)

[preco_final(p, 0.15) for p in [10, 0, 25]]
```
</details>



## 2. Definindo funções (`def` e `return`) <a id="def"></a>

A sintaxe básica:
```python
def nome_funcao(param1, param2):
    """Docstring (opcional): descreva propósito, parâmetros e retorno."""
    # corpo da função
    return resultado
```
Se você não usar `return`, a função retorna `None`.


In [13]:
def media(a: float, b: float) -> float:
    """Retorna a média aritmética simples de dois números."""
    return (a + b) / 2

media(10, 6)

8.0

In [14]:
# Retorno implícito de None
def imprime_boas_vindas(nome: str):
    print(f"Bem-vindo(a), {nome}!")

r = imprime_boas_vindas("Carlos")
type(r), r  # retorna None

Bem-vindo(a), Carlos!


(NoneType, None)


## 3. Parâmetros, argumentos e valores padrão <a id="params"></a>

- **Posicionais**: a ordem dos argumentos importa.  
- **Nomeados** (keyword): você especifica `nome=valor`.  
- **Valores padrão**: definidos na assinatura; úteis para tornar argumentos opcionais.


In [21]:
def saudacao(nome: str, titulo: str = "Sr./Sra.", pontuacao: str = "!") -> str:
    return f"Olá, {titulo} {nome}{pontuacao}"

saudacao("Joana")
saudacao("Bruno", titulo="Dr.")
#saudacao(nome="Lia", pontuacao="!!!")

'Olá, Dr. Bruno!'


**Exercícios — Parâmetros**  
1. Crie `potencia(base, expoente=2)` que eleva `base` a `expoente` (padrão 2).  
2. Faça `preco_com_imposto(preco, aliquota=0.17)` retornando `preco * (1 + aliquota)`.


In [None]:
# Espaço para respostas dos Exercícios propostos:
def potencia(base: float, expoente: int = 2) -> float:
    if expoente < 0:
        return 1 / (base ** abs(expoente))
    return base ** expoente

print("Calculo de potências:", potencia(2), potencia(2, 3), potencia(2, -2))

def preco_com_imposto(preco: float, aliquota: float = 0.17) -> float:
    if preco <= 0:
        return 0.0
    return preco * (1 + aliquota)

print("Preço com imposto:",  preco_com_imposto(50),  preco_com_imposto(100),  preco_com_imposto(-10))

Calculo de potências: 4 8 0.25
Preço com imposto: 58.5 117.0 0.0



<details>
<summary><strong>Gabarito sugerido</strong></summary>

```python
def potencia(base, expoente=2):
    return base ** expoente

def preco_com_imposto(preco, aliquota=0.17):
    return preco * (1 + aliquota)

potencia(3), potencia(3, 3), preco_com_imposto(100)
```
</details>



## 4. `*args` e `**kwargs` <a id="varargs"></a>

- `*args`: empacota argumentos **posicionais** variáveis em uma tupla;  
- `**kwargs`: empacota argumentos **nomeados** variáveis em um dicionário.  
Úteis quando não sabemos quantos argumentos serão passados.


In [32]:
def soma_todos(*args):
    total = 0
    for n in args:
        total += n
    return total

def mostrar_config(**kwargs):
    for k, v in kwargs.items():
        print(f"{k} = {v}")

soma_todos(1, 2, 3, 4), mostrar_config(modo="debug", verbose=True)

modo = debug
verbose = True


(10, None)


**Exercício — Variádicos**  
Implemente `media_ponderada(*valores, **pesos)` onde `valores` são números e `pesos` tem uma chave `w` com uma lista dos pesos. Ex.: `media_ponderada(6, 8, 10, w=[1, 2, 3])`.


In [None]:
# Espaço para respostas dos Exercícios propostos:

def media_ponderada(*valores, **pesos):
    lista_pesos = pesos['w']
    soma_pesos = sum(lista_pesos)
    if soma_pesos == 0:
        return 0.0
    total_ponderado = sum(valor * peso for valor, peso in zip(valores, lista_pesos))

    return total_ponderado / soma_pesos

print("Média ponderada:", media_ponderada(6, 8, 10, w=[1,2,3]))

Média ponderada: 8.666666666666666



<details>
<summary><strong>Gabarito sugerido</strong></summary>

```python
def media_ponderada(*valores, **pesos):
    w = pesos.get("w", [1] * len(valores))
    assert len(valores) == len(w), "valores e pesos devem ter o mesmo tamanho"
    numerador = sum(v * wi for v, wi in zip(valores, w))
    denominador = sum(w)
    return numerador / denominador

media_ponderada(6, 8, 10, w=[1, 2, 3])
```
</details>



## 5. Escopo: local e global <a id="scope"></a>

- **Local**: variáveis definidas dentro da função.  
- **Global**: definidas no módulo (arquivo). Use `global` com moderação.  

In [37]:
x = 10  # global

def f():
    x = 5  # local
    return x

def g():
    global x
    x = 99  # altera a global (use com cuidado)

f(), x
g(); x

99

In [38]:
def contador():
    count = 0
    def inc():
        nonlocal count
        count += 1
        return count
    return inc

c = contador()
c(), c(), c()  # 1, 2, 3

(1, 2, 3)


## 6. Docstrings, anotações de tipos e `help()` <a id="docs"></a>

- **Docstrings** (`"""..."""`) explicam como usar a função.  
- **Type hints** ajudam ferramentas e humanos; não são obrigatórios.  
- Use `help(func)` ou `func.__doc__` para ver a documentação.


In [39]:
def normaliza_texto(s: str, remover_espacos: bool = True) -> str:
    """Normaliza um texto:
    - Converte para minúsculas
    - (Opcional) remove espaços extras
    Retorna a string normalizada.
    """
    t = s.lower()
    if remover_espacos:
        t = " ".join(t.split())
    return t

help(normaliza_texto)
print("Docstring curta:", normaliza_texto.__doc__.splitlines()[0])

Help on function normaliza_texto in module __main__:

normaliza_texto(s: str, remover_espacos: bool = True) -> str
    Normaliza um texto:
    - Converte para minúsculas
    - (Opcional) remove espaços extras
    Retorna a string normalizada.

Docstring curta: Normaliza um texto:



## 7. Jupyter Notebook na prática <a id="jnb"></a>

**Células:**  
- **Código** (executam Python) e **Markdown** (texto formatado).  
- Altere o tipo da célula com: `Esc` → `M` (Markdown) ou `Esc` → `Y` (Código).

**Atalhos úteis:**  
- Executar célula: `Shift+Enter` (vai para a próxima) ou `Ctrl+Enter` (permanece).  
- Inserir célula **acima**: `A`; **abaixo**: `B`.  
- Deletar célula: `D` duas vezes (`D`, `D`).  
- Desfazer exclusão de célula: `Z`.  
- Alternar modo edição/command: `Enter` / `Esc`.

**Kernel:**  
- Reiniciar: Menu *Kernel* → *Restart* quando o ambiente “embolou”.  
- Executar tudo: *Run* → *Run All Cells*.

**Magics** (prefixo `%` ou `%%`):  
- `%timeit expr` mede tempo de execução de uma expressão repetidas vezes.  
- `%%time` mede tempo de execução de toda a célula.  
- `%whos` lista variáveis definidas no ambiente.  
- `%lsmagic` mostra todos os magics disponíveis.


In [40]:
# Exemplos de magics (podem variar conforme o ambiente Jupyter)
# Remova o comentário e execute em um Jupyter local para testar.
# %timeit sum(range(1000))
# %%time
# total = 0
# for i in range(100000):
#     total += i
# total


## 8. Mini-projeto: limpando e sumarizando dados <a id="mini"></a>

Cenário: temos uma lista de registros de vendas (produto, preço e categoria).  
Tarefas:
1. Criar funções para **limpar** nomes (title case, remover espaços duplicados) e validar preços;
2. Calcular **total por categoria**;
3. Montar um **relatório** final com as métricas calculadas.

**Desafio:**  
- Adapte o mini-projeto para também calcular a **média de preço** por categoria (considere apenas preços válidos).  
- Exiba as categorias ordenadas do maior para o menor total.


In [13]:
dados = [
    ("  Caderno universitário  ", 19.9, "Papelaria"),
    ("lapiseira 0.7", 12.5, "papelaria"),
    ("Café Expresso", 7.0, "Alimentos"),
    ("refri lata", 5.5, "Alimentos"),
    ("Caneta   azul", 3.2, "Papelaria"),
    ("Chocolate", -1.0, "Alimentos"),  # inválido (preço negativo)
]

# Complete as funções abaixo conforme os exercícios propostos

def limpar_nome(nome: str) -> str:
    return " ".join(nome.title().split()) 

def limpar_categoria(categoria: str) -> str:
    return categoria.title().strip()

def validar_preco(preco: float) -> float:
    return preco if preco > 0 else 0.0

def total_por_categoria(dados):
    totais = {}
    for nome, preco, categoria in dados:
        preco_valido = validar_preco(preco)
        if categoria not in totais:
            totais[categoria] = 0.0
        totais[categoria] += preco_valido
    return totais

def media_por_categoria(dados):
    soma = {}
    contagem = {}
    for nome, preco, categoria in dados:
        preco_valido = validar_preco(preco)
        if categoria not in soma:
            soma[categoria] = 0.0
            contagem[categoria] = 0
        if preco_valido > 0:
            soma[categoria] += preco_valido
            contagem[categoria] += 1
    medias = {cat: (soma[cat] / contagem[cat]) if contagem[cat] > 0 else 0.0 for cat in soma}
    return medias

def gerar_relatorio(dados):
    dados_limpos = [(limpar_nome(nome), validar_preco(preco), limpar_categoria(categoria)) for nome, preco, categoria in dados]
    totais = total_por_categoria(dados_limpos)
    #medias = media_por_categoria(dados_limpos)
    
    return dados_limpos, totais


#- Exiba as categorias ordenadas do maior para o menor total.


dados_limpos, totais = gerar_relatorio(dados)
print("Dados limpos:", dados_limpos)
print("Totais por categoria:", totais) 
#print("Médias por categoria:", medias)


Dados limpos: [('Caderno Universitário', 19.9, 'Papelaria'), ('Lapiseira 0.7', 12.5, 'Papelaria'), ('Café Expresso', 7.0, 'Alimentos'), ('Refri Lata', 5.5, 'Alimentos'), ('Caneta Azul', 3.2, 'Papelaria'), ('Chocolate', 0.0, 'Alimentos')]
Totais por categoria: {'Papelaria': 35.6, 'Alimentos': 12.5}



## 9. Boas práticas <a id="bp"></a>

- **Uma função = uma responsabilidade** clara;  
- Prefira **nomes descritivos** e docstrings objetivas;  
- Use **valores padrão** sensatos e evite `global` quando possível;  
- Considere **anotações de tipo** para clareza e ferramentas;  
- Em Jupyter, reinicie o kernel quando houver conflitos de estado;
- **Teste** funções com casos simples e casos limite.
