# 📚 Aula Prática – Arquivos, Pacotes e Módulos

## Tema: Arquivos, Módulos e Pacotes (os, random, faker, requests, BeautifulSoup)

## Objetivo da aula: Criar, organizar, analisar e coletar informações em diferentes contextos com Python.

ℹ️ Lembretes:

- O sistema de arquivos do Colab é temporário. Se quiser salvar os arquivos, baixe-os para seu computador ou conecte seu Google Drive.

- Utilize `%%writefile` para criar módulos

- Use código Python para criar pastas e arquivos.

## Nível Básico – Aquecimento

### Exercício 1 – Cadastro de alunas (usando `faker` e `random`)

- Imagine que você é responsável por organizar uma lista de alunas para um curso.

- Use a biblioteca `faker` para gerar pelo menos 30 nomes de alunas.

- Para cada aluna, crie também um número de matrícula aleatório (por exemplo, entre 1000 e 9999).

- Salve os dados em um arquivo chamado alunas.txt, com o formato: `Nome - Matrícula`





In [None]:
# ============================================================
# PASSO 0: Instalar a biblioteca necessária
# ============================================================
!pip install faker

# ============================================================
# PASSO 1: Importar bibliotecas
# ============================================================
from faker import Faker  # gera nomes fictícios
import random            # gera números aleatórios

fake = Faker("pt_BR")  # inicializa gerador de dados em português

# ============================================================
# PASSO 2: Gerar nomes fictícios
# ============================================================
alunas = []  # lista para armazenar os nomes

for i in range(30):          # repete 30 vezes
    nome = fake.name()       # cria um nome fictício
    alunas.append(nome)      # adiciona na lista

# ============================================================
# PASSO 3: Criar matrícula para cada aluna
# ============================================================
cadastro = []  # lista para armazenar nome + matrícula

for nome in alunas:
    matricula = random.randint(1000, 9999)  # número aleatório de 4 dígitos
    cadastro.append(f"{nome} - {matricula}")  # junta nome e matrícula

# ============================================================
# PASSO 4: Salvar no arquivo
# ============================================================
with open("alunas.txt", "w", encoding="utf-8") as f:
    for linha in cadastro:
        f.write(linha + "\n")  # escreve cada cadastro em uma linha

# ============================================================
# PASSO 5: Ler e mostrar o arquivo
# ============================================================
with open("alunas.txt", "r", encoding="utf-8") as f:
    conteudo = f.read()   # lê todo o conteúdo
    print(conteudo)       # mostra na tela

### Exercício 2 – Analisando números de uma pesquisa (usando random)

Você está ajudando em uma pesquisa que deseja coletar 200 respostas numéricas (valores entre 1 e 1000).

1. Gere esses números aleatórios e salve-os em um arquivo numeros.txt.

2. Escreva um programa que leia o arquivo e descubra: Qual foi a menor resposta registrada? Qual foi a maior resposta registrada?

Esse tipo de análise é importante para entender extremos em pesquisas ou levantamentos de dados.

In [None]:
import random  # biblioteca para gerar números aleatórios

# ============================================================
# PASSO 1: Gerar e salvar os números no arquivo
# ============================================================
with open("numeros.txt", "w", encoding="utf-8") as f:
    for i in range(200):
        numero = random.randint(1, 1000)   # gera número entre 1 e 1000
        # str(numero) → converte o número inteiro em texto, porque f.write só aceita string
        # + "\n" → adiciona uma quebra de linha, para que cada número fique em uma linha do arquivo
        f.write(str(numero) + "\n")

# ============================================================
# PASSO 2: Ler e converter os números do arquivo
# ============================================================
with open("numeros.txt", "r", encoding="utf-8") as f:
    # percorre cada linha do arquivo (for l in f)
    # converte a linha em inteiro (int(l))
    # monta uma lista com todos os números ([ ... ])
    nums = [int(l) for l in f]

# Então:
# f = o arquivo numeros.txt aberto
# for l in f = percorre cada linha do arquivo
# l = cada linha individual (string)

# ============================================================
# PASSO 3: Analisar os dados
# ============================================================
menor = min(nums)  # encontra o menor valor
maior = max(nums)  # encontra o maior valor

# ============================================================
# PASSO 4: Mostrar os resultados
# ============================================================
print("Menor número registrado:", menor)
print("Maior número registrado:", maior)

In [None]:
import random  # biblioteca para gerar números aleatórios

# ============================================================
# Exemplo 1: Sorteando entre 1 e 5
# ============================================================
print("Exemplo 1: números entre 1 e 5")
for i in range(10):  # repete 10 vezes
    print(random.randint(1, 5))  # pode sair 1, 2, 3, 4 ou 5

print("-" * 40)

# ============================================================
# Exemplo 2: Sorteando entre 10 e 10 (sempre igual)
# ============================================================
print("Exemplo 2: número entre 10 e 10")
for i in range(5):  # repete 5 vezes
    print(random.randint(10, 10))  # sempre vai sair 10

print("-" * 40)

# ============================================================
# Exemplo 3: Sorteando entre 50 e 60
# ============================================================
print("Exemplo 3: números entre 50 e 60")
for i in range(10):  # repete 10 vezes
    print(random.randint(50, 60))  # pode sair qualquer número de 50 até 60


## Nível Intermediário – Reutilizando e organizando código

Aqui, o objetivo é não repetir código e aprender a organizar funções em módulos.

### Exercício 3 – Frases motivacionais do ano (usando random)

Uma empresa quer criar um sistema que sorteia uma frase motivacional por dia para seus funcionários.

1. Gere o arquivo frases.txt, que contém 31 frases (uma para cada dia do mês).

2. Escreva um programa que:

a. Leia todas as frases do arquivo.

b. Sorteie uma frase usando random.choice.

c. Exiba a frase na tela.

👉 Esse exercício mostra como reaproveitar grandes arquivos de texto em aplicações do dia a dia.

In [None]:
# ============================================================
# PASSO 1: Criar o arquivo frases.txt
# ============================================================

# lista com 31 frases motivacionais (uma para cada dia do mês)
frases = [
    "Acredite no seu potencial!",
    "Cada dia é uma nova chance.",
    "O esforço de hoje é o sucesso de amanhã.",
    "Você é capaz de conquistar grandes coisas.",
    "Persistência leva à vitória.",
    "Confie no processo e siga em frente.",
    "Pequenos passos constroem grandes jornadas.",
    "Sua dedicação faz a diferença.",
    "Nada é impossível quando acreditamos.",
    "A disciplina supera a motivação.",
    "Seu trabalho tem valor.",
    "Sonhe grande, comece pequeno.",
    "Não desista no primeiro obstáculo.",
    "Aprender é crescer todos os dias.",
    "Você é a sua melhor versão em construção.",
    "Coragem é agir apesar do medo.",
    "Seja constante, mesmo nos dias difíceis.",
    "Transforme erros em aprendizado.",
    "A vitória começa com a decisão de tentar.",
    "Respeite seu tempo e siga firme.",
    "Tenha orgulho do seu progresso.",
    "Seja a inspiração que você procura.",
    "Cada conquista começa com um passo.",
    "Você está no caminho certo.",
    "Foque no que você pode controlar.",
    "O sucesso é feito de persistência.",
    "Você tem força para continuar.",
    "Não compare sua jornada com a dos outros.",
    "A motivação vem da ação.",
    "Seu esforço hoje vale a pena amanhã.",
    "Acreditar em si é o primeiro passo."
]

# cria o arquivo frases.txt com todas as frases
with open("frases.txt", "w", encoding="utf-8") as f:
    for frase in frases:
        # f.write só aceita strings
        # frase é uma string, e "\n" serve para quebrar a linha
        # assim cada frase fica em uma linha separada no arquivo
        f.write(frase + "\n")

# ============================================================
# PASSO 2: Ler todas as frases do arquivo
# ============================================================
with open("frases.txt", "r", encoding="utf-8") as f:
    # percorre cada linha do arquivo (for linha in f)
    # linha.strip() → remove o \n do final da frase
    # [ ... for linha in f ] → cria uma lista com todas as frases
    frases = [linha.strip() for linha in f]

import random  # precisamos importar para usar random.choice

# ============================================================
# PASSO 3: Sortear e exibir uma frase
# ============================================================

# random.choice(lista) → escolhe aleatoriamente um item da lista
frase_sorteada = random.choice(frases)

# mostra a frase escolhida na tela
print("Frase motivacional do dia:")
print(frase_sorteada)

### Exercício 4 – Criando um módulo de utilidades para arquivos

Agora que já temos vários arquivos (`alunas.txt`, `numeros.txt`, `frases.txt`), vamos criar um **módulo** arquivos.py para facilitar a manipulação de arquivos.

1. Esse módulo deve conter as seguintes funções:

- `contar_caracteres(nome_arquivo)` → devolve o número total de caracteres do arquivo.

- `contar_palavras(nome_arquivo)` → devolve a quantidade total de palavras no arquivo.

- `ler_conteudo(nome_arquivo, qtd_linhas)` → lê e devolve apenas as primeiras N linhas do arquivo (N é definido pelo usuário).

2. Teste cada função do módulo com os arquivos criados (`alunas.txt`, `numeros.txt`, `frases.txt`).

👉 Isso mostra como modularizar código ajuda a organizar programas maiores.

In [None]:
# =============================================
# Função: contar_caracteres
# Objetivo:
#   - Abrir um arquivo de texto
#   - Contar quantos caracteres existem nele
#   - Retornar esse total como número inteiro
#
# Observação:
#   - "Caracteres" inclui letras, números, espaços,
#     pontuações e quebras de linha.
# =============================================

def contar_caracteres(nome_arquivo):
    # 1. Abre o arquivo no modo de leitura ("r")
    #    encoding="utf-8" é usado para suportar acentos e cedilhas.
    with open(nome_arquivo, "r", encoding="utf-8") as f:
        # 2. f.read() lê TODO o conteúdo do arquivo como uma string única
        conteudo = f.read()

    # 3. len(conteudo) conta quantos caracteres existem nessa string
    return len(conteudo)


# =============================================
# Testando a função
# - Aqui chamamos a função passando o nome do arquivo
# - O resultado é impresso no console
# =============================================

print("Total de caracteres em frases.txt:", contar_caracteres("frases.txt"))
print("Total de caracteres em alunas.txt:", contar_caracteres("alunas.txt"))
print("Total de caracteres em numeros.txt:", contar_caracteres("numeros.txt"))

In [None]:
# =============================================
# Função: ler_conteudo
# Objetivo:
#   - Abrir um arquivo de texto
#   - Ler apenas as PRIMEIRAS N linhas
#   - Retornar essas linhas como lista
#
# Observação:
#   - Aqui usamos .readlines() que já pega todas
#     as linhas do arquivo de uma vez.
#   - Depois usamos [:qtd_linhas] para pegar só
#     as primeiras N linhas.
# =============================================

def ler_conteudo(nome_arquivo, qtd_linhas):
    # 1. Abre o arquivo no modo leitura
    with open(nome_arquivo, "r", encoding="utf-8") as f:
        # 2. .readlines() devolve TODAS as linhas numa lista
        linhas = f.readlines()

    # 3. Pegamos só as N primeiras linhas com [:qtd_linhas]
    #    e tiramos a quebra de linha "\n" no final de cada uma
    return [linha.rstrip("\n") for linha in linhas[:qtd_linhas]]


# =============================================
# Testando a função
# - Aqui pedimos para mostrar só as 3 primeiras linhas
# =============================================

print("Primeiras linhas de frases.txt:", ler_conteudo("frases.txt", 1)) # mostra só a primeira linha
print("Primeiras linhas de alunas.txt:", ler_conteudo("alunas.txt", 5)) # mostra as 5 primeiras linhas
print("Primeiras linhas de numeros.txt:", ler_conteudo("numeros.txt", 10)) # mostra as 10 primeiras linhas

## Nível Avançado – Buscando informações na web

### Exercício 5 – Criando um módulo coletor de notícias (usando requests + BeautifulSoup)

Você foi convidado a desenvolver um coletor de manchetes para um portal de notícias.

1. Crie um módulo chamado coletor.py com pelo menos 4 funções:

- `coletar_noticias(url)` → acessa a página indicada com requests e usa BeautifulSoup para coletar o título e o texto da nóticia. Cria um arquivo para salvar a noticia. Adiciona o título da noticia em um arquivo `noticias.txt`.

- `ler_titulos(nome_arquivo)` → lê os títulos salvos e devolve como lista.

- `gerar_relatorio()` → lê o arquivo `noticias.txt`, cria um relatório com: número total de títulos coletados; quantidade de palavras por título.
Salve relatório em `relatorio.txt`.

👉 Você pode usar como exemplo para raspagem o site: https://quotes.toscrape.com

👉 Esse exercício mostra como Python pode ser usado em aplicações reais de web scraping e análise de texto.

In [47]:
# =============================================
# coletor.py – versão simplificada
# Exercício 5 – Coletor de manchetes
#
# Funções:
#   1) coletar_noticias(url)
#   2) ler_titulos()
#   3) gerar_relatorio()
#
# Obs.: Aqui tudo é direto, sem funções extras para
#       limpar texto ou criar nomes complexos.
# =============================================

import requests
from bs4 import BeautifulSoup

# ---------------------------------------------
# 1) coletar_noticias(url)
#   - Baixa a página
#   - Pega o título (h1 ou <title>)
#   - Pega os parágrafos <p> como texto
#   - Salva notícia em um arquivo .txt simples
#   - Acrescenta título em noticias.txt
# ---------------------------------------------
def coletar_noticias(url):
    resp = requests.get(url)
    soup = BeautifulSoup(resp.text, "html.parser")

    # pega título (prioriza h1, senão usa <title>)
    titulo = soup.find("h1").get_text(strip=True) if soup.find("h1") else soup.title.get_text(strip=True)

    # pega todo o texto dos parágrafos
    paragrafos = [p.get_text(strip=True) for p in soup.find_all("p")]
    texto = " ".join(paragrafos) if paragrafos else "Sem conteúdo."

    # salva notícia completa em um arquivo
    with open("noticia.txt", "w", encoding="utf-8") as f:
        f.write(titulo + "\n\n" + texto)

    # adiciona título em noticias.txt
    with open("noticias.txt", "a", encoding="utf-8") as f:
        f.write(titulo + "\n")

    print("Notícia coletada:", titulo)


# ---------------------------------------------
# 2) ler_titulos()
#   - Lê noticias.txt e devolve uma lista de títulos
# ---------------------------------------------
def ler_titulos(nome_arquivo="noticias.txt"):
    try:
        with open(nome_arquivo, "r", encoding="utf-8") as f:
            return [linha.strip() for linha in f]
    except FileNotFoundError:
        return []


# ---------------------------------------------
# 3) gerar_relatorio()
#   - Lê noticias.txt
#   - Conta quantos títulos existem
#   - Conta quantas palavras cada título tem
#   - Salva tudo em relatorio.txt
# ---------------------------------------------
def gerar_relatorio():
    titulos = ler_titulos()
    total = len(titulos)

    with open("relatorio.txt", "w", encoding="utf-8") as f:
        f.write(f"Total de títulos: {total}\n\n")
        for t in titulos:
            f.write(f"{t} ({len(t.split())} palavras)\n")

    print("Relatório gerado em relatorio.txt")


# ---------------------------------------------
# Teste rápido
# ---------------------------------------------
if __name__ == "__main__":
    url = "https://quotes.toscrape.com"
    coletar_noticias(url)
    print("Títulos já salvos:", ler_titulos())
    gerar_relatorio()

Notícia coletada: Quotes to Scrape
Títulos já salvos: ['Quotes to Scrape']
Relatório gerado em relatorio.txt


In [48]:
# =============================================
# coletor_simplificado.py
# Exercício 5 – versão mínima
#
# O que faz?
#   1) Coleta título e texto de uma página
#   2) Guarda título em noticias.txt
#   3) Mostra relatório direto no console
# =============================================

import requests
from bs4 import BeautifulSoup

# ---------------------------------------------
# Função: coletar_noticias
#   - Pega título e texto de uma URL
#   - Salva notícia em noticia.txt
#   - Acrescenta título em noticias.txt
# ---------------------------------------------
def coletar_noticias(url):
    resp = requests.get(url)
    soup = BeautifulSoup(resp.text, "html.parser")

    titulo = soup.find("h1").get_text(strip=True) if soup.find("h1") else soup.title.get_text(strip=True)
    paragrafos = [p.get_text(strip=True) for p in soup.find_all("p")]
    texto = " ".join(paragrafos) if paragrafos else "Sem conteúdo."

    with open("noticia.txt", "w", encoding="utf-8") as f:
        f.write(titulo + "\n\n" + texto)

    with open("noticias.txt", "a", encoding="utf-8") as f:
        f.write(titulo + "\n")

    print("✅ Notícia coletada:", titulo)


# ---------------------------------------------
# Função: ler_titulos
#   - Retorna lista de títulos salvos
# ---------------------------------------------
def ler_titulos():
    try:
        with open("noticias.txt", "r", encoding="utf-8") as f:
            return [linha.strip() for linha in f]
    except FileNotFoundError:
        return []


# ---------------------------------------------
# Teste rápido
# ---------------------------------------------
if __name__ == "__main__":
    url = "https://quotes.toscrape.com"
    coletar_noticias(url)

    titulos = ler_titulos()
    print("\n📌 Títulos salvos até agora:")
    for i, t in enumerate(titulos, start=1):
        print(f"{i}. {t}")

    print("\n📊 Resumo:")
    print("Total de títulos:", len(titulos))
    for t in titulos:
        print(f"- '{t}' ({len(t.split())} palavras)")

✅ Notícia coletada: Quotes to Scrape

📌 Títulos salvos até agora:
1. Quotes to Scrape
2. Quotes to Scrape

📊 Resumo:
Total de títulos: 2
- 'Quotes to Scrape' (3 palavras)
- 'Quotes to Scrape' (3 palavras)
