## 🎓 **Aula sobre: Introdução à Leitura de Arquivos e Lendo Arquivos TXT em Python**

 <br>

### 🧭 Sumário da Aula

| # | Sub-tópico                    | Tempo Estimado | Complexidade |
|---|-------------------------------|----------------|--------------|
| 1 | Ficha de Revisão Rápida       | ~1 min         | ⭐           |
| 2 | Mergulho Profundo             | ~15 min        | ⭐⭐⭐⭐      |
| 3 | Profundezas e Conexões        | ~3 min         | ⭐⭐        |
| 4 | Ação e Verificação            | ~5 min         | ⭐⭐        |
| 5 | Mergulhos Adicionais          | Opcional       | ⭐⭐⭐⭐      |

 <br>

---
 <br>


### 1. 🧠 Ficha de Revisão Rápida | (O Essencial)

> Para ler um arquivo TXT em Python, use a função `open(caminho, modo)` para obter um *file object* e chame métodos como `read()`, `readline()` ou `readlines()`.  
> Não esqueça de fechar o arquivo com `close()`, ou prefira o *gerenciador de contexto* `with open(...) as f:` que fecha automaticamente.


### 2. 🔬 Mergulho Profundo | (Os Detalhes)

#### **🎯 O Conceito Central**  
- `open(path, mode='r', encoding='utf-8')` abre o arquivo; modos comuns: `'r'` (leitura), `'w'` (escrita), `'a'` (append), `'b'` (binário).  
- Métodos de leitura:  
  - `f.read(n)` lê até *n* caracteres ou todo o conteúdo se omitido.  
  - `f.readline()` lê uma linha por vez.  
  - `f.readlines()` retorna lista de todas as linhas.  
- O *ponteiro de arquivo* avança conforme leitura; use `f.seek(pos)` e `f.tell()` para controlar posição.  
- O *gerenciador de contexto* (`with`) garante fechamento mesmo em erros.

 <br>

#### **🔗 Analogia de Data Science**  
Ao carregar um dataset CSV grande, você pode ler em *blocos* (`chunks`) para não carregar tudo na memória. Em textos, carregar pedaços evita estouro de memória e permite processar streaming de logs ou arquivos de texto extensos.


### **💻 Exemplos de Mercado (Abrangentes)**

#### **Nível Simples: Lendo todo o arquivo de uma vez**


In [None]:
f = open("/content/meu_arquivo.txt", "r", encoding="utf-8")
conteudo = f.read()
f.close()
print(conteudo)


In [29]:
# Pratique seu código aqui!

f = open("/content/meu_arquivo.txt", "r", encoding="utf-8")
conteudo = f.read()
f.close()
print(conteudo)


esse é meu arquivo
essa é outra linha do arquivo


*   **O que o código faz:** Abre `dados.txt`, lê todo o texto e fecha o arquivo.  
*   **Cenário de Mercado:** Scripts rápidos que trabalham com arquivos pequenos de configuração ou logs recentes.  
*   **Boas Práticas:** Prefira `with` para evitar esquecer `close()`.


#### **Nível Intermediário: Lendo linha a linha**


In [None]:
with open("dados.txt", "r", encoding="utf-8") as f:
    for linha in f:
        print(linha.strip())


In [32]:
# Pratique seu código aqui!

with open("/content/meu_arquivo.txt", "r", encoding="utf-8") as f:
  for linha in f:
    print(linha.strip())

esse é meu arquivo
essa é outra linha do arquivo


*   **O que o código faz:** Usa *gerenciador de contexto* e itera cada linha, removendo quebras com `.strip()`.  
*   **Cenário de Mercado:** Processamento de grandes logs ou datasets de texto linha a linha.


#### **Nível Avançado: Usando `readlines()` e compreensão**


In [None]:
with open("dados.txt", "r", encoding="utf-8") as f:
    linhas = [linha.strip() for linha in f.readlines()]
print(linhas)


In [34]:
# Pratique seu código aqui!

with open("/content/meu_arquivo.txt", encoding="utf-8") as f:
    linhas = [linha.strip() for linha in f.readlines()]
print(linhas)



['esse é meu arquivo', 'essa é outra linha do arquivo']


*   **O que o código faz:** Cria lista de linhas sem `\n` usando *list comprehension*.  
*   **Cenário de Mercado:** Coleta rápida de dados para análises exploratórias.


#### **Nível DEUS (1/3): Leitura em blocos (chunks)**


In [None]:
def ler_em_blocos(caminho, tamanho=1024):
    with open(caminho, "r", encoding="utf-8") as f:
        while True:
            bloco = f.read(tamanho)
            if not bloco:
                break
            processa(bloco)  # função de processamento


In [39]:
# Pratique seu código aqui!

def ler_em_blocos(caminho, tamanho=1024):
    """
    Lê um arquivo em blocos de tamanho especificado
    """
    with open(caminho, "r", encoding="utf-8") as f:
        while True:
            bloco = f.read(tamanho)
            if not bloco:
                break
            yield bloco  # Use yield para criar um gerador

# Forma 1: Usando o gerador
print("=== Lendo em blocos ===")
for bloco in ler_em_blocos("/content/meu_arquivo.txt"):
    print(f"Bloco lido: {len(bloco)} caracteres")
    print(bloco)
    print("-" * 40)



=== Lendo em blocos ===
Bloco lido: 48 caracteres
esse é meu arquivo
essa é outra linha do arquivo
----------------------------------------


*   **O que o código faz:** Lê o arquivo em pedaços de 1 KB, processando cada bloco.  
*   **Cenário de Mercado:** Streaming de arquivos grandes ou análise de logs contínuos.


#### **Nível DEUS (2/3): Controlando posição com `seek()` e `tell()`**


In [None]:
with open("dados.txt", "r", encoding="utf-8") as f:
    print(f.read(10))       # lê 10 caracteres
    pos = f.tell()          # obtém posição atual
    f.seek(pos - 5)         # volta 5 caracteres
    print(f.read(5))


In [45]:
# Pratique seu código aqui!

with open("/content/meu_arquivo.txt", "r", encoding="utf-8", errors='ignore') as f:
  print(f.read(10))
  pos = f.tell()
  f.seek(pos - 5)
  print(f.read(5))

esse é meu
 meu 


*   **O que o código faz:** Demonstra leitura parcial e reposicionamento do *ponteiro de arquivo*.  
*   **Cenário de Mercado:** Extração de campos fixos em arquivos de formato legado.


#### **Nível DEUS (3/3): Lendo CSV “na mão” como TXT**


In [None]:
with open("dados.csv", "r", encoding="utf-8") as f:
    header = f.readline().strip().split(",")
    for linha in f:
        valores = linha.strip().split(",")
        registro = dict(zip(header, valores))
        print(registro)


In [47]:
# Pratique seu código aqui!

with open("/content/meu_arquivo.txt", "r", encoding="utf-8", errors='ignore') as f:
  header = f.readline().strip().split(",")
  for linha in f:
    valores = linha.strip().split(",")
    registro = dict(zip(header, valores))
    print(registro)


{'esse é meu arquivo': 'essa é outra linha do arquivo'}


*   **O que o código faz:** Constrói dicionários a partir de linhas CSV sem usar pandas.  
*   **Cenário de Mercado:** Pré-processamento leve antes de carregar em DataFrame.


### 3. 🕸️ Profundezas e Conexões

 <br>
Leitura de arquivos TXT se relaciona diretamente à leitura de dados em *pandas* (`pd.read_csv()`), ao uso de *pathlib* para manipulação de caminhos, e a *context managers* personalizados para recursos (sockets, conexões de banco). Compreender `open()` é base para trabalhar com formatos como JSON, XML e binários.
 <br>

---
 <br>


### 4. 🚀 Ação e Verificação

 <br>
#### **🤔 Desafio Prático**
1. Abra um arquivo “exemplo.txt” e leia apenas as primeiras 5 linhas.  
2. Conte quantas vezes a palavra “erro” aparece em todo o arquivo.  
3. Leia o arquivo em blocos de 512 bytes e acumule o tamanho total lido.  
4. Use `seek()` para pular os primeiros 100 caracteres e leia os próximos 50.  
5. Implemente um parser simples que converta linhas do tipo `chave:valor` em dicionário.

 <br>
#### **❓ Pergunta de Verificação**
Por que usar `with open()` é mais seguro do que `open()` e `close()` manuais? Quais problemas ele evita?
 <br>

---
 <br>
