## üéì **Aula sobre: Introdu√ß√£o √† Leitura de Arquivos e Lendo Arquivos TXT em Python**

 <br>

### üß≠ Sum√°rio da Aula

| # | Sub-t√≥pico                    | Tempo Estimado | Complexidade |
|---|-------------------------------|----------------|--------------|
| 1 | Ficha de Revis√£o R√°pida       | ~1 min         | ‚≠ê           |
| 2 | Mergulho Profundo             | ~15 min        | ‚≠ê‚≠ê‚≠ê‚≠ê      |
| 3 | Profundezas e Conex√µes        | ~3 min         | ‚≠ê‚≠ê        |
| 4 | A√ß√£o e Verifica√ß√£o            | ~5 min         | ‚≠ê‚≠ê        |
| 5 | Mergulhos Adicionais          | Opcional       | ‚≠ê‚≠ê‚≠ê‚≠ê      |

 <br>

---
 <br>


### 1. üß† Ficha de Revis√£o R√°pida | (O Essencial)

> Para ler um arquivo TXT em Python, use a fun√ß√£o `open(caminho, modo)` para obter um *file object* e chame m√©todos como `read()`, `readline()` ou `readlines()`.  
> N√£o esque√ßa de fechar o arquivo com `close()`, ou prefira o *gerenciador de contexto* `with open(...) as f:` que fecha automaticamente.


### 2. üî¨ Mergulho Profundo | (Os Detalhes)

#### **üéØ O Conceito Central**  
- `open(path, mode='r', encoding='utf-8')` abre o arquivo; modos comuns: `'r'` (leitura), `'w'` (escrita), `'a'` (append), `'b'` (bin√°rio).  
- M√©todos de leitura:  
  - `f.read(n)` l√™ at√© *n* caracteres ou todo o conte√∫do se omitido.  
  - `f.readline()` l√™ uma linha por vez.  
  - `f.readlines()` retorna lista de todas as linhas.  
- O *ponteiro de arquivo* avan√ßa conforme leitura; use `f.seek(pos)` e `f.tell()` para controlar posi√ß√£o.  
- O *gerenciador de contexto* (`with`) garante fechamento mesmo em erros.

 <br>

#### **üîó Analogia de Data Science**  
Ao carregar um dataset CSV grande, voc√™ pode ler em *blocos* (`chunks`) para n√£o carregar tudo na mem√≥ria. Em textos, carregar peda√ßos evita estouro de mem√≥ria e permite processar streaming de logs ou arquivos de texto extensos.


### **üíª Exemplos de Mercado (Abrangentes)**

#### **N√≠vel Simples: Lendo todo o arquivo de uma vez**


In [None]:
f = open("/content/meu_arquivo.txt", "r", encoding="utf-8")
conteudo = f.read()
f.close()
print(conteudo)


In [29]:
# Pratique seu c√≥digo aqui!

f = open("/content/meu_arquivo.txt", "r", encoding="utf-8")
conteudo = f.read()
f.close()
print(conteudo)


esse √© meu arquivo
essa √© outra linha do arquivo


*   **O que o c√≥digo faz:** Abre `dados.txt`, l√™ todo o texto e fecha o arquivo.  
*   **Cen√°rio de Mercado:** Scripts r√°pidos que trabalham com arquivos pequenos de configura√ß√£o ou logs recentes.  
*   **Boas Pr√°ticas:** Prefira `with` para evitar esquecer `close()`.


#### **N√≠vel Intermedi√°rio: Lendo linha a linha**


In [None]:
with open("dados.txt", "r", encoding="utf-8") as f:
    for linha in f:
        print(linha.strip())


In [32]:
# Pratique seu c√≥digo aqui!

with open("/content/meu_arquivo.txt", "r", encoding="utf-8") as f:
  for linha in f:
    print(linha.strip())

esse √© meu arquivo
essa √© outra linha do arquivo


*   **O que o c√≥digo faz:** Usa *gerenciador de contexto* e itera cada linha, removendo quebras com `.strip()`.  
*   **Cen√°rio de Mercado:** Processamento de grandes logs ou datasets de texto linha a linha.


#### **N√≠vel Avan√ßado: Usando `readlines()` e compreens√£o**


In [None]:
with open("dados.txt", "r", encoding="utf-8") as f:
    linhas = [linha.strip() for linha in f.readlines()]
print(linhas)


In [34]:
# Pratique seu c√≥digo aqui!

with open("/content/meu_arquivo.txt", encoding="utf-8") as f:
    linhas = [linha.strip() for linha in f.readlines()]
print(linhas)



['esse √© meu arquivo', 'essa √© outra linha do arquivo']


*   **O que o c√≥digo faz:** Cria lista de linhas sem `\n` usando *list comprehension*.  
*   **Cen√°rio de Mercado:** Coleta r√°pida de dados para an√°lises explorat√≥rias.


#### **N√≠vel DEUS (1/3): Leitura em blocos (chunks)**


In [None]:
def ler_em_blocos(caminho, tamanho=1024):
    with open(caminho, "r", encoding="utf-8") as f:
        while True:
            bloco = f.read(tamanho)
            if not bloco:
                break
            processa(bloco)  # fun√ß√£o de processamento


In [39]:
# Pratique seu c√≥digo aqui!

def ler_em_blocos(caminho, tamanho=1024):
    """
    L√™ um arquivo em blocos de tamanho especificado
    """
    with open(caminho, "r", encoding="utf-8") as f:
        while True:
            bloco = f.read(tamanho)
            if not bloco:
                break
            yield bloco  # Use yield para criar um gerador

# Forma 1: Usando o gerador
print("=== Lendo em blocos ===")
for bloco in ler_em_blocos("/content/meu_arquivo.txt"):
    print(f"Bloco lido: {len(bloco)} caracteres")
    print(bloco)
    print("-" * 40)



=== Lendo em blocos ===
Bloco lido: 48 caracteres
esse √© meu arquivo
essa √© outra linha do arquivo
----------------------------------------


*   **O que o c√≥digo faz:** L√™ o arquivo em peda√ßos de 1 KB, processando cada bloco.  
*   **Cen√°rio de Mercado:** Streaming de arquivos grandes ou an√°lise de logs cont√≠nuos.


#### **N√≠vel DEUS (2/3): Controlando posi√ß√£o com `seek()` e `tell()`**


In [None]:
with open("dados.txt", "r", encoding="utf-8") as f:
    print(f.read(10))       # l√™ 10 caracteres
    pos = f.tell()          # obt√©m posi√ß√£o atual
    f.seek(pos - 5)         # volta 5 caracteres
    print(f.read(5))


In [45]:
# Pratique seu c√≥digo aqui!

with open("/content/meu_arquivo.txt", "r", encoding="utf-8", errors='ignore') as f:
  print(f.read(10))
  pos = f.tell()
  f.seek(pos - 5)
  print(f.read(5))

esse √© meu
 meu 


*   **O que o c√≥digo faz:** Demonstra leitura parcial e reposicionamento do *ponteiro de arquivo*.  
*   **Cen√°rio de Mercado:** Extra√ß√£o de campos fixos em arquivos de formato legado.


#### **N√≠vel DEUS (3/3): Lendo CSV ‚Äúna m√£o‚Äù como TXT**


In [None]:
with open("dados.csv", "r", encoding="utf-8") as f:
    header = f.readline().strip().split(",")
    for linha in f:
        valores = linha.strip().split(",")
        registro = dict(zip(header, valores))
        print(registro)


In [47]:
# Pratique seu c√≥digo aqui!

with open("/content/meu_arquivo.txt", "r", encoding="utf-8", errors='ignore') as f:
  header = f.readline().strip().split(",")
  for linha in f:
    valores = linha.strip().split(",")
    registro = dict(zip(header, valores))
    print(registro)


{'esse √© meu arquivo': 'essa √© outra linha do arquivo'}


*   **O que o c√≥digo faz:** Constr√≥i dicion√°rios a partir de linhas CSV sem usar pandas.  
*   **Cen√°rio de Mercado:** Pr√©-processamento leve antes de carregar em DataFrame.


### 3. üï∏Ô∏è Profundezas e Conex√µes

 <br>
Leitura de arquivos TXT se relaciona diretamente √† leitura de dados em *pandas* (`pd.read_csv()`), ao uso de *pathlib* para manipula√ß√£o de caminhos, e a *context managers* personalizados para recursos (sockets, conex√µes de banco). Compreender `open()` √© base para trabalhar com formatos como JSON, XML e bin√°rios.
 <br>

---
 <br>


### 4. üöÄ A√ß√£o e Verifica√ß√£o

 <br>
#### **ü§î Desafio Pr√°tico**
1. Abra um arquivo ‚Äúexemplo.txt‚Äù e leia apenas as primeiras 5 linhas.  
2. Conte quantas vezes a palavra ‚Äúerro‚Äù aparece em todo o arquivo.  
3. Leia o arquivo em blocos de 512 bytes e acumule o tamanho total lido.  
4. Use `seek()` para pular os primeiros 100 caracteres e leia os pr√≥ximos 50.  
5. Implemente um parser simples que converta linhas do tipo `chave:valor` em dicion√°rio.

 <br>
#### **‚ùì Pergunta de Verifica√ß√£o**
Por que usar `with open()` √© mais seguro do que `open()` e `close()` manuais? Quais problemas ele evita?
 <br>

---
 <br>
