# 📖 Abrindo Arquivos em Python: Teoria e Prática

Este notebook cobre a manipulação de arquivos em Python, incluindo conceitos teóricos, exemplos básicos e avançados, e uso da biblioteca `pandas` para manipulação de arquivos estruturados.

## 📝 Parte 1: Teoria e Conceitos Fundamentais

Em Python, a manipulação de arquivos é feita usando a função `open()`, que permite **ler, escrever e manipular arquivos** no sistema.

### 📌 Modos de Abertura de Arquivos

| Modo  | Descrição |
|--------|-------------------------------|
| `"r"`  | Leitura (modo padrão). O arquivo deve existir. |
| `"w"`  | Escrita. Sobrescreve o conteúdo do arquivo se ele já existir. |
| `"a"`  | Acrescenta conteúdo ao final do arquivo. Se não existir, cria um novo. |
| `"x"`  | Cria um novo arquivo. Retorna erro se o arquivo já existir. |
| `"b"`  | Modo binário (usado para arquivos como imagens e PDFs). |
| `"t"`  | Modo de texto (padrão). |

A sintaxe básica é:

```python
arquivo = open("meuarquivo.txt", "r")
conteudo = arquivo.read()
arquivo.close()
```

Para evitar esquecer de fechar o arquivo, use `with open()`, que fecha o arquivo automaticamente:

```python
with open("meuarquivo.txt", "r") as arquivo:
    conteudo = arquivo.read()
```

## ✏ Parte 2: Exemplos Simples

In [6]:
with open("../exemplo.txt", "w", encoding="utf-8") as f:
    pass  # Apenas cria o arquivo sem escrever nada

In [5]:
# 1️⃣ Lendo um Arquivo Texto Inteiro
with open("../data/texto.txt", "r", encoding="utf-8") as arquivo:
    conteudo = arquivo.read()
    print(conteudo)

Nome: João da Silva
Idade: 32 anos
Cidade: São Paulo
Profissão: Engenheiro de Software

Nome: Maria Oliveira
Idade: 28 anos
Cidade: Rio de Janeiro
Profissão: Designer Gráfico

Nome: Pedro Santos
Idade: 40 anos
Cidade: Belo Horizonte
Profissão: Analista de Dados

Este é um arquivo de exemplo contendo informações de diferentes pessoas.
Cada bloco contém nome, idade, cidade e profissão.



In [110]:
# 2️⃣ Lendo um Arquivo Linha por Linha
with open("../data/texto.txt", "r", encoding="utf-8") as arquivo:
    for linha in arquivo:
        print(linha.strip())

Nome: João da Silva
Idade: 32 anos
Cidade: São Paulo
Profissão: Engenheiro de Software

Nome: Maria Oliveira
Idade: 28 anos
Cidade: Rio de Janeiro
Profissão: Designer Gráfico

Nome: Pedro Santos
Idade: 40 anos
Cidade: Belo Horizonte
Profissão: Analista de Dados

Este é um arquivo de exemplo contendo informações de diferentes pessoas.
Cada bloco contém nome, idade, cidade e profissão.


In [111]:
# 3️⃣ Escrevendo em um Arquivo (Sobrescrevendo)
with open("../data/saida.txt", "w", encoding="utf-8") as arquivo:
    arquivo.write("Escrevendo minha primeira linha em um arquivo!\n")
    arquivo.write("E esta é a segunda linha.")

In [112]:
with open("../data/saida.txt", "r", encoding="utf-8") as arquivo:
    conteudo = arquivo.read()
    print(conteudo)

Escrevendo minha primeira linha em um arquivo!
E esta é a segunda linha.


In [113]:
# 4️⃣ Acrescentando Texto em um Arquivo Existente
with open("../data/saida.txt", "a", encoding="utf-8") as arquivo:
    arquivo.write("\nAgora estou adicionando mais conteúdo ao final!")

## 🏗 Parte 3: Exemplos Mais Complexos

In [7]:
# 6️⃣ Contar a Frequência de Palavras em um Arquivo Texto
from collections import Counter

with open("../data/texto.txt", "r", encoding="utf-8") as arquivo:
    palavras = arquivo.read().split()
    # print(palavras)
    contagem = Counter(palavras)
    # print(contagem)

print(contagem.most_common(5))

[('de', 5), ('Nome:', 3), ('Idade:', 3), ('anos', 3), ('Cidade:', 3)]


CSV: comma separator value

In [8]:
# 7️⃣ Manipulando Arquivos CSV sem Pandas
import csv

with open("../data/dados.csv", "r", encoding="utf-8") as arquivo:
    leitor = csv.reader(arquivo)
    for linha in leitor:
        print(linha)

['Nome', 'Idade', 'Cidade', 'Profissão', 'Salário']
['João da Silva', '32', 'São Paulo', 'Engenheiro de Software', '12000']
['Maria Oliveira', '28', 'Rio de Janeiro', 'Designer Gráfico', '7500']
['Pedro Santos', '40', 'Belo Horizonte', 'Analista de Dados', '9500']
['Ana Souza', '35', 'Curitiba', 'Gerente de Projetos', '13500']
['Carlos Mendes', '29', 'Porto Alegre', 'Desenvolvedor Web', '8500']
['Fernanda Lima', '41', 'Brasília', 'Cientista de Dados', '14500']


In [117]:
# Escrevendo um CSV sem Pandas
dados = [
    ["Nome", "Idade", "Cidade"],
    ["Ana", 25, "São Paulo"],
    ["Carlos", 30, "Rio de Janeiro"]
]

with open("saida.csv", "w", newline='', encoding="utf-8") as arquivo:
    escritor = csv.writer(arquivo)
    escritor.writerows(dados)

In [10]:
with open("../data/saida.csv", "r", newline='', encoding="utf-8") as arquivo:
    conteudo = csv.reader(arquivo)
    for linha in conteudo:
        print(linha)

FileNotFoundError: [Errno 2] No such file or directory: '../data/saida.csv'

In [119]:
# 8️⃣ Trabalhando com JSON
import json

dados = {
    "nome": "João",
    "idade": 30,
    "cidade": "Curitiba"
}

# Salvando um dicionário em JSON
with open("dados.json", "w", encoding="utf-8") as arquivo:
    json.dump(dados, arquivo, indent=4)

# Lendo JSON
with open("dados.json", "r", encoding="utf-8") as arquivo:
    dados_carregados = json.load(arquivo)

print(dados_carregados)

{'nome': 'João', 'idade': 30, 'cidade': 'Curitiba'}


## 📊 Parte 4: Manipulação de Arquivos com Pandas

In [11]:
# 9️⃣ Lendo um CSV com Pandas
import pandas as pd

df = pd.read_csv("../data/dados.csv", encoding="utf-8") # modo 'r'
df.head(2)

Unnamed: 0,Nome,Idade,Cidade,Profissão,Salário
0,João da Silva,32,São Paulo,Engenheiro de Software,12000
1,Maria Oliveira,28,Rio de Janeiro,Designer Gráfico,7500


In [12]:
# 🔟 Salvando um DataFrame como CSV
df.to_csv("../data/saida_pandas.csv", index=False, encoding="utf-8") # modo 'w'

In [18]:
# 1️⃣1️⃣ Lendo um Arquivo JSON com Pandas
df_json = pd.read_json("../data/dados.json", orient="index")
df_json

FileNotFoundError: File ../data/dados.json does not exist

In [14]:
# 1️⃣2️⃣ Salvando um DataFrame em JSON
df_json.to_json("../data/saida.json", orient="records", indent=4)

NameError: name 'df_json' is not defined

In [15]:
with open("../data/saida.json", "r", encoding="utf-8") as arquivo:
    dados_carregados = json.load(arquivo)
    print(dados_carregados)

FileNotFoundError: [Errno 2] No such file or directory: '../data/saida.json'

In [125]:
# 1️⃣3️⃣ Filtrando Dados de um CSV
df_filtrado = df[df["Idade"] > 35]  # Filtra apenas pessoas com mais de 25 anos
df_filtrado

Unnamed: 0,Nome,Idade,Cidade,Profissão,Salário
2,Pedro Santos,40,Belo Horizonte,Analista de Dados,9500
5,Fernanda Lima,41,Brasília,Cientista de Dados,14500


In [16]:
# 1️⃣4️⃣ Criando um Novo CSV Apenas com Colunas Específicas
df_cols = df[["Nome", "Idade"]]
df_cols.to_csv("../data/nomes_idades.csv", index=False) # modo 'w'

In [17]:
df_subset = pd.read_csv("../data/nomes_idades.csv")
df_subset.head(3)

Unnamed: 0,Nome,Idade
0,João da Silva,32
1,Maria Oliveira,28
2,Pedro Santos,40


## 🎯 Resumo e Conclusão

✔ Python permite abrir arquivos de texto, CSV e JSON facilmente com `open()`.

✔ Para arquivos grandes, ler **linha por linha** evita o consumo excessivo de memória.

✔ O **modo de abertura (`r`, `w`, `a`, `b`)** define o comportamento ao acessar o arquivo.

✔ `csv` e `json` são módulos úteis para manipular arquivos estruturados.

✔ `pandas` facilita a análise e transformação de arquivos CSV e JSON.