# Aula 1: Introdução ao Manuseio de Arquivos em Python

In [None]:

# Montando o Google Drive
from google.colab import drive
drive.mount('/content/drive')


### Leitura de Arquivos de Texto

In [None]:
# Abrindo o arquivo no modo de leitura ('r')
with open('exemplo.txt', 'r') as arquivo:
    # Lendo todo o conteúdo do arquivo
    conteudo = arquivo.read()
    print(conteudo)

### Escrita em um arquivo de texto

In [None]:
# Abrindo o arquivo no modo de escrita ('w')
with open('novo_arquivo.txt', 'w') as arquivo:
    # Escrevendo conteúdo no arquivo
    arquivo.write('Este é um novo arquivo.\n')
    arquivo.write('Aqui está outra linha de texto.\n')

### Adicionando conteúdo a um arquivo existente

In [None]:
# Abrindo o arquivo no modo de adição ('a')
with open('novo_arquivo.txt', 'a') as arquivo:
    # Adicionando uma nova linha ao arquivo
    arquivo.write('Esta linha foi adicionada ao arquivo.\n')

### Leitura de um arquivo linha por linha

In [None]:
# Abrindo o arquivo no modo de leitura
with open('exemplo.txt', 'r') as arquivo:
    # Lendo o arquivo linha por linha
    for linha in arquivo:
        print(linha.strip())  # O strip() remove espaços em branco extras


### Leitura e Escrita em Modo Binário

In [1]:
# Leitura de um arquivo de imagem em modo binário
with open('imagem.jpg', 'rb') as arquivo_binario:
    conteudo_binario = arquivo_binario.read()
    print(conteudo_binario[:10])  # Exibe os primeiros 10 bytes



FileNotFoundError: [Errno 2] No such file or directory: 'imagem.jpg'

###  Leitura de grandes arquivos CSV em chunks com Pandas

In [None]:
import pandas as pd

# Definindo o tamanho do chunk (quantidade de linhas por bloco)
chunksize = 100000

# Leitura do arquivo CSV em partes menores
for chunk in pd.read_csv('grande_arquivo.csv', chunksize=chunksize):
    # Processando o chunk (exemplo: calculando a média de uma coluna)
    media = chunk['coluna_exemplo'].mean()
    print(f"Média da coluna_exemplo: {media}")


### Escrita de um grande DataFrame em vários arquivos CSV

In [None]:
import pandas as pd

# Criando um grande DataFrame (exemplo)
df_grande = pd.DataFrame({
    'coluna1': range(1, 100001),
    'coluna2': range(100001, 200001)
})

# Dividindo o DataFrame em partes menores e salvando em múltiplos arquivos
chunksize = 20000
for i, chunk in enumerate(range(0, len(df_grande), chunksize)):
    df_chunk = df_grande.iloc[chunk:chunk + chunksize]
    df_chunk.to_csv(f'saida_parte_{i + 1}.csv', index=False)
    print(f"Escrevendo parte {i + 1}")


###  Leitura e escrita de arquivos Excel com múltiplas planilhas

In [None]:
import pandas as pd

# Leitura de um arquivo Excel com várias planilhas
arquivo_excel = pd.ExcelFile('exemplo_multiplas_planilhas.xlsx')

# Iterando sobre as planilhas e processando cada uma
for nome_planilha in arquivo_excel.sheet_names:
    df = pd.read_excel(arquivo_excel, sheet_name=nome_planilha)
    print(f"Processando planilha: {nome_planilha}")
    print(df.head())  # Exibe as primeiras linhas de cada planilha
