## Outros modos

Modo 'b' (binário): Utilizado para trabalhar com arquivos que não são texto, como imagens ou documentos PDF. Pode ser combinado com outros modos, como 'rb' ou 'wb'.

Modo 'x' (exclusivo): Cria e abre um arquivo apenas se ele não existir; falha se o arquivo já existir.

In [None]:
with open('dados/newfile.txt', 'x') as f:
    f.write('Novo arquivo criado!')


# Encoding

In [None]:
with open('dados/exemplo.txt', 'r', encoding='utf-8') as file:
    content = file.read()
content


'esse é um arquivo de exemplo\numa nova linha do exemplo\nNova linha no final do arquivo\nNova linha no final do arquivo\nNova linha no final do arquivo\nNova linha no final do arquivo\nNova linha no final do arquivo'

*** 
- ***Especificação de Codificação: Ao abrir o arquivo com open('livroInteiro.txt', 'r', encoding='utf-8'), você está instruindo o Python a usar UTF-8 como a codificação para ler o arquivo. Isso deve cobrir a maioria dos caracteres e símbolos que você pode encontrar em um texto.***
- ***Por que UTF-8?: UTF-8 é uma codificação de caracteres universal que suporta todos os caracteres de todos os scripts de escrita modernos, sendo bastante robusta para manipulação de dados de texto.***
***


## Desafio:
Escreva um script Python que leia um arquivo de texto, conte e conte quantas palavras diferente existem no texto e o número de ocorrencias de cada um e escreva os resultados em um novo arquivo de texto de forma ordenada.


## Manipulação Avançada de Arquivos
Além dos básicos de leitura e escrita, há mais funcionalidades do Python para trabalhar com arquivos, como manipular arquivos grandes ou realizar operações de arquivo mais complexas:

In [None]:
# Lendo grandes arquivos linha por linha 
# lazy method
qtd_palavras = 0
def process_data(data):
    """Processa os dados, contando palavras em cada pedaço."""
    # Converte os dados em string e divide em palavras
    palavras = data.split()
    # Retorna o número de palavras
    return len(palavras)

with open('dados/livroInteiro.txt', 'r', encoding='utf-8') as f:
    for linha in f:
        qtd_palavras += process_data(linha)
        
qtd_palavras        


59765

In [None]:
# O arquivo livroInteiro.txt possui apenas duas linhas
# Vou aicionar quebras de linha após cada ponto final e salvar em um novo arquivo.

# Caminho do arquivo original e do novo arquivo
original_file_path = 'dados/livroInteiro.txt'
new_file_path = 'dados/livroInteiro_Editado.txt'

# Lendo o arquivo original
with open(original_file_path, 'r', encoding='utf-8') as file:
    content = file.read()

# Adicionando quebras de linha após cada ponto final
edited_content = content.replace('. ', '.\n')

# Salvando o conteúdo editado no novo arquivo
with open(new_file_path, 'w', encoding='utf-8') as new_file:
    new_file.write(edited_content)


In [None]:

# Escrevendo em um arquivo com append
with open('dados/log.txt', 'a') as f:
    f.write('Nova entrada de log\n')


In [None]:

# Trabalhando com arquivos binários
with open('dados/imagem.png', 'rb') as f:
    dados = f.read()  # Lê todo o conteúdo binário
print(dados)

b'\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR\x00\x00\x03\xdc\x00\x00\x03\x14\x08\x06\x00\x00\x00N\xeb/\xc4\x00\x00\x00\tpHYs\x00\x00\x0e\xc4\x00\x00\x0e\xc4\x01\x95+\x0e\x1b\x00\x00\x004tEXtComment\x00xr:d:DAFRZZcekMc:26,j:43937911139,t:23032417^g\x886\x00\x00\x04\xfaiTXtXML:com.adobe.xmp\x00\x00\x00\x00\x00http://ns.adobe.com/xap/1.0/\x00<x:xmpmeta xmlns:x=\'adobe:ns:meta/\'>\n        <rdf:RDF xmlns:rdf=\'http://www.w3.org/1999/02/22-rdf-syntax-ns#\'>\n\n        <rdf:Description rdf:about=\'\'\n        xmlns:dc=\'http://purl.org/dc/elements/1.1/\'>\n        <dc:title>\n        <rdf:Alt>\n        <rdf:li xml:lang=\'x-default\'>Design sem nome - 1</rdf:li>\n        </rdf:Alt>\n        </dc:title>\n        </rdf:Description>\n\n        <rdf:Description rdf:about=\'\'\n        xmlns:Attrib=\'http://ns.attribution.com/ads/1.0/\'>\n        <Attrib:Ads>\n        <rdf:Seq>\n        <rdf:li rdf:parseType=\'Resource\'>\n        <Attrib:Created>2023-03-24</Attrib:Created>\n        <Attrib:ExtId>09cb4f5

### Trabalho com Arquivos Grandes
Leitura por Chunks: Ao trabalhar com arquivos muito grandes, pode ser útil ler o arquivo em pedaços menores (chunks).

In [None]:
def read_in_chunks(file_object, chunk_size=1024):
    """Lê um arquivo em pedaços de tamanho especificado."""
    while True:
        data = file_object.read(chunk_size)
        if not data:
            break
        yield data
def process_data(data):
    """Processa os dados, contando palavras em cada pedaço."""
    # Converte os dados em string e divide em palavras
    palavras = data.split()
    # Retorna o número de palavras
    return len(palavras)

with open('dados/livroInteiro.txt', 'r', encoding='utf-8') as f:
    total_palavras = 0
    for piece in read_in_chunks(f):
        total_palavras += process_data(piece)
    print(f"Total de palavras no arquivo: {total_palavras}")


Total de palavras no arquivo: 60016


## Exemplo de sistema que manipula arquivos

In [None]:
def ler_arquivo(nome_arquivo):
    try:
        with open(nome_arquivo, 'r') as arquivo:
            print(arquivo.read())
    except FileNotFoundError:
        print("Arquivo não encontrado.")

def adicionar_linha(nome_arquivo, texto):
    with open(nome_arquivo, 'a') as arquivo:
        arquivo.write(texto + '\n')
    print("Texto adicionado com sucesso.")

def substituir_conteudo(nome_arquivo, novo_conteudo):
    with open(nome_arquivo, 'w') as arquivo:
        arquivo.write(novo_conteudo)
    print("Conteúdo substituído com sucesso.")

def ler_linha_especifica(nome_arquivo, numero_linha):
    try:
        with open(nome_arquivo, 'r') as arquivo:
            for atual, linha in enumerate(arquivo, 1):
                if atual == numero_linha:
                    print(linha)
                    break
    except FileNotFoundError:
        print("Arquivo não encontrado.")

def menu():
    print("Gerenciador de Arquivo de Texto")
    print("1. Ler arquivo")
    print("2. Adicionar linha")
    print("3. Substituir conteúdo")
    print("4. Ler linha específica")
    print("5. Sair")

    escolha = input("Escolha uma opção: ")
    nome_arquivo = "dados/meu_arquivo.txt"

    if escolha == '1':
        ler_arquivo(nome_arquivo)
    elif escolha == '2':
        texto = input("Digite o texto a ser adicionado: ")
        adicionar_linha(nome_arquivo, texto)
    elif escolha == '3':
        novo_conteudo = input("Digite o novo conteúdo do arquivo: ")
        substituir_conteudo(nome_arquivo, novo_conteudo)
    elif escolha == '4':
        numero_linha = int(input("Digite o número da linha a ser lida: "))
        ler_linha_especifica(nome_arquivo, numero_linha)
    elif escolha == '5':
        print("Encerrando o programa.")
        return
    else:
        print("Opção inválida.")

    menu()

menu()


Gerenciador de Arquivo de Texto
1. Ler arquivo
2. Adicionar linha
3. Substituir conteúdo
4. Ler linha específica
5. Sair
The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!Nova entrada de log

Ge

# Ver também

- ## Módulo OS
  - Oferece uma maneira portátil de usar funcionalidades dependentes do sistema operacional, como criar e remover um diretório, buscar conteúdos de um diretório, etc.

- ## Módulo shutil
  - Fornece operações de alto nível em arquivos e coleções de arquivos. Inclui funções para copiar e remover arquivos.

- ### Módulo requests
  - Recursos para requisições de APIs

- ### Módulo openpyxl
  - Manipulação de arquivos excel

# EXTRAS 


### Manipulação de Diretórios com OS
- Criar Diretórios:
    - Função: os.mkdir() para criar um único diretório, os.makedirs() para criar diretórios recursivamente.

In [None]:
import os
os.mkdir('novo_diretorio')
os.makedirs('novo_diretorio/subdiretorio')


- Listar Conteúdos de um Diretório:
  - Função: os.listdir()


In [None]:
conteudos = os.listdir('.')
print(conteudos)


- Remover Diretórios:

    - Função: 
      - os.rmdir() para diretórios vazios, 
      - os.removedirs() para remover diretórios recursivamente.


In [None]:
os.rmdir('novo_diretorio')
os.removedirs('novo_diretorio/subdiretorio')

#### Manipulação de Arquivos com OS


- Renomear Arquivos:
    - Função: os.rename()


In [None]:
os.rename('original.txt', 'novo_nome.txt')


- Remover Arquivos:
    - Função: os.remove()

In [None]:

os.remove('novo_nome.txt')

### Operações de Arquivos com shutil

- Copiar Arquivos e Diretórios:
    - Funções: 
      - shutil.copy() (arquivo), 
      - shutil.copy2() (preserva metadados), 
      - shutil.copytree() (diretório).


In [None]:
import shutil
shutil.copy('source.txt', 'dest.txt')
shutil.copytree('source_dir', 'dest_dir')


- Mover Arquivos e Diretórios:
  - Função: shutil.move()


In [None]:
shutil.move('source.txt', 'new_location/')


- Deletar Diretórios:
  - Função: shutil.rmtree()


In [None]:
shutil.rmtree('dest_dir')

### os.walk():

- usar os.walk() para navegar recursivamente através de uma árvore de diretórios, permitindo operações complexas como a pesquisa e modificação de arquivos em subdiretórios.


In [None]:
import os

for dirpath, dirnames, filenames in os.walk('diretorio_raiz'):
    print(f'Explorando o diretório: {dirpath}')
    for filename in filenames:
        print(f'Arquivo encontrado: {filename}')


- Descrição: 
  - os.walk() gera três valores para cada diretório na árvore de diretórios: dirpath, dirnames, e filenames.
  - dirpath: O caminho até o diretório atual.
  - dirnames: Uma lista de subdiretórios no diretório atual.
  - filenames: Uma lista de arquivos no diretório atual.

### Arquivos Temporários
**tempfile**: Útil para criar arquivos para armazenamento temporário de dados sem afetar o sistema de arquivos permanente.

In [None]:
import tempfile
with tempfile.TemporaryFile() as temp:
    temp.write(b'Hello World')
    temp.seek(0)
    print(temp.read())


### OpenPyXL para Arquivos Excel:

openpyxl permite gerenciar arquivos Excel (.xlsx) de forma mais detalhada, incluindo acesso a células específicas, estilos, e fórmulas.

In [None]:
from openpyxl import Workbook
wb = Workbook()
ws = wb.active
ws['A1'] = 'Hello, Excel!'
wb.save('dados/example_openpyxl.xlsx')



## Ferramenta de gestão de arquivos

-  incorporar funcionalidades de backup e reversão


- **Função criar_backup**: Cria uma cópia do arquivo atual com a extensão .bak como um backup. Utiliza o módulo shutil para copiar o arquivo, garantindo que um backup seja sempre disponível caso algo dê errado durante a manipulação do arquivo.
- **Função reverter_para_backup**: Substitui o arquivo atual pelo último backup criado. Isso é útil se o usuário cometer um erro e precisar reverter para a versão anterior do arquivo.

In [None]:
import shutil

def criar_backup(nome_arquivo):
    backup_nome_arquivo = nome_arquivo + ".bak"
    try:
        shutil.copy(nome_arquivo, backup_nome_arquivo)
        print("Backup criado com sucesso.")
    except FileNotFoundError:
        print("Arquivo original não encontrado para criar backup.")

def reverter_para_backup(nome_arquivo):
    backup_nome_arquivo = nome_arquivo + ".bak"
    try:
        shutil.copy(backup_nome_arquivo, nome_arquivo)
        print("Arquivo revertido para o último backup com sucesso.")
    except FileNotFoundError:
        print("Backup não encontrado.")

def menu():
    print("Gerenciador de Arquivo de Texto")
    print("1. Ler arquivo")
    print("2. Adicionar linha")
    print("3. Substituir conteúdo")
    print("4. Ler linha específica")
    print("5. Criar backup do arquivo")
    print("6. Reverter para o último backup")
    print("7. Sair")

    escolha = input("Escolha uma opção: ")
    nome_arquivo = "meu_arquivo.txt"

    if escolha == '1':
        ler_arquivo(nome_arquivo)
    elif escolha == '2':
        texto = input("Digite o texto a ser adicionado: ")
        adicionar_linha(nome_arquivo, texto)
    elif escolha == '3':
        novo_conteudo = input("Digite o novo conteúdo do arquivo: ")
        substituir_conteudo(nome_arquivo, novo_conteudo)
    elif escolha == '4':
        numero_linha = int(input("Digite o número da linha a ser lida: "))
        ler_linha_especifica(nome_arquivo, numero_linha)
    elif escolha == '5':
        criar_backup(nome_arquivo)
    elif escolha == '6':
        reverter_para_backup(nome_arquivo)
    elif escolha == '7':
        print("Encerrando o programa.")
        return
    else:
        print("Opção inválida.")

    menu()

menu()


- Função Log

In [None]:
import datetime

def registrar_log(mensagem):
    """Registra a mensagem de log com a data e hora atuais."""
    with open("log_de_atividades.txt", "a") as log_file:
        timestamp = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
        log_file.write(f"{timestamp} - {mensagem}\n")

def ler_arquivo(nome_arquivo):
    try:
        with open(nome_arquivo, 'r') as arquivo:
            conteudo = arquivo.read()
        print(conteudo)
        registrar_log(f"Arquivo {nome_arquivo} lido com sucesso.")
    except FileNotFoundError:
        print("Arquivo não encontrado.")
        registrar_log(f"Erro ao ler: Arquivo {nome_arquivo} não encontrado.")

def adicionar_linha(nome_arquivo, texto):
    with open(nome_arquivo, 'a') as arquivo:
        arquivo.write(texto + '\n')
    print("Texto adicionado com sucesso.")
    registrar_log(f"Linha adicionada ao arquivo {nome_arquivo}.")

def substituir_conteudo(nome_arquivo, novo_conteudo):
    with open(nome_arquivo, 'w') as arquivo:
        arquivo.write(novo_conteudo)
    print("Conteúdo substituído com sucesso.")
    registrar_log(f"Conteúdo do arquivo {nome_arquivo} substituído.")

def ler_linha_especifica(nome_arquivo, numero_linha):
    try:
        with open(nome_arquivo, 'r') as arquivo:
            for atual, linha in enumerate(arquivo, 1):
                if atual == numero_linha:
                    print(linha)
                    break
        registrar_log(f"Linha {numero_linha} do arquivo {nome_arquivo} lida com sucesso.")
    except FileNotFoundError:
        print("Arquivo não encontrado.")
        registrar_log(f"Erro ao ler linha: Arquivo {nome_arquivo} não encontrado.")

# Adicione chamadas de registrar_log nas funções criar_backup e reverter_para_backup conforme necessário.

def menu():
    print("Gerenciador de Arquivo de Texto")
    print("1. Ler arquivo")
    print("2. Adicionar linha")
    print("3. Substituir conteúdo")
    print("4. Ler linha específica")
    print("5. Criar backup do arquivo")
    print("6. Reverter para o último backup")
    print("7. Sair")

    escolha = input("Escolha uma opção: ")
    nome_arquivo = "meu_arquivo.txt"

    if escolha == '1':
        ler_arquivo(nome_arquivo)
    elif escolha == '2':
        texto = input("Digite o texto a ser adicionado: ")
        adicionar_linha(nome_arquivo, texto)
    elif escolha == '3':
        novo_conteudo = input("Digite o novo conteúdo do arquivo: ")
        substituir_conteudo(nome_arquivo, novo_conteudo)
    elif escolha == '4':
        numero_linha = int(input("Digite o número da linha a ser lida: "))
        ler_linha_especifica(nome_arquivo, numero_linha)
    elif escolha == '5':
        criar_backup(nome_arquivo)
    elif escolha == '6':
        reverter_para_backup(nome_arquivo)
    elif escolha == '7':
        registrar_log("Programa encerrado.")
        print("Encerrando o programa.")
        return
    else:
        print("Opção inválida.")

    menu()

menu()


## manipular permissões de arquivos e diretórios em Python usando o módulo os
 
- crucial para a segurança e o controle de acesso nos sistemas de arquivos.


In [None]:
import os

# Definir permissões de leitura e escrita
os.chmod('example.txt', 0o644)


- Descrição: 
  - os.chmod() permite mudar as permissões de um arquivo ou diretório. 
  - O segundo argumento define as permissões desejadas usando um código octal.
    - 0o644 
      - significa que o proprietário tem permissões de leitura e escrita, enquanto outros têm apenas permissão de leitura.


- Aplicações Práticas
  - Segurança de Dados: Assegurar que arquivos sensíveis sejam acessíveis apenas por usuários autorizados.
  - Automatização de Configurações: Aplicar configurações de permissão padrão a arquivos em instalações de software ou durante a inicialização de projetos.