# Manipulação de Arquivos em Python

In [61]:
import os
from datetime import datetime
import shutil

### Definindo métodos

In [2]:
# Definir cor da função print
class color:
    PURPLE = '\033[95m'
    CYAN = '\033[96m'
    DARKCYAN = '\033[36m'
    BLUE = '\033[94m'
    GREEN = '\033[92m'
    YELLOW = '\033[93m'
    RED = '\033[91m'
    ORANGE = '\033[33m'
    BOLD = '\033[1m'
    UNDERLINE = '\033[4m'
    END = '\033[0m'

In [12]:
# Retorna diretório de Data Sets
def setDatasetPath():

    return './datasets/'

In [4]:
# Método para leitura de arquivo (todo conteúdo)
def readFileContent(filename):
    try:
        fileobject = open(filename, "r", encoding='utf-8')
        print(color.BOLD+color.BLUE+'\nO conteúdo do arquivo '+filename+' é: \n'+color.END)
        if fileobject.mode == 'r':
            filecontents = fileobject.read()
            print(filecontents) # imprime o conteúdo lido
        fileobject.close()
    except FileNotFoundError:
        print(color.BOLD+color.RED+'\nErro ao tentar ler o arquivo! \nO arquivo '+filename+' não existe!'+color.END)

In [5]:
# Método para leitura do arquivo (ler cada uma das linhas e inserir em uma lista)
def readFileLines(filename):
    try:
        print(color.BOLD+color.BLUE+'\nAs linhas do arquivo '+filename+' são: \n'+color.END)
        fileobject = open(filename, 'r', encoding='utf-8')
        filelines = fileobject.readlines()
        
        numline = 1
        # Imprimir o número da linha
        for line in filelines:
            print('Linha '+str(numline)+': '+line, end='')
            numline += 1

        fileobject.close()
    except FileNotFoundError:
        print(color.BOLD+color.RED+'\nErro ao tentar ler o arquivo! \nO arquivo '+filename+' não existe!'+color.END)

In [26]:
# Método para alteração de arquivo
def appendFile(filename):
    fileobject = open(filename, "a", encoding='utf-8')
    fileobject.write('\n')
    fileobject.write('\nOlá pessoal!')
    now = datetime.now()
    date_time = now.strftime('%d/%m/%Y, %H:%M:%S')
    fileobject.write('\n--> Hoje é: '+str(date_time))
    fileobject.write('\n\n')
    fileobject.write('Olá pessoal!')
    fileobject.write('\n--> Hoje é: '+str(date_time))
    
    fileobject.close()


In [7]:
# Método para escrita de arquivo
def writeFile(filename):
    fileobject = open(filename, 'w', encoding='utf-8')
    fileobject.write('Abri o arquivo '+filename+' em modo de escrita!')
    now = datetime.now()
    date_time = now.strftime('%d/%m/%Y, %H:%M:%S')
    fileobject.write('--> Hoje é: '+str(date_time))

    fileobject.close()

In [8]:
# Método para criação de arquivo
def createFile(filename):
    try:
        fileobject = open(filename, 'x', encoding='utf-8')
        fileobject.write('Este é um novo arquivo criado usando o modo de criação!')
        
        fileobject.close()
    except FileExistsError:
        print('\nErro ao tentar criar arquivo! \nO arquivo '+filename+' já existe!')

### Executar os métodos em $main()$

In [13]:
# Verificar o diretório
datasetPath = setDatasetPath()
datasetPath

'./datasets/'

In [14]:
# Define arquivo para leitura
filename = datasetPath + 'arquivoTextoRead.txt'

# Imprimir texto com alinhamento ao centro
print(color.CYAN+'Será lido o seguinte arquivo: '+color.END+filename)

[96mSerá lido o seguinte arquivo: [0m./datasets/arquivoTextoRead.txt


In [19]:
# Tudo de uma vez
readFileContent(filename)

[1m[94m
O conteúdo do arquivo ./datasets/arquivoTextoRead.txt é: 
[0m
Exemplo de coleta de dados em arquivos de texto.

Escritor: Machado de Assis
Nome completo: Joaquim Maria Machado de Assis
Nacionalidade: Brasileira
Natural de: Rio de Janeiro
Nascimento: 21 de junho de 1839
Morte: 29 de setembro de 1908 (69 anos)
Cônjuge: Carolina Augusta Xavier de Novais (1869-1904)
Ocupação: Escritor, jornalista, contista, cronista, dramaturgo e poeta
Movimento literário: Romantismo, Realismo
Fonte: https://pt.wikipedia.org/wiki/Machado_de_Assis


In [20]:
# Linha a linha
readFileLines(filename)

[1m[94m
As linhas do arquivo ./datasets/arquivoTextoRead.txt são: 
[0m
Linha 1: Exemplo de coleta de dados em arquivos de texto.
Linha 2: 
Linha 3: Escritor: Machado de Assis
Linha 4: Nome completo: Joaquim Maria Machado de Assis
Linha 5: Nacionalidade: Brasileira
Linha 6: Natural de: Rio de Janeiro
Linha 7: Nascimento: 21 de junho de 1839
Linha 8: Morte: 29 de setembro de 1908 (69 anos)
Linha 9: Cônjuge: Carolina Augusta Xavier de Novais (1869-1904)
Linha 10: Ocupação: Escritor, jornalista, contista, cronista, dramaturgo e poeta
Linha 11: Movimento literário: Romantismo, Realismo
Linha 12: Fonte: https://pt.wikipedia.org/wiki/Machado_de_Assis

### Append em um arquivo que já existe</h2>

In [31]:
# Abrir o arquivo em modo de alteração (append)
filename = datasetPath + 'arquivoTextoAppend1.txt'
# Conferindo conteúdo
readFileContent(filename)

[1m[94m
O conteúdo do arquivo ./datasets/arquivoTextoAppend1.txt é: 
[0m



In [32]:
# Invocando Append
appendFile(filename)

In [33]:
# Ler o resultado
readFileContent(filename)

[1m[94m
O conteúdo do arquivo ./datasets/arquivoTextoAppend1.txt é: 
[0m


Olá pessoal!
--> Hoje é: 28/07/2020, 14:36:54

Olá pessoal!
--> Hoje é: 28/07/2020, 14:36:54


### Criar uma arquivo e fazer append

In [34]:
filename = datasetPath + 'arquivoTextoAppend2.txt'
readFileContent(filename)

[1m[91m
Erro ao tentar ler o arquivo! 
O arquivo ./datasets/arquivoTextoAppend2.txt não existe![0m


In [35]:
appendFile(filename)
readFileContent(filename)

[1m[94m
O conteúdo do arquivo ./datasets/arquivoTextoAppend2.txt é: 
[0m


Olá pessoal!
--> Hoje é: 28/07/2020, 14:40:57

Olá pessoal!
--> Hoje é: 28/07/2020, 14:40:57


### Escrever em um arquivo existente

In [38]:
filename = datasetPath + 'arquivoTextoWrite1.txt'
readFileContent(filename)

[1m[94m
O conteúdo do arquivo ./datasets/arquivoTextoWrite1.txt é: 
[0m
Abri o arquivo ./datasets/arquivoTextoWrite1.txt em modo de escrita!--> Hoje é: 28/07/2020, 14:44:23


In [40]:
writeFile(filename)
readFileContent(filename)

[1m[94m
O conteúdo do arquivo ./datasets/arquivoTextoWrite1.txt é: 
[0m
Abri o arquivo ./datasets/arquivoTextoWrite1.txt em modo de escrita!--> Hoje é: 28/07/2020, 14:44:33


### Escrever em um arquivo não existente

In [41]:
filename = datasetPath + 'arquivoTextoWrite2.txt'
readFileContent(filename)

[1m[91m
Erro ao tentar ler o arquivo! 
O arquivo ./datasets/arquivoTextoWrite2.txt não existe![0m


In [42]:
writeFile(filename)
readFileContent(filename)

[1m[94m
O conteúdo do arquivo ./datasets/arquivoTextoWrite2.txt é: 
[0m
Abri o arquivo ./datasets/arquivoTextoWrite2.txt em modo de escrita!--> Hoje é: 28/07/2020, 14:48:13


### Listar arquivos do diretório

In [48]:
working_dir = os.getcwd()
print(f'O diretório de trabalho é: {color.BLUE}{working_dir}{color.END}')

O diretório de trabalho é: [94m/home/vcwild/Projects/igti/data-science/notebooks[0m


### Ler arquivos do diretório

In [49]:
filelist = os.listdir(datasetPath)
print(f'A lista de arquivos e/ou diretórios é: \n{color.BLUE}{filelist}{color.END}')

A lista de arquivos e/ou diretórios é: 
[94m['arquivoTextoAppend2.txt', 'arquivoTextoWrite2.txt', 'arquivoTextoAppend1.txt', 'arquivoTextoWrite1.txt', 'arquivoTextoRead.txt'][0m


### Ler o conteúdo de cada arquivo do diretório

In [57]:
for filename in os.listdir(datasetPath):
    if os.path.isfile(os.path.join(datasetPath, filename)):
        fullfilename = datasetPath + filename
        try:
            print(color.BOLD+'\nLendo conteúdo do arquivo: '+color.END+color.CYAN+fullfilename+color.END)
            fileobject = open(fullfilename, 'r', encoding='utf-8')
            if fileobject.mode == 'r':
                filecontents = fileobject.read()
                print(filecontents)
            fileobject.close()
        except FileNotFoundError:
            print(color.BOLD+color.RED+'\nErro: Arquivo não existe! \n'+color.END)
    else:
        print(color.BOLD+color.BLUE+'\n'+filename+' é um diretório!'+color.END)

[1m[94m
target é um diretório![0m
[1m
Lendo conteúdo do arquivo: [0m[96m./datasets/arquivoTextoAppend2.txt[0m


Olá pessoal!
--> Hoje é: 28/07/2020, 14:40:57

Olá pessoal!
--> Hoje é: 28/07/2020, 14:40:57
[1m
Lendo conteúdo do arquivo: [0m[96m./datasets/arquivoTextoWrite2.txt[0m
Abri o arquivo ./datasets/arquivoTextoWrite2.txt em modo de escrita!--> Hoje é: 28/07/2020, 14:48:13
[1m
Lendo conteúdo do arquivo: [0m[96m./datasets/arquivoTextoAppend1.txt[0m


Olá pessoal!
--> Hoje é: 28/07/2020, 14:36:54

Olá pessoal!
--> Hoje é: 28/07/2020, 14:36:54
[1m
Lendo conteúdo do arquivo: [0m[96m./datasets/arquivoTextoWrite1.txt[0m
Abri o arquivo ./datasets/arquivoTextoWrite1.txt em modo de escrita!--> Hoje é: 28/07/2020, 14:44:33
[1m
Lendo conteúdo do arquivo: [0m[96m./datasets/arquivoTextoRead.txt[0m
Exemplo de coleta de dados em arquivos de texto.

Escritor: Machado de Assis
Nome completo: Joaquim Maria Machado de Assis
Nacionalidade: Brasileira
Natural de: Rio de Janeiro


### Remover todos arquivos de um diretório

In [52]:
# Listar o diretório destino
folder = setDatasetPath() +'target/'
folder

'./datasets/target/'

In [59]:
# Listar arquivos existentes no diretório
filelist = os.listdir(folder)
filelist

['arquivoTextoAppend2.txt',
 'arquivoTextoWrite2.txt',
 'arquivoTextoAppend1.txt',
 'arquivoTextoWrite1.txt',
 'arquivoTextoRead.txt']

In [60]:
for filename in os.listdir(folder):
    try:
        if os.path.isfile(os.path.join(folder, filename)):
            filepath = os.path.join(folder, filename)
            os.unlink(filepath)
    except Exception as error:
        print(f'Falha ao excluir {color.CYAN}{filepath}{color.END}\nRazão da falha: {color.BLUE}{error}{color.END}')

filelist = os.listdir(folder)
print('\nLista de arquivos após a exclusão: ', sep='')
print(filelist)


Lista de arquivos após a exclusão: 
[]


### Movendo arquivos entre pastas

In [63]:
folderSource = setDatasetPath() + 'src/'
folderTarget = setDatasetPath() + 'target/'
sourceList = os.listdir(folderSource)
targetList = os.listdir(folderTarget)

print('Arquivos na origem: ', sep='')
print(sourceList)
print('Arquivos no destino: ',sep='')
print(targetList)

Arquivos na origem: 
['arquivoTextoAppend2.txt', 'arquivoTextoRead.txt']
Arquivos no destino: 
[]


In [65]:
for filename in sourceList:
    try:
        if os.path.isfile(os.path.join(folderSource, filename)):
            filepath = os.path.join(folderSource, filename)
            shutil.move(filepath, folderTarget)
    except Exception as error:
        print(f'Falha ao excluir {color.CYAN}{filepath}{color.END}\nRazão da falha: {color.BLUE}{error}{color.END}')

sourceList = os.listdir(folderSource)
targetList = os.listdir(folderTarget)

print('Arquivos na origem: ', sep='')
print(sourceList)
print('Arquivos no destino: ',sep='')
print(targetList)

Arquivos na origem: 
[]
Arquivos no destino: 
['arquivoTextoAppend2.txt', 'arquivoTextoRead.txt']


### Copiando arquivos entre diretórios

In [66]:
sourceList = os.listdir(folderSource)
targetList = os.listdir(folderTarget)

for filename in targetList:
    try:
        if os.path.isfile(os.path.join(folderTarget, filename)):
            origin = os.path.join(folderTarget, filename)
            destination = os.path.join(folderSource, filename)
            shutil.copy(origin, destination)
    except Exception as error:
        print(f'Falha ao excluir {color.CYAN}{filepath}{color.END}\nRazão da falha: {color.BLUE}{error}{color.END}')

sourceList = os.listdir(folderSource)
targetList = os.listdir(folderTarget)

print('Arquivos na origem: ', sep='')
print(sourceList)
print('Arquivos no destino: ',sep='')
print(targetList)

Arquivos na origem: 
['arquivoTextoAppend2.txt', 'arquivoTextoRead.txt']
Arquivos no destino: 
['arquivoTextoAppend2.txt', 'arquivoTextoRead.txt']


### Renomeando arquivo

In [69]:
filenameSource = 'arquivoTexto.txt'
filenameTarget = 'arquivoTextoRenomeado.txt'

old_file = os.path.join(folderTarget, filenameSource)
new_file = os.path.join(folderTarget, filenameTarget)

filelist = os.listdir(folderTarget)
print('\nLista de Arquivos: ', sep='')
print(filelist)


Lista de Arquivos: 
['arquivoTextoAppend2.txt', 'arquivoTextoRead.txt', 'arquivoTexto.txt']


In [70]:
os.rename(old_file, new_file)
filelist = os.listdir(folderTarget)
print('\nLista de arquivos após renomear: ', sep='')
print(filelist)


Lista de arquivos após renomear: 
['arquivoTextoRenomeado.txt', 'arquivoTextoAppend2.txt', 'arquivoTextoRead.txt']
