## Arquivos
Como vimos, teremos informação de entrada e saída no nosso programa. Seja ela extraída da web, de uma API, uma informação teclada pelo usuário, em um determinado momento iremos salvá-la em um arquivo ou em banco de dados para depois ser acessada novamente.

Neste módulo veremos como trabalhar com arquivos e diretórios no Python. Usaremos um problema para ilustrar o uso das bibliotecas.

### Problema
Temos um conjunto de imagens que foram [baixados da internet](https://unsplash.com/). Mas quando foram salvas no computador, não foi pensado em renomear estes arquivos de maneira correta a sabermos do que elas se tratam.

Assim, nosso trabalho será de renomear cada uma delas.

In [None]:
# importando as bibliotecas que usaremos
import os

In [None]:
# algums definicoes
diretorio_atual = os.path.abspath(os.curdir)
pasta_entrada = os.path.join(diretorio_atual, 'ImagensSemNome/')
pasta_saida = os.path.join(diretorio_atual, 'ImagensComNome/')

In [None]:
os.walk?

In [None]:
# para cada diretório na árvore, retornará a pasta com o diretório completo, subdiretórios e arquivos
for diretorio, subdiretorio, arquivos in os.walk('.'):
    print('----')
    print(diretorio, subdiretorio, arquivos)

In [None]:
import glob
glob.glob(os.path.join(pasta_saida,'*.jp*'))

### Lógica/algoritmo
Para podermos decifrar o que existe em cada foto eu devo (de maneira geral, não necessariamente via programação):
    
- Ir ao diretório
- [Listar as fotos e para cada foto no diretório](https://www.google.com/search?source=hp&ei=RIqkXM_sGZPA5OUPk4KHqAE&q=como+listar+arquivos+python3&btnK=Google+Search&oq=como+listar+arquivos+python3&gs_l=psy-ab.3..33i160.972.972..1898...0.0..0.183.280.1j1......0....2j1..gws-wiz.....0.i6v6S990CY8)
    - abrir a foto
    - [identificar o que é](https://www.google.com/search?ei=7IukXPHcJZ-85OUPn7SOmAU&q=machine+learning+api+google+imagens&oq=machine+learning+api+google+imagens&gs_l=psy-ab.3..33i160.47963.47963..48145...0.0..0.169.169.0j1......0....2j1..gws-wiz.7Emee_opaSw)
    - [fechar a foto e renomear o arquivo](https://www.google.com/search?ei=WIukXKi-BJjG5OUP27yKOA&q=como+renomar+um+arquivo+no+python&oq=como+renomar+um+arquivo+no+python&gs_l=psy-ab.3..0i22i30.143539.147658..147837...0.0..1.213.3774.4j28j1......0....1..gws-wiz.......0i71j0i131j0j0i67j0i70i255j0i13j0i13i30.RqvN69CDPbM)
    
Fazendo esta lógica com a programação:

In [None]:
# queremos pegar todos os arquivos da pasta ImagensSemNome
print("Diretório atual {}".format(diretorio_atual))
for arquivo in os.listdir(pasta_entrada):
    
    # só move se for arquivo de foto (existem alguns escondidos as vezes.)
    extensao = arquivo.split('.')[-1]
    if extensao not in ['jpg', 'jpeg']:
        break
        
    # abrir a foto
    print("Arquivos de entrada {}".format(arquivo))
    
    # identificar o que é
    
    # renomear o arquivo
    os.rename(os.path.join(pasta_entrada,arquivo), os.path.join(pasta_saida, 'teste_{}'.format(arquivo)))

# verificando se renomeamos
for arquivo in os.listdir(pasta_saida):
    print("Arquivos de saída {}".format(arquivo))

In [None]:
# retorna para o arquivo anterior
print("Diretório atual {}".format(diretorio_atual))
for arquivo in os.listdir(pasta_saida):
    # só move se for arquivo de foto (existem alguns escondidos as vezes.)
    extensao = arquivo.split('.')[-1]
    if extensao not in ['jpg', 'jpeg']:
        break
        
    # abrir a foto
    print("Arquivos de entrada {}".format(arquivo))
    
    # identificar o que é
    
    # renomear o arquivo
    os.rename(os.path.join(pasta_saida,arquivo), os.path.join(pasta_entrada, arquivo[len('teste_'):]))

# verificando se renomeamos
for arquivo in os.listdir(pasta_entrada):
    print("Arquivos de saída {}".format(arquivo))

Resolvemos o pequeno problema. Mas o ideal seria copiar. Vamos mais tarde trocar o código usando [copia](https://www.google.com/search?q=copiando+arquivos+python3&oq=copiando+arquivos+python3&aqs=chrome..69i57j0l4.5944j0j9&sourceid=chrome&ie=UTF-8) ao invés de rename

In [None]:
# instalando a biblioteca do Python
! pip install --upgrade google-cloud-vision

In [None]:
import io
import os

# define onde está a nossa chave
arquivo_chave = 'client_secret.json'
os.environ['GOOGLE_APPLICATION_CREDENTIALS']=os.path.join(diretorio_atual, arquivo_chave)

# importação de arquivo
from google.cloud import vision
from google.cloud.vision import types

# cria variaveis para teste
arquivo = '4.jpeg'

# inicia o cliente que chamará as apis
client = vision.ImageAnnotatorClient()

# nome do arquivo que processaremos
file_name = os.path.join(
    pasta_entrada, 
    arquivo)
print(file_name)

# carrega o arquivo de imagem na memória
with io.open(file_name, 'rb') as image_file:
    content = image_file.read()

image = types.Image(content=content)

# detecta a imagem e dá etiquetas a ela
response = client.label_detection(image=image)
labels = response.label_annotations

# imprime na tela
print('Labels:')
for label in labels:
    print(label)

![4.jpg](ImagensSemNome/4.jpeg)

Agora que temos tudo o que precisamos, vamos terminar o programa

In [None]:
import io
import os

# define onde está a nossa chave
arquivo_chave = 'client_secret.json'
os.environ['GOOGLE_APPLICATION_CREDENTIALS']=os.path.join(diretorio_atual, arquivo_chave)

# importação de arquivo
from google.cloud import vision
from google.cloud.vision import types

# inicia o cliente que chamará as apis
client = vision.ImageAnnotatorClient()

def identificaImagens(caminhoArquivo):
    """
    Identifica etiquetas (tags) associadas com uma imagem
    Args:
        caminhoArquivo: arquivo a ser identificado, com caminho completo
    Returns:
        lista com as tags, em ordem de maior certeza para menor
    """
    # nome do arquivo que processaremos    
    print("Processando Arquivo {}".format(caminhoArquivo))

    # carrega o arquivo de imagem na memória
    with io.open(caminhoArquivo, 'rb') as image_file:
        content = image_file.read()
    image = types.Image(content=content)

    # detecta a imagem e dá etiquetas a ela
    response = client.label_detection(image=image)
    labels = response.label_annotations

    # imprime na tela
    return [label.description for label in labels]

In [None]:
identificaImagens(file_name)

In [None]:
import shutil

print("Diretório atual {}".format(diretorio_atual))
for arquivo in os.listdir(pasta_entrada):
    # abrir a foto
    nome_arquivo = os.path.join(diretorio_atual, pasta_entrada, arquivo)
    
    # identificar o que é
    tags = identificaImagens(nome_arquivo)

    # acha a extensão do arquivo. Ex: file.jpg (divide no ponto e pega o último pedaço)
    extensao = arquivo.split('.')[-1]
    
    # cria o novo nome, usando as 3 primeiras tags
    novo_nome = '{}.{}'.format("-".join(tags), extensao)
    novo_nome = novo_nome.replace(" ", "_")
    novo_nome = os.path.join(pasta_saida, novo_nome)
    
    # renomear(copiar) o arquivo
    shutil.copyfile(nome_arquivo, novo_nome)
#     os.rename(nome_arquivo, novo_nome)

Mas e se quiséssemos salvar estas fotos em um [arquivo](https://www.google.com/search?q=python3+salvando+arquivo&oq=python3+salvando+arquivo&aqs=chrome..69i57.9570j0j7&sourceid=chrome&ie=UTF-8)??

In [None]:
#salvaremos a informação em um csv
arquivo_salvo = os.path.join(pasta_saida, 'lista_arquivos.csv')
with open(arquivo_salvo, 'w') as arquivo_escrita:
    for arquivo in os.listdir(pasta_entrada):
        arquivo_escrita.write(arquivo)
        
# abra o arquivo. Existe algo estranho nele?

In [None]:
# precisamos coloca um pula linha para ficar mais bonito
with open(arquivo_salvo, 'w') as arquivo_escrita:
    for arquivo in os.listdir(pasta_entrada):
        arquivo_escrita.write(arquivo+'\n')

E se quiséssemos fazer algo em colunas? (abra no excel mais tarde)

In [None]:
with open(arquivo_salvo, 'w') as arquivo_escrita:
    for i, arquivo in enumerate(os.listdir(pasta_entrada)):
        arquivo_escrita.write('{} ; {} ; {}\n'.format(i, pasta_entrada, arquivo))

In [None]:
# colocando cabeçalho 
with open(arquivo_salvo, 'w') as arquivo_escrita:
    arquivo_escrita.write('{} ; {} ; {}\n'.format('id', 'pasta de entrada', 'arquivo'))
    for i, arquivo in enumerate(os.listdir(pasta_entrada)):
        arquivo_escrita.write('{} ; {} ; {}\n'.format(i, pasta_entrada, arquivo))

Claro que no `Python` já existe alguem que precisou fazer isto e resolveu disponibilizar [algo melhor](https://www.google.com/search?q=python3+escrevendo+csv&oq=python3+&aqs=chrome.1.69i59l2j69i57j69i60l2j0.2736j0j4&sourceid=chrome&ie=UTF-8).

In [None]:
import csv

# primeiro lemos o que já haviamos escrito
with open(arquivo_salvo, 'r') as csvfile:
    arquivo = csv.reader(csvfile, delimiter=';', quotechar='"')
    for row in arquivo:
        print(', '.join(row))

In [None]:
# podemos escrever direto de uma estrutura
with open(arquivo_salvo, 'w', newline='') as f:
    writer = csv.writer(f, delimiter=",")
    linhas_excel = []
    for arquivo in os.listdir(pasta_entrada):
        linhas_excel.append([i, pasta_entrada, arquivo])
    writer.writerows(linhas_excel)