# <span style="color:#336699">SER-347 - Introdução à Programação para Sensoriamento Remoto</span>
<hr style="border:2px solid #0077b9;">

# <span style="color:#336699">Aula Manipulacao de Diretórios e Arquivos</span>


[<img src="https://www.python.org/static/community_logos/python-logo-master-v3-TM.png" alt="library for use commands of system in Python" width="150" align="right">](https://docs.python.org/3/library/os.html)


- Fabiano Morelli
- Gilberto Ribeiro de Queiroz
- Thales Sehn Körting

<span style="color:#336699; font-size:1.5em;">
</span>

# 1. Visão geral do Módulo OS
<hr style="border:1px solid #0077b9;">


O módulo OS é uma interface que permite interagir com o sistema operacional executando serviços ou operações básicas,  sem a necessidade de comandos específicos das diferentes plataformas ou tipos de _Sistema Operacional_ e suas muitas versões. 

Um exemplo básico de aplicação é a definição e mudança do diretório de trabalho, ou ainda ações para criar, renomear ou apagar diretórios.



In [None]:
# Importação dos módulos necessários para esta aula
import os

In [None]:
help(os)

## Definição da Pasta de Trabalho - Work Directory

A maioria dos métodos apresentados a seguir utilizam o caminho completo para endereçar um arquivo ou mesmo o diretório. Para facilitar as operações, uma boa opção é definir o diretório de trabalho como sendo o local onde estão os arquivos a serem manipulados.

Criar um diretório de trabalho temporário para cada instância do programa rodando, também é uma boa prática pois arquivos temporários podem ser criados independente de quantas instâncias estejam rodando simultâneamente.

O método **getcwd()** não espera receber nenhum parâmetro e retorna uma string com a indicação do caminho completo do diretório de trabalho atualmente ativo, conforme as definições do sistema operacional corrente. Estas definições referentes as _Variáveis de Ambiente_ do  _Sistema Operacional_ podem ser modificadas por meio do módulo **_SYS_** que não será tratado nestas aulas.  

In [None]:
print(os.getcwd())
# Exemplo da resposta do comando
# '/Users/fabianomorelli/Documents'

Para mudar o diretorio de trabalho utilizando o método **chdir** passando como parâmetro uma string do novo _caminho completo_. 

## Exemplo:

In [None]:
os.chdir("/Users/fabianomorelli/ownCloud/notebooks/dados_exemplo/")
# os.chdir(r"c:\dados\aula_07")
os.getcwd()
# Exemplo da resposta do comando
# '/Users/fabianomorelli/Documents/dados_exemplo'

<hr>
## Listar o conteúdo do Diretórios

A listagem do conteúdo de um diretório pode ser obtida por meio do método **listdir** que espera um caminho completo e devolve uma lista.

## Exemplos destes métodos:

In [None]:
os.listdir("/Users/fabianomorelli/ownCloud/notebooks/dados_exemplo/")
# os.listdir(os.getcwd())
# Exemplo da resposta do comando
# ['.DS_Store', 'foc_sev_20161010.bin', 'foc_sev_20161010.hdr']


<hr>

## Ferramentas de "Caminho" - Módulo **_path_**

Quando estamos depurando o programa ou preparando para que deixe de ser um script específico e ganhe a possibilidade de ser reutilizado em outros computadores, precisamos nos preocupar com os caminhos dos arquivos e diretórios. Para facilitar o desenvolvimento e deixar o código independente do Sistema Operacional o módulo **_path_** possui uma grande variedade de métodos para auxiliar nestas atividades.

Os problemas de endereçamento de arquivos e diretórios acontecem sempre quando trocamos entre windows e 'Unix'. 

No exemplo unix o endereço do arquivo pode ser representado pala string:
'/Users/fabianomorelli/Documents/dados_exemplo/foc_sev_20161010.bin'

Este mesmo endereço no windows pode ser representado pela seguinte string:
'c:\fabianomorelli\Documents\dados_exemplo\foc_sev_20161010.bin'

Note que existe uma diferença na direção da barra separadora das pastas além do fato que em windows temos a representação da unidade de disco que está sendo utilizada para armazenar o arquivo.

## Exemplo de métodos

**_abspath_** = Utliza o caminho do diretorio de trabalho para criar uma string com o caminho completo até o arquivo que foi referenciado.

**_join_** = Junta dois ou mais partes de um caminho inserindo o separador quando nessesário, pois nunca é adicionado o separador final, pois o método não diferencia se estamos informando o nome de um diretório ou de um arquivo. Para forçar a formação da string terminada com o separador o último elemento indicado deve ser uma string vazia.

**_split_** = Método que corta a cadeia de caracteres em duas partes. Normalmente a primeira parte representada pelo caminho com todos os diretórios e a segunda parte que representa o nome do arquivo ou a última parte da string sem separador.

**_splitext_** = É um método que também separa a cadeia de caracteres em duas partes, sendo a primeira parte o caminho completo e nome do arquivo, seguido pela extensão do arquivo na segunda parte.

In [None]:
# Exemplo da utilização do método abspath
# utilizar o nome de um dos arquivos retonados no comando anterior,
# para criar uma variável com o caminho completo do arquivo.

file = os.path.abspath('foc_sev_20161010.bin')

In [None]:
# Verificação do conteúdo da variável criada
print(file)

In [None]:
# Criação de uma variável para remover apenas o nome do arquivo da variável file
# Notar que neste exemplo está sendo utilizado o método split de uma string e não do módulo path

nome = file.split("/")[-1]

In [None]:
# Exemplo da utilização do método join
# os.path.join('/Users/fabianomorelli/Documents', 'dados_exemplo')
# note que a saída é uma string concatenando as partes para formar um caminho válido para o Sistema Operacional

os.path.join(os.getcwd(), 'dados_saida')

In [None]:
# Exemplo da utilização do método split
# os.path.split('/Users/fabianomorelli/Documents/dados_exemplo/foc_sev_20161010.bin')
os.path.split(file)

In [None]:
# Exemplo da utilização do método dirname
# para extrair o caminho da variável file

os.path.dirname(file)

In [None]:
# Exemplo da utilização do método basename
# utilizado para extarir o nome completo do arquivo da variável file

os.path.basename(file)

In [None]:
# Exemplo da utilização do método splitext
# utilizado para extarir a extensão do nome completo do arquivo definido na variável file

os.path.splitext(nome)

<hr>
## Criação de Diretórios
Para criar um novo diretório o módulo **_OS_** possui o método **mkdir** que funciona independente do sistema operacional. Porém caso seja necessário criar uma árvore de diretórios completa pode ser utilizado o método **makedirs**.


## Exemplos destes métodos:

In [None]:
# Exemplo da utilização do método mkdir
# utilizado para criar um diretório dentro do espaço de trabalho corrente.
# Para verificar o local de trabalho utilizar os.getcwd()

os.mkdir("teste")

In [None]:
# Utilizar o comando abaixo para verificar o conteúdo do diretório de trabalho.

os.listdir(os.getcwd())
# Exemplo da resposta do comando
# ['.DS_Store', 'foc_sev_20161010.bin', 'foc_sev_20161010.hdr', 'teste']

In [None]:
# Exemplo da utilização do método makedirs
# utilizado para criar um caminho completo com todos os diretórios dentro do espaço de trabalho corrente.

os.makedirs("novos_dados/tmp/csv")

<hr>
## Removendo de Diretórios

Existem dois métodos semelhantes para apagar **rmdir** e **removedirs**, podem ser utilizados para apagar um único diretório e o segundo para toda a árvore.


## Exemplos destes métodos:

In [None]:
os.listdir(os.getcwd())
# Exemplo da resposta do comando
# ['.DS_Store', 'foc_sev_20161010.bin', 'foc_sev_20161010.hdr', 'novos_dados', 'teste']

In [None]:
# Exemplo da utilização do método removedirs
# utilizado para apagar um caminho completo com todos os diretórios dentro do espaço de trabalho corrente.


os.removedirs("novos_dados/tmp/csv")
# Lembrar que se o diretório não estiver vazio o comando não irá ser executado com sucesso.

In [None]:
os.listdir(os.getcwd())

In [None]:
os.rmdir("teste")

In [None]:
os.listdir(os.getcwd())

# Visão Geral do módulo SHUTIL

Quando é necessário mover ou efetuar a cópia de um arquivo é recomendado utilizar o módulo shutil que possui as mesmas funcionalidades do módulo **_OS_** porém um conjunto de recursos extras que foram extendidos aos métodos padrão.

O método **copyfile** recebe como parâmetros o caminho completo do dado que será copiado seguido pelo caminho completo do arquivo destino. Todos as pastas do caminho devem existir para que a operação possa ser concluída com exito.

## Exemplos:

In [3]:
import shutil

In [None]:
# O método abaixo espera como parâmetros o nome do arquivo de origem seguido pelo nome destino
shutil.copyfile("foc_sev_20161010.hdr", "/tmp/modelo.hdr")

In [None]:
os.listdir(os.getcwd())

# Visão Geral do módulo GLOB

O módulo GLOB ajuda encontrar os arquivos dentro de um diretório por meio filtros com uso de caracteres curingas que podem ser utilizados para filtrar a lista a ser gerada. O método **_glob_** recebe o caminho completo e o conjunto de caracteres que será utilizado no filtro. 

**Dica**: Utilizar o filtro entre asteriscos (ex: "*modis*") para filtrar todos os arquivos com a palavra modis, o métido é sensível a tipografia, ou seja, faz diferença entre maiúscula e minúscula.

In [8]:
import glob

In [None]:
 lst = glob.glob("*d?")

In [None]:
lst.sort()
print lst

# Exercícios
<hr>
## Exercício 1 -  Criar uma lista com nome dos arquivos do diretorio dados_exemplo que foi criado com a extração do arquivo compactado com o mesmo nome, e imprimir cada nome dos arquivos com extensão .bin

In [10]:
# Complete aqui seu código


['foc_sev_20161010.bin',
 'foc_sev_20161010.txt',
 'foc_sev_20161011.bin',
 'foc_sev_20161013.bin',
 'foc_sev_20161012.bin',
 'foc_sev_20161015.bin',
 'foc_sev_20161014.bin',
 'foc_sev_20161010.hdr',
 'foc_sev_20161010.bin.aux.xml']

<hr>
## Exercício 2 - Criar uma copia do arquivo modelo.hdr para cada arquivo foc_sev\*bin, de tal maneira que no diretorio dos dados exista um par de arquivos para cada data, por exemplo:
['foc_sev_20161010.bin','foc_sev_20161010.hdr']

In [11]:
# Complete aqui seu código


<hr>
## Exercício 3 - Desenvolva um trecho de código para imprimir a seguinte string:
**'O arquivo foc_sev_20161010.bin é do dia juliano 284 do ano 2016' **

## sendo que o nome do arquivo, o dia juliano e o ano devem ser extraídos de cada arquivo do diretório de trabalho dos arquivos de exemplo.

In [None]:
# Complete aqui seu código
