# Fundamentos Python

![img](https://i.ibb.co/F6TLzYT/pythonn.png)

**[Python](https://www.python.org/)** é uma linguagem de programação que nos permite trabalhar rapidamente e integrar sistemas de forma mais eficaz.

Quer você seja novo em programação ou um desenvolvedor experiente, é fácil aprender e usar Python.

### Expressões Regulares

1. Importe o **[módulo regex](https://docs.python.org/3/library/re.html)** com `import re`.
2. Crie um objeto Regex com a função `re.compile()`. (Lembre-se de usar uma **raw string**.)
3. Passe a string que você deseja pesquisar no método `search()` do objeto Regex. Isso retorna um objeto `Match`.
4. Chame o método `group()` do objeto `Match` para retornar uma string do texto correspondido.

Todas as funções regex em Python estão no módulo **re**:

In [1]:
import re

#### Correspondendo Objetos Regex 

In [2]:
telefone_num_regex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')

t = telefone_num_regex.search('Meu número é 415-555-4242.')

print('Número de telefone encontrado: {}'.format(t.group()))

Número de telefone encontrado: 415-555-4242


#### Agrupando com Parênteses

In [4]:
telefone_num_regex = re.compile(r'(\d\d\d)-(\d\d\d-\d\d\d\d)')

t = telefone_num_regex.search('Meu número é: 415-555-4242.')

In [5]:
t.group(1)

'415'

In [6]:
t.group(2)

'555-4242'

In [7]:
t.group(0)

'415-555-4242'

In [8]:
t.group()

'415-555-4242'

Para recuperar todos os grupos de uma vez: use o método **groups()** - observe a forma plural do nome do método.

In [9]:
t.groups()

('415', '555-4242')

In [10]:
código_área, número_principal = t.groups()

In [11]:
print(código_área)

415


In [13]:
print(número_principal)

555-4242


#### Correspondendo Múltiplos Grupos com Pipe

O caracter `|` é chamado de **pipe**. 

Podemos usá-lo em qualquer lugar em que desejarmos corresponder a uma das muitas expressões. 

Por exemplo, a expressão regular `r'Batman | Superman'` corresponderá a `'Batman'` ou `'Superman'`.

In [14]:
heróis_regex = re.compile (r'Batman|Superman')
h = heróis_regex.search('Batman e Superman são membros da liga da Justiça')

In [15]:
h.group()

'Batman'

In [18]:
h2 = heróis_regex.search('Superman e Batman são membros da liga da Justiça')

In [19]:
h2.group()

'Superman'

Podemos também usar o **pipe** para corresponder a um dos vários padrões como parte de nossa regex:

In [21]:
bat_regex = re.compile(r'Bat(man|mobile|copter|bat)')

b = bat_regex.search('Batmobile sofreu danos problemáticos')

In [23]:
b.group()

'Batmobile'

In [24]:
b.group(1)

'mobile'

#### Correspondência Opcional com o Ponto de Interrogação

O `?` caractere sinaliza o grupo que o precede como uma parte opcional do padrão.

In [25]:
bat_regex = re.compile(r'Bat(wo)?man')
b1 = bat_regex.search('As Aventuras do Batman')
b1.group()

'Batman'

In [26]:
b2 = bat_regex.search('As Aventuras da Batwoman')
b2.group()

'Batwoman'

#### Correspondência de Zero ou Mais com a Estrela

O `*` (chamado de estrela ou asterisco) significa “corresponder a zero ou mais” - o grupo que precede a estrela pode ocorrer qualquer número de vezes no texto.

In [27]:
bat_regex = re.compile(r'Bat(wo)*man')

b1 = bat_regex.search('The Adventures of Batman')
b1.group()

'Batman'

In [28]:
b2 = bat_regex.search('The Adventures of Batwoman')
b2.group()

'Batwoman'

In [29]:
b3 = bat_regex.search('The Adventures of Batwowowowoman')
b3.group()

'Batwowowowoman'

#### Correspondência de Um ou Mais com o Mais

Enquanto `*` significa: “corresponder a zero ou mais”. 

O `+` (ou mais) significa “corresponder a um ou mais”. 

O grupo que precede um sinal de mais deve aparecer pelo menos uma vez. Não é opcional:

In [30]:
bat_regex = re.compile(r'Bat(wo)+man')
b1 = bat_regex.search('The Adventures of Batwoman')
b1.group()

'Batwoman'

In [31]:
b2 = bat_regex.search('The Adventures of Batwowowowoman')
b2.group()

'Batwowowowoman'

In [33]:
b3 = bat_regex.search('The Adventures of Batman')
b3 is None

True

#### Correspondendo Repetições Específicas com Chaves

Se você tem um grupo que deseja repetir um determinado número de vezes, siga o grupo em sua regex com um número entre chaves. 

Por exemplo: a regex `(Ha){3}` corresponderá à string `'HaHaHa'`, mas não corresponderá a `'HaHa'`, já que a última tem apenas duas repetições do grupo `(Ha)`.

Em vez de um número, você pode especificar um intervalo escrevendo um **mínimo**, uma vírgula e um **máximo** entre as chaves. 

Por exemplo: o regex `(Ha){3,5}` corresponderá a `'HaHaHa'`, `'HaHaHaHa'` e `'HaHaHaHaHa'`.

In [34]:
ha_regex = re.compile(r'(Ha){3}')
h1 = ha_regex.search('HaHaHa')
h1.group()

'HaHaHa'

In [35]:
h2 = ha_regex.search('Ha')
h2 is None

True

#### Correspondência Greedy e Nongreedy

As expressões regulares do Python são **greedy** por padrão, o que significa que em situações ambíguas, elas corresponderão à string mais longa possível. A versão **nongreedy** das chaves, que corresponde à menor string possível, tem a chave de fechamento seguida por um ponto de interrogação.

In [36]:
greedy_ha_regex = re.compile(r'(Ha){3,5}')
g = greedy_ha_regex.search('HaHaHaHaHa')
g.group()

'HaHaHaHaHa'

In [37]:
nongreedy_ha_regex = re.compile(r'(Ha){3,5}?')
ng = nongreedy_ha_regex.search('HaHaHaHaHa')
ng.group()

'HaHaHa'

#### O Método **findall()**

Além do método **search()**, os objetos Regex também possuem um método **findall()**. 

Enquanto **search()** retornará um **objeto Match** do primeiro texto encontrado na string pesquisada, o método **findall()** retornará as strings de cada correspondência na string pesquisada.

In [38]:
phone_num_regex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')
phone_num_regex.findall('Celular: 415-555-9999 Trabalho: 212-555-0000')

['415-555-9999', '212-555-0000']

#### Criando suas Próprias Classes de Caracteres

Há momentos em que desejamos combinar um conjunto de caracteres, mas as classes de caracteres abreviados (`\d`, `\w`, `\s` e assim por diante) são muito amplas. 

Podemos definir nossa própria classe de caracter usando colchetes. 

Por exemplo, a classe de caracteres `[aeiouAEIOU]` corresponderá a qualquer vogal, tanto em minúsculas quanto em maiúsculas.

In [39]:
vogais_regex = re.compile(r'[aeiouAEIOU]')

vogais_regex.findall('Rato Roeu a Roupa do Rei de Roma')

['a', 'o', 'o', 'e', 'u', 'a', 'o', 'u', 'a', 'o', 'e', 'i', 'e', 'o', 'a']

Se quisermos contar cada caracter, podemos usar o método **Counter** do módulo **[collections](https://docs.python.org/3/library/collections.html)**.

In [41]:
from collections import Counter

vogais = vogais_regex.findall('Rato Roeu a Roupa do Rei de Roma')

contador = Counter(vogais)
print(contador)

Counter({'o': 5, 'a': 4, 'e': 3, 'u': 2, 'i': 1})


Podemos também incluir intervalos de letras ou números usando um hífen. 

Por exemplo, a classe de caracteres `[a-zA-Z0-9]` corresponderá a todas as letras minúsculas, maiúsculas e números.

Ao colocar um acento circunflexo (`^`) logo após o colchete de abertura da classe de caractere, podemos fazer uma classe de caractere de negação. 

Uma classe de caractere de negação corresponderá a todos os caracteres que não estão na classe de caractere. 

Por exemplo, digite o seguinte no shell interativo:

In [44]:
consoantes_regex = re.compile(r'[^aeiouAEIOU\s]')

consoantes_regex.findall('Rato Roeu a Roupa do Rei de Roma')

['R', 't', 'R', 'R', 'p', 'd', 'R', 'd', 'R', 'm']

Novamente podemos fazer a contagem das consoantes com o método **Counter**:

In [45]:
consoantes = consoantes_regex.findall('Rato Roeu a Roupa do Rei de Roma')

c = Counter(consoantes)
print(c)

Counter({'R': 5, 'd': 2, 't': 1, 'p': 1, 'm': 1})


#### Os Caracteres Acento Circunflexo e Sinal de Dólar

- Podemos também usar o símbolo circunflexo (`^`) no início de uma regex para indicar que uma correspondência deve ocorrer no início do texto pesquisado.

- Da mesma forma, podemos colocar um cifrão (`$`) no final da regex para indicar que a string deve terminar com esse padrão de regex.

- E podemos usar `^` e `$` juntos para indicar que toda a string deve corresponder à regex, ou seja, não é suficiente para uma correspondência ser feita em algum subconjunto da string.

- A string de expressão regular `r'^ Hello'` corresponde a strings que começam com 'Hello':

In [46]:
começa_com_hello = re.compile(r'^Hello')
começa_com_hello.search('Hello world!')

<re.Match object; span=(0, 5), match='Hello'>

In [47]:
começa_com_hello.search('Ele falou Hello') is None

True

A string de expressão regular `r'\d$'` corresponde a strings que terminam com um caractere numérico de **0** a **9**:

In [48]:
string_é_número = re.compile(r'^\d+$')
string_é_número.search('1234567890')

<re.Match object; span=(0, 10), match='1234567890'>

In [49]:
string_é_número.search('12345xyz67890') is None

True

In [50]:
string_é_número.search('12 34567890') is None

True

In [51]:
string_é_número.search('1234567890') is None

False

#### O Caracter Wildcard

O caractere `.` (ou ponto) em uma expressão regular é chamado de curinga (**wildcard**) e corresponderá a qualquer caractere, exceto para uma nova linha:

In [53]:
at_regex = re.compile(r'.ato')
at_regex.findall('O gato, o pato, o mato, o jato')

['gato', 'pato', 'mato', 'jato']

#### Correspondendo Tudo com Dot-Star (.*)


In [56]:
nome_regex = re.compile(r'Nome: (.*) Sobrenome: (.*)')

In [57]:
nr = nome_regex.search('Nome: Gabriel Sobrenome: Felippe')
nr.group()

'Nome: Gabriel Sobrenome: Felippe'

In [58]:
nr.group(1)

'Gabriel'

In [60]:
nr.group(2)

'Felippe'

O **Dot-Start** (ponto-estrela) usa o modo **greedy**: 

Ele sempre tentará corresponder o máximo de texto possível. 

Para fazer a correspondência de todo e qualquer texto de maneira **nongreedy**, use o ponto, a estrela e o ponto de interrogação `(.*?)`. 

O ponto de interrogação diz ao Python para corresponder de uma forma **nongreedy**:

In [61]:
nongreedy_regex = re.compile(r'<.*?>')
ngr = nongreedy_regex.search('<Hora do Trabalho> Programação e Estudos.>')
ngr.group()

'<Hora do Trabalho>'

In [62]:
greedy_regex = re.compile(r'<.*>')
gr = greedy_regex.search('<Hora do Trabalho> Programação e Estudos.>')
gr.group()

'<Hora do Trabalho> Programação e Estudos.>'

#### Correspondendo Novas Linhas com o Caracter Dot

O **Dot-Star** (ponto-estrela) corresponderá a tudo, exceto a uma nova linha. 

Ao passarmos `re.DOTALL` como o segundo argumento para **re.compile()**, podemos fazer com que o caractere ponto corresponda a todos os caracteres, incluindo o caractere de nova linha:

In [63]:
no_newline_regex = re.compile('.*')
no_newline_regex.search('Rato\nRoeu\nRoupa\nRei\nRoma').group()

'Rato'

In [64]:
newline_regex = re.compile('.*', re.DOTALL)
newline_regex.search('Rato\nRoeu\nRoupa\nRei\nRoma').group()

'Rato\nRoeu\nRoupa\nRei\nRoma'

#### Revisão dos Símbolos de Expressões Regulares

| Símbolo                   | Correspondência                                                |
| ------------------------ | ------------------------------------------------------ |
| `?`                      | zero ou um do grupo anterior.                          |
| `*`                      | zero ou mais do grupo anterior.                        |
| `+`                      | um ou mais do grupo anterior.                          |
| `{n}`                    | exatamente **n** do grupo anterior.                    |
| `{n,}`                   | **n** ou mais do grupo anterior.                       |
| `{,m}`                   | **0** a **m** do grupo anterior.                       |
| `{n,m}`                  | pelo menos **n** e no máximo **m** do **p** anteior    |
| `{n,m}?` or `*?` or `+?` | executa uma combinação **nongreedy** do **p**.         |
| `^spam`                  | significa que a string deve começar com spam.          |
| `spam$`                  | significa que a string deve terminar com spam.         |
| `.`                      | qualquer caractere, exceto caracteres de nova linha.   |
| `\d`, `\w`, and `\s`     | um dígito, palavra ou caractere de espaço, respectivamente.      |
| `\D`, `\W`, and `\S`     | qualquer coisa, exceto um dígito, palavra ou espaço, respectivamente. |
| `[abc]`                  | qualquer caractere entre colchetes (como a, b, c).   |
| `[^abc]`                 | qualquer caractere que não esteja entre colchetes.   |

#### Correspondência Case-Insensitive

Para tornar o regex insensível a maiúsculas e minúsculas, podemos passar `re.IGNORECASE` ou `re.I` como um segundo argumento para **re.compile()**:

In [65]:
robocop = re.compile(r'robocop', re.I)
robocop.search('Robocop is part man, part machine, all cop.').group()

'Robocop'

In [66]:
robocop.search('ROBOCOP protects the innocent.').group()

'ROBOCOP'

In [67]:
robocop.search('Al, why does your programming book talk about robocop so much?').group()

'robocop'

#### Substituindo Strings com o Método **sub()**

O método **sub()** para objetos Regex recebe dois argumentos:

1. O primeiro argumento é uma string para substituir quaisquer correspondências.
2. A segunda é a string para a expressão regular.

O método **sub()** retorna uma string com as substituições aplicadas:

In [68]:
names_regex = re.compile(r'Agent \w+')
names_regex.sub('CENSORED', 'Agent Alice gave the secret documents to Agent Bob.')

'CENSORED gave the secret documents to CENSORED.'

Outro exemplo:

In [72]:
agent_names_regex = re.compile(r'Agent (\w)\w*')
agent_names_regex.sub(r'\1****', 'Agent Alice told Agent Carol that Agent Eve knew Agent Bob was a double agent.')

'A**** told C**** that E**** knew B**** was a double agent.'

#### Gerenciando Expressões Regulares Complexas

Para dizer à função **re.compile()** para ignorar espaços em branco e comentários dentro da string de expressão regular, o “modo verboso” pode ser ativado passando a variável `re.VERBOSE` como o segundo argumento para **re.compile()**.

Agora, em vez de uma expressão regular difícil de ler como esta:

In [73]:
phone_regex = re.compile(r'((\d{3}|\(\d{3}\))?(\s|-|\.)?\d{3}(\s|-|\.)\d{4}(\s*(ext|x|ext.)\s*\d{2,5})?)')

Podemos espalhar a expressão regular em várias linhas com comentários como este:

In [74]:
phone_regex = re.compile(r'''(
    (\d{3}|\(\d{3}\))?            # area code
    (\s|-|\.)?                    # separator
    \d{3}                         # first 3 digits
    (\s|-|\.)                     # separator
    \d{4}                         # last 4 digits
    (\s*(ext|x|ext.)\s*\d{2,5})?  # extension
    )''', re.VERBOSE)

### Manipulando Caminhos de Arquivos e Diretórios

Existem dois módulos principais em Python que lidam com a manipulação de caminhos. 

Um é o módulo `os.path` e o outro é o módulo `pathlib`. 

O módulo `pathlib` foi adicionado ao Python 3.4, oferecendo uma maneira orientada a objetos de lidar com os caminhos do sistema de arquivos.

#### Barra Invertida no Windows e Barra no OS X e Linux

No Windows, os caminhos são gravados com barras invertidas (`\`) como separador entre os nomes das pastas. 

Em sistemas operacionais baseados em Unix, como macOS, Linux e BSDs, a barra (`/`) é usada como separador de caminho. 

Unir caminhos pode ser uma dor de cabeça se seu código precisar funcionar em plataformas diferentes.

Felizmente, Python oferece maneiras fáceis de lidar com isso. Mostraremos como lidar com isso com `os.path.join` e `pathlib.Path.joinpath`

Usando `os.path.join` no Unix:

In [77]:
import os 
os.path.join('usr', 'bin', 'spam')

'/usr/bin/spam'

Usando `pathlib` no Unix:

In [78]:
from pathlib import Path
print(Path('usr').joinpath('bin').joinpath('spam'))

usr/bin/spam


`pathlib` também fornece um atalho para **joinpath** usando o operador `/`:

In [79]:
print(Path('usr') / 'bin' / 'spam')

usr/bin/spam


Observe que o separador de caminho é diferente entre o Windows e o sistema operacional baseado em Unix, é por isso que devemos optar em usar um dos métodos acima em vez de adicionar strings para juntar caminhos.

Juntar caminhos é útil se você precisar criar caminhos de arquivo diferentes no mesmo diretório.

Usando `os.path.join` no Unix:

In [148]:
my_files = ['accounts.txt', 'details.csv', 'invite.docx']

for filename in my_files:
    print(os.path.join('/home/gabriel', filename))

/home/gabriel/accounts.txt
/home/gabriel/details.csv
/home/gabriel/invite.docx


Usando `pathlib` no Unix:

In [81]:
my_files = ['accounts.txt', 'details.csv', 'invite.docx']
home = Path.home()
for filename in my_files:
    print(home / filename)

/home/akira/accounts.txt
/home/akira/details.csv
/home/akira/invite.docx


#### O Diretório de Trabalho Atual

Usando `os` no Unix:

In [82]:
os.getcwd()

'/home/akira/Documentos/Cursos/Fundamentos de Programação'

In [149]:
os.chdir('/home/akira/Downloads')

Usando `pathlib` no Unix:

In [83]:
from os import chdir

print(Path.cwd())

/home/akira/Documentos/Cursos/Fundamentos de Programação


In [84]:
chdir('/usr/lib/python3.6')

In [85]:
print(Path.cwd())

/usr/lib/python3.6


In [150]:
chdir('/home/akira/Documentos/Cursos/Fundamentos de Programação')

In [151]:
print(Path.cwd())

/home/akira/Documentos/Cursos/Fundamentos de Programação


#### Criando Novos Diretórios

Usando `os` no Unix:

In [152]:
os.makedirs(f'{Path.cwd()}/Teste/Teste/Teste')

Usando `pathlib` no Unix:

In [88]:
cwd = Path.cwd()
print(cwd)

/home/akira/Documentos/Cursos/Fundamentos de Programação


In [89]:
(cwd / 'Teste' / 'Teste' / 'Teste').mkdir(parents=True)

#### Caminhos Relativos vs Caminhos Absolutos

Existem duas maneiras de especificar um caminho de arquivo:

1. Um caminho absoluto, que sempre começa com a pasta raiz
2. Um caminho relativo, que é relativo ao diretório de trabalho atual do programa

Existem também os diretórios (pastas) ponto (`.`) E ponto-ponto (`..`).

Essas não são pastas reais, mas nomes especiais que podem ser usados em um caminho. 

- Um único ponto (“**ponto**”) para o nome de uma pasta é a abreviação de “este diretório”. 
- Dois pontos (“**ponto-ponto**”) significa “a pasta pai”.

#### Lidando com Caminhos Absolutos e Relativos

Para ver se um caminho é um caminho absoluto.

Usando `os.path` no Unix:

In [90]:
os.path.isabs('/')

True

In [91]:
os.path.isabs('..')

False

Usando `pathlib` no Unix:

In [92]:
Path('/').is_absolute()

True

In [93]:
Path('..').is_absolute()

False

Você pode extrair um caminho absoluto com `os.path` e `pathlib`.

Usando `os.path` no Unix:

In [96]:
print(os.getcwd())
os.path.abspath('..')

/home/akira/Documentos/Cursos/Fundamentos de Programação


'/home/akira/Documentos/Cursos'

Usando `pathlib` no Unix:

In [97]:
print(Path.cwd())
print(Path('..').resolve())

/home/akira/Documentos/Cursos/Fundamentos de Programação
/home/akira/Documentos/Cursos


Você pode obter um caminho relativo de um caminho inicial para outro caminho.

Usando `os.path` no Unix:

In [98]:
os.path.relpath('/etc/passwd', '/')

'etc/passwd'

Usando `pathlib` no Unix:

In [99]:
print(Path('/etc/passwd').relative_to('/'))

etc/passwd


#### Checando a Validade de um Caminho

Verificando se um **arquivo** / **diretório** existe:

Usando `os.path` no Unix:

In [100]:
os.path.exists('.')

True

In [101]:
os.path.exists('setup.py')

False

In [102]:
os.path.exists('/etc')

True

In [103]:
os.path.exists('arquivo')

False

Usando `pathlib` no Unix:

In [104]:
Path('.').exists()

True

In [110]:
Path('FundamentosPython01.ipynb').exists()

True

In [106]:
Path('/etc').exists()

True

In [113]:
Path('arquivo_inexistente').exists()

False

#### Checando se um Caminho é um Arquivo

Usando `os.path` no Unix:

In [109]:
os.path.isfile('FundamentosPython01.ipynb')

True

In [111]:
os.path.isfile('/home')

False

In [114]:
os.path.isfile('arquivo_inexistente')

False

Usando `pathlib` no Unix:

In [115]:
Path('FundamentosPython01.ipynb').is_file()

True

In [116]:
Path('/home').is_file()

False

In [117]:
Path('arquivo_inexistente').is_file()

False

#### Checando se um Caminho é um Diretório

Usando `os.path` no Unix:

In [118]:
os.path.isdir('/')

True

In [119]:
os.path.isdir('FundamentosPython01.ipynb')

False

In [120]:
os.path.isdir('/spam')

False

Usando `pathlib` no Unix:

In [121]:
Path('/').is_dir()

True

In [122]:
Path('FundamentosPython01.ipynb').is_dir()

False

In [123]:
Path('/spam').is_dir()

False

#### Buscando Tamanho de Arquivos e Conteúdo de Diretórios

Obtendo o tamanho de um arquivo em **bytes**.

Usando `os.path` no Unix:

In [124]:
os.path.getsize('/home/akira/Documentos/Cursos/Fundamentos de Programação/FundamentosPython01.ipynb')

80994

Usando `pathlib` no Unix:

In [128]:
stat = Path('/home/akira/Documentos/Cursos/Fundamentos de Programação/FundamentosPython01.ipynb').stat()
print(stat)
print(f'Tamanho do Arquivo = {stat.st_size}')

os.stat_result(st_mode=33204, st_ino=30413514, st_dev=2049, st_nlink=1, st_uid=1000, st_gid=1000, st_size=80994, st_atime=1617083410, st_mtime=1617083409, st_ctime=1617083409)
Tamanho do Arquivo = 80994


Listando o conteúdo do diretório usando `os.listdir` no Unix:

In [129]:
cwd = os.getcwd()
os.listdir(cwd)

['FundamentosProgramaçãoPython.pdf',
 'FundamentosPython03.ipynb',
 'FundamentosPython02.ipynb',
 'Scripts',
 'FundamentosPython01.ipynb',
 '.ipynb_checkpoints',
 'Python.odp']

Listando o conteúdo do diretório usando `pathlib` no Unix:

In [131]:
for f in Path(cwd).iterdir():
    print(f)

/home/akira/Documentos/Cursos/Fundamentos de Programação/FundamentosProgramaçãoPython.pdf
/home/akira/Documentos/Cursos/Fundamentos de Programação/FundamentosPython03.ipynb
/home/akira/Documentos/Cursos/Fundamentos de Programação/FundamentosPython02.ipynb
/home/akira/Documentos/Cursos/Fundamentos de Programação/Scripts
/home/akira/Documentos/Cursos/Fundamentos de Programação/FundamentosPython01.ipynb
/home/akira/Documentos/Cursos/Fundamentos de Programação/.ipynb_checkpoints
/home/akira/Documentos/Cursos/Fundamentos de Programação/Python.odp


Para encontrar o tamanho total de todos os arquivos neste diretório:

**AVISO**: Os próprios diretórios também têm um tamanho! Portanto, você pode querer verificar se um caminho é um arquivo ou diretório usando os métodos nos métodos discutidos na seção acima!

Usando `os.path.getsize()` e `os.listdir()` juntos no Unix:

In [132]:
total_size = 0

for filename in os.listdir(cwd):
    total_size = total_size + os.path.getsize(os.path.join(cwd, filename))

In [133]:
print(total_size)

13069178


Usando `pathlib` no Unix:

In [134]:
total_size = 0

for sub_path in Path(cwd).iterdir():
    total_size += sub_path.stat().st_size

In [135]:
print(total_size)

13069178


#### Copiando Arquivos e Diretórios

O módulo `shutil` fornece funções para copiar arquivos, bem como pastas inteiras.

In [136]:
import shutil

In [139]:
os.chdir('/home/akira/Downloads')
shutil.copy('hal.png', 'hal2.png')

'hal2.png'

In [140]:
shutil.copy('market-price', 'bitcoin.csv')

'bitcoin.csv'

Enquanto `shutil.copy()` copia um único arquivo, `shutil.copytree()` copia uma pasta inteira e todas as pastas e arquivos contidos nela:

In [141]:
os.chdir('/home/akira/Downloads')
shutil.copytree('BigO', 'BigO_backup')

'BigO_backup'

#### Renomeando Arquivos 

In [146]:
shutil.move('market-price','btc.csv')

'btc.csv'

#### Deletando Arquivos e Diretórios Permanentemente

Chamar `os.unlink(path)` ou `Path.unlink()` excluirá o arquivo no caminho.

Chamar `os.rmdir(caminho)` ou `Path.rmdir()` excluirá a pasta no caminho. Esta pasta deve estar vazia de quaisquer arquivos ou pastas.

Chamar `shutil.rmtree(path)` removerá a pasta em path e todos os arquivos e pastas que ela contém também serão excluídos.

#### Caminhando por uma Árvore de Diretórios

In [147]:
for folder_name, subfolders, filenames in os.walk(cwd):
    print('O diretório atual é: {}'.format(folder_name))
    
    for subfolder in subfolders:
        print('Subdiretório de {}: {}'.format(folder_name, subfolder))
    
    for filename in filenames:
        print('Arquivo Dentro {}: {}'.format(folder_name, filename))
    
    print('')

O diretório atual é: /home/akira/Documentos/Cursos/Fundamentos de Programação
Subdiretório de /home/akira/Documentos/Cursos/Fundamentos de Programação: Scripts
Subdiretório de /home/akira/Documentos/Cursos/Fundamentos de Programação: .ipynb_checkpoints
Arquivo Dentro /home/akira/Documentos/Cursos/Fundamentos de Programação: FundamentosProgramaçãoPython.pdf
Arquivo Dentro /home/akira/Documentos/Cursos/Fundamentos de Programação: FundamentosPython03.ipynb
Arquivo Dentro /home/akira/Documentos/Cursos/Fundamentos de Programação: FundamentosPython02.ipynb
Arquivo Dentro /home/akira/Documentos/Cursos/Fundamentos de Programação: FundamentosPython01.ipynb
Arquivo Dentro /home/akira/Documentos/Cursos/Fundamentos de Programação: Python.odp

O diretório atual é: /home/akira/Documentos/Cursos/Fundamentos de Programação/Scripts
Arquivo Dentro /home/akira/Documentos/Cursos/Fundamentos de Programação/Scripts: for.py
Arquivo Dentro /home/akira/Documentos/Cursos/Fundamentos de Programação/Scripts: soma

`pathlib` fornece muito mais funcionalidades do que as listadas acima, como obter o nome do arquivo, obter a extensão do arquivo, ler / gravar um arquivo sem abri-lo manualmente, etc. 

Verifique a [documentação oficial](https://docs.python.org/3/library/pathlib.html) se quiser saber mais!

#### Abrindo e Lendo Arquivos com a Função **open()**

In [153]:
with open('hello_world.txt') as hello_file:
    conteúdo_hello = hello_file.read()

conteúdo_hello

'Hello World!'

Como alternativa, você pode usar o método **readlines()** para obter uma lista de valores de string do arquivo, uma string para cada linha de texto:

In [157]:
with open('shakespeare.txt') as sonnet_file:
    soneto = sonnet_file.readlines()

soneto

['Sonnet 1\n',
 '\n',
 'From fairest creatures we desire increase,\n',
 'That thereby beauty’s rose might never die,\n',
 'But as the riper should by time decease,\n',
 'His tender heir might bear his memory;\n',
 'But thou, contracted to thine own bright eyes,\n',
 'Feed’st thy light’s flame with self-substantial fuel,\n',
 'Making a famine where abundance lies,\n',
 'Thyself thy foe, to thy sweet self too cruel.\n',
 'Thou that art now the world’s fresh ornament\n',
 'And only herald to the gaudy spring\n',
 'Within thine own bud buriest thy content,\n',
 'And, tender churl, mak’st waste in niggarding.\n',
 'Pity the world, or else this glutton be,\n',
 'To eat the world’s due, by the grave and thee.\n']

Podemos também iterar no arquivo linha por linha:

In [158]:
with open('shakespeare.txt') as sonnet_file:
    for linha in sonnet_file:
        print(linha)

Sonnet 1



From fairest creatures we desire increase,

That thereby beauty’s rose might never die,

But as the riper should by time decease,

His tender heir might bear his memory;

But thou, contracted to thine own bright eyes,

Feed’st thy light’s flame with self-substantial fuel,

Making a famine where abundance lies,

Thyself thy foe, to thy sweet self too cruel.

Thou that art now the world’s fresh ornament

And only herald to the gaudy spring

Within thine own bud buriest thy content,

And, tender churl, mak’st waste in niggarding.

Pity the world, or else this glutton be,

To eat the world’s due, by the grave and thee.



#### Escrevendo em Arquivos

In [163]:
with open('texto.txt', 'w') as texto:
    texto.write('Escrevendo em um Arquivo com Python\n')

In [164]:
with open('texto.txt', 'a') as texto:
    texto.write('Escrevendo novamente em um Arquivo com Python')

In [165]:
with open('texto.txt') as texto:
    conteúdo = texto.read()

conteúdo

'Escrevendo em um Arquivo com Python\nEscrevendo novamente em um Arquivo com Python'

#### Lendo Arquivos ZIP

In [180]:
import zipfile

with zipfile.ZipFile('compactados.zip') as example_zip:
    print(example_zip.namelist())
    info = example_zip.getinfo('shakespeare.txt')
    print(info.file_size)
    print(info.compress_size)
    print('Arquivo comprimido é %sx menor!' % (round(info.file_size / info.compress_size, 2)))

['shakespeare.txt', 'texto.txt']
632
372
Arquivo comprimido é 1.7x menor!


#### Extraindo Arquivos ZIP

O método **extractall()** para objetos **ZipFile** extrai todos os arquivos e pastas de um arquivo ZIP para o diretório de trabalho atual:

In [181]:
with zipfile.ZipFile('compactados.zip') as example_zip:
    example_zip.extractall()

O método **extract()** para objetos ZipFile extrairá um único arquivo do arquivo ZIP:

In [182]:
with zipfile.ZipFile('compactados.zip') as example_zip:
    print(example_zip.extract('texto.txt'))
    print(example_zip.extract('texto.txt', cwd))

/home/akira/Documentos/Cursos/Fundamentos de Programação/texto.txt
/home/akira/Documentos/Cursos/Fundamentos de Programação/texto.txt


#### Criando e Adicionando Arquivos ZIP

In [183]:
with zipfile.ZipFile('hello_world.zip', 'w') as new_zip:
    new_zip.write('hello_world.txt', compress_type=zipfile.ZIP_DEFLATED)

Este código criará um novo arquivo ZIP denominado `hello_world.zip` que possui o conteúdo compactado de `hello_world.txt`.

### Arquivos JSON

Abrindo um arquivo JSON:

In [190]:
import json

with open("arquivo.json", "r") as f:
    content = json.loads(f.read())

print(content)

{'nome': 'Gabriel', 'idade': 20}


Escrevendo em um Arquivo JSON:

In [189]:
content = {"nome": "Gabriel", "idade": 20}

with open("arquivo.json", "w") as f:
    f.write(json.dumps(content, indent=2))