# Fundamentos Python
---

## Funções e arquivos

### O que você vai aprender nesta aula?

- Funções
    - Definir nções
    - Funções como objetos
    - Argumentos padrão
    - Invocar funções pelos nomes dos argumentos (keyword arguments)
    - Empacotamento e desempacotamento de argumentos

- Arquivos
    - Como ler e escrever arquivos
    - Trabalhando com arquivos CSV (Comma-separated values)

# Funções

### Definindo funções

Nas aulas anteriores já usamos e definimos algumas funções. 

Nesta aula revisaremos como essas coisas acontecem e aprofundaremos o assunto.

In [None]:
# Função que dobra um número

In [None]:
# Chamando a função

Vale notar que o Python não faz checagem de tipos, então podemos usar nossa função `dobra()` com outros tipos de argumentos:

In [None]:
# Teste com string

In [None]:
# Teste com lista...

Uma função pode receber mais de um parâmetro:

In [None]:
# FUnção que recebe 4 argumentos/parâmetros

In [None]:
# Somandoo 4 inteiros...

In [None]:
# Somandoo 4 caracteres (str)...

A documentação de funções é feita utilizando `docstring`. 

*p.s.: Essa é uma boa prática no processo de desenvolvimento, independentemente da linguagem (documentação).*

In [None]:
# Exemplo de função fatorial
def fatorial(n):
    """ Retorna o fatorial de n (n!)"""
    return 1 if n < 1 else n * fatorial(n - 1)

In [None]:
# Exemplos de chamadas...

### Funções como objetos

Funções em python podem ser tratadas como outros objetos (no jargão formal diz-se que funções são *objetos de primeira classe*)

In [None]:
# Atribuindo a função a uma variavel `fat`...

In [None]:
# Verificando objeto..

In [None]:
# Tipo do objeto...

É possível acessar atributos desse objeto function:

In [None]:
# Exembplo de atributo __doc__ (docstring)

Para conhecermos os atributos e métodos de um objeto `function` podemos usar a função `dir()` que retorna os métodos atributos de um objeto

In [None]:
# `Lista de metodos e atributos do objeto `fat`

Os métodos e atributos envoltos em \__ são conhecidos como Métodos Mágicos ou Métodos Dunder (Double UNDERline) e serão vistos em detalhes durante as aulas de Orientação a Objetos

In [None]:
# Atributo __name__

É possível acessar o metadados e o bytecode dessas funções:

In [None]:

fat.__code__

In [None]:
dir(fat.__code__)

In [None]:
# Nome da função (compilada - __code__.co_name)

In [None]:
# Lista de parametros da funcao (compilada - __code__.co_varnames

Bytecode:

In [None]:
# Bytecode (__code__.co_code)

### Valores padrões de argumentos (default arguments)
O Python permite a atribuição de valores padrão para argumentos de uma função. Ao chamar essa função esses argumentos são opcionais, sendo utilizado o valor padrão fornecido na definição da função.

Por exemplo vamos criar uma função que converte um valor em dólar para real com o preço do dólar como argumento com valor padrão:

In [None]:
# Criar funcao dolar_para_real (dolar=5.15)

Para calular um preço de um produto de, por exemplo, U$89,00 só precisamos passar esse valor:

Supondo que queiramos calcular o preço do produto no ano passado quando o valor do dólar estava menor:

Muitas funções da biblioteca padrão usam argumentos padrão para simplificar e extender seus usos. Muita funções que vimos neste curso fazem isso, como,  por  exemplo a função `str.split()`.

Para mostrar isso vamos recorrer a sua documentação que é invocada ao passar essa função como argumento para a função `help()`:

In [None]:
help(str.split)

Como visto a função split possui dois argumentos com valores padrão: separador e número máximo de splits. Por padrão o separador é um espaço em branco e o número máximo de splits é todos os possíveis, como podemos observar neste exemplo:

In [None]:
'Frase sem sentido algum para ser usada como exemplo'.split()

Podemos mudar esse comportamento passando outros argumentos:

In [None]:
frase = 'Frase sem sentido algum para ser usada como exemplo'
frase.split(' ', 1)  # somente 1 split foi feito gerando uma lista de dois elementos

In [None]:
url = 'www.dominio.com.br'
url.split('.')

In [None]:
url.split('.', 1)  # para separar somente o www do resto

Outra função que também faz isso é a função `open()` usada para abrir arquivos:

In [None]:
# Abrindo arquivo (nome do arquivo e modo abertura 'w'  = escrita)

# arquivo aberto

In [None]:
# fechando arquivo

In [None]:
# por padrão o modo de abertura é 'r' (leitura)

# arquivo (modo leitura)

In [None]:
# fechando arquivo

Veremos mais sobre esta função ainda nesta aula.

**Cuidado com argumentos padrões!**

Os argumentos padrões de funções são executados apenas uma vez e isso pode causar alguns comportamentos "estranhos".

Suponhamos que queremos criar uma função `anexa()` que adiciona um elemento a uma lista e, se a lista não for passada, criamos uma nova:

In [None]:
def anexa(elemento, lista=[]):
    lista.append(elemento)
    return lista

In [None]:
anexa(1)

In [None]:
anexa(2)

In [None]:
anexa(3)

Como dito anteriormente o valor do argumento da lista `[]` (que cria uma lista) é executado apenas uma vez, portanto a mesma lista é usada sempre que chamamos a função `anexa()`. Para criarmos uma nova lista quando não nos é passado uma fazemos:

In [None]:
def anexa(elemento, lista=None):
    if not lista:
        lista = []
    lista.append(elemento)
    return lista

Desse jeito criamos uma nova lista cada vez que a função é executada:

In [None]:
lista = anexa(10)
lista

In [None]:
anexa(5)

In [None]:
anexa(20, lista)
lista

Como já vimos anteriormente (porém não foi explicado como) o Python permite que os argumentos da função sejam chamados por seu nome e não somente por sua posição:

In [None]:
anexa(elemento=100, lista=[1, 2, 3])

In [None]:
'Exemplo de split chamado pelo nome dos argumentos'.split(sep=' ', maxsplit=-1)

#### Exemplo de uso de argumentos nomeados: biblioteca datetime

Uma função da biblioteca padrão do Python que faz uso extensivo de argumentos padrões é a `timedelta()` da biblioteca datetime (que trabalha com datas e horários). Essa função é usada para representar durações, diferenças entre datas ou horários:

In [None]:
from datetime import date, timedelta
hoje = date.today()
hoje  # objeto do tipo date

In [None]:
hoje.year, hoje.month, hoje.day  # atributos de date: day, month e year

foo

In [None]:
# amanhã (hoje + timdelta de 1 dias)

In [None]:
# ontem (hoje - timdelta de 1 dias)

In [None]:
# depois de amanhã

In [None]:
# antes de ontem

In [None]:
# semana que vem

In [None]:
# mês que vem

`timedelta()` também pode ser usado com datetimes (data e hora):

In [None]:
from datetime import datetime

agora = datetime.now()
agora

In [None]:
agora.year, agora.month, agora.day, agora.hour, agora.minute, agora.second, agora.microsecond

In [None]:
# daqui uma hora (agora + timedelta de 1 horas)

In [None]:
# uma hora atrás

In [None]:
# daqui 2 horas e meia

Subtrair dates e datetimes gera objetos timedelta que representam a diferença de tempo entre os dois:

In [None]:
daqui_a_pouco = agora + timedelta(minutes=15, seconds=45)
daqui_a_pouco - agora

Chamar funções dando nomes aos seus argumentos, em conjunto com bons nomes de funções e argumentos, é uma ótima forma de aumentar a **LEGIBILIDADE** de seu código.

### Empacotamento e desempacotamento de argumentos de funções

A criação de funções com argumentos arbitrários é feita usando o conceito de empacotamento de argumentos. Algumas funções da biblioteca padrão do Python usam esse conceito:

In [None]:
max(1, 2)  # funciona com 2 argumentos

In [None]:
max(1, 2, 3)  # 3 argumentos

In [None]:
max(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18)  # muitos argumentos

O que acontece é que esses vários argumentos são empacotados para uma tupla e então a partir dessa tupla de elementos é possível encontrar o máximo.

A funcão `sum()` que soma os elementos de uma sequência não suporta argumentos abritrários, vamos fazer uma versão dessa função que suporte isso:

In [None]:
sum(1, 2, 3, 4)  # não suporta

O empacotamento de argumentos é feito na definição dos argumentos da função usando o operador `*`, conforme é mostrado a seguir. Vamos começar analisando o resultado desse argumento para depois implementar a funcionalidade de soma:

In [None]:
# Criando a função soma, que *empacota uma lista de numeros arbitrarios
# - Mostrar o tipo do argumento
# - Mostrar os valores contidos no argumento

Só para não haver dúvidas: **`*numeros` não é um ponteiro**. O que realmente acontece é que os valores recebidos ao invocar a função `soma()` serão empacotados para o argumento `numeros`.

In [None]:
# Somando -1, 0, 1

Nesse exemplo a função `soma()` foi chamada com os valores -1, 0, 1 que foram empacotados na tupla numeros. Sabendo disso podemos calcular a soma desses elementos:

In [None]:
# Implementando a função soma (utilizando laço de repetição)

In [None]:
# Exemplo com 4 digitos

É possível criar função que receba alguns argumentos fixos e argumentos arbitrários:

In [None]:
def foo(bar, *baz):
    print(type(bar), type(baz))
    print('bar: {}, baz: {}'.format(bar, baz))

In [None]:
foo(1, 2, 3, 4, 5)

In [None]:
foo([1, 2, 3], 10, 'aba', False, (1, 2, 3))

Do mesmo jeito que empacotamos argumentos recebidos na chamada de uma função podemos desempacotar argumentos para enviar as funções:

In [None]:
numeros = -1, 0, 10
max(*numeros)

No exemplo anterior **desempacotamos** a tupla com os valores -1, 0, 10 e, ao invés de enviar uma tupla, mandamos cada um deles como um argumento separado. Para deixar esse conceito claro criaremos uma função que recebe argumentos desempacotados:

In [None]:
def soma(a, b, c):
    """ Soma três números a, b, e c (a + b + c) """
    return a + b + c

Normalmente faríamos:

In [None]:
soma(1, 2, 3)

Porém podemos desempacotar uma sequência de 3 elementos e enviá-los para a função:

In [None]:
números = -1, 0, 1
soma(*números)

Se a lista for maior ou menor uma exceção será levantada:

In [None]:
# MENOS argumentos que necessário...

In [None]:
# MAIS argumentos que necessário...

Para ficar mais claro ainda vamos criar uma função que deve receber, obrigatoriamente, três argumentos fixos e, opcionalmente, quantos mais valores forem enviados:

In [None]:
def foo(a, b, c, *args):
    print('a: {} {}'.format(a, type(a)))
    print('b: {} {}'.format(b, type(b)))
    print('c: {} {}'.format(c, type(c)))
    print('*args: {} {}'.format(args, type(args)))

In [None]:
args = ['foobarbaz', False, 10]
foo(*args)

Ao receber argumentos empacotados, como feito na função `foo(a, b, c, *args)`, permitimos o envio de uma quantidade arbitrária de argumentos. Isso inclui o envio de *nenhum* argumento, por esse motivos as funções embutidas `min()` e `max()` definem dois argumentos fixos e depois recebem mais argumentos empacotados:

In [None]:
min(10)  # levanta exceção

In [None]:
min(10, -10)  # correto

In [None]:
min(10, -10, 0)  # também correto

O mesmo vale para nossa função `foo()`:

In [None]:
foo(1)

In [None]:
foo(1, 2)

In [None]:
foo(1, 2, 3)

In [None]:
foo(1, 2, 3, 4, 5, 6, 7, 8, 9)

**Empacotamento e desempacotamento de argumentos são conceitos importantes**, uma vez que são usados extensivamente em bibliotecas e frameworks Python. Funções embutidas como `format()`, `max()` e `min()` usam.

Além de empacotar e desempacotar argumentos em/de sequências também é possível fazer isso para dicionários:

In [17]:
def foo(a, b, c):
    print('a: {} {}'.format(a, type(a)))
    print('b: {} {}'.format(b, type(b)))
    print('c: {} {}'.format(c, type(c)))

In [18]:
kwargs = {'a': 1.5, 'b': True, 'c': 'alo'}
foo(**kwargs)  # desempacotando dicionário kwargs para função foo()

a: 1.5 <class 'float'>
b: True <class 'bool'>
c: alo <class 'str'>


O que acontece por trás disso é: os argumentos com o nome das chaves do dicionário recebem o respectivo valor, portanto é necessário se atentar com as chaves e nomes do argumentos:

In [None]:
kwargs = {'q': 10, 'x': 'foo', 'a': 123}
foo(**kwargs)

Assim como visto anteriormente também é possível, ao criar uma função, empacotar os argumentos em dicionários:

In [19]:
def foo(a, b, c, **kwargs):  # kwargs = KeyWord Arguments (argumentos de palavra-chave)
    print('a: {} {}'.format(a, type(a)))
    print('b: {} {}'.format(b, type(b)))
    print('c: {} {}'.format(c, type(c)))
    print('kwargs: {} {}'.format(kwargs, type(kwargs)))

In [20]:
foo(1, 2, 3)

a: 1 <class 'int'>
b: 2 <class 'int'>
c: 3 <class 'int'>
kwargs: {} <class 'dict'>


In [21]:
foo(1, 2, 3, nome='José', idade=100, vivo=True)

a: 1 <class 'int'>
b: 2 <class 'int'>
c: 3 <class 'int'>
kwargs: {'nome': 'José', 'idade': 100, 'vivo': True} <class 'dict'>


A função `str.format()` recebe argumentos posicionais e de palavra-chave arbitrários que devem corresponder a quantidade de variáveis a ser substituidas na string de formatação:

In [None]:
'{0}'.format(1)

In [None]:
'{0} {1}'.format(1, 2)

Podemos desempacotar uma sequência e enviar à função de formatação:

In [None]:
numeros = [1, 2, 3, 4, 5]
'{0} {1} {2} {3} {4}'.format(*numeros)

In [None]:
'{nome} é {sexo} e tem {idade} anos de idade.'.format(nome='Joana', sexo='mulher', idade=35)

Podemos desempacotar um dicionários e enviar essas informações à função:

In [None]:
dados = {'nome': 'Joana', 'sexo': 'mulher', 'idade': 35}
'{nome} é {sexo} e tem {idade} anos de idade.'.format(**dados)

Para criar uma função que receba **argumentos arbitrários** é preciso criar uma função que empacote tanto os argumentos posicionais (em uma tupla) quanto os nomeados (em um dicionários):

In [25]:
def silverbullet(*args, **kwargs):
    print('args: {} {}'.format(args, type(args)))
    print('kwargs: {} {}'.format(kwargs, type(kwargs)))

In [26]:
silverbullet(1, 2, 3, 4, a=10, b=20, c=30)

args: (1, 2, 3, 4) <class 'tuple'>
kwargs: {'a': 10, 'b': 20, 'c': 30} <class 'dict'>


In [27]:
foo = 1, 2, 3
bar = {'abc': False, 'def': 'alololo'}
silverbullet(-1, -10, *foo, a=150, b='oi', **bar)

args: (-1, -10, 1, 2, 3) <class 'tuple'>
kwargs: {'a': 150, 'b': 'oi', 'abc': False, 'def': 'alololo'} <class 'dict'>


### Arquivos

Para abrir um arquivo existe a função embutida `open()` que recebe, além de outras coisas, o **nome do arquivo** e **modo de abertura**. 

Os modos suportados são:

<table>
<thead>
<th>Character</th>
<th>Meaning</th>
</thead>
<tbody>
<tr>
<td>'r'</td><td>abrir par leitura (padrão)</td>
</tr>
<tr>
<td>'w'</td><td>abrir para escrita, o arquivo é truncado primeiro</td>
</tr>
<tr>
<td>'x'</td><td>abrir para criação exclusiva, falhando se o arquivo existe</td>
</tr>
<tr>
<td>'a'</td><td>abrir para escrita, anexando o conteúdo para o fim do arquivo caso ele exista</td>
</tr>
<tr>
<td>'b'</td><td>modo binário (pode ser usado em  conjunto com os de abertura)</td>
</tr>
<tr>
<td>'t'</td><td>modo  texto (padrão)</td>
</tr>
<tr>
<td>'+'</td><td>abrir um arquivo do disco para atualização (funciona para escrita e leitura)</td>
</tr>
<tr>
<td>'U'</td><td>modo quebra de linhas universal (depreciado)</td>
</tr>
</tbody>
</table>

Vamos começar abrindo um arquivo de texto para escrita:

In [28]:
arq = open('dados.txt', 'w')
arq

<_io.TextIOWrapper name='dados.txt' mode='w' encoding='cp1252'>

In [29]:
arq.write('Olá, mundo!\n')
arq.write('Essa é uma aula de Python!')
arq.close()

Agora abra o arquivo `dados.txt` e veja seu conteúdo.

Note que após fechar o arquivo não podemos fazer operações nele:

In [None]:
arq.write('esqueci de escrever esta frase')

Agora vamos usar o próprio python para ler o arquivo:

In [30]:
arq = open('dados.txt')

In [31]:
conteudo = arq.read()
conteudo

'Olá, mundo!\nEssa é uma aula de Python!'

Como visto a função `file.read()` nos dá o conteúdo de todo o arquivo como uma única string. Mais para frente veremos outros métodos de leitura e escrita.

In [32]:
# não podemos esquecer de fechar o arquivo

Agora vamos gerar um arquivo mais complexo com dados mais úteis usando a famigerada biblioteca faker:

In [34]:
!! pip install Faker

Defaulting to user installation because normal site-packages is not writeable
Collecting Faker
  Downloading Faker-17.6.0-py3-none-any.whl (1.7 MB)
     ---------------------------------------- 1.7/1.7 MB 4.0 MB/s eta 0:00:00
Installing collected packages: Faker
Successfully installed Faker-17.6.0



[notice] A new release of pip available: 22.3.1 -> 23.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [None]:
from faker import Factory

# Instanciando uma fábrica de texto em língua portuguesa
faker = Factory.create('pt_BR')

In [39]:
faker.name()

'Sra. Nicole Almeida'

In [40]:
faker.job()

'Jogador de vôlei'

In [41]:
faker.company()

'Nunes S/A'

In [42]:
# Geração de dados "sintéticos"...
# 1. Abre o arquivo dados.txt (modo escrita)
# 2. Percorre uma lista de 100 posições
# 3. Para cada posição p em P, faça:
#    - gere um nome 
#    - gere um cargo
#    - gere uma empresa
#    - greve os dados gerados no arquivo (separado por virgula) + \n 
#       (ideal: usar string formatada)
# 4. fechar arquivo

Abra o arquivo `dados.txt` e dentro dele haverá 100 linhas. Cada linha contém os dados (nome, cargo e empresa) separados por vírgula.

Esse formato de dados é muito popular e é chamado de CSV (Comma-separated Values ou Valores Separados por Vírgula), muitas empresas usam o CSV para mover dados entre sistemas que trabalham com formatos incompatíveis ou proprietários. Ainda nesta aula veremos mais sobre como trabalhar com esses dados.

Existem algumas maneiras diferentes para ler arquivo. Podemos ler todas as linhas de uma só vez e jogá-la em uma lista (ou iterá-la diretamente) usando `file.readlines()`:

In [None]:
# abrimos o arquivo no modo padrão (escrita)



In [None]:
# o arquivo é todo lido e cada linha vira um elmento na lista linhas (metodo readlines() do arquivo)

In [None]:
# Exibe o tipo do retorno - linhas



In [None]:
# Exibe o conteudo lido



In [None]:
# Fecha o arquivo

Podemos iterar a lista e trabalhar com os dados vindo do arquivo:

In [None]:
# pegando só as 10 primeiras por indexacao

# Exibindo texto da linha (.strip() remove a quebra de linha no final)

Como vocês viram anteriormente abrimos o arquivo, mexemos com ele e depois o fechamos. Trabalhar dessa forma geralmente pode levar a erros, pois é comum esquecer de fechar o arquivo e, ter vários arquivos abertos, pode deixar o programa lento/ineficiente. (eu mesmo esqueci de fechar os arquivos nos dois exemplos acima)

Uma maneira melhor de manipular arquivos é usando gerenciadores de contexto se responsabilizam pelo fechamento ou finalização de recursos utilizados e isso pode ser usado para trabalhar com arquivos ou cuidar de transações ao trabalhar com banco de dados, por exemplo.

Vamos mostrar como trabalhar com gerenciadores de contexto lendo o arquivo que criamos anteriormente:

In [None]:
with open('dados.txt') as arq:  # abre o arquivo numeros.txt e o coloca na variável arq
    for linha in arq.readlines()[-10:]:  # pega as 10 últimas linhas por brevidade
        print(linha.strip())

O arquivo `arq` já foi fechado, podemos verificar isso tentando ler uma linha do arquivo:

In [None]:
arq.readlines()

### Trabalhando com arquivos CSV

Não existe nenhum padrão de arquivos CSV. É comum ver arquivos desses formatos separados por outros caracteres que não a vírgula como: `;` `-` e `.`. Em alguns casos cada coluna pode ser envolta em aspas simples ou aspas duplas. Por conta dessas particularidades o Python criou uma biblioteca `csv` que auxilia na manipulação de arquivos CSV.

Para ler arquivos CSV precisamos primeiro importar a biblioteca e depois criamos um leitor CSV com a função `csv.reader()`:

In [None]:
import csv

with open("dados.txt") as arq_csv:  # abrindo o arquivo
    leitor = csv.reader(arq_csv)
    for linha in leitor:
        print(type(linha), linha)

A função `csv.reader()` já retorna cada linha como uma lista Python com as aspas e quebra de linhas removidas.

Podemos deixar a leitura do arquivo ainda melhor usando desempacotamento de sequências:

In [None]:
with open('dados.txt') as arq_csv:
    leitor = csv.reader(arq_csv)
    for nome, cargo, empresa in leitor:
        print('{} trabalha como {} na {}'.format(nome, cargo, empresa))

Agora vamos criar um arquivo CSV em um padrão diferente usando a função `csv.writer()`. Nossas colunas serão separadas por espaço em branco e cada coluna será separada por `|` ao invés de aspas:

In [None]:
with open('mais-dados.csv', 'w') as arq_csv:
    escritor = csv.writer(arq_csv, delimiter=' ', quotechar='|')
    for _ in range(20):
        dados = faker.name(), faker.job(), faker.company()
        escritor.writerow(dados)

Para ler o arquivo é só usar a mesma função `csv.reader()` usada anteriormente especificando o padrão:

In [None]:
with open('mais-dados.csv') as arq_csv:
    for linha in csv.reader(arq_csv, delimiter=' ', quotechar='|'):
        print(linha)

Para mais informações sobre como usar a biblioteca `csv` consulte sua [documentação oficial](https://docs.python.org/3/library/csv.html#csv-fmt-params)

# Exercícios

- Finalizar o arquivo `exercicios.ipynb`

# Fim.