# Funções e strings

Até agora vimos os seguintes tipos:

* `int`, representa números inteiros
* `float`, representa números com casas depois da vírgula
* `complex`, representa números complexos
* `bool`, representa valores verdadeiros e falsos.

Neste capítulo, veremos mais três tipos:

* `str`, representa sequências de caracteres (strings)
* `function`, que realizam ações com base em argumentos e retornam valores. Utilizaremos as `str` como referência, pois possuem um conjunto grande de funções.
* `None`, que indica a ausência de valor.

## Strings

Strings são variáveis que contém texto. Essas variáveis são criadas colocando texto entre aspas simples `''` ou duplas `""`, e não pode haver uma quebra de linha (um "Enter"). Se você utilizar três conjuntos de aspas, aí você pode utilizar quebras de linha sem problemas. Se você utilizar um tipo de aspas, pode utilizar a outra dentro da string. Por exemplo:

In [1]:
nome = "Karl"
possessivo = "'s book"
citação = 'e não pode haver uma quebra de linha (um "Enter")'
texto_longo = """Primeiro parágrafo.

Segundo parágrafo.

Terceiro.
"""

Interessantemente, strings aceitam serem somadas com outras strings. Isso é chamado de concatenação.

In [2]:
nome + possessivo

"Karl's book"

Mas strings não aceitam serem somadas com outras coisas, como números.

In [3]:
possessivo + 12

TypeError: can only concatenate str (not "int") to str

Tanto que a mensagem de erro fala que somente uma string (`str`) pode ser concatenada a outra `str`. Strings também não aceitam quaisquer outras operações matemáticas, exceto duas: `*` repete uma string:

In [4]:
'ba' + 'na' * 2

'banana'

e `%` aplica uma formatação na string, também chamado de interpolação. Vide o [capítulo extra](sec:format_string_modulo) para maiores informações sobre esse tipo de formatação.

### `f-string`s

A maneira mais aceita hoje em dia de realizar interpolação de strings é por `f-string`s, também conhecidas por *formatted string literals*. Mais informações podem ser encontradas na [documentação oficial](https://docs.python.org/3/tutorial/inputoutput.html#tut-f-strings).

Para criar uma `f-string`, preceda as aspas iniciais por um `f` minúsculo ou maiúsculo. No interior da string, coloque chaves com o valor que você deseja exibir, opcionalmente seguido de códigos formatadores. Aqui, substitua `nome` pelo seu nome, se desejar.

In [5]:
nome = 'Karl'
objeto = 'book'
possessivo = f"{nome}'s {objeto}"
possessivo

"Karl's book"

In [6]:
f'O valor aproximado de pi é {3.1415}'

'O valor aproximado de pi é 3.1415'

In [7]:
f'O valor aproximado de pi é {3.1415:.2f}'

'O valor aproximado de pi é 3.14'

In [8]:
num = 127
f'{num:04d} {"ba" + "na" * 2}s'

'0127 bananas'

No último caso, note que pude colocar inclusive expressões, que serão avaliadas e inseridas no espaço desejado, e que podem conter aspas, desde que não sejam do mesmo tipo das aspas que iniciaram a string.

### Sequências de escape

Se você testou por conta própria a variável `texto_longo` definida acima, você verá que sua representação é diferente da declaração.

In [9]:
texto_longo

'Primeiro parágrafo.\n\nSegundo parágrafo.\n\nTerceiro.\n'

Ao invés de aparecer em três parágrafos, temos o texto em uma linha só, e com alguns símbolos que não havíamos adicionado, `\n`. Isso é conhecido como um *caracter de escape* (*escape character* ou *escape sequence*) que possuem como finalidade expressar texto invisível. Os tipos mais comuns são:

* `\n` indica uma nova linha (*newline* ou *line feed*)
* `\t` indica um tab horizontal
* `\r` indica *carriage return*. Pensando no texto digitado como sendo feito numa máquina de datilografar, isso significa o ato de voltar com o carro para a esquerda (onde são pressionadas as letras).
* `\\` indica uma barra para a esquerda, somente.
* `\'` e `\"` permite que você use as mesmas aspas utilizadas no início da string no meio da mesma. Por exemplo, `'Karl\'s book'`. Evite utilizar isso se possível.

Mais informações podem ser encontradas [aqui](https://docs.python.org/3/reference/lexical_analysis.html#string-and-bytes-literals)

Em Windows, arquivos de texto utilizam a combinação de `'\r\n'` para separar linhas, enquanto que sistemas Linux utilizam `'\n'` somente.

Caso você queira que o texto `\n` apareça literalmente na string, pode fazer o seguinte:

1. "Escapar" (colocar um `\`) a primeira barra, seguido de `n`.
2. Utilizar uma `raw string`, precedendo as aspas com um `r`.

Ambos os métodos são válidos, mas acho o segundo mais conveniente. Você pode também combinar `raw string` com `f-string`. Vejamos alguns exemplos.



In [10]:
r'\n\n\n'

'\\n\\n\\n'

Note que, na exibição, `\n` foi "escapado" para `\\n`.

In [11]:
fr'\n{nome}\n'

'\\nKarl\\n'

## Comparadores com strings

Os comparadores também funcionam com strings. 

* `==` compara primeiramente se o comprimento das duas strings são iguais, e se for, compara letra por letra. Retorna `True` somente se tudo for igual.
* `>` compara duas strings em ordem alfabética. Se uma string vier depois da outra, isso retorna `True`. O oposto vale para `<`.

In [12]:
'abc' == 'abc'

True

In [13]:
'abcd' < 'bcd'

True

In [14]:
'abc' < 'abc'

False

In [15]:
'abc' <= 'abc'

True

In [16]:
'abc' != 'def'

True

## Funções

Uma função é um bloco de código que aceita de 0 a potencialmente infinitas variáveis como entrada (chamadas argumentos), executa alguma ação nessas variáveis, podendo alterá-las, e depois retorna de 0 a potencialmente infinitas variáveis como saída.

                   ______
    entrada ----->|  f   |------> saída
                  |______|

O propósito de funções é permitir que você reutilize certa lógica com facilidade, sem ter que copiar o código inteiro, pois você só precisa chamar a função. Também pode lhe auxiliar na simplificação do seu código, pois abstrai um conjunto de linhas e as resume com um nome. Essa abstração pode ser completamente opaca, permitindo que o utilizador tenha somente uma ideia do que está sendo feito pela função, sem precisar saber os detalhes da operação.

Em Python, existem algumas funções pré-existentes. Além disso, variáveis podem possuir funções internas, definidas por seus tipos. Por trás dos panos, são essas funções internas que operam quando fazemos, por exemplo, `a + b`.

Para chamar uma função, você precisa localizá-la, escrever seu nome, colocar um par de parênteses e dentro deles, os argumentos separados por vírgulas, se necessário. Por exemplo, para chamar a função `f` que aceita dois argumentos:

```
f(arg1, arg2)
```

Como funções várias vezes retornam valores, podemos atribuí-los à variáveis. Então

```
res = f(arg1, arg2)
```

Se uma função não retornar um valor, mas você atribuir de qualquer maneira esse resultado inexistente, irá notar que um objeto do tipo `None` foi criado. Isso é um alerta para você, pois é possível que a operação da função não tenha sucedido (por exemplo, se você procurar por alguma coisa, mas não encontrá-la).

### As funções `print` e `input`

A função `print` serve para fazer texto aparecer na tela/console. Já utilizamos isso anteriormente para testar se tudo está operando como esperado. Essa função aceita um número infinito de argumentos como entrada, coloca eles na tela, e não retorna nada (`None`). O tipo de variável mais comumente utilizado com `print` são strings. A função `input` aceita uma string, que irá aparecer na tela, e em seguida permite que um usuário escreva alguma coisa. Quando apertar "Enter", o conteúdo da linha escrita é armazenada em uma variável.

Vamos ver alguns exemplos:

In [17]:
print("Hello world!")
print('Hello world!')
print('''Hello
world!''')
print('Hello', "world!")

Hello world!
Hello world!
Hello
world!
Hello world!


In [18]:
nome = input('Qual o seu nome? ')
print('Olá', nome)

Qual o seu nome?  Karl


Olá Karl


    Qual o seu nome?  Karl
    Olá Karl

(Por conta da maneira que este material é organizado, tenho que colocar células com `input` de uma maneira especial).

### Obtendo ajuda com a função `help`

Você pode se perguntar o seguinte. "Se eu, até agora, escrevi o nome de uma variável e obtive o "valor" dela de volta, numa célula, o que acontece se fizer o mesmo com uma função?" Possivelmente inspirado na observação que fiz que, em Python, tudo é um objeto, você teria este resultado:

In [19]:
print

<function print(*args, sep=' ', end='\n', file=None, flush=False)>

Note que não adicionei os parênteses! Isso *chamaria* a função, i.e., a executaria. Aqui, estamos somente tentando observar a função em si.

Neste caso, temos como resposta um pequeno texto explicando algumas opções da função `print`, com uma sintaxe que ainda não vimos. Há 5 argumentos para essa função, `*args`, `sep=' '`, `end='\n'`, `file=None`, `flush=False`. Isso é útil caso você queira rever rapidamente os argumentos, mas não serve muito se você não souber o que tais argumentos significam. Para isso, podemos utilizar a função `help`.

In [20]:
help(print)

Help on built-in function print in module builtins:

print(*args, sep=' ', end='\n', file=None, flush=False)
    Prints the values to a stream, or to sys.stdout by default.
    
    sep
      string inserted between values, default a space.
    end
      string appended after the last value, default a newline.
    file
      a file-like object (stream); defaults to the current sys.stdout.
    flush
      whether to forcibly flush the stream.



Note algo interessante aqui: Nós passamos uma função para outra! Em Python, tudo é um objeto, e todo objeto tem um tipo, inclusive funções.

Vamos então passo a passo pelos argumentos de `print`:

* `*args`: Esta nomenclatura significa que aceita um número qualquer de argumentos *sem nome* ou *posicionais*. Argumentos *sem nome* são diferente dos argumentos *com nome* ou *keyword arguments*, pois o significado deles depende de sua posição. Na função `print`, a sequência de argumentos posicionais que você fornecer será a ordem do texto que aparece na tela. O tipo deles não importa - qualquer variável é aceita, pois as variáveis em si que controlam como são exibidas como texto, e `print` utiliza isso.

Os outros argumentos de `print` são todos `keyword arguments`. Eles podem aparecer em qualquer ordem exceto antes do argumetos posicionais, e só podem aparecer uma vez, e possuem um valor padrão, dado pelo valor após o `=`.

* `sep` controla o que é colocado entre os argumentos, é o *separador*. Por padrão, Python coloca um espaço `' '`. Somente `str`s são aceitas.
* `end` controla o que é colocado no final do texto criado. Por padrão, insere `'\n'`. Isso é chamado de um *caracter de escape* ou *escape character*. Há vários caracteres de escape e eles possuem significados diferentes. `'\n'` significa *newline*, ou seja, por padrão, Python coloca um "Enter", uma quebra de linha, depois do texto que você fornece. Veja nos exemplos anteriores que todos os "Hello world!" apareceram em linhas separadas? Este é o motivo. Somente `str`s são aceitos.
* `file` controla se você quer colocar o texto criado em outro lugar além da tela. Aqui, `sys.stdout` significa *o local padrão de output do sistema*, que é geralmente o console. Somente objetivos tipo arquivos são aceitos.
* `flush` é uma opção que tem a ver com o funcionamento interno de `print` e `sys.stdout`. É possível que essa ferramenta armazene os resultados por um tempo antes de mostrar o resultado. Com `flush=True`, você força que tudo enviado para `print` seja exibido. Isso é geralmente utilizado caso você esteja fazendo alguma coisa interativa, por exemplo, e precisa que o texto que aparece na tela esteja sempre atualizado. Um booleano é aceito.

Em ambientes IPython (como um jupyter notebook), podemos também colocar um (`?`) ou dois (`??`) pontos de interrogação antes do nome para obter mais informações sobre a função. Não haverá diferença para `print`, mas há diferença com funções não `builtin` do Python, onde `??` mostra o código fonte da função.

In [21]:
?print

[1;31mSignature:[0m [0mprint[0m[1;33m([0m[1;33m*[0m[0margs[0m[1;33m,[0m [0msep[0m[1;33m=[0m[1;34m' '[0m[1;33m,[0m [0mend[0m[1;33m=[0m[1;34m'\n'[0m[1;33m,[0m [0mfile[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m [0mflush[0m[1;33m=[0m[1;32mFalse[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[1;31mDocstring:[0m
Prints the values to a stream, or to sys.stdout by default.

sep
  string inserted between values, default a space.
end
  string appended after the last value, default a newline.
file
  a file-like object (stream); defaults to the current sys.stdout.
flush
  whether to forcibly flush the stream.
[1;31mType:[0m      builtin_function_or_method

Vendo isso, vamos explorar a função `print` mais um pouco, utilizando os argumentos revelados pela ajuda.

Além do conteúdo de `help`, `?` forneceu a assinatura da função, que já vimos anteriormente, e informa o tipo de `print`, que é uma função ou método embutido no Python.

In [22]:
print("Hello", "World!", sep='\n\n\n', end=' ooo')
print("Hello", "World!", sep='---', end=' aaa')

Hello


World! oooHello---World! aaa

In [23]:
print('', ' ', sep='Hello', end='World!', flush=True)

Hello World!

Note como o conteúdo de uma string, e o material que é mostrado na tela, podem ser bastante diferentes, devido aos caracteres de escape.

In [24]:
texto = 'ABC\n\n\nDEF'
texto

'ABC\n\n\nDEF'

In [25]:
print(texto)

ABC


DEF


Mais chocante ainda se você utilizar o caracter `\r`, veja se consegue entender como o seguinte resultado pôde ser atingido.

In [26]:
texto = 'ABCD\rEFG'
texto

'ABCD\rEFG'

In [27]:
print(texto)

EFGD


### Funções internas: métodos

Você se lembra que quando chamei uma variável de uma caixinha com valores e ferramentas? Essas ferramentas são funções que operam dentro das variáveis e podem usar o estado delas para realizar algumas operações. `str`, por exemplo, possui muitos métodos próprios. Vamos ver a ajuda.

In [28]:
help(str)

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  

Por brevidade, não incluí o resultado dessa função no livro. É possível ver que há uma quantidade bastante grande de métodos definidos para `str`. Vários deles começam e terminam com dois underlines -- esses são chamados de *dunder methods*. Geralmente não são chamados diretamente, e são eles que fazem várias ações utilizando os operadores básicos em python. Por exemplo, `__add__(self, value, /)` de `str` é uma função que realiza a adição, ou concatenação, de strings, chamada pelo operador `+`. Note também que várias dessas funções possuem como argumento `self`. Não se preocupe com isso agora, mas a função disso é permitir que a função acesse o estado da atual variável, e são passados automaticamente pelo interpretador.

Depois dos *dunder methods*, temos algumas funções que parecem ser mais interessantes. `capitalize`, `center`, `count`, `find`, `isalpha`, etc. Para acessar um método interno, utilize a notação `.`. Por exemplo

In [29]:
'primeira frase. segunda frase'.capitalize() # Torna a primeira letra da string maiúscula.

'Primeira frase. segunda frase'

In [30]:
'primeira letra maiúscula. segunda letra maíscula'.title() # torna a primeira letra de todas as palavras maíscula

'Primeira Letra Maiúscula. Segunda Letra Maíscula'

In [31]:
'texto texto texto'.upper() # torna todas as letras maísculas (caixa alta)

'TEXTO TEXTO TEXTO'

In [32]:
'texto com sequência inconsequênte'.count('quê') # conta quantas vezes uma string ocorre em outra

2

In [33]:
'12345'.isnumeric()  # Retorna True se todos os caracteres forem números

True

In [34]:
'12345.7890'.isnumeric() # Retornou false porque "." não é um número

False

In [35]:
'12345ABCD'.isalnum() # Retorna True se todos os caracteres forem números ou texto

True

In [36]:
'12345ABCD-'.isalnum() # Retornou False porque "-" não é uma letra ou número

False

In [37]:
'12345ABCD'.isalpha() # Retorna True se todos os caracteres forem do alfabeto

False

In [38]:
'áéíóú'.isalpha()

True

In [39]:
"""linha
""".endswith('\n') # Retorna True se uma string termina com uma sequência de caracteres

True

Não são só as strings que possuem vários métodos. Os outros tipos que já vimos possuem suas próprias funções internas.

In [40]:
a = 65
a.bit_length() # Informa quantos bits tem um número inteiro

7

Podemos averiguar isso com:

In [41]:
0b1000001

65

E com

In [42]:
bin(a)

'0b1000001'

A função bin aceita um número inteiro e retorna uma string com a representação binária do número.

#### Métodos e propriedades: uma pequena diferença

Estamos vendo métodos, que necessitam que você os chame, i.e., precisam ter um par de parênteses depois do nome do método. Algumas coisas, conhecidas como propriedades, refletem mais o *estado* de uma variável, e não precisam serem chamadas, pois não é feito um cálculo. Por exemplo, um número complexo possui uma parte real e uma parte imaginária.

In [43]:
c = 2 + 3j

In [44]:
c.real

2.0

In [45]:
c.imag

3.0

Se você equivocadamente chamar essas propriedades, irá notar uma mensagem de erro estranha.

In [46]:
c.real()

TypeError: 'float' object is not callable

Acima, vimos que a resposta de `c.real` é `2.0`, ou um número `float`. Quando utilizamos `c.real()`, primeiro o valor `c.real` é avaliado, tornando-se `2.0` e depois esse valor tenta ser chamado. Mas como um float não possui o instrumental para ser uma função, uma *callable*, essa mensagem de erro aparece.

É possível entender porque não é necessário chamar `real` e `imag`. Ambos são valores intrínsecos ao funcionamento da variável. Não é necessário realizar um cálculo para encontrá-los. Porém, se você deseja achar o complexo conjugado do número, isso pode requerir um cálculo, então é necessário colocar os `()`. Note que, devido a uns detalhes com decoradores e propriedades, isso não é *estritamente* verdadeiro, mas é *habitualmente* verdadeiro.

In [47]:
c.conjugate()

(2-3j)

### Funções para conversão de objetos

Como vimos, não podemos operar em strings com a maior parte dos operadores matemáticos. Agora, suponha que eu fiz um pequeno programa utilizando `print` e `input`, para o cálculo da massa necessária para ser pesada para o preparo de uma solução. Como eu faria para converter as `str` que são produziras por `input` em números, para fazer os cálculos?

```python
print('Cálculadora de massas')
conc = input('Concentração do analito, em mmol/L: ')
massa_molar = input('Massa molar do analito, em g/mol: ')
volume = input('Volume de solução, em mL: ')
# Como continuar?
```

Vamos supor que os seguintes valores foram colocados:

In [48]:
conc = '100'
massa_molar = '152.12'
volume = '10'

Para isso, temos as funções `int()` e `float()`, que aceitam uma `str` e retornam um valor numérico, caso consigam interpretar a `str` fornecida.

In [49]:
conc = float(conc)
massa_molar = float(massa_molar)
volume = float(volume)

n_mols = volume * 1E-3 * conc * 1E-3
massa = n_mols * massa_molar
print(f'A massa que precisa ser pesada é {massa} g')

A massa que precisa ser pesada é 0.15212 g


Você pode ter se perguntado porque eu utilizei `float` em todos os casos. Eu fiz isso por ser mais genérico. Neste caso, tanto a concentração quanto o volume fornecidos foram números inteiros, mas é bastante capaz que alguém forneça valores decimais. Aí teríamos que ter uma maneira de detectar se o valor possui um ponto e, se possuir, utilizar `float`, senão utilizar `int`... e aí o código fica muito mais complexo sem um ganho real.

Uma situação onde você deve utilizar uma conversão com `int` é, por exemplo, se perguntar quantas replicatas seriam feitas. Como não existe meia replicata, somente um `int` faria sentido.

Vejamos o código completo.

```python
print('Cálculadora de massas')
conc = float(input('Concentração do analito, em mmol/L: '))
massa_molar = float(input('Massa molar do analito, em g/mol: '))
volume = float(input('Volume de solução, em mL: '))
n_mols = volume * 1E-3 * conc * 1E-3
massa = n_mols * massa_molar
print(f'A massa que precisa ser pesada é {massa} g')
```

O que acontece se o valor fornecido não conseguir ser interpretado? Como imagina, é lançada uma exceção, um erro.

In [50]:
float('3,1415')

ValueError: could not convert string to float: '3,1415'

In [51]:
int('5 vezes')

ValueError: invalid literal for int() with base 10: '5 vezes'

Aqui coloquei dois erros comuns. Primeiro, é necessário que o separador decimal seja `.` para as conversões funcionarem. Isso é um problema muito frequente, inclusive em outros locais, outras linguagens, e envolve as opções de localização da sua língua (*locale*). O segundo erro ocorre quando o usuário não leu direito as instruções e colocou a unidade junto. Como `' vezes'` não é um número válido, a função `int` não conseguiu interpretar a string. Veremos no futuro como contornar essas situações, utilizando [condicionais](cap:cond) e [loops](cap:loops).

### Mais funções embutidas em Python

Até agora exploramos somente algumas das funções embutidas, como `print`, `input`, `float`, `int`, e alguns métodos de tipos embutidos, como os métodos de `str` e `complex`. Existem mais algumas funções em Python, algumas mais frequentemente utilizadas que outras. [Uma listagem com todas pode ser encontrada na documentação oficial](https://docs.python.org/3/library/functions.html). Irei listar aqui somente mais duas, `abs`, `len`, `str`, `repr` que já temos o *background* para entender.

* `abs` retorna o valor absoluto de um número (remove o sinal). Se for um número complexo, calcula o tamanho do vetor correspondente, `(real**2 + imag**2)**0.5`.

In [52]:
abs(-5)

5

In [53]:
abs(3-2j) == (3**2 + 2**2) ** 0.5

True

* `len` retorna um número inteiro com o número de elementos de uma coleção. No caso de uma string, é o número de caracteres, contando os caracteres invisíveis! Note que `\n`, apesar de escrevermos como dois caracteres, significa um símbolo só, a quebra de linha.

In [54]:
len('ABCD')

4

In [55]:
len('ABCD\n')

5

* `str` converte um objeto em string. Por traz dos panos, chama o método `__str__` do objeto, que você pode chamar também diretamente, se desejar. Isso é utilizado automaticamente quando você faz interpolação de strings com números.

In [56]:
str(123)

'123'

In [57]:
(123).__str__()
# Aqui, precisei envolver o número em parênteses para o Python entender que o 
# ponto se refere ao objeto, não a uma tentativa de escrever um decimal.

'123'

* `repr` é similar a `str`, e retorna uma string, mas tem como objetivo mostrar uma representação mais completa do objeto, potencialmente uma maneira de gerar o objeto em si, se você copiar e colar o resultado numa nova célula. Por trás dos panos, quando colocamos uma variável numa célula e a executamos, o valor de `repr` é passado para print, não `str`.

In [58]:
repr(123)

'123'

In [59]:
repr(2+3j)

'(2+3j)'

In [60]:
repr('12345')

"'12345'"

### Explorando um objeto

A função `help` pode ser bastante útil, mas ela acaba dependendo da existência de `docstring`s, que servem de documentação para classes e métodos. Porém, dependendo do pacote que você utilizar, é possível que nem tudo esteja documentado, e que você precise explorar sozinho. Para isso, você pode utilizar as ferramentas de autocompletação disponíveis em seu editor (para testar, digite uma variável e aperte `.`. Geralmente a autocompletação irá acionar e preencher um menu com os componentes do objeto), mas isso também pode não estar disponível. Por fim, existe a função `dir`. Essa função lista todos os componentes do ambiente global, se você não fornecer nenhum argumento, ou os componentes de um objeto, se você fornecê-lo. Vejamos o conteúdo do número complexo acima.

In [61]:
dir(c)

['__abs__',
 '__add__',
 '__bool__',
 '__class__',
 '__complex__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getnewargs__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__neg__',
 '__new__',
 '__pos__',
 '__pow__',
 '__radd__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmul__',
 '__rpow__',
 '__rsub__',
 '__rtruediv__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__truediv__',
 'conjugate',
 'imag',
 'real']

O objetos mais complexos podem ser compostos de vários outros objetos internos, que possuem mais objetos, e assim vai. Se quiser informações sobre eles, só chamar `dir` no objeto em si. Por exemplo, se você quer mais informações sobre `real`, tente `dir(c.real)`. Se você quiser saber qual é o tipo de um desses objetos, pode utilizar a função `type`.

In [62]:
type(c)

complex

In [63]:
type(c.real)

float

## Definindo sua própria função

Para criar uma função, devemos seguir a seguinte sintaxe:

```
def nome(arg1, arg2, [mais args...], kwarg1=defval1, kwarg2=defval2, [mais kwargs...]):
    """docstring""" (opcional)
    [linha1]
    [linha2]
    return [resultado] (opcional)
```

Em suma, escrevemos a *keyword* `def`, seguido do nome da função, abrimos um par de parênteses, colocamos os nomes das variáveis posicionais, depois o `nome=valor padrão` das variáveis de palavra chave, fechamos os parênteses, colocamos um dois-pontos, damos Enter, depois um tab (ou quatro espaços), potencialmente colocamos uma *docstring*, depois as linhas de código da função, e por fim podemos retornar um valor com a *keyword* `return` e o valor a ser retornado. Vamos ver um exemplo:

In [64]:
def calcular_número_de_mols(massa, massa_molar):
    """Calcula o número de mols a partir da massa pesada e da massa molar de um material"""
    return massa / massa_molar

Se quisermos utilizar essa função, basta chamá-la:

In [65]:
calcular_número_de_mols(0.1, 348.48) # Lauril glicosídeo

0.0002869605142332415

In [66]:
def fahrenheit_to_celsius(F):
    return (F - 32) / 9 * 5
def celsius_to_fahrenheit(C):
    return C / 5 * 9 + 32

fahrenheit_to_celsius(celsius_to_fahrenheit(25))

25.0

Neste último caso, eu aninhei duas funções (coloquei uma dentro da outra), com um objetivo: testar se a fórmula utilizada é verdadeira. Como as funções `celsius_to_fahrenheit` e `fahrenheit_to_celsius` deveriam ser inversas, aplicando elas dessa maneira e obtendo o mesmo valor inicial, eu garanto que minha implementação está correta. Podemos formalizar isso um pouco melhor com uma nova *keyword*, `assert`. Essa *keyword* aceita à sua direita uma expressão, que precisa ser verdadeira. Se for falsa, uma mensagem de erro irá aparecer, com um `AssertionError`. Lembre-se que vimos na [seção sobre limitações de `float`s](sec:limit_float) que utilizar `==` não é muito apropriado para `float`s, e sim um valor de tolerância.

In [67]:
value = 25
conversion = fahrenheit_to_celsius(celsius_to_fahrenheit(value))
assert (value - conversion) < 1E-10

Este tipo de teste irá aumentar muito a confiança que você possui em seu código. De certa maneira, já fizemos isso com a passagem acima, mas utilizando um `assert`, nós deixamos explícito que uma determinada condição precisa ser passada. Quando a complexidade do seu código aumentar, e o número de partes móveis aumentar também, e você começar a se deparar com bugs, um conjunto de `assert`s poderá ser bastante útil como maneira de detecção de bugs.

Um outro exemplo de `assert` que utilizo é na hora de gerar listas de nomes de arquivos. Se eu fiz 10 experimentos, espero 10 arquivos. Posso ter escrito errado a maneira de escolher os arquivos, ou esquecido de copiar um do computador de operação, e não iria detectar isso sem uma verificação manual da lista de arquivos, ou com um `assert` me informando que é possível que alguma coisa errada aconteceu.

Agora um exemplo com um argumento opcional

In [77]:
def cumprimentar(nome, tratamento = 'Humano'):
    print('Olá', tratamento, nome)
cumprimentar('Karl')
cumprimentar('Mel', 'Cachorra')

Olá Humano Karl
Olá Cachorra Mel


(sec:func_lambda)=
## Funções anônimas `lambda`

Quando você define uma função pela keyword `def`, ela possui um nome. Existe uma maneira de declarar uma função sem um nome, utilizando a keyword `lambda`. Esse tipo de ferramenta é geralmente utilizada quando se deseja fornecer uma função simples, e não vale a pena declarar uma função inteira para aquela tarefa.

Para isso, utilize a sintaxe: `lambda var1, var2, ... : valor que será retornado`. Funções `lambda` não podem ter mais de uma linha, isto é, tudo que precisa ser computado deve ser feito em uma linha só.

Você pode atribuir a função `lambda` a uma variável e utilizá-la como qualquer outra função.

In [82]:
quadrado1 = lambda x: x**2
quadrado1(2)

4

In [84]:
def quadrado2(x):
    return x**2
quadrado2(2)

4

Aqui, `quadrado1` e `quadrado2` são funções idênticas, divergindo somente em seu nome. Se você quiser chamar uma função lambda logo em seguida, pode envolver tudo em parênteses e depois chamar o objeto criado.

In [79]:
(lambda x, y: x**2 + y**2)(2, 2)

8

Mas claro, seria mais fácil passar diretamente `2**2 + 2**2` que fazer todo esse rolo com lambda. Os exemplos mostrados aqui são artificiais e não mostram o uso mais comum deste tipo de função. Geralmente, utiliza-se uma função lambda quando se deseja uma função que só precisa ser usada uma vez, para um motivo bastante específico, como ordenar elementos em uma lista, que pode ser [visto na seção de listas](sec:listas).

## Exercícios resolvidos

### Escrevendo um gerador de questões

Vamos neste exercício escrever uma função que retorna o texto de uma questão com alternativas de resposta. Para isso, utilizaremos as funções de strings e algumas funções para a resolução matemática do problema. Como ainda não visitamos condicionais, não posso tornar a lógica desta função mais complexa, mas você verá que isto já é bastante bacana.

Para o primeiro exemplo, revisitaremos a [questão do gás ideal](sec:prob_gas_ideal). Queremos um enunciando parecido com:

    A fórmula do gás ideal é 
    
    $$pV = nRT$$
    
    considerando 3,4g de hélio a 77°F em um frasco de 35mL, calcule a pressão em bar. Considere a constante dos gases igual a 8,314472 J/(K mol). Considere a massa molar de hélio como 4 g/mol.

    (a) 60.20 bar
    (b) 602.0 bar
    (c) 155.48 bar
    (d) 707.03 bar


In [68]:
def ideal_gas_p_isolated(n, T, V, R=8.314472):
    """p = n * R * T / V, where:
    
    $p$ is pressure
    $n$ is number of moles = mass / molar amss
    $R$ is the gas constant
    $T$ is the temperature
    $V$ is the volume

    This assumes that all variables are in the international system,
    so the return pressure is in Pa.
    """
    return n * R * T / V

def criar_pergunta_gas_ideal(m, MM, nome_do_elemento, T_F, volume_mL):
    n = m / MM
    T_K = fahrenheit_to_celsius(T_F) + 273.15
    volume_m3 = volume_mL * 1E-6

    p_correta = ideal_gas_p_isolated(n, T_K, volume_m3) / 1E5
    p_errada1 = ideal_gas_p_isolated(n, T_K, volume_m3) / 1E6  # Erro na conversão de Pa para bar, 1E6 ao invés de 1E5
    p_errada2 = ideal_gas_p_isolated(n, T_F, volume_m3) / 1E5 # Não converteu temperatura
    p_errada3 = ideal_gas_p_isolated(n, T_F + 273.15, volume_m3) / 1E5 # Erro na conversão

    texto = f'''\
A fórmula do gás ideal é 

$$pV = nRT$$

considerando {m}g de {nome_do_elemento} a {T_F}°F em um frasco de {volume_mL}mL, calcule a pressão em bar.
Considere a constante dos gases igual a 8,314472 J/(K mol).
Considere a massa molar de {nome_do_elemento} como {MM} g/mol.

(a) {p_errada1:.2f} bar
(b) {p_correta:.2f} bar
(c) {p_errada2:.2f} bar
(d) {p_errada3:.2f} bar\
'''
    return texto

In [69]:
print(criar_pergunta_gas_ideal(3.4, 4, 'He', 77, 35))

A fórmula do gás ideal é 

$$pV = nRT$$

considerando 3.4g de He a 77°F em um frasco de 35mL, calcule a pressão em bar.
Considere a constante dos gases igual a 8,314472 J/(K mol).
Considere a massa molar de He como 4 g/mol.

(a) 60.20 bar
(b) 602.03 bar
(c) 155.48 bar
(d) 707.03 bar


Imagine que com mais alguns métodos para aleatorizar vários aspectos da pergunta, como valores, unidades de entrada e saída, elementos, ordem das questões, teríamos uma ferramenta potencialmente poderosa para criar provas individualizadas. Note que a alternativa correta é sempre a segunda e, se formos aleatorizar tudo, seria necessário retornar também a posição da alternativa correta, para gerarmos um gabarito.

Note que eu também alterno entre escrever funções em português e em inglês. É força de hábito. Coisas mais "fixas", que tem alta chance de serem utilizadas em outros locais no futuro, eu escrevo em inglês. Coisas mais restritas, que possuem utilidade local, escrevo em português, por conveniência. Em pacotes mais sérios, recomendo utilizar somente o inglês desde o começo. Você nunca sabe com quem irá compartilhar o código.

### Criar função para o cálculo de massa de soluções

Similar a um exemplo deste capítulo, defina uma função que aceite como argumentos a concentração molar, a massa molar e um volume e retorne a massa necessária para pesagem.

In [70]:
def calc_massa_pesagem(conc_molar, massa_molar, volume):
    """Calcula a massa para pesagem de uma solução de volume, massa molar e concentração especificadas.
    As unidades são:
        conc_molar: em mmol/L
        massa_molar: em g/mol
        volume: em mL
    """
    return conc_molar * 1E-3 * volume * 1E-3 * massa_molar

calc_massa_pesagem(100, 152.12, 10)

0.15212

### Contar quantos algarismos existem em um número

Suponha que você tenha um número grande. Quantos algarismos existem nele, em base 10? Faça uma função que encontre isso.

In [71]:
def contar_algarismos(numero):
    return len(str(numero))

assert contar_algarismos(1000) == 4

Você consegue ver um possível bug nesta função? O que ocorreria se um número negativo fosse fornecido? O que precisaríamos fazer para conseguir distinguir essas duas situações?

## Exercícios extra

### Expandindo o gerador de questões

```{warning}
Para fazer este exercício, você precisa de conhecimentos de [classes](cap:oop)
```

Faça uma classe que aceite uma string de formatação para a questão, uma string de formatação para colocar as alternativas (a, b, c, ...), com um número variável de alternativas, e como *output* forneça uma questão apropriadamente formatada. É necessário conseguir variar os números de entrada facilmente (massas, p.e.), e que, para as alternativas erradas fornecidas, os números sejam factíveis e atrelados a erros em cada etapa da resolução da questão. Forneça alguns testes para averiguar se os resultados estão apropriados.

In [72]:
# %load "Soluções de exercícios/Gerador/QuestionGenerator.py"
import enum
import random
from copy import deepcopy
from typing import Protocol
import string
from dataclasses import dataclass

stateDict = dict[str, float]


@dataclass
class QuestionOutput:
    """Meant to hold the output of a QuestionGenerator generate_question_string"""

    correctAlternative: str
    questionText: str
    all_states: dict[str, stateDict]


class OutcomeOfStep(enum.StrEnum):
    """Holds the possible outcomes of a step. Currently, steps can only
    be forced to be correct or make a mistake."""

    Correct = "Correct"
    Wrong = "Wrong"


class SolutionStepProtocol(Protocol):
    """Specifies the function signature of a solution step."""

    def execute(self, state: stateDict, outcome_of_step: OutcomeOfStep) -> stateDict:
        ...


class CantCreateAllErroneousStatesException(Exception):
    pass


class QuestionGenerator:
    def __init__(
        self,
        template_string: str,
        alternative_template_string: str,
        state: stateDict,
        steps: list[SolutionStepProtocol],
        amount_of_alternatives: int = 4,
        chance_error_during_steps: float = 0.1,
    ):
        """
        Creates a question generator

        :param template_string: A string containing the appropriate markings
        so that `.format(state)` will be applied. The answers will be added later.
        :param alternative_template_string: String template that specifies the formatting of the
        alternatives, like number of decimal places, and separators.
        :param state: A dict that contains keys to variable names, like constants,
        initial parameters. These will be passed to the steps, so they can solve the problem
        :param steps: a list of steps that will be executed in sequence, in order to generate
        the answers. One will always be correct, the others will be wrong.
        :param amount_of_alternatives: Number of alternatives in the question, marked a), b), ...
        :param chance_error_during_steps: Chance of commiting an error during the steps.

        To generate the question itself, call generate_question_output
        """
        self._question_template_string = template_string
        self._alternative_template_string = alternative_template_string
        self._initial_state = deepcopy(state)
        self._steps = steps
        self._amount_of_alternatives = amount_of_alternatives
        self._chance_error_during_steps = chance_error_during_steps
        self.key_for_answer = "answer"
        self._safety_iter = 100

    sequence_for_alternatives = [f"{i})" for i in string.ascii_lowercase]

    def _calculate_correct_state(self) -> stateDict:
        """Calculates the correct state by forcing the outcomes of all steps to be correct"""
        correct_state = deepcopy(self._initial_state)
        for step in self._steps:
            correct_state = step.execute(correct_state, outcome_of_step=OutcomeOfStep.Correct)
        return correct_state

    def _calculate_wrong_states(self, correct_state: stateDict) -> list[stateDict]:
        """Calculates only wrong states by discarding states that are either accidentally
        correct or were calculated before (no repeated states).

        Throws CantCreateAllErroneousStatesException in case it couldn't create enough
        erroneous states after _safety_iter iterations.
        """
        wrong_states: list[stateDict] = []
        wrong_answers: list = []
        correct_answer = correct_state[self.key_for_answer]

        for i in range(self._safety_iter):
            # Create only the requested number of alternatives
            if len(wrong_states) >= self._amount_of_alternatives - 1:
                break

            state = deepcopy(self._initial_state)
            for j, step in enumerate(self._steps):
                type_of_step = (
                    OutcomeOfStep.Wrong
                    if random.random() < self._chance_error_during_steps
                    else OutcomeOfStep.Correct
                )
                state = step.execute(state, type_of_step)

            answer = state[self.key_for_answer]
            if answer == correct_answer:  # Didn't make a mistake? Must.
                continue
            elif answer in wrong_answers:  # Made the same mistake? Try again.
                continue
            else:
                wrong_states.append(state)
                wrong_answers.append(answer)
        else:
            raise CantCreateAllErroneousStatesException()

        return wrong_states

    def _format_question_main_body(self) -> str:
        return self._question_template_string.format(**self._initial_state)

    def _format_alternatives(self, all_states_with_letters: dict[str, stateDict]) -> str:
        return "".join(
            [
                self._alternative_template_string.format(letter, state[self.key_for_answer])
                for letter, state in all_states_with_letters.items()
            ]
        )

    def generate_question_output(self, seed: int | None = None) -> QuestionOutput:
        """
        Generates a question body and a sequence of alternatives, where one of them
        is correct and the other are wrong. Returns a QuestionOutput object that
        contains the correct letter, the question string, and all the states
        used to generate the question, in a dict by their letter.

        :param seed: Can be used to set the seed of the random number generator
        :return: QuestionOutput instance.
        """
        if seed:
            random.seed(seed)

        correct_state = self._calculate_correct_state()
        wrong_states = self._calculate_wrong_states(correct_state)
        all_states = [correct_state, *wrong_states]

        random.shuffle(all_states)
        all_states_with_letters = {
            letter: state
            for letter, state in zip(QuestionGenerator.sequence_for_alternatives, all_states)
        }
        correct_letter = [
            letter
            for letter, state in all_states_with_letters.items()
            if state[self.key_for_answer] == correct_state[self.key_for_answer]
        ][0]

        question_string = self._format_question_main_body()
        alternatives_string = self._format_alternatives(all_states_with_letters)
        final_string = question_string + alternatives_string

        return QuestionOutput(correct_letter, final_string, all_states_with_letters)


In [73]:
# %load "Soluções de exercícios/Gerador/problema_gas_ideal.py"
# encoding utf8
# Este arquivo mostra como utilizar o QuestionGenerator para fazer uma
# pergunta similar àquelas utilizadas no curso.

import random
from copy import deepcopy

from QuestionGenerator import QuestionGenerator, stateDict, OutcomeOfStep

template_str = """\
A fórmula do gás ideal é

$$pV = nRT$$

considerando {m:.3f}g de {nome_do_elemento} a {T_F:.3f}°F em um frasco de {volume_mL:.3f}mL.
Considere a constante dos gases igual a {R} J/(K mol).
Considere a massa molar de {nome_do_elemento} como {MM:.2f} g/mol.
Calcule a pressão em bar.
"""
alternative_str = "{0} {1:.3g} bar\n"
first_state_dict = {
    "m": 3.4,
    "MM": 4.0,
    "T_F": 77,
    "volume_mL": 35,
    "R": 8.314472,
    "nome_do_elemento": "Hélio",
}
number_of_alternatives = 4


class Passo1ConversaoDeVolume:
    def execute(self, state: stateDict, outcome_of_step: OutcomeOfStep) -> stateDict:
        state = deepcopy(state)
        if outcome_of_step == OutcomeOfStep.Correct:
            return self.correto(state)
        else:
            return self.erro1(state)

    def correto(self, state: stateDict) -> stateDict:
        state["V"] = state["volume_mL"] * 1e-6
        return state

    def erro1(self, state: stateDict) -> stateDict:
        state["V"] = state["volume_mL"] * 1e-3
        return state


class Passo2ConversaoDeTemperatura:
    def execute(self, state: stateDict, outcome_of_step: OutcomeOfStep) -> stateDict:
        state = deepcopy(state)
        if outcome_of_step == OutcomeOfStep.Correct:
            return self.correto(state)
        choices = [self.erro1, self.erro2, self.erro3]
        return random.choice(choices)(state)

    def correto(self, state: stateDict) -> stateDict:
        state["T"] = (state["T_F"] - 32) / 9 * 5 + 273.15
        return state

    def erro1(self, state: stateDict) -> stateDict:
        """Esquece de converter F para K"""
        state["T"] = state["T_F"]
        return state

    def erro2(self, state: stateDict) -> stateDict:
        """Esquece de converter C para K"""
        state["T"] = (state["T_F"] - 32) / 9 * 5
        return state

    def erro3(self, state: stateDict) -> stateDict:
        """Utiliza a conversão errada de C para K"""
        state["T"] = (state["T_F"] - 32) / 9 * 5 - 273.14
        return state


class Passo3CalculoNumeroMols:
    def execute(self, state: stateDict, outcome_of_step: OutcomeOfStep) -> stateDict:
        state = deepcopy(state)
        if outcome_of_step == OutcomeOfStep.Correct:
            return self.correto(state)
        else:
            return self.errado(state)

    def correto(self, state: stateDict) -> stateDict:
        state["n"] = state["m"] / state["MM"]
        return state

    def errado(self, state: stateDict) -> stateDict:
        """Erra no cálculo do número de mols"""
        state["n"] = state["m"] * state["MM"]
        return state


class Passo4CalculoGasIdeal:
    """Não possui erro"""

    def execute(self, state: stateDict, outcome_of_step: OutcomeOfStep) -> stateDict:
        state = deepcopy(state)
        return self.correto(state)

    def correto(self, state: stateDict) -> stateDict:
        n = state["n"]
        R = state["R"]
        T = state["T"]
        V = state["V"]
        state["p"] = n * R * T / V
        return state


class Passo5ConversaoPressao:
    def execute(self, state: stateDict, outcome_of_step: OutcomeOfStep) -> stateDict:
        state = deepcopy(state)
        if outcome_of_step == OutcomeOfStep.Correct:
            return self.correto(state)
        else:
            return self.errado(state)

    def correto(self, state: stateDict) -> stateDict:
        state["answer"] = state["p"] / 1e5
        return state

    def errado(self, state: stateDict) -> stateDict:
        """Erra no cálculo do número de mols"""
        state["answer"] = state["p"] / 1e6
        return state


Q = QuestionGenerator(
    template_string=template_str,
    alternative_template_string=alternative_str,
    amount_of_alternatives=4,
    chance_error_during_steps=0.1,
    steps=[
        Passo1ConversaoDeVolume(),
        Passo2ConversaoDeTemperatura(),
        Passo3CalculoNumeroMols(),
        Passo4CalculoGasIdeal(),
        Passo5ConversaoPressao(),
    ],
    state=first_state_dict,
)


if __name__ == "__main__":
    print("-------- Gerando divergências com o mesmo conjunto de dados de entrada --------")
    res1 = Q.generate_question_output(42)
    res2 = Q.generate_question_output(43)
    res3 = Q.generate_question_output(44)
    res4 = Q.generate_question_output(45)

    print(
        "1) " + res1.questionText,
        "2) " + res2.questionText,
        "3) " + res3.questionText,
        "4) " + res4.questionText,
        sep="\n",
    )

    print("GABARITO".center(15, "-"))
    print(1, res1.correctAlternative)
    print(2, res2.correctAlternative)
    print(3, res3.correctAlternative)
    print(4, res4.correctAlternative)

    print("------ Gerando diferentes valores das variáveis ------")
    gases = {"H2": 2, "He": 4.002, "Ne": 20.1797, "Ar": 39.792, "N2": 28.01348}
    massa_min = 1e-3
    massa_max = 10.0
    T_min = 0.0
    T_max = 200.0
    volume_min = 1.0
    volume_max = 100.0

    num_quests = 5
    questoes = []
    for i in range(num_quests):
        state = deepcopy(first_state_dict)
        state["nome_do_elemento"] = random.choice(list(gases.keys()))
        state["MM"] = gases[state["nome_do_elemento"]]
        state["m"] = random.uniform(massa_min, massa_max)
        state["T_F"] = random.uniform(T_min, T_max)
        state["volume_mL"] = random.uniform(volume_min, volume_max)
        Q = QuestionGenerator(
            template_string=template_str,
            alternative_template_string=alternative_str,
            amount_of_alternatives=4,
            chance_error_during_steps=0.1,
            steps=[
                Passo1ConversaoDeVolume(),
                Passo2ConversaoDeTemperatura(),
                Passo3CalculoNumeroMols(),
                Passo4CalculoGasIdeal(),
                Passo5ConversaoPressao(),
            ],
            state=state,
        )
        questoes.append(Q.generate_question_output())

    for i, q in enumerate(questoes):
        print(f"{i+1})", q.questionText)

    print("GABARITO".center(15, "-"))

    for i, q in enumerate(questoes):
        print(i + 1, q.correctAlternative)
