[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/gcmatos/python-para-geociencias/blob/master/notebooks/1.2%20Primeiros%20passos%20em%20Python.ipynb)

Ctrl/Cmd + click para abrir em uma nova aba do navegador web e utilizar o Google Colab para rodar o tutorial.

# Primeiros passos em Python
__O que iremos aprender__
- Semântica da linguagem (indentação e formatação de códigos Python)
- Criação e manipulação de objetos
- Operadores e expressões lógicas (`if, elif, else, for, while`)
- Namespace e Scope
- Funções

## Introdução

### Estilo da linguagem

Abaixo estão dois importantes aspectos da linguagem, publicado no [PEP20](https://www.python.org/dev/peps/pep-0020/), que tem como objetivo principal simplificar tarefas que eram antes consideradas complexas em outras linguagens de programação. O poema _Zen of Python_ trata de exemplificar em palavras os pricípios básicos do estilo da formatação e o _Easter Egg_
mostra um exemplo da simplicidade da linguagem para importar um pacote de funções ou de dados para uma sessão de análise de dados ou de desenvolvimento.

In [None]:
import this

### Checando versão e `$PYTHONPATH`

Para iniciar uma seção de análise, é importante conhecer os seguintes parâmetros:
- Diretório de instalação
- Versão

Os comandos para verificar tais parâmetros serão inseridos no terminal Linux, onde este notebook está rodando, através do símbolo `"!"` no início da linha. Comandos como `!which python` serão passados diretamente para o terminal, não ativando nada no Python.

In [None]:
# $PYTHONPATH
!which python

In [None]:
# Versão
!python -V

### Primeiros comandos em Python
Esta linguagem é simples pois é do tipo interpretada, não sendo necessário compilação como em Java e C. Aqui neste notebook, cada célula de código gera um output, permitindo que possamos avaliar o andamento da análise passo à passo. Isso é uma característica das sessões iPython, que são muito comuns no meio científico, pois permite avaliar o andamento da análise e facilita a colaboração e o compartilhamento de conhecimento.

__Exemplos:__

1) Imprimir a frase Hello, World! utilizando a função `print()`, obter ajuda com a função `help()` e verificar o tipo de objeto com a função `type()`.

In [None]:
# Imprimir a frase Hello, World!
print("Hello, World!")

In [None]:
# Imprimir a frase Hello, World!
frase = "Hello, World!"
print(frase)

In [None]:
# Ajuda sobre a função print()
# help(print)
print?

2) Importar um determinado item de uma biblioteca Python e imprimir o valor do objeto importado.

In [None]:
%whos

In [None]:
print(pi)

In [None]:
# Importa pi do pacote math
from math import pi
# Imprime pi
# print(pi)
pi

3) Cálculo fatorial utilizando fução disponível na biblioteca `math`

> $5! = 5 * 4 * 3 * 2 * 1 = 120$

In [None]:
# Importar função factorial()
from math import factorial
from math import pi
# Calcular 5!
factorial(5)

In [None]:
import math

In [None]:
math.factorial(3)

A função abaixo `whos` é um recurso do Colab notebook, que serve para checar as variáveis que estão carregadas na sessão Python.

## Objetos em Python

Estruturas de dados são abstrações matemáticas da forma como os computadores armazenam e organizam a informação. Para acessar e trabalhar com dados em Python é preciso compreender as varáveis como objetos, que pertencem à uma determinada classe e possuem propriedades e métodos específicos. Dados em Python são tratados como objetos, assim como escalares e funções.

Em Python é possível declarar objetos sem especificar o tipo (classe). Trata-se de uma linguagem dinâmica. Isso pode ser verificado nos exemplos abaixo, onde apenas digitamos os valores e o sistema reconhece as classes automaticamente \o/

Classes primitivas de objetos:
- **int** (números inteiros)
- **float** (números reais em computação)
- **str** (texto/string)
- **bool** (Boolean True/False)

Classes compostas (estruturas de dados)
- **list** (listas de objetos mutável)
- **tuple** (objetos imutáveis)
- **dict** (dicionários)
- **set** (conjuntos de valores únicos em uma lista)

Neste notebook trataremos apenas das classes de dados primitivas e abordaremos as classes compostas no próximo notebook [1.4 Estruturas de dados em Python](https://colab.research.google.com/drive/1GiTFcq_jtfMsCsqa5-6TuDOsYxKDFmNI)

__Utilizando as funções `type()` e `id()`__

In [None]:
a = 1
b = 1

In [None]:
type(a)

In [None]:
id(a), id(b)
# a is b
# a == b

### Números
Números são objetos imutáveis que podem ser inteiros ou reais contínuos e que aceitam oprações aritméticas como soma, subtração, divisão, etc. Abaixo alguns exemplos de operações com a sintaxe utilizada pelo Python.

__Inteiros (`int`)__

Os números inteiros podem ser positivos, negativos ou zero.
Qualquer divisão (`/`) entre dois números inteiros que não resulte em um quociente inteiro, resultará em um número Real (**`float`**).

In [None]:
# Soma
2 + 2

In [None]:
# Divisão
17 / 3

In [None]:
# Quociente da divisão
17 // 3

In [None]:
# Resto da divisão
17 % 3

In [None]:
# Multiplicação
5 * 2

In [None]:
# Potência
5 ** 2

In [None]:
# Equações
(50 - 5 * 6) / 4

__Reais (`float`)__

Números reais são representados em computação por números do tipo *double precision floating-point*.
[Wikipedia](https://en.wikipedia.org/wiki/Double-precision_floating-point_format)


In [None]:
# Declarar um número Real
x = 1.5
x

In [None]:
# Calcular a área do círculo
pi = 3.14
raio = 4.5
area = pi * (raio ** 2)
area

### _Boolean_
Números booleanos são uma subclasse de números inteiros que assumem apenas os valores True (1) ou False (0). Esta classe de objetos pdoe ser utilizada para realizar testes lógicos e filtrar dados.

In [None]:
# Declarar valores booleanos
t = True
f = False
t, f

In [None]:
int(True), int(False)

In [None]:
# Testes lógicos
1 > 2

In [None]:
1 == 1

In [None]:
largura = 10.0
comprimento = 5.0

print(largura == comprimento)

In [None]:
# Operações com inteiros e booleanos
1 + True

### _Strings_
Textos (*Strings*) em Python são objetos  imutáveis compostos por sequências de caracteres que podem ser formatados com métodos e funções, e que são acessados da mesma forma como é feito com uma lista, utilizando fatiamento por índices.

Strings permitem realizar operações como:
- Imprimir 
- Indexar
- Reordenar
- Formatar (placeholders e format())

__Imprimir *strings*__

In [None]:
'hello'

In [None]:
"Hello"

In [None]:
'I don't like that'

In [None]:
# Declarar objeto
frase = "Hello, World!"
# Verificar tipo de objeto
type(frase)

In [None]:
# Comprimento da lista de caracteres (str)
len(frase)

In [None]:
# Imprimir texto com print()
print('UFPE é massa!')

In [None]:
# Concatenar strings
a = 'A '
b = 'cidade '
c = 'não '
d = 'pára '
e = '...'

print(a + b + c + d + e)

In [None]:
letra = 'k'
10 * letra

In [None]:
# Imprimir com tabulação e pular linha
print('"A cidade não pára\n A cidade só cresce\n O de cima sobe\n E o de baixo desce"\n\nChico Science - A Cidade (1994)')

__Indexação de _string___

A indexação e fatiamento de *strings* é feita com a seguinte sintaxe:

```python
sequencia[inicio:fim:passo]
```

In [None]:
sequencia = "abcdefgh"

In [None]:
len(sequencia)

In [None]:
# Imprimir a letra 'a'
sequencia[0]

In [None]:
sequencia[1]

In [None]:
sequencia[0:7]

In [None]:
sequencia[0:8]

In [None]:
sequencia[0:8:2]

In [None]:
sequencia[-1]

__Exemplo:__

Extrair apenas o número do ponto de mapeamento (XX-100).

In [None]:
# Declarar o ponto
ponto = 'XX-100'
# Extrair o número
ponto[3:]

__Reordenamento__

Caso seja necessário imprimir o texto na ordem inversa, basta utilizar a sintaxe abaixo.

In [None]:
# Reordenar 'string'
sequencia[::-1]

__Formatação__

A formatação com strings pode ser realizada de duas formas:
- Utilizando *placeholders* (%)
- Utilizando a função Python 3.x format()

In [None]:
# Declarar variáveis
x, y = 'Gabriel', 40
print("%s tem %d anos." % (x, y))

In [None]:
# Atenção ao utilizar placeholders
print('O resultado é %s' % 3.75)
print('O resultado é %d' % 3.75) 

In [None]:
# Função format()
"Escrevo alguma coisa, {}".format("mas não digo nada.")

In [None]:
# Imprimir variáveis com format()
"{x} tem {y} anos.".format(x='Gabriel', y=40)

In [None]:
# Imprimir números reais com precisão formatada
pi = 3.141592653589793
print('pi = {0:1.2f}'.format(pi))

__Exemplo:__

Abaixo vemos um exemplo com quatro diferentes classes de objetos descritas com a função `type()`:


*   Números inteiros (_Integer_)
*   Números reais contínuos (_Floating_)
*   Lógicos ou booleanos (_True / False_)
*   _String_



In [None]:
# Declarar objetos
x = 1
y = 1.0
z = True
a = 'a'

# Imprimir as classes dos objetos
print(' x é {}\n y é {}\n z é {}\n a é {}'.format(type(x), 
                                                  type(y), 
                                                  type(z), 
                                                  type(a)))

## Declarar objetos (variávies)

Regras para declarar variáveis:
* Nomes não podem começar com números
* Nomes não contém espaços, usar **_**
* Nomes não podem conter os símbulos:

      :'",<>/?|\!@#%^&*~-+
       
* Recomendável seguir as boas práticas segundo a norma [PEP8](https://www.python.org/dev/peps/pep-0008/#function-and-variable-names) que diz nomes de objetos são em letras minúsculas e separados por *underscore* **_**
* Evitar usar palavras chave das bibliotecas Python nativas (built-in) como `list` e `str`
* Evitar caracteres únicos como `l`, `O` e `I`, pois podem ser confundidos com `1` e `0`

### Python `name` e `namespace`

In [None]:
# Checando o namespace
%whos

In [None]:
# Declarar uma nova variável (novo name) no namespace
n = 3
print(n)

In [None]:
# Erro de namespace ao tentar imprimir variável inexistente
outra_variavel

__Exemplo:__

A forma como o Python administra os objetos e valores no `namespace` é otimizada, onde dois ou mais objetos podem compartilhar dados.

No exemplo abaixo, dois objetos (`lista_a`, `lista_b`) compartilham a mesma lista de valores `[1, 2, 3]`.

In [None]:
# Declarar uma lista
lista_a = [1, 2, 3]
# Apontar outro objeto para a mesma lista
lista_b = lista_a
# Adicionar um elemento à list_a
lista_a.append(4)
# Verificar a lista_b
print(lista_b)

### Declaração dinâmica
Em Python, as variáveis podem sofrer alterações dinâmicas enquanto digitamos. Um objeto (variável) pode ser modificada para outros valores e outras classes, bastando que as mesmas sejam declaradas novamente.

In [None]:
# Declarar objeto
objeto = 10
objeto, type(objeto), id(objeto)

In [None]:
# Declarar novo valor para o objeto
objeto = 'abcd'
objeto, type(objeto), id(objeto)

In [None]:
# Checar namespace
%whos

### Declaração dinâmica com operações aritméticas

In [None]:
# Declarar uma variável com um valor inteiro
a = 1
a

In [None]:
# Declarar a mesma variável alterando seu valor a partir da soma
a += 1
a

In [None]:
# Declarar a mesma variável alterando seu valor a partir da multiplicação
a *= 2
a

## Operadores binários




### Tabela de operadores aritméticos
Na tabela abaixo, sendo as variáveis inteiras  (`int`) ou reais (`float`) `a` e `b`

Operador | Nome | descrição
--- | ---
 `a + b` | Adição | Soma de `a` com `b`
 `a - b` | Subtração | Subtrai o valor de `b` de `a`
 `a * b` | Multiplicação | Multiplica o valor de `a` pelo valor de  `b`
 `a / b` | Divisão real | Retorna o quociente fracionado da divisão de `a` por `b`
 `a // b` | Divisão inteira | Retorna o quociente inteiro da divisão de `a` por `b`
 `a % b` | Resto da divisão inteira | Retorna o resto da divisão de `a` por `b`
 `a ** b` | Potência | Retorna o valor de `a` elevado a potência de `b`
 `-a` | Negativo | Converte o valor de `a` em número negativo
 `+a` | Postivo | Converte o valor de `a` em número positivo
 
 

__Exemplos:__

In [None]:
# Utilizar operadores aritméticos com perênteses
(4 + 8) * (6.5 - 3)

In [None]:
# Adicionar o valor 8 à soma anterior e fazer divisão real por 6
((4 + 8) * (6.5 - 3) + 8) / 6

In [None]:
# Fazer divisão "inteira"
((4 + 8) * (6.5 - 3) + 8) // 6

In [None]:
# Encontrar o resto da divisão inteira
((4 + 8) * (6.5 - 3) + 8) % 6

### Tabela de operadores de comparação
Na tabela abaixo, sendo `a = 1` e `b = 2`

Simbologia | Descrição | Exemplo | Boolean
--- | ---
 `==` | Verifica se os valores são iguais | `a == b` | `False`
 `!=` | Verifica se os valores são diferentes | `a != b` | `True`
 `>` | Verifica se um valor é maior | `a > b` | `False`
 `<` | Verifica se um valor menor | `a < b` | `True`
 `>=` | Verifica se um valor é maior ou igual | `a >= b` | `False`
 `<=` | Verifica se um valor é menor ou igual | `a <= b` | `True`
`is` | Verifica se o valor é o mesmo entre duas variáveis | `a is b` | `False`
`is not` | Verifica se o valor de uma variável não é igual ao de outra | `a is not b` | `True`


__Exemplos:__

In [None]:
# Declarar duas variáveis
a = 1
b = 2

In [None]:
# Verificar se a e b são iguais
a == b

In [None]:
# Verificar se a e b são diferentes
a != b

In [None]:
# Verificar se a é maior que b
a > b

In [None]:
# Verificar se a é menor que b
a < b

In [None]:
# Verificar se a é maior ou igual a b
a >= b

In [None]:
# Verificar se a é menor ou igual a b
a <= b

In [None]:
# Verificar se a é b
a is b

In [None]:
# Apontar o valor b para a
a = b
a is b

In [None]:
# Verificar se a não é b
a is not b

In [None]:
# Declarar a como nula e verificar condição
a = None
a is None

## Expressões condicionais (controle de fluxo)
Dois fatores fundamentais para se utilizar expressões condicionais em Python:
- Identação (4 espaços ou 1 tabulação)
- Consistência lógica

### `if, elif, else`
```python
if condition1:
    indentedBlockForTrueCondition1
elif condition2:
    indentedBlockForTrueCondition2
else:
    indentedBlockForEachConditionFalse
```


In [None]:
# Exemplo com if
if True:
    print('Verdadeiro!')

In [None]:
# Exemplo com else
if a == b:
    print('a é igual a b')
else:
    print('a não é igual a b')
    

In [None]:
# Exemplo com elif
if a == b:
    print('a é igual b')
elif a > b:
    print('a é maior que b')
else:
    print('a é menor que b')

### `for`
```python
for item in data:
    indentedBlock
```

In [None]:
# Criar lista com números inteiros de 1 à 5
lista = [1, 2, 3, 4, 5]

In [None]:
# Criar iteração para imprimir cada item com for
for item in lista:
    print(item)

In [None]:
# Criar iteração para somar valores aos itens da lista com for
for i in lista:
    i = i + 1

print(lista)

In [None]:
# Somar
for i in lista:
    i += 1
    
print(lista)

In [None]:
# Checar números em uma lista e imprimir apenas os ímpares
for n in range(20):
    # checar se n é par
    if n % 2 == 0:
        continue
    # Imprimir n se for impar
    print(n)

### `while`
```python
while condition:
    indentedBlock
```
O `while`loop em Python é mais próximo da linguagem natural, como por ememplor:
> "While your tea is too hot, add a chip of ice."

In [None]:
# Adicionar 2 a variável i a cada passo, a partir de i = 4 enquanto i < 9
i = 4 
while i < 9:
    print(i)
    i = i + 2


## Métodos e atributos de objetos
Objetos em Python contêm atributos e podem ser modificados através de métodos, que são funções que são inerentes de cada classe de objeto.


In [None]:
string = "UFPE"

In [None]:
dir(string)

In [None]:
# Buscando ajuda sobre um método de string com a função help()
help(string.split)

In [None]:
# Testar o método lower
string.lower()

In [None]:
# Buscando ajuda com ?
string.join?

In [None]:
# Criar string com pontos de campo aglomerados em uma sequencia de strings
pontos = "PT-01,PT-02,PT-03"
# Criar lista separar pontos de campo com ","
lista_de_pontos = pontos.split(",")
print(lista_de_pontos)

In [None]:
# Declarar uma variável numérica
numero = 10
numero.bit_length()

### Funções nativas (Built-in)

Funções em Python são objetos que recebem argumentos para realizar tarefas como, cálculos aritméticos, transformações de variáveis, etc.

Funções são uma forma eficiente de otimizar códigos.

__Exemplos:__

- `print()`
- `help()`
- `dir()`
- ...

### *User-defined functions (UDFs)*
UDFs são funções criadas pelo usuário para ajudá-lo a resolver problemas específicos. Estas funções recebem muitas vezes o nome de *helper functions*.

Funções precisam ser declaradas com o comando `def` como no exemplo abaixo:

```python
def hello():
    '''
    Docstring (documentação)
    '''
    return print("Hello, World!")  
```

`Docstrings` são textos que documentam a função, descrevendo o objetivo da função, os parâmetros (argumentos) e variáveis de entrada (input) e a saída (output).

In [None]:
def soma(a, b):
    '''
    Função para somar dois valores
    
    input: a, b
    
    output: soma a + b
    '''
    return a + b

In [None]:
soma(1, 4)

Funções podem receber argumentos flexíveis, ao invés de variáveis fixas. Para utilizar este recurso é preciso declarar `*args` e/ou `**kwargs` como input, fazendo com que a quantidade de variáveis não seja limitada. ``

In [None]:
def soma_n_valores(*args):
    return sum(args)

In [None]:
# Calcular soma de valores com a função soma_n_valores()
soma_n_valores(1, 4, 5)

In [None]:
def catch_all(*args, **kwargs):
    '''
    Função para coletar argumentos e imprimir
    '''
    print("args =", args)
    print("kwargs = ", kwargs)

In [None]:
catch_all(1, 2, 3, a=4, b=5)

In [None]:
catch_all('a', keyword=2)

In [None]:
inputs = (1, 2, 3)
keywords = {'pi': 3.14}

catch_all(*inputs, **keywords)

__Exemplos:__

Limpar os nomes dos pontos coletados em campo removendo os caracteres errados e formatando os prefixos dos pontos para upper case.

In [None]:
# Declarar uma lista com pontos de campo
pontos_de_campo = ['PT-01!#   ', '  pt-02  ', '  Pt?-03 ']

In [None]:
def clean_strings(strings):
    '''
    Função para limpar e formatar valores em uma lista de pontos de campo
    
    input: lista com os pontos de campo
    
    output: lista com os valores limpos e formatados
    '''
    import re
    result = []
    for value in strings:
        value = value.strip()
        value = re.sub('[!#?]', '', value)
        value = value.upper()
        result.append(value)
    return result

In [None]:
# Aplicar a função criada na lista de pontos
clean_strings(pontos_de_campo)

Em geologia estrutural uma tarefa essencial para se computar com ângulos é necessário converter graus em radianos. Podemos criar uma helper function para conversão de unidades.

In [None]:
def deg2rad(x):
    ''' 
    Função para converter graus em radianos

    input: ângulo em graus

    output: ângulo em radianos
    
    requisito: from math import pi
    
    '''
    from math import pi
    
    return x * pi / 180

In [None]:
deg2rad?

In [None]:
# Converter graus em radianos
deg2rad(90)

### Funções anônimas (*lambda*)
Funções lambda não são definidas com `def` como as UDFs.

In [None]:
add = lambda x, y: x + y

add(1, 2)

In [None]:
double = lambda x: x * 2

double(5)

### *Namespaces*, *scope* e funçoes locais
Funções podem ser definidas em global scope ou local.

In [None]:
# Apagar todas as variáveis
%reset

In [None]:
def func():
    '''
    Função para criar lista com 5 números inteiros
    '''
    a = []
    for i in range(5):
        a.append(i)
    return print(a)

In [None]:
# Rodar a função func()
func()

In [None]:
# Checar namespace
%whos

In [None]:
print(a)

In [None]:
# Declarar uma variável no escopo global
a = []
# Declarar função
def func():
    # Criar uma lista em escopo global
    for i in range(5):
        # Agregar valores à lista a
        a.append(i)
    return print(a)

In [None]:
func()

In [None]:
%whos

### Utilizando funções para criar objetos
Em Python é possível criar múltiplas variáveis com uma única função. Esse recurso é muito utilizado na ciência de dados, pois 

In [None]:
def f():
    '''
    Função para criar 3 variáveis
    '''
    a = 5 
    b = 6 
    c = 7
    return a, b, c

In [None]:
a, b, c = f()
a, b, c

In [None]:
valores = f()
valores

__Referências__

- [The Python Tutorial (Python.org)](https://docs.python.org/3.6/tutorial/index.html)
- [Kaggle's Python Tutorial](https://www.kaggle.com/learn/python)
- [Built-in Functions](https://docs.python.org/3/library/functions.html)