## Tutorial de Python com Jupyter Notebook

Este tutorial foi traduzido e adaptado por [Rui Marcelino](https://orcid.org/0000-0001-8717-3243) para as sessões de Tracking, da [Pós-Graduação em Football Anaytics](https://www.europeia.pt/online/formacao-de-executivos/pos-graduacoes/football-analytics) da Universidade Europeia, para o ano de 2021-2022. Atualizado em 21/03/2022

O tutorial foi escrito originalmente por [Justin Johnson](https://web.eecs.umich.edu/~justincj/) para cs231n e adaptado enquando Jupyter notebook para cs228 por [Volodymyr Kuleshov](http://web.stanford.edu/~kuleshov/) e [Isaac Caswell](https://symsys.stanford.edu/viewing/symsysaffiliate/21335). Existe uma versão disponível em [Google Colab](https://colab.research.google.com/github/cs231n/cs231n.github.io/blob/master/jupyter-notebook-tutorial.ipynb#scrollTo=HvlSN5hlucGz)

Esta versão foi adaptada como um notebook Jupyter com suporte Python3 por Kevin Zakka para a edição Spring 2020 de [cs231n](http://cs231n.stanford.edu/).

## O que é um Jupyter Notebook?

Um Jupyter Notebbok é composto de várias células. Cada célula pode conter código Python. Existem dois tipos principais de células: células `Code` e células` Markdown`. Esta célula em particular é uma célula `Markdown`. Podes executar esta célula em particular clicando duas vezes nela (a cor de destaque mudará de azul para verde) ou pressionando `Shift-Enter`. Ao fazer isso, se a célula for uma célula de `Código`, o código na célula será executado e a saída da célula será exibida abaixo da célula e, se a célula for uma célula de` Markdown`, o texto de marcação será renderizado abaixo da célula.

Avança e tente executar esta célula.

A célula abaixo é uma célula de `Código`. Vai em frente, clique nela e execute-a.

In [None]:
x = 1
print(x)

Variáveis globais são compartilhadas entre células. Tente executar a célula abaixo:

In [None]:
y = 2 * x
print(y)

### Atalhos do teclado

Existem alguns atalhos de teclado que devem conhecer para tornar a experiência do notebook mais agradável. Para escapar da edição de uma célula, pressione `esc`. O escape de uma célula `Markdown` não irá renderizá-la, então certifique-se de executá-la se quiser renderizar o _markdown_. Observe como a cor de realce muda de volta para azul quando você sai de uma célula.

É possível navegar entre as células pressionando as teclas de seta. Executar uma célula desloca automaticamente o cursor da célula 1 célula para baixo, se houver, ou cria uma nova célula abaixo da atual, se não houver nenhuma.

* Para colocar uma célula abaixo da atual, pressione `b`.
* Para colocar uma célula acima da atual, pressione `a`.
* Para excluir uma célula, pressione `dd`.
* Para converter uma célula em `Markdown` pressione` m`. Observe que você deve estar no modo `esc`.
* Para convertê-lo de volta para `Código` pressione` y`. Observe que você deve estar no modo `esc`.

Familiariza-re com esses atalhos de teclado, são bastante úteis!

Un notebook pode ser reiniciar, limpando todas as células clicando em `Kernel -> Restart & Clear Output`. Se não quiser limpar as saídas das células, basta clicar em `Kernel -> Restartr`.

Por convenção, espera-se que os notebooks Jupyter sejam executados de cima para baixo. Deixar de executar algumas células ou executar células fora de ordem pode resultar em erros. Depois de reiniciar o notebook, tente executar o `y = 2 * x` célula 2 células acima e observe o que acontece.

Depois de modificar um bloco de anotações Jupyter para uma das atribuições, modificando ou executando algumas de suas células, lembre-se de salvar suas alterações! Você pode salvar com o atalho `Command / Control + s` ou clicando em` File -> Save and Checkpoint`.

Esta foi apenas uma breve introdução aos blocos de notas do Jupyter, mas deve ser o suficiente para que comecem a trabalhar com as tarefas deste curso.

## Python Tutorial

Python é uma linguagem de programação de propósito geral por si só, mas com a ajuda de algumas bibliotecas `libraries` populares (numpy, scipy, matplotli, ...) torna-se um ambiente poderoso para computação científica.

Neste tutorial, vamos cobrir:

* Python básico: tipos de dados básicos (Containers, listas, dicionários, conjuntos, tuplas), funções, classes
* Numpy: matrizes, indexação de matrizes, tipos de dados, matemática de matrizes, transmissão
* Matplotlib: criação de gráficos, subtramas, imagens
* IPython: Criação de notebooks, fluxos de trabalho típicos

## Uma breve nota sobre as versões do Python

Desde 1º de janeiro de 2020, Python tem [oficialmente cancelado o suporte] (https://www.python.org/doc/sunset-python-2/) para `python2`. ** Estaremos usando Python 3.8 para esta iteração do curso. **



In [None]:
!python --version

## Fundamentos de Python

Python é uma linguagem de programação multiparadigma de tipo dinâmico de alto nível. O código Python costuma ser considerado quase como um pseudocódigo, pois permite que se expressem ideias muito poderosas em poucas linhas de código e, ao mesmo tempo, é muito legível. Como exemplo, aqui está uma implementação do algoritmo clássico de classificação rápida em Python:

In [None]:
def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)

print(quicksort([3,6,8,10,1,2,1]))

Aqui está o que a classe acima está a fazer:

    1. Quando a classe é instanciada, ela cria um atributo de instância chamado
    `arr` e atribui a ele o valor do argumento de entrada` arr`.

    2. Existe um método chamado `quicksort` que leva um array como entrada
    argumento.

    3. Dentro do método `quicksort`, a primeira coisa que ele faz é verificar se o
    o comprimento da matriz é menor ou igual a um. Se isso for verdade, o
    método retorna a matriz.

    4. Se o comprimento for maior que um, o código cria um atributo
    chamado `pivot` e o atribui ao valor do item no índice do meio
    da matriz.

    5. O código cria um atributo chamado `left` e o atribui a um array
    contendo todos os itens na matriz de entrada que são menores que o valor de
    o atributo `pivot`.

    6. O código cria um atributo chamado `middle` e o atribui a um array
    contendo todos os itens na matriz de entrada que são iguais ao valor de
    o atributo `pivot`.

    7. O código cria um atributo chamado `right` e o atribui a um array
    contendo todos os itens na matriz de entrada que são maiores que o valor
    do atributo `pivot`.

    8. O código retorna a concatenação do resultado da chamada recursiva
    o método `quicksort` no array` left`, o array `middle`, e o
    array `right`.
    

Esta é o resultado a quando o código é executado na matriz de entrada
`[3,6,8,10,1,2,1]`:

     >>> s = Solution ([3,6,8,10,1,2,1])
     >>> s.quicksort ([3,6,8,10,1,2,1])
     [1, 1, 2, 3, 6, 8, 10]

e se
>>> s = Solution ([4,5,4,10,12,12,1])

>>> s.quicksort ([4,5,4,10,12,12,1])

então a saída é:

     [1, 4, 4, 5, 10, 12, 12]

Experimenta utilizar aquele conjunto de dados

### Tipo de dados básicos

#### Números

Inteiros e decimais (floats) funcionam como você esperaria de outras linguagens:

In [None]:
x = 3
print(x, type(x))

In [None]:
print(x + 1)   # Addition
print(x - 1)   # Subtraction
print(x * 2)   # Multiplication
print(x ** 2)  # Exponentiation

In [None]:
x += 1
print(x)
x *= 2
print(x)

In [None]:
y = 2.5
print(type(y))
print(y, y + 1, y * 2, y ** 2)

Observa que, ao contrário de muitas linguagens, Python não tem operadores de incremento (x ++) ou decremento (x--) unário.

Python também possui tipos embutidos para inteiros longos e números complexos; podes encontrar todos os detalhes na [documentação] (https://docs.python.org/3.8/library/stdtypes.html#numeric-types-int-float-long-complex).

#### Booleanos

Python implementa todos os operadores usuais para lógica booleana, mas usa palavras em inglês em vez de símbolos (`&&`, `||`, etc.):

In [None]:
t, f = True, False
print(type(t))

Agora vamos dar ver as operações lógicas:

In [None]:
print(t and f) # Logical AND;
print(t or f)  # Logical OR;
print(not t)   # Logical NOT;
print(t != f)  # Logical XOR;

#### Strings

In [None]:
hello = 'hello'   # String literais podem usar aspas simples
world = "world"   # ou aspas duplas; não faz diferença
print(hello, len(hello))

In [None]:
hw = hello + ' ' + world  # String concatenation
print(hw)

In [None]:
hw12 = '{} {} {}'.format(hello, world, 12)  # string formatting
print(hw12)

Os objetos String têm vários métodos úteis; por exemplo:

In [None]:
s = "hello"
print(s.capitalize())  # Capitalize a string
print(s.upper())       # Converta uma string em maiúsculas; imprime "HELLO"
print(s.rjust(7))      # Justifique uma string à direita, preenchendo com espaços
print(s.center(7))     # Centralize uma string, preenchendo com espaços
print(s.replace('l', '(ell)'))  # Substitua todas as ocorrências de uma substring por outra
print('  world '.strip())  # Retire os espaços em branco à esquerda e à direita

Podes encontrar uma lista de todos os métodos aplicados às strings aqui: [documentação](https://docs.python.org/3.8/library/stdtypes.html#string-methods).

### Containers

Python inclui vários tipos de containers integrados: listas, dicionários, conjuntos e tuplas.

#### Listas

Uma lista é o equivalente em Python de uma matriz `array`, mas pode ser redimensionada e pode conter elementos de diferentes tipos:

In [None]:
xs = [3, 1, 2]   # Cria uma lista
print(xs, xs[2])
print(xs[-1])     # Os índices negativos contam a partir do final da lista; imprime "2"

In [None]:
xs[2] = 'foo'    # As listas podem conter elementos de diferentes tipos
print(xs)

In [None]:
xs.append('bar') # Adicione um novo elemento ao final da lista
print(xs)  

In [None]:
x = xs.pop()     # Remova e retorne o último elemento da lista
print(x, xs)

Como sempre, podem encontrar todos os detalhes sobre as listas na [documentação](https://docs.python.org/3.8/tutorial/datastructures.html#more-on-lists).

#### Slicing

Além de acessar os elementos da lista um por vez, o Python fornece uma sintaxe concisa para acessar as sublistas; isso é conhecido como slicing:

In [None]:
nums = list(range(5))    # intervalo é uma função incorporada que cria uma lista de inteiros
print(nums)         # Imprime "[0, 1, 2, 3, 4]"
print(nums[2:4])    # Obtenha uma fatia do índice 2 a 4 (exclusivo); imprime "[2, 3]"
print(nums[2:])     # Obtenha uma fatia do índice 2 até o final; imprime "[2, 3, 4]"
print(nums[:2])     # Obtenha uma do início ao índice 2 (exclusivo); imprime "[0, 1]"
print(nums[:])      # Obtenha uma de toda a lista; imprime ["0, 1, 2, 3, 4]"
print(nums[:-1])    # Os índices de fatia podem ser negativos; imprime ["0, 1, 2, 3]"
nums[2:4] = [8, 9]  # Atribuir uma nova sublista a uma fatia
print(nums)         # Imprime "[0, 1, 8, 9, 4]"

#### Loops

É possível repetir `loop` os elementos de uma lista como esta:

In [None]:
animals = ['cat', 'dog', 'monkey']
for animal in animals:
    print(animal)

Se quisermos aceder ao índice de cada elemento dentro do corpo de um loop, usamos a função incorporada `enumerate`:

In [None]:
animals = ['cat', 'dog', 'monkey']
for idx, animal in enumerate(animals):
    print('#{}: {}'.format(idx + 1, animal))

#### List comprehensions

Ao programar, frequentemente queremos transformar um tipo de dado noutro. Como um exemplo simples, considera o seguinte código que calcula números quadrados:

In [None]:
nums = [0, 1, 2, 3, 4]
squares = []
for x in nums:
    squares.append(x ** 2)
print(squares)

É possível tornar este código mais simples, fazendo uma list comprehension:

In [None]:
nums = [0, 1, 2, 3, 4]
squares = [x ** 2 for x in nums]
print(squares)

List comprehensions também podem conter condições:

In [None]:
nums = [0, 1, 2, 3, 4]
even_squares = [x ** 2 for x in nums if x % 2 == 0]
print(even_squares)

#### Dicionários

Um dicionário armazena pares (chave `key`, valor `value`), semelhante a um `Map` em Java ou um objeto em Javascript. Pode ser utilizado assim:

In [None]:
d = {'cat': 'cute', 'dog': 'furry'}  # Crie um novo dicionário com alguns dados
print(d['cat'])       # Obtenha uma entrada de um dicionário; imprime "cute"
print('cat' in d)     # Verifique se um dicionário possui uma determinada chave; imprime "True"

In [None]:
d['fish'] = 'wet'    # Definir uma entrada num dicionário
print(d['fish'])      # Imprime "wet"

In [None]:
print(d['monkey'])  # KeyError: 'monkey' não é uma chave de d

In [None]:
print(d.get('monkey', 'N/A'))  # Obtenha um elemento com um padrão; imprime "N / A"
print(d.get('fish', 'N/A'))    # Obtenha um elemento com um padrão; imprime "wet"

In [None]:
del d['fish']        # Remova um elemento de um dicionário
print(d.get('fish', 'N/A')) # "fish" não é mais uma chave; imprime "N / A"

Podes encontrar tudo o que necessitas na [documentação](https://docs.python.org/2/library/stdtypes.html#dict).

É fácil iterar nas chaves de um dicionário:

In [None]:
d = {'person': 2, 'cat': 4, 'spider': 8}
for animal, legs in d.items():
    print('A {} has {} legs'.format(animal, legs))

Compreensões de dicionário: são semelhantes às compreensões de lista, pois permitem criar dicionários facilmente. Por exemplo:

In [None]:
nums = [0, 1, 2, 3, 4]
even_num_to_square = {x: x ** 2 for x in nums if x % 2 == 0}
print(even_num_to_square)

#### Conjuntos `Sets`

Um conjunto é uma coleção não ordenada de elementos distintos. Como um exemplo simples, considere o seguinte:

In [None]:
animals = {'cat', 'dog'}
print('cat' in animals)   # Verifique se um elemento está em um conjunto; imprime "Verdadeiro"
print('fish' in animals)  # Imprime "False"


In [None]:
animals.add('fish')      # Adiciona um elemento a um conjunto
print('fish' in animals)
print(len(animals))       # Imprime o número de elementos num conjunto;

In [None]:
animals.add('cat')       # Adicionar um elemento que já está no conjunto não faz nada
print(len(animals))       
animals.remove('cat')    # Remove um elemento de um conjunto
print(len(animals))       

* Loops *: Iterar sobre um conjunto tem a mesma sintaxe que iterar sobre uma lista; no entanto, como os conjuntos não são ordenados, não se pode fazer suposições sobre a ordem em que visita os elementos do conjunto:

In [None]:
animals = {'cat', 'dog', 'fish'}
for idx, animal in enumerate(animals):
    print('#{}: {}'.format(idx + 1, animal))

Compreensões de conjuntos: como listas e dicionários, podemos construir conjuntos facilmente usando compreensões de conjuntos:

In [None]:
from math import sqrt
print({int(sqrt(x)) for x in range(30)})

#### Tuples

Um tuple é uma lista ordenada (imutável) de valores. Um tuple é, em muitos aspectos, semelhante a uma lista; uma das diferenças mais importantes é que tuplas podem ser usadas como chaves em dicionários e como elementos de conjuntos, enquanto listas não. Aqui está um exemplo trivial:

In [None]:
d = {(x, x + 1): x for x in range(10)}  # Cria um dicionário com chaves de tuples
t = (5, 6)       # Cria um tuple
print(type(t))
print(d[t])       
print(d[(1, 2)])

### Funções

As funções em Python são definidas usando a palavra-chave `def`. Por exemplo:

In [None]:
def sign(x):
    if x > 0:
        return 'positive'
    elif x < 0:
        return 'negative'
    else:
        return 'zero'

for x in [-1, 0, 1]:
    print(sign(x))

Frequentemente, definiremos funções para aceitar argumentos de palavra-chave opcionais, como este:

In [None]:
def hello(name, loud=False):
    if loud:
        print('HELLO, {}'.format(name.upper()))
    else:
        print('Hello, {}!'.format(name))

hello('Bob')
hello('Fred', loud=True)

### Classes

A sintaxe para definir classes em Python é direta:

In [None]:
class Greeter:

    # Construtor
    def __init__(self, name):
        self.name = name  # Crie uma variável de instância

    # Instance method
    def greet(self, loud=False):
        if loud:
          print('HELLO, {}'.format(self.name.upper()))
        else:
          print('Hello, {}!'.format(self.name))

g = Greeter('Fred')  # Construir uma instância da classe Greeter
g.greet()            # Chama por um método de instância; imprime "Hello, Fred"
g.greet(loud=True)   # Chama por um método de instância; imprime "HELLO, FRED!"

## Numpy

Numpy é a biblioteca central para computação científica em Python. Ela fornece um objeto de matriz multidimensional de alto desempenho e ferramentas para trabalhar com essas matrizes. Mais informação na [documentação](https://numpy.org/doc/stable/reference/?v=20211116120726)

Para usar o Numpy, primeiro precisamos importar o pacote `numpy`:

In [None]:
import numpy as np

### Arrays (matriz)

Uma matriz numpy é uma grade de valores, todos do mesmo tipo, e é indexada por uma tupla de inteiros não negativos. O número de dimensões é a classificação da matriz; a forma de uma matriz é uma tupla de inteiros fornecendo o tamanho da matriz ao longo de cada dimensão.

Podemos inicializar matrizes numpy a partir de listas Python aninhadas e acessar elementos usando colchetes:

In [None]:
a = np.array([1, 2, 3])  # Criar ranking de 1 array
print(type(a), a.shape, a[0], a[1], a[2])
a[0] = 5                 # Alterar um elemento num array
print(a)                  

In [None]:
b = np.array([[1,2,3],[4,5,6]])   # Criar ranking de 2 array
print(b)

In [None]:
print(b.shape)
print(b[0, 0], b[0, 1], b[1, 0])

O Numpy também oferece muitas funções para criar matrizes:

In [None]:
a = np.zeros((2,2))  # Crie uma matriz apenas com zeros
print(a)

In [None]:
b = np.ones((1,2))   # Crie uma matriz apenas com uns
print(b)

In [None]:
c = np.full((2,2), 7) # Crie uma matriz constante
print(c)

In [None]:
d = np.eye(2)        # Crie uma matriz de identidade 2x2
print(d)

In [None]:
e = np.random.random((2,2)) # Crie uma matriz preenchida com valores aleatórios
print(e)

### Tipo de Dados

Cada matriz numpy é uma grade de elementos do mesmo tipo. Numpy fornece um grande conjunto de tipos de dados numéricos que se podem usar para construir matrizes. O Numpy tenta adivinhar um tipo de dados quando se cria uma matriz, mas as funções que constroem matrizes geralmente também incluem um argumento opcional para especificar explicitamente o tipo de dados. Aqui está um exemplo:

In [None]:
x = np.array([1, 2])  # Deixar numpy escolher o tipo de dados
y = np.array([1.0, 2.0])  # Deixar numpy escolher o tipo de dados
z = np.array([1, 2], dtype=np.int64)  # Forçar um determinado tipo de dados

print(x.dtype, y.dtype, z.dtype)

Informação sobre os tipos de dados numpy na [documentação](http://docs.scipy.org/doc/numpy/reference/arrays.dtypes.html).

## Matplotlib

Matplotlib é uma biblioteca para representação gráfica.

In [None]:
import matplotlib.pyplot as plt

Ao executar este comando especial do iPython, exibiremos gráficos embutidos (inline):

In [None]:
%matplotlib inline

### Plotting

In [None]:
#Para criar um gráfico de linha simples, basta fornecer uma lista de valores y para a função plt.plot ().

plt.plot([5, 8, 2, 6, 1, 8, 2, 3, 4, 5, 6])

A função mais importante em `matplotlib` é plot, que permite plotar dados 2D. Aqui está um exemplo simples:

In [None]:
# Calcula as coordenadas x e y para pontos em uma curva seno
x = np.arange(0, 3 * np.pi, 0.1)
y = np.sin(x)

# Traça os pontos usando matplotlib
plt.plot(x, y)

Com apenas um pouco de trabalho extra, podemos facilmente plotar várias linhas de uma vez e adicionar um título, legenda e rótulos de eixo:

In [None]:
y_sin = np.sin(x)
y_cos = np.cos(x)

# Plot the points using matplotlib
plt.plot(x, y_sin)
plt.plot(x, y_cos)
plt.xlabel('x axis label')
plt.ylabel('y axis label')
plt.title('Seno and Coseno')
plt.legend(['Seno', 'Coseno'])

### Subplots 

É possível plotar coisas diferentes na mesma figura usando a função subplot. Aqui está um exemplo:

In [None]:
# Calcule as coordenadas x e y para pontos nas curvas seno e cosseno
x = np.arange(0, 3 * np.pi, 0.1)
y_sin = np.sin(x)
y_cos = np.cos(x)

# Configure uma grade de subplots com altura 2 e largura 1,
# e defina a primeira subplots como ativa.
plt.subplot(2, 1, 1)

# Produz o primeiro gráfico (plot)
plt.plot(x, y_sin)
plt.title('Sine')

# define o segundo subplot como ativo, e produz o segundo gráfico.
plt.subplot(2, 1, 2)
plt.plot(x, y_cos)
plt.title('Cosine')

# mostra a figura.
plt.show()

Mais sobre a função `subplot` na [documentação](http://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.subplot).

## Próximo passo: Onde Aprender Mais?

Python oferece uma gama completa de recursos de linguagem de programação, e há uma gama aparentemente infinita de pacotes para cálculos científicos uteis para a análise de dados.
Aqui estão algumas sugestões de lugares onde podme ir para obter mais informações sobre programação de ciências de dados em Python.

    

### Aprendizagem interativa e tutoriais online

* [Code Academy on Python](http://www.codecademy.com/tracks/python)
* [Khan Academy Videos on Python Programming](https://www.khanacademy.org/science/computer-science-subject/computer-science)
* [Python Tutorial](http://docs.python.org/2/tutorial/)
* [Think Python: How to Think Like a Computer Scientist](http://www.greenteapress.com/thinkpython/html/index.html)

### Documentação oficial, exemplos e galerias

* [Notebook Examples](https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/examples_index.html#notebook-examples)
* [Official Notebook Documentation](https://github.com/jupyter/jupyter/wiki)
* [More tutoriais](https://jckantor.github.io/CBE30338/toc.html)
* [Matplotlib](http://matplotlib.org/index.html) 

# Aceder a dados em ficheiros .csv e .xlsx

## A biblioteca Pandas será utilizada de forma extensiva para estas análises. Exemplos e tutoriais podem ser acedidos através da [documentação](https://pandas.pydata.org/docs/index.html)

In [None]:
# importar a biblioteca pandas

import pandas as pd

In [None]:
# Ler um ficheiro .csv

df = pd.read_csv("data.csv")
df.head()

In [None]:
# Ler um ficheiro .xlsx

df1 = pd.read_excel("data.xlsx")
df1.head()