# Numpy
Numpy é um pacote do Python utilizado nas análises de computação científica. As listas geradas utilizando o Numpy conferem um alto performance nas análises de um grande volume de dados e também flexibilidade para manipular matematicamente os dados.

Mais informações sobre este pacote pode ser encontrado em https://docs.scipy.org/doc/numpy/user/quickstart.html.

## Instalação
O pacote Numpy vem junto com a distribuição [Anaconda](anaconda.org). Se você não tem o Anaconda instalado, pode instalar o Numpy utilizando o pip:

``` 
python -m pip install --user numpy
```

## Utilizando o Numpy

In [None]:
import numpy as np

## Criando uma lista

In [None]:
# Criando uma lista com uma dimensão (eixo)
x = np.array([1,2,3])
print(x)

In [None]:
# Criando uma lista com duas dimensões (eixos)
x2 = np.array([[1,2,3],
               [4,5,6]])
print(x2)

In [None]:
# Erro comum ao criar uma lista do numpy
x_err = np.array(1,2,3)
print(x_err)

In [None]:
# criando listas de sequências de números
print(np.arange( 10, 30, 5 ))

In [None]:
# criando uma lista de números distribuídos em um determinado intervalo
print(np.linspace(0,10,101))

## Acessando os elementos

In [None]:
# acessando os elementos
x = np.array([1,2,3])
print(x[0], x[1], x[2])

## Acessando elementos em listas multidimensionais

In [None]:
# acessando um elemento
x2 = np.array([[1,2,3],
               [4,5,6]])
print(x2[1][2])

In [None]:
# acessando uma linha inteira
print(x2[1])

In [None]:
# acessando uma coluna inteira
print(x2[:,1])

## Atributos

In [None]:
# número de dimensões
print(x2.ndim)

In [None]:
# formato
print(x2.shape)

In [None]:
# tamanho
print(x2.size)

In [None]:
# tipo dos dados
print(x2.dtype)

## Funções agregadas

In [None]:
x2 = np.array([[1,2,3],
               [4,5,6]])
# soma
x2.sum()

In [None]:
# média
x2.mean()

In [None]:
# valor máximo
x2.max()

In [None]:
# valor mínimo
x2.min()

### Q. Como calcular a soma de uma linha?

In [None]:
# Escreva o seu código aqui:


### Q. Como calcular a soma de uma coluna?

In [None]:
# Escreva o seu código aqui:
x2[:,1].sum()

In [None]:
# soma do primeiro eixo (todas as colunas separadamente)
x2.sum(axis=0)

In [None]:
# soma do segundo eixo (todas as linhas separadamente)
x2.sum(axis=1)

## Operações básicas

In [None]:
a = np.array( [20,30,40,50] )
b = np.arange( 4 )
print(a)
print(b)

In [None]:
# Realizar operações matemáticas ("+","-", "*", "/", "**", "%", "//")
print(a-b)

In [None]:
# o sinal de "*" não se refere ao produto de uma matriz.
# ao invés disso usa-se "@" (Python 3.5+) ou a função .dot():
A = np.array( [[1,1],
               [0,1]] )
B = np.array( [[2,0],
              [3,4]] )

print(A.dot(B))
print(A @ B)

In [None]:
# Testar condição para cada elemento
test = a<35
print(test)

### Q. Como eu poderia verificar quantos foram verdadeiros?

In [None]:
# Escreva o seu código aqui


### Q. Como eu poderia verificar quantos foram falsos?

In [None]:
# Escreva o seu código aqui:


### Q. Como eu poderia recuperar apenas aqueles valores que satisfazem a condição?

In [None]:
# Escreva o seu código aqui:


## Acessando arquivos
Acesse o site do [WHO](http://apps.who.int/gho/data/node.main.SDGPOP?lang=en) e baixe a tabela com os dados populacionais dos países no formato CSV e deixe-o no mesmo diretório onde este notebook se encontra.

A tabela está organizada da seguinte forma:
1. Nome do país
2. População total (em milhares)
3. População abaixo de 15 (%)
4. População acima de 60 (%)
5. Taxa de fertilidade (por mulher)

Execute o código abaixo para formatar a tabela de forma a facilitar a análise e responda as questões logo abaixo.

In [None]:
f = open("data.csv", "r")    # ler o arquivo

firstLine = f.readline()     # pega a primeira linha (1o cabeçalho)
cells = firstLine.split(",") # 
ncol = len(cells)            # determina o número de colunas
secondLine = f.readline()    # pega e descarta a linha seguinte (2o cabeçalho)

country = []                 # armazena a ordem dos países
data = np.empty((0,ncol))    # armazena os dados numéricos
                             # 1o coluna: índice do país
                             # 2o coluna: População total (em milhares)
                             # 3o coluna: População abaixo de 15 (%)
                             # 4o coluna: População acima de 60 (%)
                             # 5o coluna: Taxa de fertilidade (por mulher)

idx = 0                      # contador de linhas; ele determinará o índice

# Formatar o arquivo
for row in f:
    
    # pula linhas vazias
    if not row.strip():  
        continue
    
    row = row.strip() # retira a quebra de linha
    
    # retira caracteres indesejáveis
    row = row.replace("\"", "")  
    row = row.replace(" ", "")
    
    cells = row.split(",") # dividir a linha por ","
    
    # armazena o país em country e atribui um índice para cada um deles
    country.append(cells[0]) 
    cells[0] = idx
    idx += 1
    
    # transformar os valores númericos (a princípio string) em float
    # dados faltantes considerado -1
    for y in range(1,len(cells)):
        if(cells[y]):
            cells[y] = float(cells[y])
        else:
            cells[y] = -1
    
    # transformar lista numa lista do numpy e armazenar em data
    ins = np.array([cells[0:]]) 
    data = np.append(data, ins, axis=0)

print(country[0:5])
print(data[0:5])


### Q. Qual a média do tamanho da população dos países?

In [None]:
# Escreva o seu código aqui:


### Q. Quais são os 10 países com maior porcentagem de população jovem?
**dica**: usar lista ordenada pode te ajudar. Veja este [link](https://stackoverflow.com/a/2828121)

In [None]:
# Escreva o seu código aqui:


### Q. Qual país tem a maior taxa de fertilidade?
**dica**: veja a função [argmax()](https://docs.scipy.org/doc/numpy-1.14.0/reference/generated/numpy.argmax.html)

In [None]:
# Escreva o seu código aqui:


### Q. Qual(is) país(es) possui(em) a menor taxa de fertilidade?
**Obs1.**: Verifique se mais de um país possui a mesma taxa.

**Obs2.**: Dados faltantes estão representados como -1

In [None]:
# Escreva o seu código aqui:


## Resumo dos comandos do Numpy
https://goo.gl/0eWPy6

## Referências

Scipy - página oficial dos criadores do Numpy: https://scipy.org/

Tutorial do Numpy:http://cs231n.github.io/python-numpy-tutorial/#numpy

WHO - World Health Organization: http://www.who.int/en/