# Python para Análise de Dados - Numpy   

<p> Iremos aprender a trabalhar coma biblioteca Numpy.


In [1]:
# Importando a biblioteca numpy
import numpy as np

In [2]:
# Criando um array de 1 dimensão
one_dim = np.array([1,2,3,4])

In [3]:
type(one_dim)

numpy.ndarray

In [4]:
# Imprimindo um array.
one_dim.ndim

1

In [5]:
# Criando um array de 2 dimensões.
two_dim = np.array([(1,2,3), (4,5,6)])

In [6]:
# Imprimindo o array
two_dim.ndim

2

In [7]:
# Cria um array de números aleatórios.
# Um array de 5 linhas e duas dimensões.
np.random.random((5,2))

array([[0.81264081, 0.99954893],
       [0.81495991, 0.24358751],
       [0.0622806 , 0.89884025],
       [0.49448268, 0.54886431],
       [0.88773408, 0.34783193]])

In [8]:
# Cria um array com valores esparsos iniciando com o valor 10, menor que 50 e incrementando de 5 em 5.
np.arange(10,50,5)

array([10, 15, 20, 25, 30, 35, 40, 45])

In [9]:
# cria um array linear de 0 a 2 de no máximo 9 elementos.
np.linspace(0,2,9)

array([0.  , 0.25, 0.5 , 0.75, 1.  , 1.25, 1.5 , 1.75, 2.  ])

In [10]:
# Cria um array de valores zero.
# Cria um array com 3 linhas e 4 dimensões.
np.zeros((3,4))

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

# Numpy Arrays Vs Listas

- Arrays Numpy permitem fazermos operações em **arrays inteiros** de forma rápida.
- Listas não permitem operações em todos os elementos da lista.
- Para operações em todos os elementos é preciso interar sobre toda a lista.
- Listas em Python armazenam diferentes tipos de objetos
- Arrays Numpy considera todos os elementos de tipos distintos como strings


In [11]:
# Criando uma lista em Python.
lista = [1,2,3]

In [12]:
lista

[1, 2, 3]

In [13]:
# Multiplicar valores da lista por 2.
lista * 2

[1, 2, 3, 1, 2, 3]

In [14]:
# Transforme a variável lista em um array Numpy
lista = np.array(lista)

In [15]:
# Imprimindo o tipo do objeto.
type(lista)

numpy.ndarray

In [16]:
# Multiplicando cada elemento por 2.
lista * 2

array([2, 4, 6])

In [17]:
# Calcular IMC de pessoas.
pesos = [67,81,120,90]
altura = [1.68,1.70,1.75,1.85]

In [18]:
# Faz o calculo usando as listas
pesos / altura ** 2

TypeError: unsupported operand type(s) for ** or pow(): 'list' and 'int'

In [19]:
# Transforme isso em arrays numpy
pesos = np.array(pesos)
altura = np.array(altura)

In [20]:
# Imprime o calculo de cada valor
pesos / altura **2

array([23.73866213, 28.02768166, 39.18367347, 26.29656684])

In [21]:
# Arrays Numpy armazena elementos como strins quando estes não são inteiros ou float
a = np.array([1,3,'Casa',True])

In [22]:
a

array(['1', '3', 'Casa', 'True'], dtype='<U11')

In [23]:
a * 2 

TypeError: ufunc 'multiply' did not contain a loop with signature matching types dtype('<U11') dtype('<U11') dtype('<U11')

# Métodos e Atributos Úteis

In [24]:
# Métodos disponíveis (digite o . pressione tab).
two_dim.

SyntaxError: invalid syntax (<ipython-input-24-538b6f2a23d9>, line 2)

In [25]:
two_dim

array([[1, 2, 3],
       [4, 5, 6]])

In [26]:
# Retorna a forma do array no formato linhas e colunas.
two_dim.shape

(2, 3)

In [27]:
# Retorna a quantidade de dimensões.
two_dim.ndim

2

In [28]:
# Imprimindo o valor máximo do array.
two_dim.max()

6

In [29]:
# Imprimindo o valor mínimo.
two_dim.min()

1

In [30]:
# Imprimindo o valor médio.
two_dim.mean()

3.5

In [31]:
# Imprimindo o desvio padrão.
two_dim.std()

1.707825127659933

In [122]:
two_dim

array([[1, 2, 3],
       [4, 5, 6]])

In [32]:
two_dim.dtype

dtype('int32')

In [33]:
two_dim.size

6

In [34]:
# mostra a quantidade
two_dim.itemsize

4

In [35]:
# Somando todos os elementos do array.
two_dim.sum()

21

#  Transformando Arrays

In [36]:
two_dim

array([[1, 2, 3],
       [4, 5, 6]])

In [37]:
# Gera a Transposta da Matriz (Linha -> coluna)
two_dim.T

array([[1, 4],
       [2, 5],
       [3, 6]])

In [38]:
two_dim

array([[1, 2, 3],
       [4, 5, 6]])

In [39]:
# Transforma em uma matriz de uma linha.
# È muito comum em bibliotecas como scikit-learn e Keras
two_dim.reshape(-1)

array([1, 2, 3, 4, 5, 6])

In [40]:
tree = np.random.random((5,3))

In [41]:
tree.shape

(5, 3)

In [42]:
tree

array([[0.7652759 , 0.24018671, 0.55664687],
       [0.76624247, 0.39843642, 0.91336962],
       [0.1486975 , 0.27384441, 0.44185305],
       [0.29316738, 0.04871082, 0.72097463],
       [0.33429855, 0.88300179, 0.51525866]])

In [43]:
# Transforma em uma matriz com 3 linhas e 5 colunas
tree.reshape(3,5)

array([[0.7652759 , 0.24018671, 0.55664687, 0.76624247, 0.39843642],
       [0.91336962, 0.1486975 , 0.27384441, 0.44185305, 0.29316738],
       [0.04871082, 0.72097463, 0.33429855, 0.88300179, 0.51525866]])

In [44]:
tree.reshape(-1)

array([0.7652759 , 0.24018671, 0.55664687, 0.76624247, 0.39843642,
       0.91336962, 0.1486975 , 0.27384441, 0.44185305, 0.29316738,
       0.04871082, 0.72097463, 0.33429855, 0.88300179, 0.51525866])

In [45]:
t=tree.reshape(1,15)
t

array([[0.7652759 , 0.24018671, 0.55664687, 0.76624247, 0.39843642,
        0.91336962, 0.1486975 , 0.27384441, 0.44185305, 0.29316738,
        0.04871082, 0.72097463, 0.33429855, 0.88300179, 0.51525866]])

In [46]:
two_dim

array([[1, 2, 3],
       [4, 5, 6]])

In [47]:
# Adicionando elementos a um array.
two_dim = np.insert(two_dim,0,10)

In [48]:
# Transforma em um array de uma linha.
two_dim

array([10,  1,  2,  3,  4,  5,  6])

In [49]:
# Apagando o elemento da primeira posição do array.
two_dim = np.delete(two_dim,[0])

In [50]:
two_dim

array([1, 2, 3, 4, 5, 6])

In [51]:
# Gerando um arquivo .txt a partir de um array
np.savetxt("dataset_array.txt",two_dim, delimiter=',')