# Treinamento Data Analytics com Python
Por [André Mattos](mailto:andremattos@kpmg.com.br)

[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/areysdemattos/TRN_Python_KPMG/main)

## Conteúdo

TO-DO AJUSTAR

1. Introdução ao Jupyter Notebook
2. A Linguagem Python
3. Importação e tratamento de dados com Pandas
4. Criação de gráficos simples
5. Criação de Dashboard com Bokeh

## Introdução ao Jupyter

### O que é?

A plataforma Jupyter uma plataforma interativa de desenvolvimento, voltada a execução imediata de scripts. Isto significa que, com o Jupyter, você pode escrever o código em células e executá-las individualmente, sem a necessidade de colocá-las em um arquivo de texto, compilar e gerar um executável.

Geralmente instalada como componente do Anaconda Python, esta plataforma é capaz de executar scripts em diversar linguagens, incluindo Python, Lua, Julia, R, Javascript, e inúmeras outras. Jupyter é *de facto* a plataforma mais utilizada em Data Science com Python.

O Jupyter Lab é uma evolução desta plataforma, em um ambiente organizado, capaz de executar multiplos notebooks de forma simultânea, além de uma organização em janelas subdivisíveis.

### Instalando

A maneira mais fácil de instalar o jupyter notebook é através da instalação do [Anaconda Python](https://www.anaconda.com/products/distribution).
Para este treinamento, utilizaremos o ambiente de testes, compartilhado no início do treinamento.




### Componentes do Jupyter Lab

TO-DO

## A Linguagem Python

### Sintaxe

Como é uma linguegem de programação desenvolvida com foco na usabilidade, a sintaxe do Python é muito simples.

Diferente de outras linguagens, o Python não exige caracteres iniciando o código nem finalizando o programa, e com exceção de algumas regras de identação, basta escrever as funções e a ferramenta executa.

Para inserir um comentário em Python, devemos utilizar o '#' precendendo o texto a ser comentado, como no exemplo abaixo.

In [1]:
#Este trecho será ignorado pela linguagem Python

### Hello World!

Uma das coisas mais fáceis de se fazer no Python é imprimir o texto 'Hello World!' em tela. Para isto, precisaremos apenas da função `print()`. Dentro da função, devemos colocar, em formato de texto, o que desejamos que seja impresso em tela.

##### Tarefa 1:
Crie um novo workbook e imprima o texto 'Hello World!'

### Instalando e Importando Bibliotecas

Em Python, nem tudo você precisa criar do zero. Existe uma infinidade de bibliotecas disponíveis, cada uma com sua função.

Para instalar uma biblioteca, você pode utilizar o **pip**. O **pip** é um gestor de pacotes incluso no python. Seu mecanismo de busca, basea-se no repositório online [PyPI](https://pypi.org).

Nosso ambiente já tem tudo o que precisamos pré-instalado. No entanto, caso quisessemos, por exemplo, instalar a biblioteca pandas, poderíamos utilizar o seguinte comando:

    import sys
    !{sys.executable} -m pip install pandas

Esse comando tem algumas características interessantes. Note que, em primeiro lugar, utilizamos um comando chamado `import`. Esse comando tem a função de trazer uma biblioteca instalada para dentro do nosso código.

Logo em seguida, nossa linha começa com uma exclamação. Essa exclamação tem a função de indicar ao Jupyter Notebook que a função que estamos solicitando será executada fora do ambiente Python.

O texto entre chaves é utilizado para trazer para um ambiente de texto, o
resultado de alguma operação Python. Neste exemplo, utilizamos a função `executable` da biblioteca `sys`, que nos traz o caminho da distribuição python sendo utilizada na execução do código. 

O argumento *-m*, indica ao Python que o próximo item a ser executado será uma biblioteca ou um módulo, e que este será executado como um script.

> Caso tivessemos acesso direto à linha de comando do ambiente, poderíamos utilizar apenas as ultimas etapas, responsáveis pela instalação do pacote, através do comando `pip install pandas`.

### Operações básicas

Para realizar as operações básicas em Python, basta escrever livremente em qualquer célula a operação a ser realizada

#### Adição

In [2]:
2+3

5

#### Multiplicação

In [3]:
3*4

12

#### Divisão

In [4]:
6/2

3.0

#### Subtração

In [5]:
4-1

3

#### Concatenação de strings

In [6]:
'Aula ' + 'de '+ 'Python'

'Aula de Python'

#### Recorte de Strings

In [7]:
'Aula de Python'[:4]

'Aula'

In [8]:
'Aula de Python'[5:7]

'de'

In [9]:
'Aula de Python'[-6:]

'Python'

#### Reversão de Strings

In [10]:
'Aula de Python'[::-1]

'nohtyP ed aluA'

### Declarando Variáveis

Declarar variáveis no Python é tão simples quanto escrever seu valor.

Se queremos declarar uma variável de texto, por exemplo, basta declararmos seu nome, o símbolo de igual, e seu valor entre aspas.


In [11]:
nomeInstrutor = 'John Doe'
print(nomeInstrutor)

John Doe



Da mesma maneira, para declarar um número interio, basta declararmos seu nome, seguido pelo símbolo de igual, e seu valor.


In [12]:
tamanhoTurma = 20
print(tamanhoTurma)

20


E, para um número decimal, basta utilizar o ponto como separador decimal.

In [13]:
horasAula = 4.0

Variáveis também podem ser declaradas a partir de operações em outras variáveis, como por exemplo:

    

In [14]:
presentesTurma = tamanhoTurma*0.75

Textos e números são apenas 2 dos muitos tipos de dados reconhecidos por Python.

Para conhecer mais formatos, clique [aqui](https://www.w3schools.com/python/python_datatypes.asp).

### Coleções de Objetos

Nem sempre conseguimos armazenar o valor em variáveis únicas. A fim de solucionar este problema, o Python possui algumas maneiras de armazenar e organizar conjuntos de dados.

#### Listas

As listas podem conter zero, um ou vários elementos em seu interior. Estes são armazenados de forma ordenada, são mutáveis e indexados.

Para declarar uma lista, devemos nomeá-la como uma variável comum e então definir cada elemento em sua composição. As listas são facilmente reconhecíveis pelo uso de colchetes em sua declaração e de sua impressão.

In [15]:
listaTurma = ['Aula de Python',
              nomeInstrutor,
              tamanhoTurma,
             ]

print(listaTurma)

['Aula de Python', 'John Doe', 20]


Podemos também adicionar valores a uma lista, através da chamada '.append()', pertencente à classe de objetos lista

In [16]:
listaTurma.append(presentesTurma)

print(listaTurma)

['Aula de Python', 'John Doe', 20, 15.0]


Caso desejemos iterar entre os elementos de uma lista, podemos utilizar de índices como no exemplo abaixo:

In [17]:
totalAlunosPresentes = listaTurma[3]
print(totalAlunosPresentes)

15.0


> Note que o iterador 3 refere-se ao quarto elemento da lista. Isso ocorre porque, em Python, o primeiro elemento é sempre representado pelo número zero.

#### Tuples

Os tuples podem conter zero, um ou vários elementos em seu interior. Estes, por sua vez, são armazenados de forma ordenada e indexados como nas listas, porém são imutáveis. Uma vez declarados, não é possível alterar os valores em seu interior, ou adicionar mais elementos ao mesmo, sem que o mesmo seja reescrito completamente.

Para declarar um tuple, devemos nomeá-lo como uma variável comum e então definir cada elemento em sua composição. Os tuples são facilmente reconhecíveis pelo uso de parenteses em sua declaração e de sua impressão.

In [18]:
tupleTurma = ('Aula de Python',
              nomeInstrutor,
              tamanhoTurma
             )
print(tupleTurma)

('Aula de Python', 'John Doe', 20)


Os elementos dentro de um tuple podem ser acessados de forma similar às listas, com o uso de um índice, iniciado no número 0

In [19]:
nomedoInstrutor = tupleTurma[1]
print(nomedoInstrutor)

John Doe


### Loops e Condicionais

Nem todo código é linear. Muitas vezes temos que executar operações repetidas

#### Clausula SE

A mais básica das operações condicionais é a clausula SE. Esta, executa uma série de operações caso a condição inicial seja atendida, independente do ocorrido em seu interior.

## Importação de dados com Pandas

Pandas é uma das bibliotecas mais versáteis em Python. Contemplando desde a importação de dados, até o processamento de dataframes, essa biblioteca é um conjunto completo para a análise de dados. 

Vamos começar por importar essa biblioteca em nosso notebook

In [20]:
import pandas as pd

Importante notar que, ao final da nossa importação, temos o componente `as pd`. Isso faz com que a biblioteca utilize esse novo *alias* quando for referenciada.

O próximo passo será importar a base de dados