# Introdução ao Python para análise exploratória de dados - aula 00

![](../img/intro_python.png)

## Tipos de dados no Python

O Python agrupa cada valor de dados — booleanos, inteiros, flutuantes, strings e até grandes estruturas de dados, funções e programas — na memória do nosso computador como um objeto.
No Python, um objeto sempre contém:
- um **tipo** que define o que podemos fazer com o objeto;
- um **id único** para distinguir os objetos;
- um **valor** que deve ser consistente com o seu tipo
- uma **contagem de referência** que contabiliza quantas vezes o objeto é usado

![](../img/data_types_table.png)
[Referência: "Introducing Python"](https://www.oreilly.com/library/view/introducing-python-2nd/9781492051374/)

### Variáveis

O Python, como a maioria das linguagens de computador, permite definir **variáveis - nomes para os objetos que estão na memória do seu computador e que você deseja usar em um programa.

O nome é uma referência a uma coisa e não a coisa em si. Pense no nome como uma tag com uma string anexada à caixa do objeto.
![](../img/conceito_objeto.png)

### Regras para criação de nomes de variáveis

- Só podem conter letras, dígitos e underscore
- São *case sensitive*: nome, Nome e NOME são nomes diferentes
- Devem começar por letra ou underscore, não por um dígito
- Nomes que começam com underscore são tratados de modo especial pelo Python (não veremos isso neste curso)
- Não pode ser uma das palavras reservadas ao Python (também chamadas de *keywords*)

In [1]:
import keyword #importar biblioteca do python
keyword.kwlist #mostra as palavras especiais do python


['False',
 'None',
 'True',
 'and',
 'as',
 'assert',
 'async',
 'await',
 'break',
 'class',
 'continue',
 'def',
 'del',
 'elif',
 'else',
 'except',
 'finally',
 'for',
 'from',
 'global',
 'if',
 'import',
 'in',
 'is',
 'lambda',
 'nonlocal',
 'not',
 'or',
 'pass',
 'raise',
 'return',
 'try',
 'while',
 'with',
 'yield']

Para saber o tipo de uma variável ou de um valor literal, podemos usar o comando *type()*. Esse é um comando nativo do Python (*build-in function*)

In [2]:
type(5) # verifica o tipo de variável que eu tenho
type(15)


int

In [3]:
type(5.5) #verificando o tipo de objeto
type(12.12)

float

In [4]:
type("5")
type("casa")

str

In [5]:
type((1,2,3))
type((7,9,12))

tuple

In [6]:
idades = [10, 15, 18, 21, 29]
type(idades)

list

### Atribuição

No Python utilizamos o sinal de igualdade para atribuir um valor a uma variável. Para checarmos a igualdade de dois valores utilizamos o sinal de igualdade 2 vezes.

In [7]:
nome = "bruna" # variável nome recebe o valor "bruna"
5 == 5 # compara dois valores
7==7

True

A atribuição não copia um valor, apenas atribui um nome ao objeto que contém os dados. O nome é uma referência a uma coisa e não a coisa em si.

Se ambos os nomes apontarem para um objeto mutável, você poderá alterar o valor do objeto por meio de qualquer um dos nomes e verá o valor alterado ao usar qualquer um dos nomes.

In [8]:
a = [2,4,6] # lista
b = a
a

[2, 4, 6]

In [11]:
b
b[2]
b[1]
a[0]

2

In [14]:
b[0]=58
a

[58, 4, 6]

In [15]:
a[0] = 99
a

[99, 4, 6]

In [18]:
b
b[2] = 74
b

[99, 4, 74]

Quando o primeiro elemento da lista é alterado, ele não aponta mais para o objeto com valor 2 , mas para um novo objeto com valor 99 . A lista ainda é do tipo list , mas seu valor (os elementos da lista e sua ordem) é mutável.

### Variáveis do tipo *int*

São números inteiros (sem casa decimal)

In [19]:
# qualquer sequencia de digitos especifica um inteiro positivo
123
# para especificar um numero negativo usamos o sinal de -
-15
# podemos atribuir uma variável
idade = 25
type(idade)

int

In [20]:
calor = 63
type(calor)

int

Podemos fazer várias operacões numéricas

![](../img/operacoes_numericas.png)

Podemos misturar inteiros literais e variáveis cujo tipo seja *int*

In [21]:
a = 95
a-3

92

Para mudar *a* podemos fazer:

In [22]:
a = a-3
a

92

Esse é como reatribuímos um valor a uma variável em Python. Em Python, a expressão do lado direito do operador de atribuicão (sinal de =) é calculada primeiro e depois atribuída à variável do lado esquerdo.

Você pode combinar os operadores aritméticos com atribuição colocando o operador antes do =

In [23]:
a = 95
a -= 3 # mesma coisa que fazer a = a - 3
a

92

In [24]:
a **= 2 # funciona com todos os operadores
a

8464

Em Python, como na maioria das linguagens, a multiplicação tem precedência maior do que a adição, então teríamos:

In [25]:
2 + 3 * 4 # resulta 20 ou 14?

2 + (3 * 4) # é bom usarmos parênteses para indicar a precedência das operações

14

Bad pipe message: %s [b'\xd4e\xca\xe5h\x13\xce\x86\n\xdf\xb2\xb2\xb1i\x8c\xe2Lq x\x98=\x94\xb9\x89\xbeo\xf8\xb6\xa0(c\n\xda\xc9\xc7\x1alF]E~\xe7\xca\xed7\xd0L\x8e\xbc\x98\x00\x08\x13\x02\x13\x03\x13\x01\x00\xff\x01\x00\x00\x8f\x00\x00\x00\x0e\x00\x0c\x00\x00\t127.0.0.1\x00\x0b\x00\x04\x03\x00\x01\x02\x00\n\x00\x0c\x00\n\x00\x1d\x00\x17\x00\x1e\x00\x19\x00\x18\x00#\x00\x00\x00\x16\x00\x00']
Bad pipe message: %s [b'\xb9ZS\xb8c\x1a(\xfa\x1cn\x05\xe9\xbd-\xc6\xe7]\xc3 i\xb8\xc5<"5XM\x94N\xe2&\x16\xb8@\x13\x0f\x07Z\xa1A\xcc`\xe6e\x89\x10f\xf2\xb2}\x87\x00\x08\x13\x02\x13\x03\x13\x01\x00\xff\x01\x00\x00\x8f\x00\x00\x00\x0e\x00\x0c\x00\x00\t127.0.0.1\x00\x0b\x00\x04\x03\x00\x01\x02\x00\n\x00\x0c\x00\n\x00\x1d\x00\x17\x00\x1e\x00\x19\x00\x18\x00#\x00\x00\x00\x16\x00\x00\x00\x17\x00\x00\x00\r\x00\x1e\x00\x1c\x04\x03\x05\x03\x06\x03\x08\x07\x08\x08\x08\t\x08\n\x08\x0b\x08\x04\x08\x05\x08\x06\x04\x01\x05\x01\x06\x01\x00+\x00\x03\x02\x03\x04\x00-\x00\x02\x01\x01\x003\x00&\x00$\x00\x1d\x00 f1\x1a\x

### Variáveis do tipo *float*

São números racionais (todo número que pode ser representado por uma fracão de dois números inteiros), ou seja, números "quebrados". Usamos o ponto como separador decimal.

In [26]:
5.
5e2 # indica 5 * 10^2 ou 5 * 10 * 10

500.0

Todos os operadores numéricos também podem ser usados com os dados do tipo *float* e para converter um int em um float ou vice-versa usamos os comandos int() e float()

In [27]:
int(4.5)

4

In [28]:
float(42)

42.0

In [29]:
42 + 3.5 # Python converte automaticamente o valor do tipo int para o tipo float

45.5

### Variáveis do tipo *bool*

É o tipo de dado mais simples do Python. Também são conhecidas por variáveis lógicas e armazenam os valores de verdadeiro ou falso. Quando convertidas para valores inteiros, são representadas pelo valores 1 e 0.

In [30]:
gosto_python = True
print(gosto_python)

True


In [31]:
gosto_python = False
print(gosto_python)

False


In [32]:
int(True) # bool(1) converte um inteiro em bool

1

In [33]:
int(False) # bool(0)

0

In [34]:
bool(0)

False

Python também converte os valores booleanos para inteiros ou floats durante as operacões numéricas.

In [35]:
False + 0

0

In [36]:
False + 0.0

0.0

In [37]:
True + 0

1

### Variáveis do tipo *string*

Todos os caracteres dentro de aspas (simples ou duplas)

In [1]:
nome =  'Ada Lovelace'
print(nome)

Ada Lovelace


In [2]:
telefone = "2556-9896"
print(telefone)

2556-9896


In [3]:
sobre = 'Criadora do primeiro algoritmo a ser processado por uma máquina'
print(sobre)

Criadora do primeiro algoritmo a ser processado por uma máquina


In [4]:
email = 'ada@lovelace.com.br'
print(email)

ada@lovelace.com.br


Podemos fazer algumas operacões com strings:

In [5]:
bordao = "Isso!"
bordao * 3

'Isso!Isso!Isso!'

O sinal de + é usado para concatenar strings

In [9]:
frase = "A vinganca nunca é plena,"
print(frase)
frase + " mata a alma e envenena!"

A vinganca nunca é plena,


'A vinganca nunca é plena, mata a alma e envenena!'

In [10]:
print(frase)

A vinganca nunca é plena,


In [11]:
frase = frase + "mata a alma e envenena!"
print(frase)

A vinganca nunca é plena,mata a alma e envenena!


In [12]:
len(frase) # conta quantos caracteres a string possui

48

Alguns dos principais métodos (comandos) usados para trabalhar com strings:
- *.upper()*: toda a string em maiúscula
- *.lower()*: toda a string em minúscula
- *.capitalize()*: apenas a primeira letra em maiúsculo
- *.title()*: primeira letra de cada palavra em maiúscula

In [13]:
serie = 'peaky blinders'
serie.upper()

'PEAKY BLINDERS'

In [14]:
serie.capitalize()

'Peaky blinders'

In [15]:
serie.title()

'Peaky Blinders'

Os comandos *.startswith()* e *endswith()*: testam se uma string começa ou termina com um elemento (teste lógico)

In [16]:
luke = "I’m your father"
luke.startswith('I')

True

In [17]:
luke.startswith('i')

False

Podemos acessar caracteres específicos dentro de uma string e também podemos pegar apenas uma parte da nossa string, ou ainda, pegar caracteres alternados dela.

![](../img/the_crown_strings.png)

In [18]:
serie = 'THE CROWN'
serie[0] # No Python indexamos valores a partir do 0!

'T'

In [19]:
serie[2]

'E'

In [20]:
serie[3]

' '

In [21]:
serie[-1]

'N'

In [25]:
serie[1:9]

'HE CROWN'

In [26]:
serie[3:8]
serie[5:9]
# quando omitimos um índice, o Python retorna todos os caracteres do extremo correspondente
serie[-1:]

'N'

In [27]:
serie[3:8]

' CROW'

In [7]:
# terceiro numero indica o numero de caracteres que queremos pular
serie[4:9:2]

'CON'

In [29]:
serie[1:9:3]

'HCW'

In [30]:
serie[::-1]


'NWORC EHT'

Bad pipe message: %s [b'P\xc6\xe3\x8a^\xec\x88\x90\x90"\xf9vu\xb0\xbd\xb0\xbc# [\x12\xcfI\x06\xceT\x90\xf7j\x89\x90\'x\xbcx\x9eTc\xff\xe5\xa7\xd9\xb2vPN\xba\x0e\x84\xbd"\x00\x08\x13\x02\x13\x03\x13\x01\x00\xff\x01\x00\x00\x8f\x00\x00\x00\x0e\x00\x0c\x00\x00\t127.0.0.1\x00\x0b\x00\x04\x03\x00\x01\x02\x00\n\x00\x0c\x00\n\x00\x1d\x00\x17\x00\x1e\x00\x19\x00\x18\x00#\x00\x00\x00\x16\x00\x00\x00\x17\x00\x00\x00\r\x00\x1e\x00\x1c\x04\x03', b'\x06\x03\x08\x07', b'\x08\t\x08\n\x08\x0b\x08']
Bad pipe message: %s [b'\x05\x08\x06']
Bad pipe message: %s [b'\x05\x01\x06', b'']
Bad pipe message: %s [b'\x03\x02\x03\x04\x00-\x00\x02\x01\x01\x003\x00&\x00$\x00\x1d\x00 l\x9e\x0b=\x12\xba\xd1I\x84\xdc\xbf\x1d3\xe3\x0b=\xfe\xb3\xfd\xe4\xfe\xb6']
Bad pipe message: %s [b'\x7f\xa0\xb0\xbd\xb3\xac\xfc\x90]\xaf\x04~\xa3\xc0\x01\xcd\xd2\x00\x00\x00|\xc0,\xc00\x00\xa3\x00\x9f\xcc\xa9\xcc\xa8\xcc\xaa\xc0\xaf\xc0\xad\xc0\xa3\xc0\x9f\xc0]\xc0a\xc0W\xc0S\xc0+', b"\x00\xa2\x00\x9e\xc0\xae\xc0\xac\xc0\xa2\xc0\x9e\xc0\