# Minicurso Introdução à ciência de dados e aprendizado de máquina usando Python
## Parte 2 - Python Básico

**Importante:** Ver este [guia de referência](http://nbviewer.jupyter.org/github/justmarkham/python-reference/blob/master/reference.ipynb) rápido.

### Valor Nulo

In [4]:
a = None
if a is None:
    print('nulo')

nulo


### Boolean

In [210]:
a = True
b = False
c = True
print(a == b)
print(a == c)

False
True


In [211]:
a, b, c  = True, False, True
print(a == b)
print(a == c)

False
True


### Números

In [1]:
1 + 2

3

In [2]:
type(1)

int

In [3]:
type(1.2)

float

In [4]:
1 // 2

0

In [5]:
1 / 2

0

In [27]:
1 / 2.0

0.5

In [6]:
from __future__ import division
1 / 2

0.5

In [121]:
2 ** 3

8

In [32]:
2 ** 0.5

1.4142135623730951

In [33]:
import math
math.sqrt(2)

1.4142135623730951

In [244]:
import random
print(random.random())
print(random.randint(1,10))   # intervalo fechado
print(random.randrange(1,10))

0.78494966832
7
5


### Strings

In [39]:
single_quoted_string = 'Data Science'
single_quoted_string

'Data Science'

In [40]:
repr(single_quoted_string)

"'Data Science'"

In [41]:
len(single_quoted_string)

12

In [42]:
type(single_quoted_string)

str

In [43]:
single_quoted_string.upper()

'DATA SCIENCE'

In [44]:
single_quoted_string.lower()

'data science'

In [3]:
str1 = 'Hoje_vai_chover_novamente.'.replace('_', ' ')
print(str1)

Hoje vai chover novamente.


In [9]:
double_quoted_string = "data science"
print(double_quoted_string)
print(repr(double_quoted_string))
double_quoted_string

data science
'data science'


'data science'

In [10]:
tab_string = "\t"        # representa o caracter 'tab'
print(tab_string)
print(repr(tab_string))

	
'\t'


In [11]:
not_tab_string = r"\t"   # representa os caracteres '\' e 't'
print(not_tab_string)
print(repr(not_tab_string))

\t
'\\t'


In [12]:
multi_line_string = """linha 1.
linha 2
linha 3"""
print(multi_line_string)
print(repr(multi_line_string))

linha 1.
linha 2
linha 3
'linha 1.\nlinha 2\nlinha 3'


In [174]:
'Repete ' * 5

'Repete Repete Repete Repete Repete '

In [13]:
"%d/%d/%d" % (2, 4, 6)

'2/4/6'

In [14]:
"%s/%s/%s" % (2, 4, 6)

'2/4/6'

In [15]:
"{}/{}/{}".format(2, 4, 6)

'2/4/6'

In [5]:
"{:2d}/{:2d}/{:2d}".format(2, 4, 16)

' 2/ 4/16'

In [6]:
"{:02d}/{:02d}/{:02d}".format(2, 4, 16)

'02/04/16'

In [19]:
'{:.2f}'.format(99.8765)

'99.88'

In [20]:
'{:.0f}'.format(99.8765)

'100'

In [21]:
'%05d' % (99)     

'00099'

In [22]:
'{:05d}'.format(99)

'00099'

In [23]:
' Hello '.strip()

'Hello'

In [24]:
' Hello '.lstrip()

'Hello '

In [25]:
' Hello '.rstrip()

' Hello'

### Data

In [237]:
from datetime import datetime
import time

inicio = datetime.now()
print(inicio)
for i in xrange(2):
    time.sleep(1)
fim = datetime.now()
print(fim)
print("Tempo de execução: {}".format(fim - inicio))

2017-03-09 16:38:53.530011
2017-03-09 16:38:55.530778
Tempo de execução: 0:00:02.000767


### Listas
- Mutáveis

In [152]:
lista = [1, 2, 3, 4, 5]
print(lista)

[1, 2, 3, 4, 5]


In [80]:
lista[2]

3

In [81]:
lista[-1] # último elemento

5

In [82]:
lista[1:3]

[2, 3]

In [104]:
a, b = lista[1:3]
a, b

(2, 3)

In [83]:
lista[:3] # 3 primeiros elementos

[1, 2, 3]

In [84]:
lista[-2:] # 2 últimos elementos

[4, 5]

In [85]:
lista[1:-1] # do segundo ao penúltimo elemento

[2, 3, 4]

In [86]:
len(lista)

5

In [87]:
sum(lista)

15

In [97]:
10 in lista

False

In [98]:
5 in lista

True

In [153]:
lista.append(7)
lista.append(6)
lista.append(7)
lista

[1, 2, 3, 4, 5, 7, 6, 7]

In [154]:
lista.remove(7)  # remove o primeiro elemento cujo valor é 7
lista

[1, 2, 3, 4, 5, 6, 7]

In [155]:
lista.extend([8, 9, -10])
lista

[1, 2, 3, 4, 5, 6, 7, 8, 9, -10]

In [156]:
lista2 = lista  # lista2 referencia lista
lista2[-1] = 10
print(lista)
print(lista2)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


In [157]:
lista3 = lista[:]  # lista3 é uma nova lista com o mesmo conteúdo de lista
lista3[-1] = -10
print(lista)
print(lista3)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 9, -10]


In [51]:
range(5)

[0, 1, 2, 3, 4]

In [58]:
range(2, 10, 2)

[2, 4, 6, 8]

In [59]:
range(5, 0, -1)

[5, 4, 3, 2, 1]

In [111]:
lista4 = [-4, 1, -2, 3]
print(sorted(lista4)) # ordena sem alterar a lista
print(sorted(lista4, reverse=True))
print(sorted(lista4, key=abs))
print(lista4)

[-4, -2, 1, 3]
[3, 1, -2, -4]
[1, -2, 3, -4]
[-4, 1, -2, 3]


In [132]:
lista4.sort() # altera a lista original
print(lista4)

[-4, -2, 1, 3]


In [248]:
a = ['a', 'casa', 'está', 'muito', 'bem', 'organizada']
print(' '.join(a))

a casa está muito bem organizada


In [250]:
import random
random.shuffle(a)
print(a)
random.shuffle(a)
print(a)

['muito', 'organizada', 'bem', 'casa', 'a', 'est\xc3\xa1']
['muito', 'a', 'bem', 'organizada', 'casa', 'est\xc3\xa1']


In [256]:
random.choice(a) # com repetição

'bem'

In [258]:
# Loteria
numeros = range(1, 100)
random.sample(numeros, 5) # sem repetição

[51, 14, 55, 39, 9]

### List Comprehensions

In [170]:
quadrados = [x * x for x in xrange(5)]
print(quadrados)

[0, 1, 4, 9, 16]


#### xrange produz valores sob demanda. Economiza memória especialmente quanto muitos valores são usados. 
- No Python 3 **range** funciona como **xrange** no Python 2.

In [173]:
# conta quantos elementos da lista são maiores que 4
sum([1 for x in quadrados if x > 4])

2

### Matrizes

In [192]:
matriz = [ [1, 2, 3],
           [4, 5, 6],
           [7, 8, 9] ]
print(matriz)

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]


### Tuplas
- Imutáveis

In [46]:
tupla = (1, 2, 3, 4)
print(tupla)

(1, 2, 3, 4)


### Dicionários

In [167]:
dicionario = { 'nome': 'Regis', 'sobrenome': 'Pires Magalhães' }
print(dicionario['nome'])
print(dicionario['sobrenome'])

Regis
Pires Magalhães


In [175]:
dicionario.keys()

['sobrenome', 'nome']

In [176]:
dicionario.values()

['Pires Magalh\xc3\xa3es', 'Regis']

#### Merge de dicionários

In [181]:
x = {'a':1, 'b': 2}
y = {'b':10, 'c': 11}
x.update(y)
print(x)

{'a': 1, 'c': 11, 'b': 10}


### Pack e Unpack

In [164]:
list1 = ['a', 'b', 'c']
list2 = [1, 2, 3]
list3 = zip(list1, list2)  # PACK
print(list3)
list4, list5 = zip(*list3)  # UNPACK
print(list4)
print(list5)

[('a', 1), ('b', 2), ('c', 3)]
('a', 'b', 'c')
(1, 2, 3)


### Conjuntos (Sets)

Coleção de elementos distintos.

In [264]:
s = set([1, 2])
print(type(s))
print(s)
s.add(3)
s.add(3)
s.add(4)
print(s)
print(len(s))
print(2 in s) 
print(3 in s)

<type 'set'>
set([1, 2])
set([1, 2, 3, 4])
4
True
True


### Python não tem &&, ++ (incremento): 

- && (Usar and)
- ++ (Usar +=1)
    - i += 1     
    - i = i + 1



### Liberando espaço alocado para variáveis

In [213]:
a = [2, 4, 6, 8, 10]
print(a)
del(a)
print(a)

[2, 4, 6, 8, 10]


NameError: name 'a' is not defined

### Condições

In [214]:
valor = 99
if valor == 99:
    print 'veloz' 
elif value > 200:
    print 'muito veloz' 
else:
    print 'lento'

veloz


#### Operador ternário

In [217]:
x = 5
par_ou_impar = "par" if x % 2 == 0 else "impar"
print(par_ou_impar)

impar


### Laços / Loops

In [204]:
a = [1, 3, 4, 5, 7]
for i in a:
    print(i)

1
3
4
5
7


In [7]:
a = [1, 3, 4, 5, 7]
for indice, valor in enumerate(a):
    print(indice, valor)

(0, 1)
(1, 3)
(2, 4)
(3, 5)
(4, 7)


In [194]:
for _ in xrange(5):
    print('oi')

oi
oi
oi
oi
oi


In [199]:
a = [2, 4, 6]
for i in xrange(len(a)):
    print 'indice:{}, valor:{}'.format(i, a[i])

indice:0, valor:2
indice:1, valor:4
indice:2, valor:6


In [205]:
a = [2, 4, 6]
for indice, valor in enumerate(a):
    print 'indice:{}, valor:{}'.format(indice, valor)

indice:0, valor:2
indice:1, valor:4
indice:2, valor:6


In [201]:
x = 0
while x < 5:
    print x
    x += 1


0
1
2
3
4


In [203]:
for x in xrange(10):
    if x == 3:
        continue
    if x == 5:
        break
    print x


0
1
2
4


In [9]:
import itertools
a = [1, 2, 3]
b = [4, 5]
c = [6, 7, 8]
for a_, b_, c_ in itertools.product(a, b, c):
    print('a:{}, b:{}, c:{}'.format(a_, b_, c_))

a:1, b:4, c:6
a:1, b:4, c:7
a:1, b:4, c:8
a:1, b:5, c:6
a:1, b:5, c:7
a:1, b:5, c:8
a:2, b:4, c:6
a:2, b:4, c:7
a:2, b:4, c:8
a:2, b:5, c:6
a:2, b:5, c:7
a:2, b:5, c:8
a:3, b:4, c:6
a:3, b:4, c:7
a:3, b:4, c:8
a:3, b:5, c:6
a:3, b:5, c:7
a:3, b:5, c:8


### Funções

In [221]:
def soma(a, b):
    return a + b

print(soma(3, 5))
print(soma('casa ', 'organizada'))

8
casa organizada
