FGV - Escola de Matemática Aplicada
==
Curso de Verão - Introdução à Programação com a Linguagem Python
--

# Comprehensions:

Em Python temos existem construções sintáticas que permitem a construção de sequências de maneira mais clara e concisa. São elas:
- list comprehension
- set comprehension 
- dict comprehension

## 1) List Comprehension

Uma list comprehension é uma maneira concisa de construir uma lista preenchida. Um uso comum é construir uma nova lista onde cada elemento é o resultado de alguma expressão aplicada a cada membro de outra sequência ou iterável, ou para construir uma subsequência cujos elementos satisfazem uma certa condição.

Ela irá seguir um modelo:  lista = ["expressão" for "elemento" in "sequência" if "condição"]. 

Vejamos o código abaixo:

In [12]:
cubos = []
for elementos in range(10):
    cubos.append(elementos**3)

In [13]:
print(cubos)

[0, 1, 8, 27, 64, 125, 216, 343, 512, 729]


Podemos reescrevê-lo de forma mais concisa utilizando a list comprehension:

In [14]:
cubos2 = [elementos**3 for elementos in range(10)]

In [15]:
print(cubos2)

[0, 1, 8, 27, 64, 125, 216, 343, 512, 729]


Outros exemplos:

In [1]:
sequencia = range(11)
sequencia

range(0, 11)

In [50]:
list(sequencia)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [3]:
[elemento**2 for elemento in sequencia if elemento%2==0]

[0, 4, 16, 36, 64, 100]

In [4]:
[x+y for x,y in [(9,4),(8,6),(2,9)]]

[13, 14, 11]

In [59]:
l = []
for x in range(1001):
    if x%5==0 or x%3==0:
        l.append(x**2)
print(sum(l))

156390386


In [5]:
lc2 = [x**2 for x in range(1001) if x%5==0 or x%3==0]
sum(lc2)

156390386

In [61]:
type(lc2)

list

##### Podemos fazer  com múltiplos loops:

Veja o código a seguir:

In [18]:
pontos = []
for x in [1,2,3]:
    for y in [3,4,5]:
        if x != y:
            pontos.append((x,y))

In [19]:
print(pontos)

[(1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5)]


Podemos reescrevê-lo dessa forma:

In [20]:
pontos = [(x,y) for x in [1,2,3] for y in [3,4,5] if x != y]
print(pontos)

[(1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5)]


#### Módulo string: aplicando a list comprehension em listas de strings

In [2]:
import string

In [3]:
string.punctuation

'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

In [4]:
string.digits

'0123456789'

In [5]:
string.ascii_letters

'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

In [6]:
my_string = 'uma string. Escrevi! Vocês duvidam? Claro, tem que ver para crer'

In [7]:
my_string.split()

['uma',
 'string.',
 'Escrevi!',
 'Vocês',
 'duvidam?',
 'Claro,',
 'tem',
 'que',
 'ver',
 'para',
 'crer']

In [8]:
[token for token in my_string.split()]

['uma',
 'string.',
 'Escrevi!',
 'Vocês',
 'duvidam?',
 'Claro,',
 'tem',
 'que',
 'ver',
 'para',
 'crer']

In [9]:
[token.lower() for token in my_string.split()]

['uma',
 'string.',
 'escrevi!',
 'vocês',
 'duvidam?',
 'claro,',
 'tem',
 'que',
 'ver',
 'para',
 'crer']

In [24]:
[token.strip(string.punctuation) for token in my_string.split()] 

['uma',
 'string',
 'Escrevi',
 'Vocês',
 'duvidam',
 'Claro',
 'tem',
 'que',
 'ver',
 'para',
 'crer']

In [16]:
[token.lower().strip(string.punctuation) for token in my_string.split()]

['uma',
 'string',
 'escrevi',
 'vocês',
 'duvidam',
 'claro',
 'tem',
 'que',
 'ver',
 'para',
 'crer']

## 2) Set Comprehension:

Podemos escrever sets de forma mais clara e concisa utilizando set comprehension. 

Seguiremos o modelo, apenas trocando os colchetes (da list comprehension) por chaves:  conjunto = {"expressão" for "elemento" in "sequência" if "condição"}. 

Vejamos o exemplo abaixo:

In [22]:
quadrados = {i**2 for i in range(5)}
print(quadrados)

{0, 1, 9, 16, 4}


In [26]:
consoantes = {letra for letra in 'cursodeverao' if letra not in "aeiou" }
print(consoantes)

{'v', 'd', 'c', 'r', 's'}


## 3) Dict Comprehension

Podemos escrever dicionários de sucinta usando dict comprehension.

Usamos o modelo: dicionario = {'elemento' : 'operação' for 'elemento' in 'sequência' if 'condição'}

Vejamos os seguintes exemplos:

In [28]:
quadrado = {x:x**2 for x in range(4)}
print(quadrado)

{0: 0, 1: 1, 2: 4, 3: 9}


In [30]:
cubo_num_impar = { x:x**3 for x in range(10) if x%2 != 0}
print(cubo_num_impar)

{1: 1, 3: 27, 9: 729, 5: 125, 7: 343}


In [39]:
d0 = {x:y for x,y in [('primeiro',1),('segundo',2)]}
d0

{'primeiro': 1, 'segundo': 2}

In [44]:
d = {x.upper():y for x,y in [('um',1),('dois',2),('tres',3)]}
d

{'TRES': 3, 'UM': 1, 'DOIS': 2}

In [40]:
d2 = dict([('um',1),('dois',2),('tres',3)])
d2

{'dois': 2, 'tres': 3, 'um': 1}

In [43]:
d3 = {chave.upper():valor for chave, valor in d2.items()}
d3

{'DOIS': 2, 'TRES': 3, 'UM': 1}

In [47]:
d3.items()

dict_items([('TRES', 3), ('UM', 1), ('DOIS', 2)])

In [49]:
d4 = {chave:valor+1 for chave,valor in d3.items()}
d4

{'DOIS': 3, 'TRES': 4, 'UM': 2}

In [53]:
for alguma_coisa in d4.items():
    print(alguma_coisa)

('TRES', 4)
('Nova', {1: 'um', 2: 'dois'})
('UM', 2)
('DOIS', 3)


## Generators (notar a diferença do Python 3):

Geradores são iteráveis, a diferença entre eles é que os seus valores só são lidos quando necessário. Dizemos que eles tem lazy evaluation.

In [67]:
gen1 = (x**(0.5) for x in range(10) if x%5==0 or x%3==0)
gen1

<generator object <genexpr> at 0x7ffb4f742eb8>

In [65]:
list(gen1)

[0.0, 1.7320508075688772, 2.23606797749979, 2.449489742783178, 3.0]

In [68]:
for x in gen1:
    print(x)

0.0
1.7320508075688772
2.23606797749979
2.449489742783178
3.0


In [92]:
gen2 = (x**x for x in range(99999999999999))
gen2

<generator object <genexpr> at 0x7ffb4f742bf8>

### Funções geradoras

#### Yield:
Funciona como um return, retornando um gerador

#### Next():
Retorna os valores do gerador um por vez até chegar no fim. Chegando no fim retorna: StopIteration

Vejamos os exemplos:

In [41]:
gerador = (letra for letra in "abcd")

In [42]:
next(gerador)

'a'

In [43]:
next(gerador)

'b'

In [44]:
next(gerador)

'c'

In [45]:
next(gerador)

'd'

In [46]:
next(gerador)

StopIteration: 

In [146]:
def gera_quadrados(x):
    while True:
        yield(x**2)
        x+=1

In [147]:
gen4 = gera_quadrados(1)
gen5 = gera_quadrados(1)

In [148]:
next(gen4)

1

In [152]:
next(gen5)

9

In [150]:
type(gen4)

generator

In [121]:
type(gera_quadrados)

function

## Programação Funcional em Python:

Funções Lambda  
Os comandos zip, map, filter e reduce

### Função Lambda

Lambda é uma função anônima que aceitam argumentos e que só suporta uma expressão. Ao executar lambda, Python retorna uma função ao invés de atribuí-la à um nome como acontece com def, Ela é usada quando precisamos de uma função que não seja seja complexa o suficiente para criá-la com def. Podemos pensar em lambdas como funções de uma linha só.

In [54]:
soma = lambda x, y : x+y

In [55]:
soma(1,2)

3

### Comando zip

Esse comando recebe duas listas não vazias de mesmo tamanho e aplica determinada operação nos elementos de mesmo índice das listas.

In [208]:
sq1 = [1,2,3,4,5,6,7,8]
sq2 = ['a','b','c','d','e','f']
z = zip(sq1,sq2)

In [214]:
print(len(sq2))

6


In [209]:
list(z)

[(1, 'a'), (2, 'b'), (3, 'c'), (4, 'd'), (5, 'e'), (6, 'f')]

In [210]:
nomes = ['renato', 'flavio', 'eduardo']
notas = [8,9,10]
dic_notas = dict(zip(nomes,notas))
dic_notas

{'eduardo': 10, 'flavio': 9, 'renato': 8}

Voltando ao dict comprehension:

In [216]:
d3 = {x.upper():y for y,x in zip(sq1,sq2)}
d3

{'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5, 'F': 6}

In [221]:
for elem in {'dois':2,'quatro':4}.items():
    print(elem)

('dois', 2)
('quatro', 4)


In [222]:
s1 = [x.lower() for x in d3.keys()]
s2 = [x for x in d3.values()]
print(s1)
print(s2)

['f', 'd', 'c', 'e', 'b', 'a']
[6, 4, 3, 5, 2, 1]


In [264]:
sq1 = [1,2,3,4,5,6,7,8]
sq2 = ['a','b','c','d','e','f']
z = zip(sq1,sq2)
lista_do_zip = list(z)
print(list(lista_do_zip))

[(1, 'a'), (2, 'b'), (3, 'c'), (4, 'd'), (5, 'e'), (6, 'f')]


In [265]:
zi = zip(*lista_do_zip)

In [266]:
list(zi)

[(1, 2, 3, 4, 5, 6), ('a', 'b', 'c', 'd', 'e', 'f')]

In [263]:
sq1 = [1,2,3,4,5,6,7,8]
sq2 = ['a','b','c','d','e','f']
sq3 = ['w','e','r','y']
z4 = zip(sq1,sq2,sq3)
list(z4)

[(1, 'a', 'w'), (2, 'b', 'e'), (3, 'c', 'r'), (4, 'd', 'y')]

### Comando map:

Essa função, em Python, serve para aplicarmos uma função a cada elemento de uma lista, retornando uma nova lista contendo os elementos resultantes da aplicação da função. 

In [271]:
def minha_funcao(x):
    return x**3

In [272]:
minha_funcao(4)

64

In [273]:
seq6 = [3,7,9,1,5,7]
resultados = map(minha_funcao,seq6)
list(resultados)

[27, 343, 729, 1, 125, 343]

In [274]:
[minha_funcao(x) for x in seq6]

[27, 343, 729, 1, 125, 343]

Usando funções lambda

In [281]:
potencia = {'quadrado': lambda x:x**2, 
            'cubo':lambda x:x**3,
            'quarta': lambda x:x**4
           }

In [282]:
potencia['quarta'](9)

6561

In [284]:
resultados2 = map(lambda x:x**4,seq6)
resultados2
list(resultados2)
#resultados2.__next__()

[81, 2401, 6561, 1, 625, 2401]

In [285]:
soma = lambda x,y:x+y

In [286]:
soma(3,4)

7

### Comando Reduce:

Reduce() está disponível no módulo functools. Sua utilidade está na aplicação de uma função a todos os valores do conjunto, de forma a agregá-los em um único valor.

In [287]:
from functools import reduce

In [291]:
seq9 = [1,2,3,4,5,6,7,8,9,10]
mult = lambda x,y:x*y
multiplica = reduce(mult,seq9)

In [289]:
multiplica

3628800

In [107]:
seq10 = ['a','b','c','d','e','f','g']
mult = lambda x,y:x+y
multiplica2 = reduce(mult,seq10)
multiplica2

'abcdefg'

### Comando Filter:

Como o próprio nome já diz, filter() filtra os elementos de uma sequência. O processo de filtragem é definido a partir de uma função passada como primeiro argumento. Assim, filter() só “deixa passar” para a sequência resultante aqueles elementos para os quais a chamada da função que o usuário passou retornar True.

In [297]:
resp = filter(lambda x:x.islower(),'aAbRmmmTTTBfgHHrTEB')
list(resp)

['a', 'b', 'm', 'm', 'm', 'f', 'g', 'r']

In [157]:
resp = filter(lambda x:x.isupper(),'aAbB')
list(resp)

['a', 'A', 'b', 'B']

In [299]:
with open('texto_python.txt',mode='r',encoding='utf-8') as f:
    texto = f.read()

In [300]:
import string

In [301]:
string.punctuation

'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

In [302]:
l_texto = texto.split()
l_texto = [l for l in l_texto if not l[0] in string.punctuation and len(l)>1]
l_texto_M = filter(lambda x:x.istitle(),l_texto)
#list(l_texto_M)

In [303]:
import requests
from bs4 import BeautifulSoup
import nltk
from collections import Counter

In [308]:
req = requests.get('https://pt.wikipedia.org/wiki/Karl_Marx')
print(req.content)

200


In [326]:
texto = requests.get('https://pt.wikipedia.org/wiki/Karl_Marx')
soup = BeautifulSoup(texto.content)
l_texto = soup.get_text().split()
stopwords = nltk.corpus.stopwords.words('portuguese')



 BeautifulSoup([your markup])

to this:

 BeautifulSoup([your markup], "lxml")

  markup_type=markup_type))


In [327]:
lista_limpa = [l.strip(string.punctuation) for l in l_texto if l not in stopwords and len(l)>1]

In [330]:
def acha_nomes(lista):
    nomes = []
    for i in range(1,len(lista)):
        if lista[i].istitle() and lista[i-1][-1] not in string.punctuation:
            nomes.append(lista[i])
    return nomes

In [332]:
nomes = acha_nomes(lista_limpa)
freq_nomes = Counter(nomes)
freq_nomes.most_common(50)

[('Marx', 207),
 ('Karl', 54),
 ('Engels', 32),
 ('Hegel', 24),
 ('Em', 18),
 ('Capital', 18),
 ('Feuerbach', 15),
 ('Crítica', 15),
 ('Filosofia', 14),
 ('Estado', 13),
 ('Marxismo', 12),
 ('Economia', 12),
 ('Ver', 11),
 ('Friedrich', 11),
 ('Na', 10),
 ('Visitado', 10),
 ('Política', 9),
 ('Para', 9),
 ('Universidade', 9),
 ('Popper', 8),
 ('Dialética', 8),
 ('Paris', 8),
 ('Londres', 8),
 ('Manifesto', 7),
 ('Jenny', 7),
 ('Comunista', 7),
 ('História', 7),
 ('Ideologia', 7),
 ('Voegelin', 7),
 ('Alemã', 7),
 ('Notas', 6),
 ('Revolução', 6),
 ('Gotha', 6),
 ('Vozes', 6),
 ('Rio', 6),
 ('Janeiro', 6),
 ('Influência', 6),
 ('Portal', 6),
 ('Ele', 6),
 ('Teses', 6),
 ('Sobre', 6),
 ('Petrópolis', 6),
 ('Trabalho', 6),
 ('Por', 5),
 ('Contribuição', 5),
 ('Tréveris', 5),
 ('Bauer', 5),
 ('The', 5),
 ('Ludwig', 5),
 ('F', 5)]