# getsizeof()
**_Retorna o tamanho de um objeto em bytes_**. O objeto pode ser qualquer tipo de objeto. Se fornecido, o padrão será retornado se o objeto não fornecer meios para recuperar o tamanho. Caso contrário, a TypeErrorserá gerado.

getsizeof()chama o **\__sizeof__** método do objeto e adiciona uma sobrecarga adicional do coletor de lixo se o objeto for gerenciado pelo coletor de lixo.

In [1]:
from sys import getsizeof

x = 5
y = [1, 'Python']

print(f'x = {getsizeof(x)} bytes')
print(f'y = {getsizeof(y)} bytes')

x = 28 bytes
y = 72 bytes


In [26]:
# Verificando o tamanho do arquivo VendasTesouroDireto.csv
with open('VendasTesouroDireto.csv', 'r', encoding="utf-8") as a:
    conteudo = a.read()

print(f'VendasTesouroDireto.csv = {getsizeof(conteudo)} bytes')
print(f'VendasTesouroDireto.csv = {getsizeof(conteudo)/1000} Kbytes')

VendasTesouroDireto.csv = 5010412 bytes
VendasTesouroDireto.csv = 5010.412 Kbytes


# O método \_\_getitem__

In [3]:
# Confirmando que conteudo tem o método __getitem__.
'__getitem__' in dir(conteudo)

True

In [4]:
# fazendo slice em nosso objeto
print(conteudo[0:151])

# so conseguimos fazer isto, pois nosso objeto esta todo na memória, assim podemos acessar qualquer parte do mesmo.a
print(conteudo[1000:1300])

Tipo Titulo;Vencimento do Titulo;Data Venda;PU;Quantidade;Valor
Tesouro IPCA+ com Juros Semestrais;15/05/2011;22/09/2008;1678,137281;664,40;1114954,40

 Prefixado com Juros Semestrais;01/01/2017;17/11/2008;730,230014;410,80;299978,48
Tesouro IPCA+;15/05/2015;17/11/2008;966,989586;750,00;725242,18
Tesouro Selic;07/03/2012;17/11/2008;3668,550000;239,00;876783,45
Tesouro Prefixado com Juros Semestrais;01/01/2014;17/11/2008;801,760094;658,80;528199,54



# É iterável? / É iterador?

In [5]:
# Confirmando que conteudo tem o método __iter__ de iterável.
'__iter__' in dir(conteudo)

True

In [6]:
# Confirmando se conteudo tem o método __next__ de iterador.
'__next__' in dir(conteudo)

False

# Aplicando __iter__ / iter()

In [7]:
# Verificando o tipo do objeto conteudo
print(f'conteudo = {type(conteudo)}')


conteudo = <class 'str'>


In [27]:
# Tornando o objeto conteudo um iterador
conteudo = iter(conteudo)
print(f'conteudo = {type(conteudo)}')

conteudo = <class 'str_iterator'>


In [24]:
# Confirmando se conteudo tem o método __next__ o tornando um iterador
'__next__' in dir(conteudo)

True

# Lazy evaluation

In [28]:
# iterando sobre o objeto com next().
print(next(conteudo))
print(next(conteudo))
print(next(conteudo))
print(next(conteudo))

T
i
p
o


# Criando uma class que recebe um arquivo e aplica métodos \_\_iter__ e \_\_next__ aplicando lazy evaluation

In [39]:
class File_iterator():
    """Recebe arquivo e retorna linha por linha aplicando
    lógica lazy evaluation"""
    def __init__(self, file: str):
        self.file = open(file, 'r', encoding="utf-8")
        self.linha_atual = ''

    def __iter__(self):
        """Tornando arquivo file um iterador"""
        return self

    def __next__(self):
        """Itera linha a linha do arquivo file. Retorna 
        linha do arquivo se a mesma possuir dados se não
        StopIteration"""
        self.linha_atual = self.file.readline()
        if self.linha_atual:
            return self.linha_atual
        raise StopIteration

In [37]:
file = 'VendasTesouroDireto.csv'

file_iterator = File_iterator(file)

# Imprimindo as duas primeiras linhas
print(next(file_iterator))
print(next(file_iterator))

Tipo Titulo;Vencimento do Titulo;Data Venda;PU;Quantidade;Valor

Tesouro IPCA+ com Juros Semestrais;15/05/2011;22/09/2008;1678,137281;664,40;1114954,40



In [42]:
# Verificando consumo de memória em cada iteração
from sys import getsizeof

file = 'VendasTesouroDireto.csv'
file_iterator = File_iterator(file)

linha1 = next(file_iterator)
print(f'{linha1}\nLinha 1 = {getsizeof(linha1)} bytes\n')

linha2 = next(file_iterator)
print(f'{linha2}\nLinha 2 = {getsizeof(linha2)} bytes')

Tipo Titulo;Vencimento do Titulo;Data Venda;PU;Quantidade;Valor

Linha 1 = 113 bytes

Tesouro IPCA+ com Juros Semestrais;15/05/2011;22/09/2008;1678,137281;664,40;1114954,40

Linha 2 = 136 bytes


# Expressões Geradoras

In [61]:
# Criando uma lista com resultado da tabuada de 2 com um for
tabuada = []
for numero in range(1,11):
    tabuada.append(numero*2)

print(tabuada)

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20]


In [63]:
# Substituindo o for por uma list comprehensions
tabuada = [x*2 for x in range(1,11)]
print(tabuada)

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20]


In [67]:
# Substituindo por um tuple comprehensions(generator)
tabuada = (x*2 for x in range(1,11))
print(tabuada)

<generator object <genexpr> at 0x000001DBBE6D83C0>


In [68]:
# Expressão geradora mais next( ) Aplicando Lazy Evaluetion

print(f'1º next = {next(tabuada)}')
print(f'2º next = {next(tabuada)}')
print(f'3º next = {next(tabuada)}')

1º next = 2
2º next = 4
3º next = 6


## Comparando uso de memória em expressões geradoras

In [72]:
from sys import getsizeof
# list comprehensions Vs tuple comprehensions(generator)

tabuada = [x*2 for x in range(1,11)]
print(f'{tabuada}\ntamanho em bytes: {getsizeof(tabuada)}\n')

# tuple comprehensions é um genaretor
tabuada = (x*2 for x in range(1,11))
print(f'{tabuada}\ntamanho em bytes: {getsizeof(tabuada)}\n')
print(f'{next(tabuada)}\ntamanho em bytes: {getsizeof(next(tabuada))}')

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20]
tamanho em bytes: 184

<generator object <genexpr> at 0x000001DBBDBE14A0>
tamanho em bytes: 112

2
tamanho em bytes: 28


In [73]:
# se refizermos o exemplo acima agora com um range de 1000 o tamanho do generator continua o mesmo, já o da lista aumenta e muito. Magia =)

tabuada = [x*2 for x in range(1,1000)]
print(f'{"tabuada"}\ntamanho em bytes: {getsizeof(tabuada)}\n')

# tuple comprehensions é um genaretor
tabuada = (x*2 for x in range(1,1000))
print(f'{tabuada}\ntamanho em bytes: {getsizeof(tabuada)}\n')
print(f'{next(tabuada)}\ntamanho em bytes: {getsizeof(next(tabuada))}')

tabuada
tamanho em bytes: 8856

<generator object <genexpr> at 0x000001DBBDBE14A0>
tamanho em bytes: 112

2
tamanho em bytes: 28


# Função geradora (yield)

In [69]:
# Exemplo de função geradora
def geradora():
    yield 1
    yield 2
    yield 3

g = geradora()

print(f'{next(g)}')
print(f'{next(g)}')
print(f'{next(g)}')

1
2
3


In [71]:
# Função Vs Gerador
print(f'O tipo de def geradora é: {type(geradora)}\n')
print(f'O tipo de g = geradora() é: {type(g)}\n')

O tipo de def geradora é: <class 'function'>

O tipo de g = geradora() é: <class 'generator'>



## Mais exemplos de geradores

In [88]:
# yield pode nos ajudar a escrever geradores de maneira simples e gerar iteráveis de maneira graciosa. Sem __iter__, sem __next__. A linguagem faz isso pra você. Você só se preocupa com o necessário

def contador():
    index = 0
    while True:
        yield index
        index += 1

c = contador()

print(f'{next(c)}')
print(f'{next(c)}')
print(f'{next(c)}')
print(f'{next(c)}')
print(f'{next(c)}')

0
1
2
3
4


In [94]:
# Nomenclatura - Quando usamos return, dizemos que a função retorna algo. Quando usamos yield dizemos que a função faz/gera algum tipo de valor. Ex:1

def gen_exemplo():
    print('Entrei na função')
    yield 'Primeiro'
    print('Estou na função')
    yield 'Segundo'
    print('Estou na função p.2')
    yield 'Ultimo'
    print('Sai da função')

print(f'O tipo de gen_exemplo é: {type(gen_exemplo)}')

g = gen_exemplo()

print(f'O tipo de g é: {type(g)}\n')

print(f'{next(g)}\n')
print(f'{next(g)}\n')
print(f'{next(g)}\n')
print(f'{next(g)}')

O tipo de gen_exemplo é: <class 'function'>
O tipo de g é: <class 'generator'>

Entrei na função
Primeiro

Estou na função
Segundo

Estou na função p.2
Ultimo

Sai da função


StopIteration: 

In [111]:
sec = range(10)

def gen(iteravel):
    for valor in iteravel:
        yield valor

print(sec)
g = gen(sec)
print(g)
print(next(g))
print(next(g))
print(list(g))

range(0, 10)
<generator object gen at 0x000002AA3406AC80>
0
1
[2, 3, 4, 5, 6, 7, 8, 9]


# Criando um gerador para ler linha por linha de um arquivo

In [75]:
file = 'VendasTesouroDireto.csv'

def gen(file:str):
    for linha in open(file, 'r', encoding="utf-8"):
        yield linha.strip().split(';')

f = gen(file)

# Assim ele carrega linha a linha na memória e não o arquivo inteiro.

print(next(f))
print(next(f))
print(next(f))
print('-' * 100)

# poderiamos fazer um for para imprimir as 10 primeiras linhas, ou varrer todo arquivo sem carregar o mesmo na memória 
for linha in range(10):
    print(next(f))

['Tipo Titulo', 'Vencimento do Titulo', 'Data Venda', 'PU', 'Quantidade', 'Valor']
['Tesouro IPCA+ com Juros Semestrais', '15/05/2011', '22/09/2008', '1678,137281', '664,40', '1114954,40']
['Tesouro Prefixado com Juros Semestrais', '01/01/2010', '22/09/2008', '968,950900', '300,00', '290685,27']
----------------------------------------------------------------------------------------------------
['Tesouro Prefixado', '01/04/2009', '22/09/2008', '931,253563', '185,20', '172468,15']
['Tesouro IPCA+ com Juros Semestrais', '15/08/2024', '22/09/2008', '1535,850000', '153,00', '234985,05']
['Tesouro IPCA+ com Juros Semestrais', '15/05/2045', '23/09/2008', '1521,730000', '33,00', '50217,09']
['Tesouro Prefixado', '01/04/2009', '23/09/2008', '931,704662', '201,60', '187831,65']
['Tesouro IPCA+', '15/08/2024', '23/09/2008', '606,015359', '61,20', '37088,13']
['Tesouro IPCA+', '15/05/2015', '23/09/2008', '1036,385938', '864,80', '896266,55']
['Tesouro IPCA+ com Juros Semestrais', '15/05/2015', '2

## Aplicando yield from

In [133]:
# yield from
def raio_sinplificador(lista_composta):
    for elemento in lista_composta:
        yield from elemento

lista = [[1,2,3],[4,5,6],[7,8,9]]

g = raio_sinplificador(lista)
print(g)
print(next(g))
print(next(g))
print(next(g))
print(next(g))

<generator object raio_sinplificador at 0x000002AA34032DD0>
1
2
3
4
