## Dataclasses
[link para aula](https://realpython.com/lessons/python-data-classes-overview/)

In [1]:
from dataclasses import dataclass

---

### Using Data Classes in Python (Overview)

- Introduzido a partir do python 3.7
- É basicamente uma classe que só contem dados

In [2]:
@dataclass
class DataClass:
    name: str
    age: int
    weight: float

In [5]:
p1 = DataClass(
        'João',
        12,
        84.9
    )

In [12]:
f"A idade de {p1.name} é {p1.age} e pesa {p1.weight} kg"

'A idade de João é 12 e pesa 84.9 kg'

---

### Comparison to standard classes

Dataclasses são criadas usando um decorator

In [14]:
@dataclass
class DataClassCard:
    rank: str
    suit: str

>Para esse objeto simples acima bastou a gente criar o nome da classe com suas variáveis e respectivos tipos

Vamos instanciar a classe criada acima e mostrar alguns dos atributos e funcionalidades

In [15]:
queen_of_hearts = DataClassCard('Q', 'Hearts')

In [17]:
queen_of_hearts

DataClassCard(rank='Q', suit='Hearts')

In [19]:
queen_of_hearts.rank

'Q'

In [20]:
queen_of_hearts.suit

'Hearts'

>Veja como é simples acessar e organizar os atributos

In [21]:
queen_of_hearts == DataClassCard('Q', 'Hearts')

True

Agora abaixo vamos comparar com a criação de uma classe padrão

In [32]:
class RegularCard:
    def __init__(self, rank, suit):
        self.rank = rank
        self.suit = suit

>Já veja aqui uma desvantagem em constuir o mesmo objeto usando uma classe padrão. Precisamos usar o nome da variável 3 vezes para criar um atributo

In [33]:
queen_of_hearts = RegularCard('Q', 'Hearts')

In [34]:
queen_of_hearts.rank

'Q'

In [35]:
queen_of_hearts

<__main__.RegularCard at 0x7fbae4c8f070>

In [36]:
queen_of_hearts == RegularCard('Q', 'Hearts')

False

>Veja aqui outra grande diferença para a criação do objeto com dataclass. A representação da classe não vem com formato descritivo na comparação de objetos iguais, ele retorna falso. Isso acontece por causa dos métodos já imbutidos como veremos abaixo

Dataclass Methods:

- __ repr __(): método mágico para representação amigável de um objeto
- __ eq __ (): método para comparações simples


Agora, para imitar um pouco mais o objeto criado com dataclass, vamos aplicar esses métodos à nossa classe padrão:

In [70]:
class RegularCard:
    def __init__(self, rank, suit):
        self.rank = rank
        self.suit = suit
    
    # criando o método para trazer uma descrição mais amigável
    def __repr__(self):
        return (f"{self.__class__.__name__}"
               f"(rank={self.rank!r}, suit={self.suit!r})")
    
    # método para fazer comparações com outras classes
    def __eq__(self, other):
        if other.__class__ is not self.__class__:
            return NotImplemented
        
        return (self.rank, self.suit) == (other.rank, other.suit)        

In [71]:
queen_of_hearts = RegularCard('Q', 'Hearts')

In [72]:
queen_of_hearts

RegularCard(rank='Q', suit='Hearts')

>Veja que tivemos que escrever muito mais código para criar uma classe que tenha as mesmas características que uma dataclass já traz como default

### Alternatives to DataClasses

Aqui vamos ver algumas alternativas pythonicas para criar objetos com características parecidas com o dataclass

Por exemplo, podemos usar a tupla ou dicionário para construir a mesma carta de baralho

In [73]:
queen_of_hearts_tuple = ('Q', 'Hearts')
queen_of_hearts_dict = {'rank':'Q', 'suit':'Hearts'}

Apesar de ter criado um objeto parecido, esse formato acima contém uma série de limitações:
- O modo de acesso é diferente para cada uma

In [75]:
queen_of_hearts_tuple[0]

'Q'

In [76]:
queen_of_hearts_dict['rank']

'Q'

- No caso do dicionário, tem que sempre lembrar que o nome da chave deve ser o mesmo. Isso coloca muita responsabilidade em cima do desenvolvedor do programa

In [80]:
queen_of_hearts_dict_1 = {'rank':'Q', 'suit':'Hearts'}
queen_of_hearts_dict_2 = {'value':'Q', 'suit':'Hearts'}

- No caso das tuplas, a ordem também tem que ser sempre a mesma. Ou senão a comparação entre objetos e acesso dos seus atributos pode ser prejudicada

In [81]:
queen_of_hearts_tuple_1 = ('Q', 'Hearts')
queen_of_spades_tuple_1 = ('Spades', 'Q')

Uma alternativa no meio do caminho entre dict e tupla é a namedtuple

In [97]:
from collections import namedtuple

In [98]:
NamedTupleCard = namedtuple('NamedTupleCard', ['rank', 'suit'])

In [99]:
queen_of_hearts = NamedTupleCard('Q', 'Hearts')

In [100]:
queen_of_hearts

NamedTupleCard(rank='Q', suit='Hearts')

In [101]:
queen_of_hearts[0]

'Q'

In [102]:
queen_of_hearts.rank

'Q'

In [103]:
queen_of_hearts == NamedTupleCard('Q', 'Hearts')

True

>Note algumas semelhanças com o objeto feito com dataclass. A representação dele é amigável. Podemos acessá-lo tanto por posição quanto por nome do atributo. A comparação entre objeto iguais retorna True.

No entanto, namedtuple é basicamente uma tupla e vai retornar True para comparações com qualquer outra tupla. Isso pode parecer interessante, mas pode gerar alguns bugs difíceis de encontrar depois

In [107]:
queen_of_hearts == ('Q', 'Hearts')

True

Para ilustrar, vamos fazer comparação com 2 objetos diferentes

In [109]:
queen_of_hearts

NamedTupleCard(rank='Q', suit='Hearts')

In [110]:
# vamos criar um objeto para ser instanciado
Person = namedtuple('Person', ['first_initial', 'last_name'])

In [112]:
queen_of_hearts == Person('Q', 'Hearts')

True

>Ela compara o tipo e seus elementos e retorna True, mesmo que sejam objetos diferentes. Um é uma carta criado com NamedTupleCard e outro seria uma pessoa criada com Person

Outro problema do namedtuple em comparação ao dataclass é que é difícil atribuir valores default. Além disso, sendo uma estrutura imutável, o namedtuple perde a flexibilidade para atualizar novos valores aos atributos

In [113]:
card = NamedTupleCard(9, 'Spades')

In [118]:
# alterar esse valor já estabelecido não é possível
card.rank = 8

AttributeError: can't set attribute

**The attrs project**

É uma alternativa que se parece muito com o dataclass na estrutura, mas é um pacote que deve ser instalado separadamente com o pip. Já o módulo dataclass já vem como built-in no python.

Algumas das diferenças que o projeto attrs tem e o dataclass não possui ainda estão abaixo:
- Suportar conversão e validadores
- Projeto maduro, já sendo usado desde o python2
- **Não** é uma biblioteca padrão do python

---

### Basic DataClasses

In [128]:
# vamos construir uma dataclass que representa a posição geográfica de uma cidade
@dataclass
class Position:
    name: str
    lon: float
    lat: float

In [129]:
pos = Position('Oslo', 10.8, 59.9)

In [131]:
pos

Position(name='Oslo', lon=10.8, lat=59.9)

In [132]:
pos.lat

59.9

Existe uma maneira de construir objeto com dataclass que é bem parecida com o namedtuple

In [144]:
from dataclasses import make_dataclass

In [145]:
Position = make_dataclass('Position', ['name', 'lat', 'lon'])

In [147]:
pos = Position('Oslo', 10.8, 59.9)

In [148]:
pos

Position(name='Oslo', lat=10.8, lon=59.9)

O Dataclass é uma classe como qualquer outra de python, com a diferença de que ela já vem com alguns métodos para que o enfoque seja na manipulação de dados:
- Não precisa construir a classe com o __ init __
- Já vem com o método __ repr __ e __ eq __


Agora vamos aprender a atribuir valores default

In [149]:
@dataclass
class Position:
    name: str
    lat: float = 0.0
    lon: float = 0.0

In [150]:
pos = Position('Oslo')

In [151]:
pos

Position(name='Oslo', lat=0.0, lon=0.0)

>Tentar criar o objeto acima sem ter um default vai dar erro

Importante notar que o type hints são obrigatórios na contrução de objetos com dataclass. Type hint é aquele tipo de dados que vem depois dos dois pontos (:)

No entanto, se quiser criar uma classe com tipo de dados específico, vc pode usar Any do módulo typing

In [152]:
from typing import Any

In [153]:
@dataclass
class WithoutExplicitTypes:
    name: Any
    value: Any = 42

In [154]:
Position(1, 'Rio', True)

Position(name=1, lat='Rio', lon=True)

>No entanto, sendo python uma linguagem de tipagem dinâmica, veja que não temos problemas se instanciarmos e atribuirmos valores com os tipos diferentes do estabelecido na classe

Adding Methods

Sendo uma classe como outra qualquer, podemos adicionar métodos as nossas dataclasses

Vamos adicionar um método à Position para calcular a distância. Usaremos a fórmula de Haversine

In [155]:
from math import asin, cos, radians, sin, sqrt

In [157]:
@dataclass
class Position:
    name: str
    lat: float = 0.0
    lon: float = 0.0
    
    # vamos aplicar a fórmula de haversine para calcular a distancia entre 2 coordenadas geográficas
    # se quiser evitar a fórmula abaixo existe um módulo python chamado Haversine
    def distance_to(self, other):
        r = 6371 # Raio da Terra em KM
        lam_1, lam_2 = radians(self.lon), radians(other.lon)
        phi_1, phi_2 = radians(self.lat), radians(other.lat)
        h = (sin((phi_2 - phi_1) / 2)**2
            + cos(phi_1) * cos(phi_2) * sin((lam_2 - lam_1) / 2)**2)
        return 2 * r * asin(sqrt(h))

In [158]:
oslo = Position('Oslo', 10.8, 59.9)
vancouver = Position('Vancouver', -123.1, 49.3)

In [159]:
oslo.distance_to(vancouver)

14808.54935421077

### More Flexible Dataclasses