<h1 align="center"><font color="yellow">Dataclasses in Python</font></h1>

<font color="yellow">Data Scientist.: PhD.Eddy Giusepe Chirinos Isidro</font>

Se você precisar definir um tipo de dados composto em `Python`, use `Dataclasses`.

Aqui faremos o estudo do Dataclasses em base ao artigo de [Alan Jones]().

O `dataclass` é um recurso que foi introduzido no `Python 3.7`. É um `decorador` que permite definir classes que são usadas principalmente para armazenar dados. Ele simplifica a criação de classes fornecendo implementações padrão para métodos como `__init__`.

Para definir um `dataclass`, você importa o `decorador` do `módulo dataclasses` e o aplica à sua definição de classe. 



<font color="red">Por exemplo:</font>

## O módulo `dataclasses`

In [1]:
from dataclasses import dataclass

@dataclass
class Person:
    name: str
    age: int
    profession: str
    

No exemplo, a classe `Person` é definida como um `dataclass`. A classe possui três atributos: `name`, `age`, e `profession`, cada um anotado com seus respectivos tipos (observe que as dicas de tipo não são obrigatórias, mas tornam o uso da classe de dados mais explícito).

O decorador `dataclass` gera automaticamente vários métodos para a classe:

1. `__init__`: Inicializa o objeto e atribui valores aos atributos com base nos argumentos fornecidos.

2. `__repr__`: Retorna uma representação de string do objeto.

3. `__eq__`: compara dois objetos para igualdade com base em seus valores de atributo.

4. `__ne__`: compara dois objetos para desigualdade com base em seus valores de atributo.

5. `__lt__`: define a comparação menor que entre dois objetos.

6. `__gt__`: define a comparação maior que entre dois objetos.

7. `__le__`: define a comparação menor ou igual entre dois objetos.

8. `__ge__: define a comparação maior ou igual entre dois objetos.


Vamos ver o uso da classe `Person`:

In [3]:
person1 = Person("Karina", 25, "Cientista de Dados")
person2 = Person("Eddy Giusepe", 41, "PhD em Física")

print(person1) 
print("")

print(person2) 
print("")

print(person1 == person2)


Person(name='Karina', age=25, profession='Cientista de Dados')

Person(name='Eddy Giusepe', age=41, profession='PhD em Física')

False


Neste exemplo, criamos duas instâncias da classe `Person` e imprimimos suas representações de string — isso usa o método `__repr__`. Também comparamos as duas instâncias usando o operador `==`, que invoca o método `__eq__`.

## Listas de `dataclasses`




Dataclasses podem ser usadas com listas para criar um array de registros.

In [9]:
people = []

people.append(Person("Karina", 25, "Cientista de Dados"))
people.append(Person("Eddy Giusepe", 41, "PhD em Física"))


for person in people:
    print(person.name)

Karina
Eddy Giusepe


Ao usar uma lista, podemos iterar por ela e realizar operações em cada elemento.

Uma lista de `dataclass` também converte muito bem no `dataframe do Pandas`.

In [10]:
import pandas as pd

df = pd.DataFrame(people)
df

Unnamed: 0,name,age,profession
0,Karina,25,Cientista de Dados
1,Eddy Giusepe,41,PhD em Física


Concluindo, o decorador `dataclass` simplifica a criação de classes que armazenam principalmente dados, reduzindo a quantidade de código que você precisa escrever e tornando-o mais conciso e legível.