# Aula 06 - Revis√£o e Guia de Boas Pr√°ticas

![png](./img/quality.png)

## Conclus√£o:

Durante este processo de aprendizado, exploramos diversas ferramentas e bibliotecas que s√£o fundamentais para garantir a qualidade durante o desenvolvimento de um projeto.

Aqui est√£o os principais pontos que foram abordados:

- **Black**: Uma poderosa ferramenta de formata√ß√£o de c√≥digo Python que automatiza a tarefa de garantir a conformidade com as diretrizes de estilo da PEP 8. Com o Black, podemos manter a consist√™ncia no estilo do c√≥digo Python em nosso projeto, facilitando a leitura e a manuten√ß√£o do c√≥digo.
---
- **isort**: Uma biblioteca para organizar os imports de m√≥dulos em arquivos Python. O isort facilita a organiza√ß√£o dos imports de acordo com as conven√ß√µes de importa√ß√£o do Python, garantindo que nosso c√≥digo seja mais leg√≠vel e f√°cil de entender.
---
- **Flake8**: Uma ferramenta de verifica√ß√£o de c√≥digo Python que ajuda a garantir a conformidade com as diretrizes de estilo do PEP 8 e identifica poss√≠veis problemas no c√≥digo-fonte. O Flake8 nos ajuda a manter a qualidade do nosso c√≥digo Python, identificando erros de sintaxe, problemas de estilo e outras quest√µes que podem afetar a legibilidade e a manuten√ß√£o do c√≥digo.
---
- **taskipy**: Uma biblioteca que facilita a cria√ß√£o e execu√ß√£o de tarefas comuns em projetos Python usando scripts Python. Com o taskipy, podemos automatizar tarefas repetitivas, como execu√ß√£o de testes, formata√ß√£o de c√≥digo, execu√ß√£o de linting e muito mais, tornando nosso processo de desenvolvimento mais eficiente e organizado.
---
- **pre-commit**: Uma ferramenta para automatizar a execu√ß√£o de verifica√ß√µes de c√≥digo antes de cada commit em um reposit√≥rio Git. Com o pre-commit, podemos garantir que nosso c√≥digo Python atenda aos padr√µes de qualidade e estilo definidos, evitando problemas comuns antes mesmo de enviarmos nossas altera√ß√µes para revis√£o.
---
Em resumo, ao incorporar essas ferramentas e bibliotecas em nosso fluxo de trabalho de desenvolvimento de software em Python, podemos melhorar a qualidade do nosso c√≥digo, aumentar a produtividade da equipe e criar projetos mais robustos e f√°ceis de manter no longo prazo.


## Configura√ß√£o para execu√ß√£o dos estudos no Jupyter

In [1]:
# verifica a vers√£o do python
!python --version

Python 3.10.13


In [3]:
from site import getsitepackages

In [4]:
# Verificando se o path est√° no .venv
print(getsitepackages())

['/home/jcnok/bootcamps/bootcamp-jornada-de-dados_2024/.venv/lib/python3.10/site-packages']


In [5]:
import os

In [6]:
# Verifia a raiz do projeto atual
os.getcwd()

'/home/jcnok/bootcamps/bootcamp-jornada-de-dados_2024/aula_06/notebook'

In [40]:
# Altera o projeto para raiz da aula_06
os.chdir('/home/jcnok/bootcamps/bootcamp-jornada-de-dados_2024/aula_06')
os.getcwd()

'/home/jcnok/bootcamps/bootcamp-jornada-de-dados_2024/aula_06'

## Guia de boas pr√°ticas:

A [PEP 8](https://peps.python.org/pep-0008/) √© uma das PEPs (Python Enhancement Proposals) mais importantes da comunidade Python. Ela estabelece diretrizes para a formata√ß√£o do c√≥digo Python, incluindo conven√ß√µes de estilo, espa√ßamento, nomes de vari√°veis e outros aspectos importantes da escrita de c√≥digo Python leg√≠vel e consistente.

A PEP 8 foi criada para promover uma base de c√≥digo Python que seja f√°cil de ler e entender para os desenvolvedores, independentemente de quem tenha escrito o c√≥digo originalmente. Isso √© crucial para facilitar a manuten√ß√£o do c√≥digo, colabora√ß√£o entre equipes de desenvolvimento e garantir a qualidade do c√≥digo em projetos Python de todos os tamanhos.

Ao seguir as diretrizes da PEP 8, os desenvolvedores podem garantir que seu c√≥digo Python seja coeso, consistente e leg√≠vel, o que contribui para a sua usabilidade, manuten√ß√£o e escalabilidade ao longo do tempo.

Em resumo, a [PEP 8](https://peps.python.org/pep-0008/) √© uma refer√™ncia essencial para qualquer desenvolvedor Python que queira escrever c√≥digo claro, organizado e de f√°cil manuten√ß√£o, promovendo as melhores pr√°ticas de desenvolvimento na comunidade Python.

### A seguir algumas bibliotecas que nos ajudam a automatizar essas boas pr√°ticas de maneira a manter nosso c√≥digo coeso, consitente e leg√≠vel:

[**Black:**](https://pypi.org/project/black/)

* O Black √© uma ferramenta de formata√ß√£o de c√≥digo Python. Ele foi projetado para automatizar a formata√ß√£o do c√≥digo Python de acordo com as diretrizes da PEP 8, garantindo assim que o c√≥digo seja formatado de maneira consistente e leg√≠vel. Black √© conhecido por ser muito r√≠gido em sua formata√ß√£o e, portanto, √© considerado como uma "opini√£o" sobre como o c√≥digo Python deve ser formatado.
Al√©m de seguir as diretrizes da PEP 8, o Black tamb√©m se esfor√ßa para produzir um c√≥digo Python mais conciso e leg√≠vel, removendo a necessidade de discuss√µes sobre estilos de codifica√ß√£o em equipes de desenvolvimento.

[**isort:**](https://pypi.org/project/isort/)

* O isort √© uma ferramenta para ordenar os imports de m√≥dulos em arquivos Python. Ele reorganiza automaticamente as declara√ß√µes de importa√ß√£o em ordem alfab√©tica e agrupa-as de acordo com as conven√ß√µes de importa√ß√£o espec√≠ficas. Isso ajuda a manter a organiza√ß√£o e a legibilidade dos imports em arquivos Python.
Al√©m de ordenar os imports, o isort tamb√©m pode corrigir importa√ß√µes erradas e remover imports n√£o utilizados, ajudando a manter o c√≥digo Python limpo e livre de importa√ß√µes desnecess√°rias.

[**flake8:**](https://pypi.org/project/flake8/)

* O flake8 √© uma ferramenta de verifica√ß√£o de c√≥digo Python que ajuda a garantir a conformidade com as diretrizes de estilo do PEP 8 e identifica poss√≠veis problemas no c√≥digo-fonte. Ele verifica o c√≥digo em busca de erros de sintaxe, problemas de estilo, vari√°veis n√£o utilizadas e outros problemas potenciais.
O flake8 √© altamente configur√°vel e pode ser estendido com plugins para fornecer verifica√ß√µes adicionais espec√≠ficas ao projeto. √â frequentemente usado como parte de pipelines de integra√ß√£o cont√≠nua (CI) para garantir a qualidade do c√≥digo Python em projetos de software.

Em resumo, "black" √© uma ferramenta de formata√ß√£o de c√≥digo Python, "isort" √© uma ferramenta para organizar e ordenar imports, e "flake8" √© uma ferramenta de verifica√ß√£o de c√≥digo que ajuda a manter o c√≥digo Python consistente, limpo e livre de problemas. Juntas, essas ferramentas s√£o amplamente utilizadas na comunidade Python para promover boas pr√°ticas de desenvolvimento e garantir a qualidade do c√≥digo.

**Conforme a aula vamos executar alguns exemplos para entender o funcionamento de cada lib.**

#### Primeiro vamos instalar o flake8:

In [9]:
#instala a lib flake8 em modo silencioso no ambiente .venv.
!poetry add flake8 -q

* Criando uma fun√ß√£o simples e salvar o c√≥digo em src/exemplo1.py:

In [32]:
%%writefile src/exemplo01.py
def minha_funcao ():
    resultado = 2 + 2
    print("O resultado √©:", resultado)
if __name__ == "__main__":
    minha_funcao()


Overwriting src/exemplo01.py


* Agora vamos executar o c√≥digo para garantir que o mesmo esteja funcionando:

In [33]:
!python src/exemplo01.py

O resultado √©: 4


* Veja que a fun√ß√£o funcionou perfeitamente, por√©m ser√° que o c√≥digo est√° de acordo com a PEP8?
* Podemos usar o flake8 para identificar poss√≠veis erros de padroniza√ß√£o conforme abaixo: 

In [34]:
!flake8 src/exemplo01.py

[1msrc/exemplo01.py[m[36m:[m1[36m:[m17[36m:[m [1m[31mE211[m whitespace before '('
[1msrc/exemplo01.py[m[36m:[m4[36m:[m1[36m:[m [1m[31mE305[m expected 2 blank lines after class or function definition, found 0


* Veja que interessante o flake8 j√° notificou 2 erros, vamos corrigir:
    * Ele informa que na linha 1  e caracter 17 existe um espa√ßo antes do '(' -> ser√° corrigido
    * Informa que na linha 4 logo no primeiro caracter j√° solicita que precisa de 2 espa√ßos depois de uma classe ou fun√ß√£o. -> corrigido abaixo.
    * Importante notar que informa at√© mesmo o c√≥digo "E211 e E305" do erro se precisar podem pesquisar o erro [aqui.](https://www.flake8rules.com/)

In [35]:
%%writefile src/exemplo01.py
def minha_funcao():
    resultado = 2 + 2
    print("O resultado √©:", resultado)


if __name__ == "__main__":
    minha_funcao()

Overwriting src/exemplo01.py


* O c√≥digo foi corrigido agora vamos executar o flake8 novamente:

In [36]:
!flake8 src/exemplo01.py

* Veja que ele n√£o trouxe nenhum erro agora, ou seja, dentro dos padr√µes pr√©-estabelecidos pelo flake8, o c√≥digo est√° legivel.
* O flake8 √© muito bom para corrigirmos esses problemas de espa√ßamentos, excesso de caracteres em uma linha, linhas em branco etc...
* Ele n√£o faz nada no c√≥digo, apenas informa onde corrigir.

#### Agora vamos instalar o Black:

In [37]:
# instalando a lib black no ambiente virtual.
!poetry add black -q

* Agora vamos criar a mesma fun√ß√£o por√©m vamos salvar como src/exemplo02.py

In [38]:
%%writefile src/exemplo02.py
def minha_funcao ():
    resultado = 2 + 2
    print("O resultado √©:", resultado)
if __name__ == "__main__":
    minha_funcao()


Writing src/exemplo02.py


* Vamos rodar o black agora:

In [39]:
!black src/exemplo02.py

[1mreformatted src/exemplo02.py[0m

[1mAll done! ‚ú® üç∞ ‚ú®[0m
[34m[1m1 file [0m[1mreformatted[0m.


* Vamos abrir o arquivo e verificar o que ele formatou: 

In [40]:
# %load src/exemplo02.py
def minha_funcao():
    resultado = 2 + 2
    print("O resultado √©:", resultado)


if __name__ == "__main__":
    minha_funcao()


* Veja que o black corrigiu autom√°ticamente os erros de c√≥digo: "E211 e E305" que o flake8 havia identificado.
* Vamos rodar o flake8 no exemplo02.py para conferir.

In [41]:
!flake8 src/exemplo02.py

* O Flake8 executou a verifica√ß√£o sem erros, pois o black j√° havia realizado as devidas corre√ß√µes.
* Essa √© a vantagem com black, pois ele identifica e j√° corrige o erro de forma aut√¥noma.

* Ent√£o quer dizer que podemos unir o melhor dos dois mundos e usar ambas libs para sempre mantermos um c√≥digo dentro dos padr√µes?
  * Nem tudo √© perfeito, existe um pequeno conflito entre ambas e vou demonstrar aqui para uma melhor compreens√£o.
  * O Flake8 utiliza por ado√ß√£o 79 caracteres m√°ximo por linha e o black 88, isso pode gerar um problema.
  * Veja o exemplo abaixo: irei salvar o arquivo em src/conflito_entre_black_e_flake8.py

In [68]:
%%writefile src/conflito_entre_black_e_flake8.py
def exemplo_de_conflito_entre_black_e_flake8():
    variavel_com_nome_muito_longo_para_testar_um_conflito_entre_black_e_flake8 = "conflito"

    if variavel_com_nome_muito_longo_para_testar_um_conflito_entre_black_e_flake8 == "confito":
        print("Conflito entre o Black e o Flake8!")
    else:
        print("Sem conflito entre o Black e o Flake8!")

    return variavel_com_nome_muito_longo_para_testar_um_conflito_entre_black_e_flake8

if __name__=="__main__":
    exemplo_de_conflito_entre_black_e_flake8()


Overwriting src/conflito_entre_black_e_flake8.py


* Vou executar o black para corrigir poss√≠veis erros de formata√ß√£o automaticamente:

In [69]:
!black src/conflito_entre_black_e_flake8.py

[1mreformatted src/conflito_entre_black_e_flake8.py[0m

[1mAll done! ‚ú® üç∞ ‚ú®[0m
[34m[1m1 file [0m[1mreformatted[0m.


In [70]:
# %load src/conflito_entre_black_e_flake8.py
def exemplo_de_conflito_entre_black_e_flake8():
    variavel_com_nome_muito_longo_para_testar_um_conflito_entre_black_e_flake8 = (
        "conflito"
    )

    if (
        variavel_com_nome_muito_longo_para_testar_um_conflito_entre_black_e_flake8
        == "confito"
    ):
        print("Conflito entre o Black e o Flake8!")
    else:
        print("Sem conflito entre o Black e o Flake8!")

    return variavel_com_nome_muito_longo_para_testar_um_conflito_entre_black_e_flake8


if __name__ == "__main__":
    exemplo_de_conflito_entre_black_e_flake8()


* Agora irei executar o flake8 para confirma√ß√£o:

In [72]:
!flake8 src/conflito_entre_black_e_flake8.py

[1msrc/conflito_entre_black_e_flake8.py[m[36m:[m2[36m:[m80[36m:[m [1m[31mE501[m line too long (82 > 79 characters)
[1msrc/conflito_entre_black_e_flake8.py[m[36m:[m7[36m:[m80[36m:[m [1m[31mE501[m line too long (82 > 79 characters)
[1msrc/conflito_entre_black_e_flake8.py[m[36m:[m14[36m:[m80[36m:[m [1m[31mE501[m line too long (85 > 79 characters)


* U√© mas o black n√£o realizou as corre√ß√µes e nos informou que j√° estava tudo certo?
    * Como o black aceita at√© 88 caracteres ele entendeu que estava tudo certo, veja uma breve explica√ß√£o e como corrigir isso.



O Black, por padr√£o, formata o c√≥digo Python utilizando linhas com at√© 88 caracteres de comprimento. Ele adota esse limite para facilitar a leitura do c√≥digo em telas de tamanho padr√£o e para permitir que as linhas sejam divididas com um n√≠vel adequado de aninhamento sem prejudicar a legibilidade.

Por outro lado, o Flake8, por padr√£o, verifica se as linhas de c√≥digo Python t√™m at√© 79 caracteres de comprimento. Esse limite √© baseado nas diretrizes da PEP 8, que recomenda linhas de at√© 79 caracteres para facilitar a leitura em ambientes com terminais de 80 colunas.

Esses valores padr√£o diferentes podem causar conflitos entre o Black e o Flake8, j√° que um pode formatar o c√≥digo al√©m do limite recomendado pelo outro.

Para resolver esse conflito e usar o Black e o Flake8 juntos, existem algumas abordagens:

Ajustar as Configura√ß√µes Padr√£o: Voc√™ pode ajustar as configura√ß√µes padr√£o do Black e do Flake8 para usar o mesmo limite de comprimento de linha. Isso pode ser feito configurando explicitamente os par√¢metros --line-length para o Black e max-line-length para o Flake8 com o mesmo valor (por exemplo, 79 caracteres).

Ignorar Verifica√ß√µes de Comprimento de Linha do Flake8: Voc√™ pode configurar o Flake8 para ignorar verifica√ß√µes de comprimento de linha, permitindo que o Black formate o c√≥digo como desejar. Isso pode ser feito configurando max-line-length para um valor alto ou desativando a verifica√ß√£o de comprimento de linha completamente no arquivo de configura√ß√£o do Flake8 (setup.cfg ou .flake8).

Ignorar Formata√ß√£o de C√≥digo do Black: Voc√™ tamb√©m pode configurar o Black para ignorar a formata√ß√£o do c√≥digo e focar apenas na verifica√ß√£o de erros de estilo usando o Flake8. Isso pode ser feito desativando a formata√ß√£o autom√°tica do Black ou configurando-o para n√£o modificar o comprimento das linhas.

##### Neste exemplo irei configurar o flake8 para aceitar o maximo de 88 caracteres em cada linha e ignorar alguns erros para evitar futuros conflitos, atribuindo a configura√ß√£o em um arquivo .flake8 conforme abaixo:

In [75]:
%%writefile .flake8
[flake8]
max-line-length = 88
extend-ignore = E203,E701

Overwriting .flake8


* Agora vamos executar o flake8 novamente no nosso arquivo de exemplo:

In [76]:
!flake8 src/conflito_entre_black_e_flake8.py

* Agora sim o conflito foi corrigido pois o flake8 agora aceita com maximo 88 caracteres em cada linha.

#### Agora vamos instalar o isort para cuidar da ordem dos imports:

In [77]:
# instala a lib isort no ambiente virtual.
!poetry add isort -q

* Agora vou criar uma fun√ß√£o de exemplo e salvar como src/exemplo_isort.py

In [88]:
%%writefile src/exemplo_isort.py
# Exemplo de arquivo desorganizado com imports
import os
import math
import site

def calcular_area_circulo(raio):
    """
    Fun√ß√£o para calcular a √°rea de um c√≠rculo.
    """
    return math.pi * raio ** 2

def diretorio_atual():
    """
    Fun√ß√£o para informar o diret√≥rio atual.
    """
    return os.getcwd()

def ambiente_atual():
    """
    Informa o ambiente de desenvolvimento atual.
    """
    return site.getsitepackages()
if __name__ == "__main__":
    diretorio_atual()


Overwriting src/exemplo_isort.py


* Executando o isort para organizar a ordem das importa√ß√µes:

In [89]:
!isort src/exemplo_isort.py

Fixing /home/jcnok/bootcamps/bootcamp-jornada-de-dados_2024/aula_06/src/exemplo_isort.py


* Verificando as altera√ß√µes:

In [91]:
# %load src/exemplo_isort.py
# Exemplo de arquivo desorganizado com imports
import math
import os
import site


def calcular_area_circulo(raio):
    """
    Fun√ß√£o para calcular a √°rea de um c√≠rculo.
    """
    return math.pi * raio ** 2

def diretorio_atual():
    """
    Fun√ß√£o para informar o diret√≥rio atual.
    """
    return os.getcwd()

def ambiente_atual():
    """
    Informa o ambiente de desenvolvimento atual.
    """
    return site.getsitepackages()
if __name__ == "__main__":
    diretorio_atual()


* Veja que o isort, segue as diretrizes da PEP 8 e organiza os imports em ordem alfab√©tica.

* Agora vamos garantir um c√≥digo leg√≠vel com as 3 libs:

In [92]:
!isort src/exemplo_isort.py

In [93]:
!black src/exemplo_isort.py

[1mreformatted src/exemplo_isort.py[0m

[1mAll done! ‚ú® üç∞ ‚ú®[0m
[34m[1m1 file [0m[1mreformatted[0m.


In [94]:
!flake8 src/exemplo_isort.py

* Analisando o c√≥digo j√° com as 3 verifica√ß√µes:

In [95]:
# %load src/exemplo_isort.py
# Exemplo de arquivo desorganizado com imports
import math
import os
import site


def calcular_area_circulo(raio):
    """
    Fun√ß√£o para calcular a √°rea de um c√≠rculo.
    """
    return math.pi * raio**2


def diretorio_atual():
    """
    Fun√ß√£o para informar o diret√≥rio atual.
    """
    return os.getcwd()


def ambiente_atual():
    """
    Informa o ambiente de desenvolvimento atual.
    """
    return site.getsitepackages()


if __name__ == "__main__":
    diretorio_atual()


* Hoje, aprendemos como usar essas bibliotecas para melhorar nossos processos de desenvolvimento de software. Aprendemos como formatar o c√≥digo automaticamente com o Black, organizar os imports com o isort e verificar a qualidade do c√≥digo com o Flake8. Ao dominar essas ferramentas, podemos nos tornar desenvolvedores mais eficientes e produzir c√≥digo Python de alta qualidade.

#### Para evitar futuros conflitos, √© necess√°rio realizar algumas altera√ß√µes no arquivo pyproject.toml, praticamente precisamos informar qual ser√° a lib preferencial

* **Carregando o arquivo pyproject.toml**.

In [4]:
# %load ../pyproject.toml
[tool.poetry]
name = "bootcamp-2024"
version = "0.1.0"
description = ""
authors = ["Julio Okuda <julio.okuda@gmail.com>"]
license = "MIT"
readme = "README.md"

[tool.poetry.dependencies]
python = "3.10.13"
ipykernel = "^6.29.3"
jupyter = "^1.0.0"
lab = "^8.1"
pandas = "^2.2.1"
polars = "^0.20.16"
duckdb = "^0.10.1"
pyspark = "^3.5.1"
vaex = "^4.17.0"
matplotlib = "^3.8.3"
dask-expr = "^1.0.5"
flake8 = "^7.0.0"
black = "^24.3.0"
isort = "^5.13.2"


[build-system]
requires = ["poetry-core"]
build-backend = "poetry.core.masonry.api"


* **Adicionando as configura√ß√µes para evitar conflitos entre o black e o isort**.

In [5]:
%%writefile -a ../pyproject.toml
# Adicionando a configura√ß√£o ao pyproject.toml para evitar conflitos
[tool.isort]
profile = "black" 


Appending to ../pyproject.toml


* **Carregando o arquivo novamente para conferir as altera√ß√µes.**

In [6]:
# %load ../pyproject.toml
[tool.poetry]
name = "bootcamp-2024"
version = "0.1.0"
description = ""
authors = ["Julio Okuda <julio.okuda@gmail.com>"]
license = "MIT"
readme = "README.md"

[tool.poetry.dependencies]
python = "3.10.13"
ipykernel = "^6.29.3"
jupyter = "^1.0.0"
lab = "^8.1"
pandas = "^2.2.1"
polars = "^0.20.16"
duckdb = "^0.10.1"
pyspark = "^3.5.1"
vaex = "^4.17.0"
matplotlib = "^3.8.3"
dask-expr = "^1.0.5"
flake8 = "^7.0.0"
black = "^24.3.0"
isort = "^5.13.2"


[build-system]
requires = ["poetry-core"]
build-backend = "poetry.core.masonry.api"
# Adicionando a configura√ß√£o ao pyproject.toml para evitar conflitos
[tool.isort]
profile = "black" 


### Agora vamos automatizar essas 3 libs para que sejam executadas em um √∫nico comando com o [TASKIPY](https://pypi.org/project/taskipy/):

In [8]:
# instalando a lib taskipy no ambiente virtual
!poetry add taskipy -q

A biblioteca "taskipy" √© uma ferramenta que facilita a cria√ß√£o e execu√ß√£o de tarefas (ou "tasks") comuns em projetos Python usando o Python scripts. Ela √© inspirada na funcionalidade de scripts do Node.js.

Com o "taskipy", voc√™ pode definir facilmente tarefas personalizadas em um arquivo tasks.py no seu projeto Python e execut√°-las usando o comando taskipy no terminal. Isso √© √∫til para automatizar tarefas repetitivas, como executar testes, iniciar o servidor de desenvolvimento, executar linting, entre outros.

Al√©m disso, o "taskipy" facilita a execu√ß√£o de tarefas espec√≠ficas do projeto, garantindo que as depend√™ncias necess√°rias estejam instaladas e que as tarefas sejam executadas no contexto correto do projeto.

Em resumo, o "taskipy" √© uma ferramenta √∫til para automatizar tarefas em projetos Python, tornando o desenvolvimento mais eficiente e organizado.

Link do projeto:[taskipy](https://pypi.org/project/taskipy/)

* **Agora precisamos adicionar nossa tarefa no arquivo pyproject.toml conforme o exemplo abaixo:**

In [10]:
%%writefile -a ../pyproject.toml
# lib para automatizar tarefas
[tool.taskipy.tasks]
format = "isort .&&black .&&flake8" #verifica a formata√ß√£o do c√≥digo na sequ√™ncia.

Appending to ../pyproject.toml


* **Apenas para conferir as altera√ß√µes:**

In [14]:
# %load ../pyproject.toml
[tool.poetry]
name = "bootcamp-2024"
version = "0.1.0"
description = ""
authors = ["Julio Okuda <julio.okuda@gmail.com>"]
license = "MIT"
readme = "README.md"

[tool.poetry.dependencies]
python = "3.10.13"
ipykernel = "^6.29.3"
jupyter = "^1.0.0"
lab = "^8.1"
pandas = "^2.2.1"
polars = "^0.20.16"
duckdb = "^0.10.1"
pyspark = "^3.5.1"
vaex = "^4.17.0"
matplotlib = "^3.8.3"
dask-expr = "^1.0.5"
flake8 = "^7.0.0"
black = "^24.3.0"
isort = "^5.13.2"
taskipy = "^1.12.2"


[build-system]
requires = ["poetry-core"]
build-backend = "poetry.core.masonry.api"
# Adicionando a configura√ß√£o ao pyproject.toml para evitar conflitos
[tool.isort]
profile = "black" 
# lib para automatizar tarefas
[tool.taskipy.tasks]
format = "isort .&&black .&&flake8" #verifica a formata√ß√£o do c√≥digo na sequ√™ncia.


* **Bom agora, vou criar uma fun√ß√£o simples e testar para conferir se a task est√° de fato funcional**.

In [18]:
%%writefile src/exemplo_com_tasks.py
#Exemplo de arquivo desorganizado com imports, fun√ß√£o sem espa√ßos adequados.
import site
import math
import os
def calcular_area_circulo(raio):
    """
    Fun√ß√£o para calcular a √°rea de um c√≠rculo.
    """
    return math.pi * raio**2
def diretorio_atual():
    """
    Fun√ß√£o para informar o diret√≥rio atual.
    """
    return os.getcwd()
def ambiente_atual():
    """
    Informa o ambiente de desenvolvimento atual.
    """
    return site.getsitepackages()
if __name__ == "__main__":
    diretorio_atual()

Overwriting src/exemplo_com_tasks.py


* **Vamos testar a task:**

In [19]:
!task format src/exemplo_com_tasks.py

Fixing /home/jcnok/bootcamps/bootcamp-jornada-de-dados_2024/aula_06/src/exemplo_com_tasks.py
[1mSkipping .ipynb files as Jupyter dependencies are not installed.
You can fix this by running ``pip install "black[jupyter]"``[0m
[1mreformatted /home/jcnok/bootcamps/bootcamp-jornada-de-dados_2024/aula_06/src/exemplo_com_tasks.py[0m

[1mAll done! ‚ú® üç∞ ‚ú®[0m
[34m[1m1 file [0m[1mreformatted[0m, [34m4 files [0mleft unchanged.


* **Conferindo como ficou:**

In [20]:
# %load src/exemplo_com_tasks.py
# Exemplo de arquivo desorganizado com imports, fun√ß√£o sem espa√ßos adequados.
import math
import os
import site


def calcular_area_circulo(raio):
    """
    Fun√ß√£o para calcular a √°rea de um c√≠rculo.
    """
    return math.pi * raio**2


def diretorio_atual():
    """
    Fun√ß√£o para informar o diret√≥rio atual.
    """
    return os.getcwd()


def ambiente_atual():
    """
    Informa o ambiente de desenvolvimento atual.
    """
    return site.getsitepackages()


if __name__ == "__main__":
    diretorio_atual()


* **Agora sim podemos garantir que nosso c√≥digo fique organizado de forma leg√≠vel, concisa e coesa?**
  * Ainda n√£o pois, imagine que esteja trabalhando em uma squad, e algu√©m simplesmente n√£o execute a task, de nada adiantaria essas configura√ß√µes.

* **Para resolver esse problema vamos utilizar uma outra lib para travar/bloquear todos os commits que n√£o atenderem os requisitos m√≠nimos necess√°rios.**

#### Biblioteca pre-commit

A biblioteca "pre-commit" √© uma ferramenta para automatizar a execu√ß√£o de verifica√ß√µes de c√≥digo antes de cada commit em um reposit√≥rio de controle de vers√£o, como o Git.

Principais caracter√≠sticas:
- **Verifica√ß√µes Autom√°ticas**: Executa verifica√ß√µes autom√°ticas, como formata√ß√£o de c√≥digo, verifica√ß√£o de estilo e an√°lise est√°tica.
- **Configura√ß√£o Flex√≠vel**: Personaliza√ß√£o f√°cil por meio do arquivo de configura√ß√£o `.pre-commit-config.yaml`.
- **Integra√ß√£o com Diversas Ferramentas**: Suporta uma ampla variedade de ferramentas de verifica√ß√£o de c√≥digo.
- **Execu√ß√£o Local**: As verifica√ß√µes s√£o executadas localmente em seu ambiente de desenvolvimento.
- **Integra√ß√£o com Git Hooks**: Integrado aos hooks do Git para acionamento autom√°tico antes de cada commit.

Link do projeto: [pre-commit](https://pypi.org/project/pre-commit/)


In [22]:
# instalando a lib pre-commit no ambiente virtual com poetry 
!poetry add pre-commit -q

* **Ap√≥s a instala√ß√£o √© necess√°rio criar um novo arquivo '.pre-commit-config.yaml' na raiz do projeto, √© nele que iremos realizar as devidas configura√ß√µes.**

* **Algumas configura√ß√µes b√°sicas ser√£o aplicadas agora conforme o exemplo abaixo:**

In [26]:
%%writefile ../.pre-commit-config.yaml
# Salvando as configura√ß√µes na raiz do projeto
repos:
  - repo: https://github.com/pre-commit/pre-commit-hooks
    rev: v4.5.0
    hooks:
      - id: trailing-whitespace
        args: [--markdown-linebreak-ext=md]
      - id: end-of-file-fixer
      - id: check-yaml
      - id: check-toml
      - id: detect-private-key
      - id: check-added-large-files
  - repo: https://github.com/psf/black-pre-commit-mirror
    rev: 24.3.0
    hooks:
      - id: black
        language_version: python3.10
  - repo: https://github.com/pycqa/isort
    rev: 5.13.2
    hooks:
      - id: isort
        name: isort (python)
  - repo: https://github.com/pycqa/flake8
    rev: 7.0.0
    hooks:
      - id: flake8

Writing ../.pre-commit-config.yaml


#### Configura√ß√£o do pre-commit

O arquivo `.pre-commit-config.yaml` cont√©m a configura√ß√£o do pre-commit para automatizar verifica√ß√µes e corre√ß√µes de c√≥digo antes de cada commit em um reposit√≥rio Git. Aqui est√° um resumo das configura√ß√µes:

- **pre-commit/pre-commit-hooks**: Este reposit√≥rio cont√©m uma cole√ß√£o de hooks do pre-commit para realizar v√°rias verifica√ß√µes no c√≥digo, como remo√ß√£o de espa√ßos em branco, adi√ß√£o de nova linha no final do arquivo, verifica√ß√£o de sintaxe YAML e TOML, detec√ß√£o de chaves privadas e verifica√ß√£o de arquivos grandes adicionados.
  
- **psf/black-pre-commit-mirror**: Este reposit√≥rio cont√©m o hook do Black, uma ferramenta de formata√ß√£o de c√≥digo Python que formata automaticamente o c√≥digo de acordo com as diretrizes do PEP 8.

- **pycqa/isort**: Este reposit√≥rio cont√©m o hook do isort, uma ferramenta para organizar os imports de m√≥dulos em arquivos Python de acordo com as conven√ß√µes de importa√ß√£o do Python.

- **pycqa/flake8**: Este reposit√≥rio cont√©m o hook do Flake8, uma ferramenta de verifica√ß√£o de c√≥digo Python que verifica a conformidade com as diretrizes de estilo do PEP 8 e identifica poss√≠veis problemas no c√≥digo-fonte.
```

Em resumo vamos usar essas ferramentas e verifica√ß√µes configuradas no arquivo `.pre-commit-config.yaml` para garantir a qualidade do c√≥digo em um projeto Python.

* **Com o arquivo .pre-commit-config.yaml criada, √© necess√°rio executar as instala√ß√µes com o c√≥digo abaixo:**

In [30]:
!pre-commit install

pre-commit installed at .git/hooks/pre-commit


* **Irei criar uma fun√ß√£o e realizar um teste e ver se est√° tudo funcioando ao realizar um commit:**

In [32]:
%%writefile src/exemplo_com_pre-commit.py
#Criando uma fun√ß√£o para testar o pre-commit

#Exemplo de arquivo desorganizado com imports, fun√ß√£o sem espa√ßos adequados.
import site
import math
import os
def calcular_area_circulo(raio):
    """
    Fun√ß√£o para calcular a √°rea de um c√≠rculo.
    """
    return math.pi * raio**2
def diretorio_atual():
    """
    Fun√ß√£o para informar o diret√≥rio atual.
    """
    return os.getcwd()
def ambiente_atual():
    """
    Informa o ambiente de desenvolvimento atual.
    """
    return site.getsitepackages()
if __name__ == "__main__":
    diretorio_atual()

Writing src/exemplo_com_pre-commit.py


* **Veja que o script acima n√£o est√° com as devidas formata√ß√µes b√°sicas da PEP8**.
* **Vamos ver se o pre-commit consegue resolver isso.**

In [33]:
!git status

On branch main
Your branch is up to date with 'origin/main'.

Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git restore <file>..." to discard changes in working directory)
	[31mmodified:   notebook/aula_06.ipynb[m
	[31mmodified:   ../poetry.lock[m
	[31mmodified:   ../pyproject.toml[m

Untracked files:
  (use "git add <file>..." to include in what will be committed)
	[31msrc/exemplo_com_pre-commit.py[m
	[31msrc/exemplo_com_tasks.py[m

no changes added to commit (use "git add" and/or "git commit -a")


In [34]:
#Adicionando ao stage
!git add src/exemplo_com_pre-commit.py

In [35]:
#conferindo se foi adicionado.
!git status

On branch main
Your branch is up to date with 'origin/main'.

Changes to be committed:
  (use "git restore --staged <file>..." to unstage)
	[32mnew file:   src/exemplo_com_pre-commit.py[m

Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git restore <file>..." to discard changes in working directory)
	[31mmodified:   notebook/aula_06.ipynb[m
	[31mmodified:   ../poetry.lock[m
	[31mmodified:   ../pyproject.toml[m

Untracked files:
  (use "git add <file>..." to include in what will be committed)
	[31msrc/exemplo_com_tasks.py[m



In [36]:
#Commitando o arquivo
!git commit -m "add:exemplo de pre-commit simples"

[INFO][m Stashing unstaged files to /home/jcnok/.cache/pre-commit/patch1712286549-259038.
trim trailing whitespace.................................................[42mPassed[m
fix end of files.........................................................[42mPassed[m
check yaml...........................................(no files to check)[46;30mSkipped[m
check toml...........................................(no files to check)[46;30mSkipped[m
detect private key.......................................................[42mPassed[m
check for added large files..............................................[42mPassed[m
black....................................................................[41mFailed[m
[2m- hook id: black[m
[2m- files were modified by this hook[m

[1mreformatted aula_06/src/exemplo_com_pre-commit.py[0m

[1mAll done! ‚ú® üç∞ ‚ú®[0m
[34m[1m1 file [0m[1mreformatted[0m.

isort (python)...........................................................[41mFailed[m


* **Observe que o black encontrou diverg√™ncias e n√£o aprovou o commit, por√©m ele pr√≥prio se encarregou de corrigir agora irei realizar um novo commit e garantir a aprova√ß√£o:**

In [37]:
!git status

On branch main
Your branch is up to date with 'origin/main'.

Changes to be committed:
  (use "git restore --staged <file>..." to unstage)
	[32mnew file:   src/exemplo_com_pre-commit.py[m

Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git restore <file>..." to discard changes in working directory)
	[31mmodified:   notebook/aula_06.ipynb[m
	[31mmodified:   src/exemplo_com_pre-commit.py[m
	[31mmodified:   ../poetry.lock[m
	[31mmodified:   ../pyproject.toml[m

Untracked files:
  (use "git add <file>..." to include in what will be committed)
	[31msrc/exemplo_com_tasks.py[m



In [38]:
!git add src/exemplo_com_pre-commit.py

In [39]:
!git commit -m "update:exemplo corrigido pelo pre-commit"

[INFO][m Stashing unstaged files to /home/jcnok/.cache/pre-commit/patch1712286803-259694.
trim trailing whitespace.................................................[42mPassed[m
fix end of files.........................................................[42mPassed[m
check yaml...........................................(no files to check)[46;30mSkipped[m
check toml...........................................(no files to check)[46;30mSkipped[m
detect private key.......................................................[42mPassed[m
check for added large files..............................................[42mPassed[m
black....................................................................[42mPassed[m
isort (python)...........................................................[42mPassed[m
flake8...................................................................[42mPassed[m
[INFO][m Restored changes from /home/jcnok/.cache/pre-commit/patch1712286803-259694.
[main e9a5bd2] update:exe

* **Desta forma conseguimos garantir que a squad ir√° manter a qualidade no desenvolvimento de todo o projeto, garantindo as boas pr√°ticas que foi definido com o time.**
* **O pre-commit pode ser utilizado para padronizar o formato dos commits, para verifica√ß√£o de seguran√ßa, padroniza√ß√£o e qualidade de c√≥digo entre outras, vale muito estudar toda a documenta√ß√£o.**