<a href="https://colab.research.google.com/github/MalenaSancho/data-mining/blob/main/notebooks/data_mining_1.2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# PEP 8

## Nombres

Si hay que quedarse con algo de *PEP 8* que sea esto, fácil y efectivo:

* *Variables*: usa letras minúsculas y guiones bajos para separar palabras
* *Funciones*: usa letras minúsculas y guiones bajos para separar palabras
* *Clases*: pon en mayúsculas la primera letra de cada palabra (*CapWords*)
* *Constantes*: usa letras mayúsculas y guiones bajos para separar palabras
* Si necesitas usar una palabra reservada, añade un guión bajo al final
* Evita usar nombres demasiado cortos como `fn`; escribe en su lugar `first_name`
* Nunca uses `l` minúscula, `O` mayúscula o `I` mayúscula como nombre de variable; se confunden fácilmente con `1` o `0`


In [None]:
students = 10  # Variable

def calculate_area(length_x, length_y):  # Función
    return length_x * length_y

class FlyingPig:  # Clase
    weight = 25

PI = 3.1415927  # Constante

class_ = 'Mammal'  # Me he encabezonado en usar 'class' como nombre de variable

## Indentación

Dado que Python utiliza la indentación en lugar de llaves para denotar el ámbito de un bloque de código, es fundamental tener un estilo de indentación limpio y consistente:

* Las directrices no son demasiado estrictas, habiendo múltiples opciones; la clave es elegir una convención y atenerse a ella.
* *PEP 8* pone fin al debate espacios vs. tabuladores, recomendando cuatro espacios en lugar de un carácter de tabulación.
* Indenta siempre el código que ocupa varias líneas, para mejorar la lectura
* Para listas de valores largas, o bien se indenta en base al delimitador de apertura (*opening delimiter*) o se utiliza una sangría colgante (*hanging indent*)
* Cuando se usan *hanging indents*, no debe existir ningún valor en la primera línea y debe añadirse un nivel extra de indentación si hay un bloque a continuación
* En el caso de sentencias multilínea, el símbolo de cierre puede alinearse con la indentación usada o con el primer carácter de la declaración


In [None]:
# ¡Este bloque no compila! Es solo para poner ejemplos

# Lista de valores larga con 'opening delimiter'
result = my_function(first_argument, second_argument,
                    third_argument, fourth_argument)

# Lista de valores larga con 'hanging indent'
result = my_function(
    first_argument, second_argument,
    third_argument, fourth_argument)

# Lista de valores larga con 'hanging indent' y bloque a continuación
def my_function(
        first_argument, second_argument,
        third_argument, fourth_argument):
    print(first_argument)

# Alineamiento de sentencia multilínea al espacio en blanco
my_list = [
    1, 2, 3,
    4, 5, 6,
    ]

# Alineamiento de sentencia multilínea al primer carácter
my_list = [
    1, 2, 3,
    4, 5, 6,
]

## Espacios en blanco y saltos de línea

PEP 8 tiene pautas bastante estrictas sobre cuándo dividir las líneas largas y agregar espacios en blanco.

Usa las siguientes pautas como punto de partida; lo más importante es mantenerse consistente.

Criterios para los saltos de línea:

* Se recomienda no incluir múltiples instrucciones en la misma línea
* Manten la longitud de las líneas por debajo de 79 caracteres
* Usa dos líneas en blanco antes y después de funciones y definiciones de clases
* Usa una línea en blanco antes y después de la definición de un método de clase
* Use una línea en blanco para separar los pasos lógicos en secuencias largas

Criterios para los espacios en blanco:

* Evita espacios en blanco innecesarios
* Evita espacios en blanco inmediatamente dentro de los paréntesis, llaves o corchetes
* Usa espacios en blanco alrededor de la asignación y los operadores lógicos
* No uses espacios en blanco en asignación de valores en parámetros por defecto
* Usa espacios alrededor de los operadores matemáticos para aclarar el orden de las operaciones
* Usa espacios en blanco después de las comas y los dos puntos si no están junto al final de un corchete, llave o paréntesis
* Cuando se usa `:` para trocear una lista, no deben ponerse espacios en blanco
* No uses espacios en blanco para alinear los valores de las variables





In [None]:
# ¡Este bloque no compila! Es solo para poner ejemplos

# Espacios en blanco dentro de paréntesis, llaves y corchetes
spam(ham[1], {eggs: 2})  # Bien
spam ( ham[ 1 ], { eggs: 2 } )  # Mal

# Espacios en blanco en asignación y operadores lógicos
egg = 12  # Bien
egg=12  # Mal

# Espacios en blanco en asignación de parámetros por defecto
def complex(real, imag=0.0):  # Bien
    return magic(r=real, i=imag)  # Bien

def complex(real, imag = 0.0):  # Mal
    return magic(r = real, i = imag)  # Mal

# Espacios en blanco en operadores matemáticos
hypot = x*x + y*y  # Bien
c = (a+b) * (a-b) # Bien

hypot = x * x + y * y  # Mal
c = (a + b) * (a - b) # Mal

# Espacios en blanco después de comas y puntos
x, y = y, x  # Bien
x , y = y , x  # Mal

# Espacios en blanco con ':'
my_list[2:5] = 10  # Bien
my_list[2 : 5] = 10  # Mal

# Espacios en blanco para alinear valores de variables
user_name    = 'Pepito'  # Mal
user_country = 'Spain'

## ¿Comillas simples o comillas dobles?

Tanto las comillas simples (`'`) como las dobles (`"`) se utilizan para definir los valores de las cadenas de caracteres.

Además, las comillas triples (`'''` o `"""`) se utilizan para cadenas que ocupen varias líneas.

Python no aboga por las comillas simples o dobles, pero sí proporciona directrices de uso:

* Usa comillas dobles para cadenas que contengan comillas simples
* Use comillas simples para cadenas con comillas dobles

In [None]:
# Todos estos ejemplos son correctos

message = 'En un lugar de "La Mancha"'

message = "En un lugar de 'La Mancha'"

message = '''En un lugar de "La Mancha", de cuyo nombre no quiero acordarme,
             no ha mucho tiempo que vivía un hidalgo de los de lanza en astillero,
             adarga antigua, rocín flaco y galgo corredor'''

message = """En un lugar de 'La Mancha', de cuyo nombre no quiero acordarme,
             no ha mucho tiempo que vivía un hidalgo de los de lanza en astillero,
             adarga antigua, rocín flaco y galgo corredor"""

## Comentarios

Mantén los comentarios actualizados; los comentarios incorrectos son peor que no tener comentarios:

* Escribe frases completas
* Un comentario comienza por `#` seguido de un espacio en blanco
* Comentarios en bloque (`block comments`):
  * Una o más líneas de comentarios que comienzan por `#`
  * Deben indentarse a la altura del código que están comentando
  * Separa párrafos en el comentario con una línea de comentario vacía
* Comentarios en línea (`inline comments`):
  * Siguen al código que comentan en la misma línea
  * Deben usarse moderadamente
  * Debe haber dos espacios en blanco entre el comentario y el código
* Todas las funciones, clases y métodos deberían estar documentadas (`docstrings`)
* Se debe usar triple comillas (`"""`) en los `docstrings`

In [None]:
# Esto es un comentario en bloque
# Puede tener una línea o más de una
#
# He dejado una línea en blanco para separar párrafos dentro del comentario
# Fácil, ¿no?

var = 34  # Esto es un comentario en línea

def my_function():
    """ Esto es un docstring de una línea no más """

def my_other_function(parameter=False):
    """
    Esto es un docstring multilínea.

    Docstring tiene también sus propios formatos, como Epytext, reST y Google.
    Ya, si eso, os lo miráis en casa...

    """

## Expresiones y módulos

* Usa la negación en línea (`if a is not b`) en lugar de negar una expresión positiva (`if not a is b`)
* No compruebes si una lista está vacía usando `len(lista) == 0` sino `if not lista`
* Siempre coloca `import` al inicio del fichero
* Importa funciones y clases usando `from my_module import MyClass` en lugar de importar el módulo completo (`import my_module`)
* Debes importar las librería en este orden:
  * Módulos de la librería standar
  * Módulos externos
  * Módulos del proyecto
* Cada una de estas secciones de importación debe estar en orden alfabético

## Ejercicio

In [4]:
# Instalamos 'Flake8' para analizar el estilo del código

!pip install flake8

Collecting flake8
  Downloading flake8-7.3.0-py2.py3-none-any.whl.metadata (3.8 kB)
Collecting mccabe<0.8.0,>=0.7.0 (from flake8)
  Downloading mccabe-0.7.0-py2.py3-none-any.whl.metadata (5.0 kB)
Collecting pycodestyle<2.15.0,>=2.14.0 (from flake8)
  Downloading pycodestyle-2.14.0-py2.py3-none-any.whl.metadata (4.5 kB)
Collecting pyflakes<3.5.0,>=3.4.0 (from flake8)
  Downloading pyflakes-3.4.0-py2.py3-none-any.whl.metadata (3.5 kB)
Downloading flake8-7.3.0-py2.py3-none-any.whl (57 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m57.9/57.9 kB[0m [31m2.2 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading mccabe-0.7.0-py2.py3-none-any.whl (7.3 kB)
Downloading pycodestyle-2.14.0-py2.py3-none-any.whl (31 kB)
Downloading pyflakes-3.4.0-py2.py3-none-any.whl (63 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m63.6/63.6 kB[0m [31m5.2 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pyflakes, pycodestyle, mccabe, flake8
Successfully installe

In [5]:
# 'Flake8' no revisa el formato de nombres
# Hay que instalar un plugin de 'Flake8' llamado 'pep8-naming'
# Los códigos de error de tipo 'Nxxx' son de nombres

!pip install pep8-naming

Collecting pep8-naming
  Downloading pep8_naming-0.15.1-py3-none-any.whl.metadata (7.4 kB)
Downloading pep8_naming-0.15.1-py3-none-any.whl (9.6 kB)
Installing collected packages: pep8-naming
Successfully installed pep8-naming-0.15.1


In [6]:
# Ejemplo de código fulero, con bastantes problemas de estilo...
# Vamos a crear un fichero 'test.py' con este código para analizarlo

%%writefile test.py
#definimos nuestros datos
my_dict ={
    'a'  : 10,
'b': 3,
    'c'  :   4,
          'd': 7}
#importamos el módulo que necesitamos
import numpy as np
#función de ayuda
def DictToArray(d):
  """Convertir valores de diccionario a array de numpy"""
  #extraer valores y convertir
               x=np.array(d.values())
               return x
# Esta es una línea de comentario innecesariamente larga que debería de dividirse en varias
print(DictToArray(my_dict))

class my_class:
    x = 12

Writing test.py


In [7]:
# Si queremos ver los números de línea

!cat -n test.py

     1	#definimos nuestros datos
     2	my_dict ={
     3	    'a'  : 10,
     4	'b': 3,
     5	    'c'  :   4,
     6	          'd': 7}
     7	#importamos el módulo que necesitamos
     8	import numpy as np
     9	#función de ayuda
    10	def DictToArray(d):
    11	  """Convertir valores de diccionario a array de numpy"""
    12	  #extraer valores y convertir
    13	               x=np.array(d.values())
    14	               return x
    15	# Esta es una línea de comentario innecesariamente larga que debería de dividirse en varias
    16	print(DictToArray(my_dict))
    17	
    18	class my_class:
    19	    x = 12


In [10]:
# Usamos 'Flake8' desde línea de comando para analizar el fichero

!flake8 test.py

[1mtest.py[m[36m:[m13[36m:[m16[36m:[m [1m[31mE999[m IndentationError: unexpected indent


### ¿Te atreves a corregirlo?

In [58]:
# Corrige los errores de estilo en esta celda

%%writefile test.py

# Importamos el módulo que necesitamos
import numpy as np

# Definimos nuestros datos
my_dict = {
    'a': 10,
    'b': 3,
    'c': 4,
    'd': 7
    }


# Función de ayuda
def dict_to_array(d):
    """Convertir valores de diccionario a array de numpy"""
    # Extraer valores y convertir
    x = np.array(d.values())
    return x


# Esta es una línea de comentario innecesariamente larga que debería de
# dividirse en varias
print(dict_to_array(my_dict))


class MyClass:
    x = 12

Overwriting test.py


In [59]:
# Vuelve a analizar el estilo hasta que esté todo correcto

!flake8 test.py

# Referencias

* [A Five-Minute Introduction to Python's Style Guide: PEP 8](https://medium.com/code-85/a-five-minute-introduction-to-pythons-style-guide-pep-8-57202886265f)
* [A Summary of PEP 8: Style Guide for Python Code](https://tandysony.com/2018/02/14/pep-8.html)
* [An Overview of The PEP 8 Style Guide](https://towardsdatascience.com/an-overview-of-the-pep-8-style-guide-5672459c7682)
* [¿Que es el PEP 8 y porque debería implementarlo?](https://dev.to/viktorvillalobos/que-es-el-pep-8-y-porque-deberia-implementarlo-54bh)