## Guiones bajos, guiones bajos y más

Los guiones bajos simples y dobles tienen un significado en los nombres de variables y métodos de Python. Parte de ese significado es simplemente por convención y pretende ser una pista para el programador, y otra parte es impuesta por el intérprete de Python.

Si te estás preguntando, "¿Cuál es el significado de las puntuaciones simples y dobles en los nombres de variables y métodos de Python?" Haré lo posible por darte la respuesta aquí. 

Vamos a ver los siguientes cinco patrones de subrayado y convenciones de nomenclatura, y cómo afectan al comportamiento de tus programas Python:

* Subrayado simple: _var
* Guión bajo final simple: var_
* Doble guión bajo inicial: \__var
* Doble guión bajo inicial y final: \__var\__
* Guión bajo simple: _

### Subrayado simple: _var

Cuando se trata de nombres de variables y métodos, el prefijo de puntuación simple tiene un significado sólo por convención. Es una pista para el programador: significa lo que la comunidad de Python acuerda que debe significar, pero no afecta al comportamiento de tus programas.

**El prefijo de guión bajo está pensado como una pista para decirle a otro programador que una variable o método que comienza con un solo guión bajo está destinado a uso interno. Esta convención está definida en PEP 8, la guía de estilo de código Python más utilizada.**

Sin embargo, esta convención no es aplicada por el intérprete de Python. Python no tiene distinciones fuertes entre variables "privadas" y "públicas" como lo hace Java. 

Añadir un solo guión bajo delante del nombre de una variable es más bien como si alguien pusiera una pequeña señal de advertencia de guión bajo que dijera: "Oye, esto no está realmente destinado a formar parte de la interfaz pública de esta clase. Es mejor dejarlo estar".

In [1]:
class Test:
    def __init__(self):
        self.foo = 11 
        self._bar = 23

In [2]:
t = Test()

print(t.foo)
print(t._bar)

11
23


Como puedes ver podemos acceder a estos valores de las variables sin problema. El _ simplemente indica que esa variable debe ser tratada como si fuera privada.

**Sin embargo, los guiones bajos iniciales afectan a la forma en que se importan los nombres de los módulos.**

Imagina que tienes el siguiente código en un módulo llamado mi_módulo:

In [3]:
# my_module.py:

def external_func(): 
    return 23

def _internal_func():
    return 42

Si hicieras:

In [None]:
from my_module import *

y después:

In [5]:
print(external_func())

23


Esta devolvería 23 como ahora.

In [None]:
print(_internal_func())

Pero esta última devolvería:
    
NameError: "name '_internal_func' is not defined"

Ahora bien, si se utiliza un comodín de importación (import *) para importar todos los nombres del módulo, Python no importará nombres con un guión bajo inicial (a menos que el módulo defina una lista \__all\__ que anule este comportamiento):

**Por cierto, las importaciones con comodines deben evitarse, ya que no dejan claro qué nombres están presentes en el espacio de nombres.**

Es mejor ceñirse a las importaciones regulares en aras de la claridad. A diferencia de las importaciones con comodines, las importaciones regulares no se ven afectadas por la convención de nomenclatura con un solo guión bajo:

### Guión bajo final simple: var_

A veces el nombre más apropiado para una variable ya está tomado por una palabra clave en el lenguaje Python.

Por lo tanto, nombres como class o def no pueden usarse como nombres de variables en Python. En este caso, puedes añadir un único guión bajo para romper el conflicto de nombres:

In [6]:
def make_object(name, class):
    pass

SyntaxError: invalid syntax (<ipython-input-6-8bc7202f8bcc>, line 1)

In [8]:
def make_object(name, class_):
    pass

### Doble guión bajo inicial: \__var

Los patrones de nomenclatura que hemos cubierto hasta ahora reciben su significado únicamente de las convenciones acordadas. 

Con los atributos de clase de Python (variables y métodos) que comienzan con doble guión bajo, las cosas son un poco diferentes.

Un prefijo de doble guión bajo hace que el intérprete de Python reescriba el nombre del atributo para evitar conflictos de nombres en las subclases.

Esto también se llama **name mangling**.

El intérprete cambia el nombre de la variable de una manera que hace más difícil crear colisiones cuando la clase se extiende más tarde.
Sé que esto suena bastante abstracto. Por eso he preparado este pequeño ejemplo de código que podemos utilizar para experimentar:

In [9]:
class Test:
    def __init__(self):
        self.foo = 11
        self._bar = 23 
        self.__baz = 23

Echemos un vistazo a los atributos de este objeto utilizando la función incorporada dir():

In [10]:
t = Test()

dir(t)

['_Test__baz',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_bar',
 'foo']

Esto nos da una lista con los atributos del objeto. Tomemos esta lista y busquemos nuestros nombres de variables originales foo, _bar y \__baz. 

Vamos a ver algunos cambios notables.

En primer lugar, la variable self.foo aparece sin modificar como foo en la lista de atributos.

A continuación, self._bar se comporta de la misma manera: aparece en la clase como _bar. Como comenté antes, el guión bajo inicial es sólo una convención en este caso, una pista para el programador.

Sin embargo, con self.\__baz las cosas se ven un poco diferentes. Cuando busques \__baz en esa lista, verás que no hay ninguna variable con ese nombre. 

Entonces, ¿Qué ha pasado con \__baz?

Si te fijas bien, verás que hay un atributo llamado _Test__baz en este objeto. Este es el nombre que aplica el intérprete de Python. Lo hace para proteger la variable de ser sobrescrita en subclases.

Vamos a crear otra clase que extienda la clase Test e intente anular sus atributos existentes añadidos en el constructor:

In [11]:
class ExtendedTest(Test):
    def __init__(self):
        super().__init__() 
        self.foo = 'overridden' 
        self._bar = 'overridden' 
        self.__baz = 'overridden'

In [12]:
t2 = ExtendedTest()

dir(t2)

['_ExtendedTest__baz',
 '_Test__baz',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_bar',
 'foo']

In [13]:
t2.foo

'overridden'

In [14]:
t2._bar

'overridden'

In [15]:
t2.__baz

AttributeError: 'ExtendedTest' object has no attribute '__baz'

Como podemos ver, la nueva clase ExtendedTest() que hereda de Test no tiene la variable \__baz:

* Tiene la variable heredada de Test llamada _Test__baz.
* Y también su propia variable \__baz llamada _ExtendedTest\__baz.

In [16]:
t2._ExtendedTest__baz

'overridden'

In [17]:
t2._Test__baz

23

El name mangling es totalmente transparente al programador:
    
    

In [18]:
class ManglingTest:
    
    def __init__(self):
        self.__mangled = 'hello' 
    
    def get_mangled(self):
        return self.__mangled

In [19]:
ManglingTest().get_mangled()

'hello'

Como ves puedes hacerle referencia a la variable desde dentro de un método de la propia clase.

In [20]:
ManglingTest().__mangled

AttributeError: 'ManglingTest' object has no attribute '__mangled'

Pero no acceder a la variable de forma directa desde un objeto de la misma clase.

Para ello habría que hacer:

In [22]:
ManglingTest()._ManglingTest__mangled

'hello'

Con los métodos de clase pasa exactamente igual, puedes hacer referencia a ellos desde la definición de la clase, pero si quieres acceder a ellos en el objeto tienes que llamarlos como arriba:

ObjetoClase()._NombreClase__nombreMetodo

In [23]:
class MangledMethod: 
    
    def __method(self):
        return 42

    def call_it(self):
        return self.__method()

In [24]:
MangledMethod().__method()

AttributeError: 'MangledMethod' object has no attribute '__method'

In [25]:
MangledMethod().call_it()

42

Otro ejemplo de name manglin es el siguiente:

In [1]:
_MangledGlobal__mangled = 23

class MangledGlobal: 
    
    def test(self):
        return __mangled

In [2]:
MangledGlobal().test()

23

En este ejemplo, declaré _MangledGlobal__mangled como una variable global. 

Luego accedí a la variable dentro del contexto de una clase llamada MangledGlobal. Gracias al name mangling, pude referenciar la variable global _MangledGlobal__mangled como \__mangled dentro del método test() de la clase.

El intérprete de Python expandió automáticamente el nombre \__mangled a _MangledGlobal__mangled porque comienza con dos caracteres de subrayado. 

**Esto demuestra que el name mangling no está ligado a los atributos de la clase específicamente. Se aplica a cualquier nombre que comience con dos caracteres de subrayado que se utilice en un contexto de clase.**

### ¿Qué significa el término "dunder"?

Si has escuchado a algunos pythonistas experimentados hablar de Python o has visto algunas charlas en conferencias, es posible que hayas oído el término dunder. Si te preguntas qué es eso, pues aquí tienes la respuesta:

**Los dobles guiones bajos se denominan a menudo "dunder" en la comunidad de Python.**

La razón es que los dobles guiones bajos aparecen con bastante frecuencia en el código de Python, y para evitar la fatiga de los músculos de la mandíbula, los pythonistas suelen acortar "doble guión bajo" a "dunder".

### Doble guión bajo inicial y final: \__var\__

**Los nombres que tienen doble puntuación inicial y final están reservados para un uso especial en el lenguaje.**

Esta regla cubre cosas como __init__ para los constructores de objetos, o __call__ para hacer que los objetos sean invocables.

### Guión bajo simple: _

Por convención, a veces se utiliza un solo guión bajo independiente como para indicar que una variable es temporal o insignificante.

Por ejemplo, en el siguiente bucle no necesitamos acceder al índice y podemos usar "_" para indicar que es sólo un valor temporal:

In [4]:
for _ in range(3):
    print('Hello, World.')

Hello, World.
Hello, World.
Hello, World.


También puedes utilizar guiones bajos simples en las expresiones de desempaquetado para ignorar valores particulares que no vas a utilizar.

De nuevo, este significado es sólo por convención y no provoca ningún comportamiento especial en el analizador de Python. El guión bajo simple es simplemente un nombre de variable válido que a veces se utiliza para este propósito.

In [5]:
car = ('red', 'auto', 12, 3812.4)
color, _, _, mileage = car

In [6]:
color

'red'

In [7]:
mileage

3812.4

In [8]:
_

12

Además de su uso como variable temporal, "_" es una variable especial en la mayoría de los REPL de Python que representa el resultado de la última expresión evaluada por el intérprete. Esto es útil si estás trabajando en una sesión de interpretación y quieres acceder al resultado de un cálculo anterior.

También es útil si creas un objeto sobre la marcha (como una lista) en el interprete sin asignarle un nombre. 

Puedes referirte a ella como "_", ya que es lo último que has puesto.

## Claves:

* Guión bajo simple inicial"_var": La convención de nomenclatura que indica un nombre es para uso interno. Generalmente no es forzada por el intérprete de Python (excepto en las importaciones con comodines) y sólo sirve como pista para el programador.

* Guión bajo simple final "var_": Se utiliza por convención para evitar conflictos de nombres con las palabras clave de Python.

* Doble guión bajo inicial "\__var": Activa la búsqueda de nombres cuando se utiliza en un contexto de clase. Lo impone el intérprete de Python.

* Doble guión bajo inicial y final "\__var\__": Indica métodos especiales definidos por el lenguaje Python. Evite este esquema de nomenclatura para sus propios atributos.

* Guión bajo simple "_": A veces se utiliza como nombre para variables temporales o insignificantes ("no importa"). Además, representa el resultado de la última expresión en una sesión REPL de Python.