# Renombrar columnas

El primer paso es comprobar si realmente tienes en tus columnas un problema con la asignación de nombres. Recomendamos empezar con el método info() para obtener una idea general sobre el dataset.

Recordemos cómo usarlo:

`print(df.info())`

<img src="/Users/dion/Documents/GitHub/DataScience_Bootcamp/SPRINT 3/img/info().png" alt="Mi imagen">

Este método muestra no solo los nombres de las columnas, sino también información sobre los tipos de datos en la tabla y la cantidad de objetos no nulos en cada columna. Es un excelente punto de partida.

Como alternativa, puedes usar el atributo .columns que solo muestra los nombres de las columnas y nada más.

Para ilustrar cómo funciona el atributo .columns, creemos una tabla que contenga las distancias entre la Tierra y varios cuerpos celestes. Crearemos un DataFrame a partir de estos datos.

<img src="/Users/dion/Documents/GitHub/DataScience_Bootcamp/SPRINT 3/img/measurements.png">

Para revisar los nombres de las columnas, vamos a mostrar el atributo columns del DataFrame.

`print(celestial.columns)`

<img src="/Users/dion/Documents/GitHub/DataScience_Bootcamp/SPRINT 3/img/celestial.png">

Aquí tenemos tres problemas:

1. `Celestial bodies` contiene dos espacios: entre las palabras y al final.
2. `MIN` y `MAX` se escriben en mayúsculas, mientras que en `Celestial bodies` solo se escribe con mayúscula el primer carácter. Este tipo de inconsistencia puede causar problemas.
3. Los nombres `MIN` y `MAX` no son muy descriptivos. Necesitamos nombres más explícitos para transmitir con claridad su significado.
Corregir los problemas

Debemos corregir estos problemas, así que cambiemos el nombre de las columnas:

* Vamos a cambiar `Celestial bodies ` a `celestial_bodies`, para respetar el estilo snake_case, y de esta manera resolvemos los problemas del nombre de esta columna.
* Remplazaremos `MIN` y `MAX` por `min_distance` y `max_distance`, y de esa manera también respetaremos el estilo snake_case y agregaremos significado al nombre de las columnas, lo que hace que su contenido se entienda más fácilmente.
Para cambiar el nombre de las columnas, llama al método `rename()` con un diccionario como su argumento columns. Las claves del diccionario deben ser los nombres anteriores de las columnas, y los valores correspondientes deben ser los nuevos nombres. De este modo:

```python
# Declara un diccionario con el nombre anterior de la columna como claves
# y los nombres nuevos de la columna como los valores
columns_new ={
    "Celestial bodies ": "celestial_bodies",
    "MIN": "min_distance",
    "MAX": "max_distance",
    }

# Llama al método rename y pasa
# el diccionario como un argumento al parámetro columns
celestial = celestial.rename(columns = columns_new)
print(celestial.columns)
```
Resultado:

`Index(['celestial_bodies', 'min_distance', 'max_distance'], dtype='object')`

Antes te mostramos cómo cambiar los nombres de las columnas y reasignar la variable `celestial` para reflejar los cambios. Si no reasignas la variable, los nombres de las columnas no cambiarán.

Sin embargo, hay una forma más elegante de renombrar columnas que no requiere reasignación como hicimos anteriormente. Solo necesitamos especificar el parámetro `inplace` y establecerlo en `True`.

```python
# Declara un diccionario con el nombre anterior de la columna como claves
# y los nombres nuevos de la columna como los valores
columns_new ={
    "Celestial bodies ": "celestial_bodies",
    "MIN": "min_distance",
    "MAX": "max_distance",
    }

# Llama al método rename y pasa
# el diccionario como un argumento al parámetro columns
# y True como un argumento al parámetro inplace
celestial.rename(columns = columns_new, inplace = True)
print(celestial.columns)
```
Resultado:

`Index(['celestial_bodies', 'min_distance', 'max_distance'], dtype='object')`

Como puedes ver, logramos los mismos resultados sin hacer ninguna asignación directa.

Forma automatizada de renombrar las columnas

A veces, la cantidad de columnas en un dataset puede ser grande, por lo que es poco práctico asignar manualmente nuevos valores a los nombres de las columnas. Y de hecho, podría ser difícil ver los problemas en un nombre de columna. En estos casos, los bucles y los métodos de string pueden ser muy útiles. 

Echa un vistazo al siguiente fragmento de código que itera sobre los antiguos nombres de la columna, los cambia y guarda los resultados en la lista```new_col_name```, que más tarde se asigna como los nuevos nombres de columna:

```python
new_col_names = []

for old_name in celestial.columns:
    # Primero, elimina los espacios al principio y al final
    name_stripped = old_name.strip()
    # Luego, pon todas las letras en minúsculas
    name_lowered = name_stripped.lower()
    # Por último, reemplaza los espacios entre palabras por guiones bajos
    name_no_spaces = name_lowered.replace(' ', '_')
    # Agrega el nuevo nombre a la lista de nuevos nombres de columna
    new_col_names.append(name_no_spaces)

# Reemplaza los nombres anteriores por los nuevos
celestial.columns = new_col_names
```

Como resultado, obtenemos un DataFrame en el que todos los nombres de las columnas se ajustan a nuestro formato deseado.

Una cosa importante a tener en cuenta es cómo reemplazamos los nombres de columna antiguos con los nuevos a través de esta línea:

`celestial.columns = new_col_names`

Vamos a explicarlo un poco más:

* `new_col_names` es una lista que contiene los nombres nuevos de columna que queremos configurar.
* Al establecer `celestial.columns` igual a `new_col_names`, hacemos el verdadero reemplazo, actualizando los nombres de columna antiguos con los nuevos almacenados en `new_col_names`.

Dicho método de reemplazo resulta útil cuando tienes nombres de columna que quieres establecer en forma de lista.

¡Es muy claro! Recorre los nombres de tus columnas; elimina todos los espacios iniciales y finales usando el método `strip()`; haz que todo esté en minúsculas con el método `lower()`; remplaza cualquier espacio entre palabras con guiones bajos aplicando el método `replace()`; y después agrega el nuevo nombre (más claro) a la nueva lista.

¡Y ahí lo tienes! ¡Un simple bucle puede hacer que todo se vea limpio y reluciente! A partir de la próxima lección, vas a estudiar cómo trabajar con problemas de contenido, empezando con los valores ausentes.