# Trabajo con marcos de datos en Pandas

Cuando tenemos un marco de datos, podemos trabajar con los datos y guardar los resultados en otros formatos. Considere una pila de 13 bloques de diferentes colores. Podemos ver que hay tres colores únicos. 

## Determinar elementos únicos en una columna

Digamos que te gustaría saber cuántos elementos únicos hay en una columna de un marco de datos. Esto puede ser mucho más difícil cuando tienes millones de elementos. Pandas tiene el método `unique` para determinar los elementos únicos en una columna de un marco de datos.

### Ejemplo: Determinar años únicos de álbumes

Si queremos determinar los años únicos en los que se publicaron álbumes en nuestro conjunto de datos, podemos hacer lo siguiente:

In [1]:
# Suponiendo que df es un marco de datos con una columna 'Publicado'
años_unicos = df['Publicado'].unique()
print(años_unicos)

NameError: name 'df' is not defined

El resultado será una lista con todos los elementos únicos de la columna `Publicado`.

### Filtrar datos por una condición
Digamos que queremos crear una nueva base de datos que solo incluya canciones de la década de 1980 y posteriores. Podemos mirar la columna `Publicado` para seleccionar solo las canciones realizadas después de 1979.

#### Paso 1: Crear una serie booleana
Podemos usar operadores de desigualdad para todo el marco de datos en Pandas. Esto nos dará una serie de valores booleanos. Por ejemplo:

In [None]:
# Seleccionamos las filas donde el año de publicación es mayor a 1979
condicion = df['Publicado'] > 1979
print(condicion)


Esto nos devolverá `True` cuando la condición sea verdadera (publicado después de 1979) y `False` en caso contrario.

#### Paso 2: Filtrar el marco de datos
Podemos utilizar esta serie booleana para filtrar el marco de datos:

In [None]:
df1 = df[condicion]
print(df1)


Ahora tenemos un nuevo marco de datos, `df1`, donde cada álbum fue lanzado después de 1979.

### Guardar el nuevo marco de datos en un archivo CSV
Podemos guardar este nuevo marco de datos usando el método `to_csv`. El argumento es el nombre del archivo CSV. Asegúrate de incluir la extensión `.csv`.

In [None]:
df1.to_csv('albumes_post_1979.csv', index=False)

Esto guardará el nuevo marco de datos en un archivo llamado albumes_post_1979.csv.

### Otros formatos
Además de CSV, Pandas permite guardar los datos en otros formatos como Excel, JSON, entre otros, usando funciones como `to_excel` o `to_json`.

In [None]:
# Guardar como archivo Excel
df1.to_excel('albumes_post_1979.xlsx', index=False)

# Guardar como archivo JSON
df1.to_json('albumes_post_1979.json')
