# **Pandas**
***

### **Editado por: Kevin Alexander Gómez**
#### Contacto: kevinalexandr19@gmail.com | [Linkedin](https://www.linkedin.com/in/kevin-alexander-g%C3%B3mez-2b0263111/) | [Github](https://github.com/kevinalexandr19)
***

### **Descripción**

Usando este manual, aprenderás a usar Pandas, una librería usada para el análisis de datos tabulares en Python.

Este Notebook es parte del [**Manual de Python aplicado a la Geología**](https://github.com/kevinalexandr19/manual-python-geologia), y ha sido creado con la finalidad de facilitar el aprendizaje en Python para estudiantes y profesionales en el campo de la Geología.

***

Empezaremos importando la librería: 
> Usaremos `pd` como una referencia abreviada de la librería.\
> También usaremos Numpy para generar información.

In [None]:
import pandas as pd
import numpy as np

### **1. Series**

Empezaremos creando un objeto llamado `Series`, que es similar a un `array` de Numpy, excepto que llevan un **índice (index)**:

In [None]:
pd.Series(np.random.random((4,)))

Los objetos de tipo `Series` representan unidades de filas y columnas.

También podemos crear una serie usando un diccionario:

In [None]:
rocas = pd.Series({"A": "andesita", "B": "basalto", "C": "diorita", "D": "granito"})

In [None]:
rocas

Podemos obtener el índice a través del atributo `.index`:

In [None]:
rocas.index

Y los valores a través del atributo `.values`:

In [None]:
rocas.values

Modificaremos el último valor de la serie `rocas` y la cambiaremos por `andesita`:

In [None]:
rocas[-1] = "andesita"
rocas

Por último, seleccionaremos el tercer elemento de la serie. Podemos hacer esto de dos formas:\
Usando el método `iloc` para ubicarlo a partir del número de posición en el índice:

In [None]:
rocas.iloc[2]

O podemos usar el método `loc` para ubicarlo a partir del nombre asignado al índice:

In [None]:
rocas.loc["C"]

### **2. DataFrame**

El otro tipo de objeto usado en Pandas es el `DataFrame`, que agrupa objetos de tipo `Series` en una tabla de filas y columnas.\
Cada fila y columna del DataFrame puede llevar un nombre específico.

Como ejemplo, crearemos un DataFrame de 2 filas y 3 columnas usando un `array` y una lista de columnas A, B y C:

In [None]:
df = pd.DataFrame(np.random.random((2, 3)), columns=["A", "B", "C"])
df

Podemos modificar los índices usando el atributo `.index`:

In [None]:
df.index = ["Fila 1", "Fila 2"]
df

Y por último, agregaremos una columna D con valores de tipo string:

In [None]:
df["D"] = ["abcdef", "ghijkl"]
df