# PANDAS 

Pandas es un programa para análisis y manejo de datos.

In [None]:
#Importar librerías

import numpy as np
import pandas as pd

In [None]:
#Creación de objetos
s = pd.Series([1, 3, 5, np.nan, 6, 8])

#Presentar lo que contiene el objeto
s

In [None]:
#Creación de una estructura de fechas simple

fechas = pd.date_range("20220101", periods=6)

#Presenta la estructura de fechas
fechas



In [None]:
#Creación de un cuadro con fechas y valores aleatorios en las columnas A, B, C, y D
fechas2 = pd.DataFrame(np.random.randn(6, 4), index=fechas, columns=list("ABCD"))

#Presenta el cuadro resultante
fechas2


#Como ejercicio vuelva a ejecutar la celda y observe los resultados

In [None]:
#Creación de una estructura de datos pasando un objeto Dict (Diccionario) que puede convertirse en
#algo parecido a una serie.
fechas3 = pd.DataFrame(
        {
            "A": 1.0,
            "B": pd.Timestamp("20220102"),
            "C": pd.Series(1, index=list(range(4)), dtype="float32"),
            "D": np.array([3] * 4, dtype="int32"),
            "E": pd.Categorical(["test", "train", "test", "train"]),
            "F": "foo",
        }
    )
 
        
fechas3

In [None]:
# Las columnas de la estructura tienen diferentes tipos de datos

fechas3.dtypes

#REVISANDO DATOS

Aquí se muestra como ver las hileras superiores e inferiores de una estructura:

In [None]:
fechas2.head()

In [None]:
fechas2.tail(3)

In [None]:
#Despliegue del índice, columnas:

fechas2.index

In [None]:
fechas2.columns

In [None]:
#DataFrame.to_numpy() provee de una representación NumPy de los datos. Observe que esto puede ser costoso cuando su
#Dataframe tiene columnas de diferentes tipos. Esto es fundamentalmente diferente entre pandas y NumPy:
#Las matrices en NumPy tienen un dtype para toda la matriz, mientras DataFrame de pandas tiene un dtype por columna.
#Cuando se llama DataFrame.to_numpy(), pandas encuentra el dtype que pueda contener todos los dtypes del DataFrame.
#Esto podría generar mas bien un objeto, el cual requiere presententar cada valor de un objeto de Python.En el ejemplo,
#los valores son del tipo floating-point, entonces la función para realizar la conversión se ejecuta rápidamente
# y no requiere copiar datos.

fechas2.to_numpy()


In [None]:
#La conversión de fechas3 que tiene múltiples dtypes con el comando DataFrame.to_numpy() es relativamente costoso.
fechas3.to_numpy()

#Nota: Observe que DataFrame.to_numpy() no incluye los índices o etiquetas de las columnas en la salida.

In [None]:
#Describe() muestra un resumen de las estadísticas de los datos
fechas2.describe()

In [None]:
#Para transponer datos:
fechas2.T

In [None]:
#Ordenar en un eje
fechas2.sort_index(axis=1, ascending=False)

In [None]:
#Ordenar por valores
fechas2.sort_values(by="B")

# OBTENER DATOS

In [None]:
# Para seleccionar solo una columna, que obtiene una serie, equivalente a fechas2.A:
fechas2["A"]

In [None]:
# Seleccionar vía [], la cual selecciona por hilera.
fechas2[0:3]

In [None]:
fechas2["20220102":"20220104"]

# SELECCION POR ETIQUETA


In [None]:
#Para obtener una selección de datos usando etiquetas:
fechas2.loc[fechas[0]]

In [None]:
#Selección multieje por etiqueta:
fechas2.loc[:,["A","B"]]

In [None]:
#Selecciona por etiqueta, en donde se incluyen ambos puntos terminales:
 
fechas2.loc["20220102":"20220104", ["A","B"]]


In [None]:
#Reducción en las dimensiones del objeto presentado:
fechas2.loc["20220102",["A","B"]]

In [None]:
#Para obtener un valor escalar:
fechas2.loc[fechas[0],"A"]

In [None]:
#Para acceder a a un valor escalar (equivalente al método anterior):
fechas2.at[fechas[0],"A"]

# SELECCIÓN POR POSICIÓN


In [None]:
#Seleccionar vía la posición de los enteros anteriores:
fechas2.iloc[3]

In [None]:
#Selección de enteros, de forma similar como en NumPY/Python:
fechas2.iloc[3:5,0:2]

# OTROS TEMAS:

- Manejo de datos perdidos
- Operaciones estadísticas
- Histogramas
- Unión de tablas de datos
- Agrupamientos
- Redimensionamiento de datos
- Series de tiempo
- Categorías
- Graficado
- Importación y exportación de datos
