 # **<font color="DarkBlue">Primeros pasos con Pandas 🐼 </font>**

<p align="center">
<img src="https://pandas.pydata.org/static/img/pandas_mark.svg" width="50">
</p>


https://pandas.pydata.org/

 ## **<font color="DarkBlue">Algo de historia de Pandas 🐼 </font>**

<p align="justify">
💗 La historia y evolución de Pandas es notable en el contexto de Business Data Science, ya que se ha convertido en una de las herramientas más populares y poderosas para el análisis de datos en Python.
<br><br>
Aquí está un resumen de su historia y su relevancia en el ámbito de Business Data Science:
<br><br>

1. **Orígenes de Pandas:**
   Pandas fue desarrollado inicialmente por Wes McKinney mientras trabajaba en AQR Capital Management en 2008. En ese momento, McKinney buscaba una herramienta eficiente para el análisis de datos en Python que pudiera manejar conjuntos de datos de tamaño variable con facilidad. Inspirado por el trabajo que había realizado en finanzas cuantitativas, McKinney creó Pandas para satisfacer estas necesidades.

2. **Lanzamiento y adopción temprana:**
   Pandas fue lanzado como un proyecto de código abierto en 2009 y rápidamente ganó popularidad dentro de la comunidad de Python debido a su capacidad para manipular y analizar datos de manera eficiente. La sintaxis clara y expresiva de Pandas, inspirada en lenguajes como R y SQL, facilitó su adopción por parte de analistas y científicos de datos.

3. **Evolución y crecimiento:**
   A lo largo de los años, Pandas ha experimentado un crecimiento significativo en términos de características, rendimiento y estabilidad. Se han agregado numerosas funcionalidades nuevas, como la capacidad de manejar datos de series temporales, realizar operaciones de agrupamiento y pivotar datos de manera eficiente. Además, se han realizado mejoras continuas en el rendimiento y la optimización del código para manejar conjuntos de datos cada vez más grandes.

4. **Relevancia en Business Data Science:**
   Pandas se ha convertido en una herramienta fundamental en el campo de Business Data Science debido a varias razones:

   - **Facilidad de uso:** La sintaxis intuitiva y expresiva de Pandas facilita la manipulación y el análisis de datos, lo que permite a los profesionales de negocios realizar tareas complejas con relativa facilidad.
   
   - **Capacidad para manejar datos estructurados:** Pandas es especialmente eficaz para trabajar con datos tabulares y estructurados, como los que se encuentran comúnmente en el entorno empresarial. Esto lo hace ideal para tareas como limpieza de datos, transformación y análisis exploratorio.
   
   - **Integración con otras herramientas:** Pandas se integra bien con otras herramientas populares en el ecosistema de Python, como NumPy, Matplotlib y Scikit-learn, lo que permite construir y desplegar pipelines de análisis de datos completos.

<br>
<p align="justify">
 👀 En resumen, Pandas ha evolucionado desde sus humildes comienzos hasta convertirse en una herramienta indispensable de cualquier profesional de Business Data Science. Su capacidad para manejar datos de manera eficiente y su facilidad de uso lo hacen invaluable para realizar análisis de datos empresariales y tomar decisiones informadas basadas en datos.

 ## **<font color="DarkBlue">Conociendo Pandas</font>**

<p align="justify">
El módulo <code>Pandas</code> es una herramienta importante en el desarrollo de los siguientes notebooks. Contiene estructuras de datos y herramientas de manipulación de datos para que la limpieza y el análisis de datos sea rápido. <br><br> <code>Pandas</code> usualmente se usa en conjunto con herramientas de computación numérica como <code>NumPy</code> y como <code>SciPy</code>. Tambien con bibliotecas analíticas como <code>statsmodels</code> y <code>scikit-learn</code> y bibliotecas de visualización de datos como <code>seaborn</code> y <code>plotly</code>. <br><br> <code>Pandas</code> adopta partes significativas del estilo idiomático de <code>NumPy</code>, especialmente funciones basadas en matrices y una preferencia por el procesamiento de datos sin bucles <code>for</code>.<br><br> Mientras que <code>Pandas</code> adopta muchos modismos de <code>NumPy</code>, la mayor diferencia que tienen ambos módulos es que <code>Pandas</code> está diseñado para trabajar con datos tabulares o heterogéneos mientras que <code>NumPy</code>, por el contrario, es el más adecuado para trabajar con datos de matrices numéricas homogéneas.Desde que se convirtió en un proyecto de código abierto en 2010, <code>Pandas</code> ha madurado hasta convertirse en una biblioteca bastante grande que es aplicable en un amplio conjunto de casos de uso del mundo real. La comunidad de desarrolladores y usuarios de <code>Pandas</code> han sido una parte clave de su éxito.
</p>

<p align="justify"> 👀 Por convención, de esta manera se importa <code>Pandas</code>:  </p>

In [None]:
import numpy as np
import pandas as pd

 # **<font color="DarkBlue">Estructuras de datos</font>**

<p align="justify">
Las estructuras de datos que debemos manejar son: <code>Series</code> y <code>DataFrame</code>. Si bien no son una solución universal para todos los problemas que se pueden plantear, proporcionan una base sólida para una amplia variedad de tareas de datos. Estas estructuras de datos son fundamentales en <code>Pandas</code>.
</p>

 ## **<font color="DarkBlue">Serie</font>**

<p align="justify">
Una serie en Pandas es una estructura de datos unidimensional similar a una columna en una hoja de cálculo o en una base de datos. Es uno de los principales tipos de datos en la biblioteca Pandas y está diseñada para manejar y analizar datos de manera eficiente.
<br><br>
Una serie tiene dos componentes: los valores y los índices.
<br><br>

- Los valores pueden ser de cualquier tipo de datos (números, cadenas, fechas, etc.), mientras que,
- los índices son etiquetas que identifican cada valor en la Serie.

<p align="justify">
<br> La serie más simple se forma a partir de solo una matriz de datos:</p>

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/array1d.png?raw=true" width="150" height="">
</p>


<p align="justify"> 👀
Con el método <code>Series()</code> de <code>Pandas</code> creamos la serie, solamente pasando una lista de elementos (del mismo tipo de datos) podemos crear nuestra serie, y luego podemos asignar esta serie a un objeto. Para verla, solamente llamamos al objeto.
</p>

In [None]:
serie = pd.Series([7, 9, 5], name="numeros")

In [None]:
serie

Unnamed: 0,numeros
0,7
1,9
2,5


<p align="justify"> 👀
La representación de una serie que se muestra interactivamente muestra el índice a la izquierda y los valores a la derecha. Como no especificamos un índice para los datos, se crea uno predeterminado que consiste en valores enteros. <br><br>Para obtener una representación de matriz, se usa el atributo <code>array</code> y para visualizar el indice de los elementos de la serie, se usa el atributo <code>index</code>.
</p>

In [None]:
serie.array

<NumpyExtensionArray>
[7, 9, 5]
Length: 3, dtype: int64

In [None]:
serie.index

RangeIndex(start=0, stop=3, step=1)

<p align="justify"> 👀
Supongamos que eres el gerente financiero de una empresa y deseas analizar las ventas semanales de un producto específico. Podrías crear una serie en Pandas para representar las ventas de las últimas cinco semanas:
</p>

In [None]:
# Datos de ventas semanales
ventas = [1500, 2300, 1800, 2100, 1700]

In [None]:
# Crear la serie de Pandas
ventas_semanales = pd.Series(ventas, name = "ventas")

In [None]:
ventas_semanales

Unnamed: 0,ventas
0,1500
1,2300
2,1800
3,2100
4,1700


<p align="justify">
Esta serie te permite ver rápidamente las ventas de cada semana. Se puede utilizar para realizar análisis más avanzados, como calcular el promedio de ventas, identificar la semana con las ventas más altas o bajas, o incluso visualizar las ventas a lo largo del tiempo con una gráfica

<p align="justify"> 👀
Puede ser que se quiera crear una serie con un índice que identifique cada punto de datos con una etiqueta. Por ejemplo:
</p>

In [None]:
semanas = ['Semana 1', 'Semana 2', 'Semana 3', 'Semana 4', 'Semana 5']
ventas_semanales = pd.Series(ventas, index = semanas, name = "ventas")

In [None]:
ventas_semanales

Unnamed: 0,ventas
Semana 1,1500
Semana 2,2300
Semana 3,1800
Semana 4,2100
Semana 5,1700


In [None]:
ventas_semanales.index

Index(['Semana 1', 'Semana 2', 'Semana 3', 'Semana 4', 'Semana 5'], dtype='object')

In [None]:
"Semana 1" in ventas_semanales

True

In [None]:
"Semana 8" in ventas_semanales

False

<p align="justify"> 👀
Si tenemos los datos contenidos en un diccionario, entonces se puede crear una serie. Puedes crear una serie en Pandas directamente a partir de un diccionario de Python. Cada clave en el diccionario se convierte en un índice en la serie, y los valores se convierten en los valores correspondientes de la serie.
<br><br>
Por ejemplo:
</p>

In [None]:
ventas_dict = {
    'Producto A': 12000,
    'Producto B': 17000,
    'Producto C': 9000,
    'Producto D': 11000
}

In [None]:
type(ventas_dict)

dict

In [None]:
ventas_mensuales = pd.Series(ventas_dict, name = "ventas")

In [None]:
ventas_mensuales

Unnamed: 0,ventas
Producto A,12000
Producto B,17000
Producto C,9000
Producto D,11000


<p align="justify"> 👀
Y una serie puede convertirse en diccionario con el metodo <code>to_dict()</code>. Por ejemplo:
</p>

In [None]:
ventas_mensuales.to_dict()

{'Producto A': 12000,
 'Producto B': 17000,
 'Producto C': 9000,
 'Producto D': 11000}

In [None]:
type(ventas_mensuales)

 ## **<font color="DarkBlue">DataFrame</font>**

<p align="justify">
Un DataFrame representa una tabla de datos y contiene una colección ordenada y con nombre de columnas, cada una de las cuales puede ser un tipo de valor diferente (numérico, cadena, booleano, etc.). El DataFrame tiene un índice de fila y columna.
<br><br>
Entonces, Un DataFrame en Pandas es una estructura de datos bidimensional, similar a una tabla en una base de datos o una hoja de cálculo en Excel. Los DataFrames son muy flexibles y poderosos, y permiten realizar análisis y manipulación de datos de manera eficiente.
</p>

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/array2d.png?raw=true" width="150" height="">
</p>


<p align="justify"> 👀
Si bien un DataFrame es físicamente bidimensional, puede usarlo para representar datos de dimensiones superiores en un formato tabular utilizando la indexación jerárquica... Hay muchas maneras de construir un DataFrame, aunque una de las más comunes es desde un diccionario de listas de igual longitud o matrices <code>NumPy</code>.
</p>

In [None]:
# Datos de ventas mensuales por producto
datos_ventas = {
    'Producto': ['Producto A', 'Producto B', 'Producto C', 'Producto D'],
    'Ventas Enero': [12000, 17000, 9000, 11000],
    'Ventas Febrero': [15000, 16000, 9500, 11500],
    'Ventas Marzo': [13000, 18000, 8700, 10500]
}

In [None]:
# Crear el DataFrame de Pandas
df_ventas = pd.DataFrame(datos_ventas)

In [None]:
df_ventas

Unnamed: 0,Producto,Ventas Enero,Ventas Febrero,Ventas Marzo
0,Producto A,12000,15000,13000
1,Producto B,17000,16000,18000
2,Producto C,9000,9500,8700
3,Producto D,11000,11500,10500


<p align="justify"> 👀
A la hora de la creacion del DataFrame se puede especificar el orden de las columnas. <br><br>Por ejemplo:
</p>

In [None]:
df_ventas_ordenado = pd.DataFrame(datos_ventas, columns=["Ventas Enero","Ventas Febrero", "Ventas Marzo", "Producto"])

In [None]:
df_ventas_ordenado

Unnamed: 0,Ventas Enero,Ventas Febrero,Ventas Marzo,Producto
0,12000,15000,13000,Producto A
1,17000,16000,18000,Producto B
2,9000,9500,8700,Producto C
3,11000,11500,10500,Producto D


<p align="justify"> 👀
Si se coloca una columna que no estaba, entonces aparece con valores nulos en el DataFrame. Por ejemplo:
</p>

In [None]:
df = pd.DataFrame(datos_ventas, columns=["Producto","Ventas Enero","Ventas Febrero","Ventas Marzo","Total Ventas"])

In [None]:
df

Unnamed: 0,Producto,Ventas Enero,Ventas Febrero,Ventas Marzo,Total Ventas
0,Producto A,12000,15000,13000,
1,Producto B,17000,16000,18000,
2,Producto C,9000,9500,8700,
3,Producto D,11000,11500,10500,


<p align="justify"> 👀
Se pueden sumar las columnas del DataFrame. Por ejemplo:
</p>

In [None]:
df["Total Ventas"] = df["Ventas Enero"] + df["Ventas Febrero"] + df["Ventas Marzo"]

In [None]:
df

Unnamed: 0,Producto,Ventas Enero,Ventas Febrero,Ventas Marzo,Total Ventas
0,Producto A,12000,15000,13000,40000
1,Producto B,17000,16000,18000,51000
2,Producto C,9000,9500,8700,27200
3,Producto D,11000,11500,10500,33000


In [None]:
# cambiar el orden de las columnas
df = df[["Producto","Total Ventas","Ventas Enero","Ventas Febrero","Ventas Marzo"]]

In [None]:
df

Unnamed: 0,Producto,Total Ventas,Ventas Enero,Ventas Febrero,Ventas Marzo
0,Producto A,40000,12000,15000,13000
1,Producto B,51000,17000,16000,18000
2,Producto C,27200,9000,9500,8700
3,Producto D,33000,11000,11500,10500


<p align="justify"> 👀
Podemos hacer transpoción del DataFrame. Por ejemplo:
</p>

In [None]:
df.T # Transpoción, cambio de lugar filas por columnas

Unnamed: 0,0,1,2,3
Producto,Producto A,Producto B,Producto C,Producto D
Total Ventas,40000,51000,27200,33000
Ventas Enero,12000,17000,9000,11000
Ventas Febrero,15000,16000,9500,11500
Ventas Marzo,13000,18000,8700,10500


<p align="justify">
🟡 Hay que tener en cuenta que la transposición descarta los tipos de datos de columna, si las columnas no tienen todas el mismo tipo de datos, por lo que hacer transposición y hacerla posteriormente de nuevo, puede generar la perdida de información de los datos anteriores. Las columnas se convierten en matrices de objetos puros en este caso.
</p>

 # **<font color="DarkBlue">El constructor del DataFrame</font>**

<p align="justify">
El constructor DataFrame de Pandas es muy flexible y permite crear un DataFrame a partir de diferentes tipos de entradas de datos. A continuación, se presenta una lista de las posibles entradas que se pueden utilizar para crear un DataFrame:



 ## **<font color="DarkBlue">Diccionario de Listas o Arrays</font>**

<p align="justify">
Las claves del diccionario se convierten en los nombres de las columnas, y los valores (listas o arrays) se convierten en los datos de las filas. Supongamos que tienes datos de ventas trimestrales para diferentes productos.




In [None]:
# Datos de ventas trimestrales
data = {
    'Producto': ['Producto A', 'Producto B', 'Producto C'],
    'Q1': [15000, 20000, 13000],
    'Q2': [16000, 21000, 14000],
    'Q3': [17000, 22000, 15000],
    'Q4': [18000, 23000, 16000]
}

In [None]:
# Crear el DataFrame
df = pd.DataFrame(data)
df

Unnamed: 0,Producto,Q1,Q2,Q3,Q4
0,Producto A,15000,16000,17000,18000
1,Producto B,20000,21000,22000,23000
2,Producto C,13000,14000,15000,16000


 ## **<font color="DarkBlue">Diccionario de Series</font>**

<p align="justify">
Similar al diccionario de listas, pero las claves son los nombres de las columnas, y los valores son Series de Pandas. Si tienes las mismas ventas trimestrales, pero almacenadas como Series de Pandas, entonces...




In [None]:
# Datos de ventas trimestrales como Series
data = {
    'Q1': pd.Series([15000, 20000, 13000], index=['Producto A', 'Producto B', 'Producto C']),
    'Q2': pd.Series([16000, 21000, 14000], index=['Producto A', 'Producto B', 'Producto C']),
    'Q3': pd.Series([17000, 22000, 15000], index=['Producto A', 'Producto B', 'Producto C']),
    'Q4': pd.Series([18000, 23000, 16000], index=['Producto A', 'Producto B', 'Producto C'])
}

In [None]:
# Crear el DataFrame
df = pd.DataFrame(data)
df

Unnamed: 0,Q1,Q2,Q3,Q4
Producto A,15000,16000,17000,18000
Producto B,20000,21000,22000,23000
Producto C,13000,14000,15000,16000


 ## **<font color="DarkBlue">Lista de Diccionarios</font>**




<p align="justify">
Cada diccionario en la lista representa una fila del DataFrame, y las claves del diccionario son los nombres de las columnas. Imagina que cada diccionario en la lista representa la información de un cliente, incluyendo su nombre, país y total de compras.




In [None]:
data = [
    {'Nombre': 'Cliente A', 'País': 'Argentina', 'Compras': 5000},
    {'Nombre': 'Cliente B', 'País': 'Brasil', 'Compras': 7000},
    {'Nombre': 'Cliente C', 'País': 'Chile', 'Compras': 6000}
]

In [None]:
# Crear el DataFrame
df = pd.DataFrame(data)
df

Unnamed: 0,Nombre,País,Compras
0,Cliente A,Argentina,5000
1,Cliente B,Brasil,7000
2,Cliente C,Chile,6000


 ## **<font color="DarkBlue">Lista de Listas o Tuplas</font>**


<p align="justify">
Se puede crear un DataFrame a partir de una lista de listas o tuplas, donde cada sublista o tupla representa una fila. Se deben proporcionar los nombres de las columnas. Aquí cada sublista representa la información de ventas de una sucursal en diferentes ciudades.




In [None]:
# Datos de ventas por sucursal
data = [
    ['Sucursal A', 'Buenos Aires', 150000],
    ['Sucursal B', 'São Paulo', 180000],
    ['Sucursal C', 'Santiago', 120000]
]

In [None]:
df = pd.DataFrame(data, columns=['Sucursal', 'Ciudad', 'Ventas'])
df

Unnamed: 0,Sucursal,Ciudad,Ventas
0,Sucursal A,Buenos Aires,150000
1,Sucursal B,São Paulo,180000
2,Sucursal C,Santiago,120000


 ## **<font color="DarkBlue">Array de Numpy</font>**


<p align="justify">
Un array de Numpy puede ser utilizado directamente para crear un DataFrame. Se pueden proporcionar nombres de columnas y filas opcionalmente. Vamos a crear un DataFrame a partir de un array de Numpy que representa inventarios mensuales de un producto.




In [None]:
# Inventarios mensuales
data = np.array([
    [100, 120, 110],
    [200, 220, 210],
    [150, 180, 170]
])

In [None]:
# Crear el DataFrame
df = pd.DataFrame(data, columns=['Enero', 'Febrero', 'Marzo'])
df.index = ['Producto A', 'Producto B', 'Producto C']
df

Unnamed: 0,Enero,Febrero,Marzo
Producto A,100,120,110
Producto B,200,220,210
Producto C,150,180,170


 ## **<font color="DarkBlue">Diccionario de Diccionarios</font>**


<p align="justify">
Las claves externas representan los nombres de las columnas, y las claves internas representan los índices de las filas. Supongamos que deseas registrar los costos de producción de varios productos en diferentes plantas de manufactura.




In [None]:
# Costos de producción por planta
data = {
    'Planta 1': {'Producto A': 5000, 'Producto B': 7000},
    'Planta 2': {'Producto A': 6000, 'Producto B': 8000},
    'Planta 3': {'Producto A': 5500, 'Producto B': 7500}
}

In [None]:
# Crear el DataFrame
df = pd.DataFrame(data)
df

Unnamed: 0,Planta 1,Planta 2,Planta 3
Producto A,5000,6000,5500
Producto B,7000,8000,7500


 ## **<font color="DarkBlue">Series o Diccionario de Escalares</font>**


<p align="justify">
Cada valor escalar se convierte en un valor constante en todas las filas del DataFrame. Si deseas crear un DataFrame donde un valor fijo representa el salario base de empleados en diferentes departamentos, entonces...




In [None]:
# Salario base por departamento
data = {
    'Departamento': 'Ventas',
    'Salario Base': 35000
}

In [None]:
# Crear el DataFrame
df = pd.DataFrame(data, index=[0, 1, 2])
df

Unnamed: 0,Departamento,Salario Base
0,Ventas,35000
1,Ventas,35000
2,Ventas,35000


 ## **<font color="DarkBlue">DataFrame existente</font>**


<p align="justify">
Puedes crear un nuevo DataFrame a partir de uno ya existente, seleccionando un subconjunto de columnas o aplicando operaciones. Entonces, puedes crear un nuevo DataFrame seleccionando un subconjunto de columnas o aplicando operaciones a un DataFrame existente de ventas de productos.




In [None]:
# DataFrame existente con datos de ventas
df_existing = pd.DataFrame({
    'Producto': ['Producto A', 'Producto B', 'Producto C'],
    'Q1': [15000, 20000, 13000],
    'Q2': [16000, 21000, 14000],
    'Q3': [17000, 22000, 15000],
    'Q4': [18000, 23000, 16000]
})

In [None]:
# Crear un nuevo DataFrame con un subconjunto de columnas
df_new = pd.DataFrame(df_existing, columns=['Producto', 'Q1', 'Q2'])
df_new

Unnamed: 0,Producto,Q1,Q2
0,Producto A,15000,16000
1,Producto B,20000,21000
2,Producto C,13000,14000


 # **<font color="DarkBlue">Objetos del indice</font>**

<p align="justify">
Los objetos de índice de un DataFrame en Pandas son una parte esencial de su estructura. El índice de un DataFrame es un conjunto de etiquetas que identifican de manera única cada fila (y cada columna, en el caso de los índices de columnas).
<br><br>
Estos índices permiten acceder, manipular, y realizar operaciones eficientes en los datos de un DataFrame.
<br><br>
Los índices pueden ser:
<br><br>

- simples, con un solo nivel (Index), o
- jerárquicos, con múltiples niveles (MultiIndex).



<p align="justify">
A continuación, algunos métodos y propiedades comunes asociados con los objetos de índice, junto con ejemplos prácticos...



 ## **<font color="DarkBlue">append()</font>**

<p align="justify">
Agrega valores adicionales al índice, creando un nuevo índice que es la concatenación de los índices originales.
<br><br>
Ejemplo: Supongamos que tienes un DataFrame con los nombres de empleados y deseas agregar más empleados al índice.



In [None]:
# Índice original
index_original = pd.Index(['Empleado A', 'Empleado B', 'Empleado C'])

# Agregar nuevos empleados al índice
index_nuevo = index_original.append(pd.Index(['Empleado D', 'Empleado E']))
index_nuevo

Index(['Empleado A', 'Empleado B', 'Empleado C', 'Empleado D', 'Empleado E'], dtype='object')

 ## **<font color="DarkBlue">difference()</font>**

<p align="justify">
Devuelve la diferencia entre dos índices, es decir, los elementos que están en un índice pero no en el otro.
<br><br>
Ejemplo: Tienes un índice de productos en stock y un índice de productos vendidos, y deseas encontrar los productos que aún están en stock.

In [None]:
# Índices de productos
index_stock = pd.Index(['Producto A', 'Producto B', 'Producto C'])
index_vendidos = pd.Index(['Producto A'])

# Encontrar productos en stock no vendidos
index_diferencia = index_stock.difference(index_vendidos)
index_diferencia

Index(['Producto B', 'Producto C'], dtype='object')

 ## **<font color="DarkBlue">intersection()</font>**

<p align="justify">
Devuelve la intersección de dos índices, es decir, los elementos que están en ambos índices.
<br><br>
Ejemplo: Tienes un índice de productos en oferta y un índice de productos con alta demanda, y deseas encontrar los productos que están en ambas categorías.

In [None]:
# Índices de productos
index_oferta = pd.Index(['Producto A', 'Producto B'])
index_demanda = pd.Index(['Producto B', 'Producto C'])

# Encontrar productos en oferta y con alta demanda
index_interseccion = index_oferta.intersection(index_demanda)
index_interseccion

Index(['Producto B'], dtype='object')

 ## **<font color="DarkBlue">union()</font>**

<p align="justify">
Devuelve la unión de dos índices, combinando los elementos de ambos índices sin duplicados.
<br><br>
Ejemplo: Combina los productos en stock y los productos que están en tránsito para obtener un listado completo de productos disponibles.

In [None]:
# Índices de productos
index_stock = pd.Index(['Producto A', 'Producto B'])
index_transito = pd.Index(['Producto C', 'Producto B'])

# Unión de productos en stock y en tránsito
index_union = index_stock.union(index_transito)
index_union

Index(['Producto A', 'Producto B', 'Producto C'], dtype='object')

 ## **<font color="DarkBlue">isin()</font>**

<p align="justify">
Devuelve un array de valores booleanos que indica si los elementos del índice están en otro índice o lista.
<br><br>
Ejemplo: Determina si ciertos productos están en la lista de productos más vendidos.



In [None]:
# Índice de productos
index_productos = pd.Index(['Producto A', 'Producto B', 'Producto D'])

# Lista de productos más vendidos
mas_vendidos = ['Producto A', 'Producto C']

# Comprobar si los productos están en la lista de más vendidos
resultados = index_productos.isin(mas_vendidos)
resultados

array([ True, False, False])

<p align="justify">

 ## **<font color="DarkBlue">delete()</font>**

<p align="justify">
Elimina un elemento en la posición especificada del índice. Ejemplo: Elimina un producto del índice de productos defectuosos.



In [None]:
# Índice de productos defectuosos
index_defectuosos = pd.Index(['Producto A', 'Producto B', 'Producto C'])

# Eliminar el segundo producto del índice
index_modificado = index_defectuosos.delete(1)
index_modificado

Index(['Producto A', 'Producto C'], dtype='object')

 ## **<font color="DarkBlue">drop()</font>**

<p align="justify">
Elimina elementos específicos del índice. Ejemplo: Remueve un producto que ya no está en stock.



In [None]:
# Índice de productos en stock
index_stock = pd.Index(['Producto A', 'Producto B', 'Producto C'])

# Eliminar un producto del índice
index_modificado = index_stock.drop('Producto B')
index_modificado

Index(['Producto A', 'Producto C'], dtype='object')

 ## **<font color="DarkBlue">insert()</font>**

<p align="justify">
Inserta un nuevo valor en una posición específica del índice. Ejemplo: Agrega un nuevo producto en una posición específica del índice de inventario.



In [None]:
# Índice de inventario
index_inventario = pd.Index(['Producto A', 'Producto C'])

# Insertar un nuevo producto en la segunda posición
index_modificado = index_inventario.insert(1, 'Producto B')
index_modificado

Index(['Producto A', 'Producto B', 'Producto C'], dtype='object')

 ## **<font color="DarkBlue">is_unique()</font>**

<p align="justify">
Una propiedad que indica si todos los elementos del índice son únicos (no repetidos). Ejemplo: Verifica si los identificadores de producto en un índice son únicos.



In [None]:
# Índice de identificadores de producto
index_productos = pd.Index(['ID_A', 'ID_B', 'ID_C', 'ID_A'])

# Comprobar si los identificadores son únicos
es_unico = index_productos.is_unique
es_unico

False

 ## **<font color="DarkBlue">unique()</font>**

<p align="justify">
Devuelve un array de los elementos únicos del índice. Ejemplo: Obtén una lista única de clientes que han realizado compras.



In [None]:
# Índice de clientes (puede haber duplicados)
index_clientes = pd.Index(['Cliente A', 'Cliente B', 'Cliente A', 'Cliente C'])

# Obtener los clientes únicos
clientes_unicos = index_clientes.unique()
clientes_unicos

Index(['Cliente A', 'Cliente B', 'Cliente C'], dtype='object')

<br>
<br>
<p align="center"><b>
💗
<font color="DarkBlue">
Hemos llegado al final de nuestro colab de Pandas, a seguir codeando...
</font>
</p>
