<a href="https://colab.research.google.com/github/Viny2030/UMSA-Analisis_de_datos/blob/main/bds_pandas_001_00.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/Logo%20Pandas.png?raw=true">
</p>


 # **<font color="#07a8ed">Historia y evolución de Pandas 🐼 </font>**

<p align="justify">
💗 La historia y evolución de Pandas es notable en el contexto de Business Data Science, ya que se ha convertido en una de las herramientas más populares y poderosas para el análisis de datos en Python.
<br><br>
Aquí está un resumen de su historia y su relevancia en el ámbito de Business Data Science:
<br><br>

1. **Orígenes de Pandas:**
   Pandas fue desarrollado inicialmente por Wes McKinney mientras trabajaba en AQR Capital Management en 2008. En ese momento, McKinney buscaba una herramienta eficiente para el análisis de datos en Python que pudiera manejar conjuntos de datos de tamaño variable con facilidad. Inspirado por el trabajo que había realizado en finanzas cuantitativas, McKinney creó Pandas para satisfacer estas necesidades.

2. **Lanzamiento y adopción temprana:**
   Pandas fue lanzado como un proyecto de código abierto en 2009 y rápidamente ganó popularidad dentro de la comunidad de Python debido a su capacidad para manipular y analizar datos de manera eficiente. La sintaxis clara y expresiva de Pandas, inspirada en lenguajes como R y SQL, facilitó su adopción por parte de analistas y científicos de datos.

3. **Evolución y crecimiento:**
   A lo largo de los años, Pandas ha experimentado un crecimiento significativo en términos de características, rendimiento y estabilidad. Se han agregado numerosas funcionalidades nuevas, como la capacidad de manejar datos de series temporales, realizar operaciones de agrupamiento y pivotar datos de manera eficiente. Además, se han realizado mejoras continuas en el rendimiento y la optimización del código para manejar conjuntos de datos cada vez más grandes.

4. **Relevancia en Business Data Science:**
   Pandas se ha convertido en una herramienta fundamental en el campo de Business Data Science debido a varias razones:

   - **Facilidad de uso:** La sintaxis intuitiva y expresiva de Pandas facilita la manipulación y el análisis de datos, lo que permite a los profesionales de negocios realizar tareas complejas con relativa facilidad.
   
   - **Capacidad para manejar datos estructurados:** Pandas es especialmente eficaz para trabajar con datos tabulares y estructurados, como los que se encuentran comúnmente en el entorno empresarial. Esto lo hace ideal para tareas como limpieza de datos, transformación y análisis exploratorio.
   
   - **Integración con otras herramientas:** Pandas se integra bien con otras herramientas populares en el ecosistema de Python, como NumPy, Matplotlib y Scikit-learn, lo que permite construir y desplegar pipelines de análisis de datos completos.

<br>
<p align="justify">
 👀 En resumen, Pandas ha evolucionado desde sus humildes comienzos hasta convertirse en una herramienta indispensable de cualquier profesional de Business Data Science. Su capacidad para manejar datos de manera eficiente y su facilidad de uso lo hacen invaluable para realizar análisis de datos empresariales y tomar decisiones informadas basadas en datos.

 # **<font color="#07a8ed">Conociendo Pandas</font>**

<p align="justify">
El módulo <code>Pandas</code> es una herramienta importante en el desarrollo de los siguientes notebooks. Contiene estructuras de datos y herramientas de manipulación de datos para que la limpieza y el análisis de datos sea rápido. <br><br> <code>Pandas</code> usualmente se usa en conjunto con herramientas de computación numérica como <code>NumPy</code> y como <code>SciPy</code>. Tambien con bibliotecas analíticas como <code>statsmodels</code> y <code>scikit-learn</code> y bibliotecas de visualización de datos como <code>seaborn</code> y <code>plotly</code>. <br><br> <code>Pandas</code> adopta partes significativas del estilo idiomático de <code>NumPy</code>, especialmente funciones basadas en matrices y una preferencia por el procesamiento de datos sin bucles <code>for</code>.<br><br> Mientras que <code>Pandas</code> adopta muchos modismos de <code>NumPy</code>, la mayor diferencia que tienen ambos módulos es que <code>Pandas</code> está diseñado para trabajar con datos tabulares o heterogéneos mientras que <code>NumPy</code>, por el contrario, es el más adecuado para trabajar con datos de matrices numéricas homogéneas.Desde que se convirtió en un proyecto de código abierto en 2010, <code>Pandas</code> ha madurado hasta convertirse en una biblioteca bastante grande que es aplicable en un amplio conjunto de casos de uso del mundo real. La comunidad de desarrolladores y usuarios de <code>Pandas</code> han sido una parte clave de su éxito.
</p>

<p align="justify"> 👀 Por convención, de esta manera se importa <code>Pandas</code>:  </p>

In [None]:
import numpy as np
import pandas as pd

<p align="justify"> 👀 Versión de <code>Pandas</code>:  </p>

In [None]:
print(pd.__version__)

2.1.4


<p align="justify"> 👀 Versión de <code>Numpy</code>:  </p>

In [None]:
print(np.__version__)

1.26.4


 # **<font color="#07a8ed">Estructuras de datos</font>**

<p align="justify">
Las estructuras de datos que debemos manejar son: <code>Series</code> y <code>DataFrame</code>. Si bien no son una solución universal para todos los problemas que se pueden plantear, proporcionan una base sólida para una amplia variedad de tareas de datos. Estas estructuras de datos son fundamentales en <code>Pandas</code>.
</p>

 ## **<font color="#07a8ed">Serie</font>**

<p align="justify">
Una serie es un objeto unidimensional similar a una matriz que contiene una secuencia de valores (similares a los tipos NumPy) del mismo tipo y una matriz asociada de etiquetas de datos, denominada índice. <br><br> La serie más simple se forma a partir de solo una matriz de datos:</p>

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/Image_0005.jpg?raw=true" width="600" height="">
</p>


<p align="justify"> 👀
Con el método <code>Series()</code> de <code>Pandas</code> creamos la serie, solamente pasando una lista de elementos (del mismo tipo de datos) podemos crear nuestra serie, y luego podemos asignar esta serie a un objeto. Para verla, solamente llamamos al objeto.
</p>

In [None]:
serie = pd.Series([7, 9, 5], name="numeros")

In [None]:
serie

Unnamed: 0,numeros
0,7
1,9
2,5


<p align="justify"> 👀
La representación de una serie que se muestra interactivamente muestra el índice a la izquierda y los valores a la derecha. Como no especificamos un índice para los datos, se crea uno predeterminado que consiste en valores enteros. <br><br>Para obtener una representación de matriz, se usa el atributo <code>array</code> y para visualizar el indice de los elementos de la serie, se usa el atributo <code>index</code>.
</p>

In [None]:
serie.array

<NumpyExtensionArray>
[7, 9, 5]
Length: 3, dtype: int64

In [None]:
serie.index

RangeIndex(start=0, stop=3, step=1)

<p align="justify"> 👀
Puede ser que se quiera crear una serie con un índice que identifique cada punto de datos con una etiqueta. Por ejemplo:
</p>

In [None]:
indice = pd.Series([40, 42, 45, 43], index=["d", "b", "a", "c"], name="cuarentas")

In [None]:
indice

Unnamed: 0,cuarentas
d,40
b,42
a,45
c,43


In [None]:
indice.index

Index(['d', 'b', 'a', 'c'], dtype='object')

In [None]:
"b" in indice

True

In [None]:
"h" in indice

False

<p align="justify"> 👀
Si tenemos los datos contenidos en un diccionario, entonces se puede crear una serie. Por ejemplo:
</p>

In [None]:
ESP = {"Activo": 35000, "Pasivo": 10000, "Patrimonio Neto": 25000}

In [None]:
type(ESP)

dict

In [None]:
serie_ESP = pd.Series(ESP, name="ESP")

In [None]:
serie_ESP

Unnamed: 0,ESP
Activo,35000
Pasivo,10000
Patrimonio Neto,25000


In [None]:
serie_ESP.iloc[0]

35000

In [None]:
serie_ESP.iloc[0] == serie_ESP.iloc[1] + serie_ESP.iloc[2]

True

<p align="justify"> 👀
Y una serie puede convertirse en diccionario con el metodo <code>to_dict()</code>. Por ejemplo:
</p>

In [None]:
serie_ESP.to_dict()

{'Activo': 35000, 'Pasivo': 10000, 'Patrimonio Neto': 25000}

In [None]:
serie_DICT = serie_ESP.to_dict()

In [None]:
type(serie_DICT)

dict

 ## **<font color="#07a8ed">DataFrame</font>**

<p align="justify">
Un DataFrame representa una tabla de datos y contiene una colección ordenada y con nombre de columnas, cada una de las cuales puede ser un tipo de valor diferente (numérico, cadena, booleano, etc.). El DataFrame tiene un índice de fila y columna.
</p>

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/Image_0007.jpg?raw=true"width="600" height="">
</p>


<p align="justify"> 👀
Si bien un DataFrame es físicamente bidimensional, puede usarlo para representar datos de dimensiones superiores en un formato tabular utilizando la indexación jerárquica... Hay muchas maneras de construir un DataFrame, aunque una de las más comunes es desde un diccionario de listas de igual longitud o matrices <code>NumPy</code>.
</p>

In [None]:
ventas = [230.1, 44.5, 17.2, 151.5, 180.8]
periodico = [22.1, 10.4, 9.3, 18.5, 12.9]
radio = [37.8, 39.3, 45.9, 41.3, 10.8]
tv = [69.2, 45.1, 69.3, 58.5, 58.4]

In [None]:
diccionario = {"Ventas":ventas,
               "Radio":radio,
               "Tv":tv,
               "Periodico":periodico}

In [None]:
df = pd.DataFrame(diccionario)

In [None]:
df

Unnamed: 0,Ventas,Radio,Tv,Periodico
0,230.1,37.8,69.2,22.1
1,44.5,39.3,45.1,10.4
2,17.2,45.9,69.3,9.3
3,151.5,41.3,58.5,18.5
4,180.8,10.8,58.4,12.9


<p align="justify"> 👀
A la hora de la creacion del DataFrame se puede especificar el orden de las columnas. <br><br>Por ejemplo:
</p>

In [None]:
df = pd.DataFrame(diccionario, columns=["Ventas","Periodico", "Radio", "Tv"])

In [None]:
df

Unnamed: 0,Ventas,Periodico,Radio,Tv
0,230.1,22.1,37.8,69.2
1,44.5,10.4,39.3,45.1
2,17.2,9.3,45.9,69.3
3,151.5,18.5,41.3,58.5
4,180.8,12.9,10.8,58.4


<p align="justify"> 👀
Si se coloca una columna que no estaba, entonces aparece con valores nulos en el DataFrame. Por ejemplo:
</p>

In [None]:
df = pd.DataFrame(diccionario, columns=["Ventas", "Periodico", "Radio", "Tv", "Medios"])

In [None]:
df

Unnamed: 0,Ventas,Periodico,Radio,Tv,Medios
0,230.1,22.1,37.8,69.2,
1,44.5,10.4,39.3,45.1,
2,17.2,9.3,45.9,69.3,
3,151.5,18.5,41.3,58.5,
4,180.8,12.9,10.8,58.4,


<p align="justify"> 👀
Se pueden sumar las columnas del DataFrame. Por ejemplo:
</p>

In [None]:
df.Medios = df.Periodico + df.Radio + df.Tv

In [None]:
df

Unnamed: 0,Ventas,Periodico,Radio,Tv,Medios
0,230.1,22.1,37.8,69.2,129.1
1,44.5,10.4,39.3,45.1,94.8
2,17.2,9.3,45.9,69.3,124.5
3,151.5,18.5,41.3,58.5,118.3
4,180.8,12.9,10.8,58.4,82.1


In [None]:
df[["Ventas","Medios","Periodico","Radio","Tv"]] # cambiar el orden de las columnas

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
1,44.5,94.8,10.4,39.3,45.1
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


In [None]:
df = df[["Ventas","Medios","Periodico","Radio","Tv"]]

In [None]:
df

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
1,44.5,94.8,10.4,39.3,45.1
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


<p align="justify"> 👀
Podemos hacer transpoción del DataFrame. Por ejemplo:
</p>

In [None]:
df.T # Transpoción, cambio de lugar filas por columnas

Unnamed: 0,0,1,2,3,4
Ventas,230.1,44.5,17.2,151.5,180.8
Medios,129.1,94.8,124.5,118.3,82.1
Periodico,22.1,10.4,9.3,18.5,12.9
Radio,37.8,39.3,45.9,41.3,10.8
Tv,69.2,45.1,69.3,58.5,58.4


<p align="justify">
🟡 Hay que tener en cuenta que la transposición descarta los tipos de datos de columna, si las columnas no tienen todas el mismo tipo de datos, por lo que hacer transposición y hacerla posteriormente de nuevo, puede generar la perdida de información de los datos anteriores. Las columnas se convierten en matrices de objetos puros en este caso.
</p>

 # **<font color="#07a8ed">Selección de Datos </font>**

<p align="justify">
Algunos métodos para la interacción con los datos contenidos en una serie o DataFrame. Para ello, vamos a generar un DataFrame con los valores de la cotización del dolar.</p>

 ## **<font color="#07a8ed">Selección por etiquetas</font>**

<p align="justify">
<code>Pandas</code> proporciona un conjunto de métodos para lograr una indexación. Este es un protocolo estricto basado en la inclusión. En el caso de indexación por etiquetas este es un protocolo estricto basado en la inclusión. Cada etiqueta solicitada debe existir, tanto en el indice como en las columnas. Al seleccionar por ejemplo filas (indice) se incluye el límite inicial indicado y el límite final. <br><br> 👀 Los números enteros son etiquetas válidas, pero se refieren a las etiquetas del indice (cuando la etiqueta es numérica) y no a la posición de cada fila. Lo mismo pasa cuando en el índice tenemos fechas.
</p>

~~~python
df.loc[fila inicial : fila final, columna inicial : columna final]
~~~


In [None]:
import yfinance as yf

In [None]:
meli = yf.download("MELI", start="2024-07-01")

[*********************100%%**********************]  1 of 1 completed


In [None]:
meli.head()

Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2024-07-01,1635.609985,1641.040039,1571.869995,1597.599976,1597.599976,337600
2024-07-02,1590.949951,1617.880005,1583.349976,1596.47998,1596.47998,297400
2024-07-03,1585.0,1594.119995,1563.209961,1591.439941,1591.439941,207700
2024-07-05,1610.0,1666.27002,1598.060059,1658.959961,1658.959961,354400
2024-07-08,1659.390015,1700.900024,1647.0,1683.75,1683.75,310500


<p align="justify">
Vamos a seleccionar los valores de apertura y de cierre, es decir, las columnas <code>Open</code> y <code>Close</code>.</p>



In [None]:
meli.loc[:, ["Open", "Close"]] # [fila inicial : fila final , [lista de columnas]]

Unnamed: 0_level_0,Open,Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2024-07-01,1635.609985,1597.599976
2024-07-02,1590.949951,1596.47998
2024-07-03,1585.0,1591.439941
2024-07-05,1610.0,1658.959961
2024-07-08,1659.390015,1683.75
2024-07-09,1698.98999,1722.050049
2024-07-10,1733.97998,1703.550049
2024-07-11,1710.569946,1708.650024
2024-07-12,1710.449951,1761.219971
2024-07-15,1745.619995,1743.98999


In [None]:
meli.loc[:,["Open","Close"]].head()

Unnamed: 0_level_0,Open,Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2024-07-01,1635.609985,1597.599976
2024-07-02,1590.949951,1596.47998
2024-07-03,1585.0,1591.439941
2024-07-05,1610.0,1658.959961
2024-07-08,1659.390015,1683.75


<p align="justify">
O podemos seleccionar también desde el día $01$ de julio al día $06$ de julio.</p>


In [None]:
meli.loc["2024-07-01":"2024-07-06",:] # [fila inicial : fila final , todas las columnas]

Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2024-07-01,1635.609985,1641.040039,1571.869995,1597.599976,1597.599976,337600
2024-07-02,1590.949951,1617.880005,1583.349976,1596.47998,1596.47998,297400
2024-07-03,1585.0,1594.119995,1563.209961,1591.439941,1591.439941,207700
2024-07-05,1610.0,1666.27002,1598.060059,1658.959961,1658.959961,354400


In [None]:
meli.loc["2024-07-05":"2024-07-05", ["Open", "Close"]]

Unnamed: 0_level_0,Open,Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2024-07-05,1610.0,1658.959961


In [None]:
meli.loc[["2024-07-05"], ["Open", "Close"]]

Unnamed: 0_level_0,Open,Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2024-07-05,1610.0,1658.959961


 ## **<font color="#07a8ed">Selección por posición</font>**

<p align="justify">
<code>Pandas</code> proporciona un conjunto de métodos para obtener una indexación puramente basada en enteros. La semántica sigue de cerca lo definido en <code>Python</code> y <code>NumPy</code>. Al seleccionar, se incluye el límite inicial $n$, mientras que se excluye el límite final $m$, es decir desde $n$ hasta $m-1$ <br><br> 👀 En los parámetros de la selección, siempre se indica primero las filas y luego las columnas. En el caso de seleccionar de un DataFrame, se hace de la siguiente forma:
</p>

~~~python
df.iloc[fila inicial : fila final, columna inicial : columna final]
~~~


<p align="justify">
Vamos a seleccionar los valores de apertura y de cierre, es decir, las columnas <code>Open</code> y <code>Close</code>, pero usando este tipo de selección.</p>


In [None]:
meli.columns

Index(['Open', 'High', 'Low', 'Close', 'Adj Close', 'Volume'], dtype='object')

In [None]:
meli.iloc[:,[0,3]].head()

Unnamed: 0_level_0,Open,Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2024-07-01,1635.609985,1597.599976
2024-07-02,1590.949951,1596.47998
2024-07-03,1585.0,1591.439941
2024-07-05,1610.0,1658.959961
2024-07-08,1659.390015,1683.75


<p align="justify">
O podemos seleccionar también desde el día $01$ de julio al día $03$ de julio.</p>


In [None]:
meli.iloc[0:3,:]

Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2024-07-01,1635.609985,1641.040039,1571.869995,1597.599976,1597.599976,337600
2024-07-02,1590.949951,1617.880005,1583.349976,1596.47998,1596.47998,297400
2024-07-03,1585.0,1594.119995,1563.209961,1591.439941,1591.439941,207700


In [None]:
meli.iloc[[0],:]

Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2024-07-01,1635.609985,1641.040039,1571.869995,1597.599976,1597.599976,337600


<p align="justify">
También podemos seleccionar la posición del dato.</p>


In [None]:
meli.iloc[0]

Unnamed: 0,2024-07-01
Open,1635.609985
High,1641.040039
Low,1571.869995
Close,1597.599976
Adj Close,1597.599976
Volume,337600.0


In [None]:
meli.iloc[[0]]

Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2024-07-01,1635.609985,1641.040039,1571.869995,1597.599976,1597.599976,337600


 ## **<font color="#07a8ed">Filtros</font>**

<p align="justify">
<code>Pandas</code> nos permite llevar a cabo algunas opciones para filtrar nuestros datos, incluidas las máscaras booleanas y algunos métodos especiales. Con las máscaras booleanas, probamos nuestros datos contra algún valor y obtenemos una estructura de la misma forma, excepto que está llena de valores que son <code>True</code> o <code>False</code>.
</p>


In [None]:
df

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
1,44.5,94.8,10.4,39.3,45.1
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


### **<font color="#07a8ed"> Mayor ```>``` Mayor igual ```>=``` Menor ```<``` Menor igual ```<=```</font>**

<p align="justify">
Filtramos los valores Radio mayores a $40$.</p>


In [None]:
df[df.Radio > 40]

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5


<p align="justify">
Ahora filtramos los valores Radio mayores a $40$, pero con el método <code>query()</code>.</p>


In [None]:
df.query("Radio > 40")

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5


### **<font color="#07a8ed">Dos o más condiciones verdaderas ```&```</font>**

<p align="justify">
Para visualizar más de dos condiciones verdaderas, es decir todas las condiciones verdaderas se usa el símbolo &...</p>


In [None]:
df

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
1,44.5,94.8,10.4,39.3,45.1
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


In [None]:
df[(df.Periodico > 11) & (df.Radio > 41)]

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
3,151.5,118.3,18.5,41.3,58.5


In [None]:
df.query("Periodico > 11 & Radio > 41")

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
3,151.5,118.3,18.5,41.3,58.5


In [None]:
df.query("Periodico > 11 and Radio > 41")

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
3,151.5,118.3,18.5,41.3,58.5


### **<font color="#07a8ed">Dos o más condiciones, alguna verdadera ```|```</font>**

<p align="justify">
Para visualizar más de dos condiciones y alguna de ellas es verdadera, se usa el símbolo |...</p>


In [None]:
df

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
1,44.5,94.8,10.4,39.3,45.1
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


In [None]:
df[(df.Periodico > 15) | (df.Radio > 41)]

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5


In [None]:
df.query("Periodico > 15 | Radio > 41")

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5


In [None]:
df.query("Periodico > 15 or Radio > 41")

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5


### **<font color="#07a8ed">Conjunto de valores ```between()```</font>**

<p align="justify">
Para un conjunto de valores entre un intervalo determinado...</p>


In [None]:
df

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
1,44.5,94.8,10.4,39.3,45.1
2,17.2,124.5,9.3,45.9,69.3
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


In [None]:
df[df.Periodico.between(10.4, 22.1)]

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
1,44.5,94.8,10.4,39.3,45.1
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


In [None]:
df.query("Periodico >= 10.4 & Periodico <= 22.1")

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
1,44.5,94.8,10.4,39.3,45.1
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


In [None]:
df.query("Periodico >= 10.4 and Periodico <= 22.1")

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
0,230.1,129.1,22.1,37.8,69.2
1,44.5,94.8,10.4,39.3,45.1
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


In [None]:
df[df.Periodico.between(10.4, 22.1, inclusive="neither")] # excluye los extremos

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


In [None]:
df.query("Periodico > 10.4 & Periodico < 22.1") # excluye los extremos

Unnamed: 0,Ventas,Medios,Periodico,Radio,Tv
3,151.5,118.3,18.5,41.3,58.5
4,180.8,82.1,12.9,10.8,58.4


<br>
<br>
<p align="center"><b>
💗
<font color="#07a8ed">
Hemos llegado al final de nuestro colab de Pandas, a seguir codeando...
</font>
</p>
