# **Obtención y preparación de datos**

# OD10. Selección en Series

In [1]:
import pandas as pd

Un aspecto relativamente complejo involucrado en el uso de las **series** y los **dataframes** -principalmente con esta última estructura- es la extracción o selección de datos. Esta relativa complejidad viene derivada principalmente de la abundancia de alternativas y de las excepciones a la norma que algunas de ellas aparentan ser.

## <font color='blue'>**Selección de datos en series**</font>

Una serie pandas consta de un array de datos y un array de etiquetas (el índice o index). Si al crear la serie no se ha especificado el índice, ya sabemos que se asignará uno implícito por defecto.

In [2]:
# Creamos una serie sin un índice explícito
s = pd.Series([10, 20, 30, 40])
s

Unnamed: 0,0
0,10
1,20
2,30
3,40


Es posible seleccionar los valores haciendo referencia al índice asignado con la misma notación que en un diccionario (la llamada "notación corchetes" o "*square bracket notation*").

In [3]:
print(s[0])
print(s[2])

10
30


Usando esta sintaxis, si no se ha especificado un índice explícito, los índices negativos no están permitidos.

Si se asignan índices de forma explícita:

In [4]:
# Volvemos a crear la serie, esta vez con un índice explícito
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s

Unnamed: 0,0
a,10
b,20
c,30
d,40


Es posible seleccionar los elementos usando el índice explícito o el implícito:

In [5]:
print(s["a"], s[0])

10 10


  print(s["a"], s[0])


In [6]:
print(s["d"], s[-1])

40 40


  print(s["d"], s[-1])


Con esta sintaxis, sí está permitido hacer uso de índices negativos para referirnos a los elementos desde el final de la estructura.

Si los índices asignados son números enteros (al igual que las etiquetas del índice implícito), el índice implícito queda desactivado para seleccionar elementos individuales.

In [7]:
s = pd.Series([10, 20, 30, 40], index = [3, 2, 1, 0])
s

Unnamed: 0,0
3,10
2,20
1,30
0,40


In [8]:
s[0]

40

en cuyo caso no es posible usar índices negativos.

In [9]:
try:
  s[-1]
except:
  print("Error")


Error


También es posible **seleccionar rangos de valores**. De esta forma, si usamos un rango numérico en una serie en la que hemos definido un índice explícito.



In [10]:
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s[1:3]

Unnamed: 0,0
b,20
c,30


Se puede observar que el rango se interpreta como haciendo referencia al índice implícito, y se incluyen los valores desde el primer índice incluido, hasta el último sin incluir.

Si no se incluye alguno de los límites, el comportamiento es el estándar en Python (si no se incluye el primer valor, se consideran todos los elementos desde el principio, y si no se incluye el último valor, se consideran todos los elementos hasta el final).

In [11]:
s[1:]

Unnamed: 0,0
b,20
c,30
d,40


In [12]:
s[:3]

Unnamed: 0,0
a,10
b,20
c,30


Para incluir los valores desde el primer índice hasta el último índice, ambos incluidos, se procede de la siguiente manera.

In [13]:
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s

Unnamed: 0,0
a,10
b,20
c,30
d,40


In [14]:
s[:"c"]

Unnamed: 0,0
a,10
b,20
c,30


In [15]:
s["b":]

Unnamed: 0,0
b,20
c,30
d,40


Una posible fuente de confusión viene derivada del hecho de que, usando rangos, es posible hacer referencia tanto a las etiquetas como a los índices numéricos. Si se utilizaron etiquetas, se debe hacer referencia a las etiquetas.

In [16]:
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s["b":"c"]

Unnamed: 0,0
b,20
c,30


Si utilizamos números, hacemos referencia a los índices numéricos.

In [17]:
s[1:3]

Unnamed: 0,0
b,20
c,30


¿Y qué ocurre si nuestras etiquetas son números? siempre que se usen rangos con números se estará haciendo referencia a los índices numéricos. No es posible hacer referencia a las etiquetas.

In [18]:
s = pd.Series([10, 20, 30, 40], index = [3, 2, 1, 0])
s[1:3]

Unnamed: 0,0
2,20
1,30


In [19]:
s[1]

30

En el caso anterior, se devolvió el valor cuya etiqueta es 1 (si existe), o el valor cuya posición es 1 si dicha etiqueta no existe y el índice explícito no es numérico.


In [20]:
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s[1]

  s[1]


20

### Los métodos `loc` e `iloc`
Es debido a esto que existen los métodos `loc` e `iloc`. Estos métodos hacen una referencia explícita a etiquetas o posiciones, respectivamente, eliminando cualquier duda al respecto de su interpretación.

Al igual que con los array NumPy, es posible seleccionar datos de una serie utilizando una **lista de valores**.

In [21]:
s[[3,1]]

  s[[3,1]]


Unnamed: 0,0
d,40
b,20


En este ejemplo, la lista contiene los números 3 y 1, y son los valores correspondientes a estos índices -y en el orden especificado- los devueltos por la instrucción.

El resultado devuelto sigue siendo una serie pandas.

In [22]:
type(s[[3,1]])

  type(s[[3,1]])


Con esta notación, en el caso de que la serie tenga un índice explícito numérico, los valores de la lista se interpretan como haciendo referencia al índice explícito.

También es posible usar el método `pandas.Series.get` para extraer un valor de forma segura.

In [23]:
s.get(2)

  s.get(2)


30

Si la clave indicada no existe, la función devuelve *None* por defecto (es posible personalizar este valor con el parámetro `default`).

In [24]:
s.get(7)

  s.get(7)


In [25]:
s.get(7, default=0)

  s.get(7, default=0)


0

Las series pandas y los dataframes disponen de los versátiles métodos `loc` e `iloc`.

El método `pandas.Series.loc` permite __seleccionar un grupo de elementos por etiquetas__.

Como argumento de este método puede utilizarse una única etiqueta.

In [26]:
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s.loc["b"]

20

Tal como dijimos, `loc` buscará el argumento en las etiquetas explícitas, no en el índice implícito, aún cuando éste exista.

In [27]:
try:
    s.loc[0]
except Exception as e:
    print(e.__doc__)
    print(type(e).__name__)

Mapping key not found.
KeyError


In [28]:
s = pd.Series([10, 20, 30, 40])
s

Unnamed: 0,0
0,10
1,20
2,30
3,40


In [29]:
s.loc[0]

10

En este caso el argumento se interpreta siempre como etiqueta del índice, nunca como posición en dicho índice aun cuando se pase un número entero que no pertenece al conjunto de etiquetas y pueda representar una posición válida. Veamos a continuación si el índice explícito es numérico.

In [30]:
s = pd.Series([10, 20, 30, 40], index = [1, 2, 3, 4])
try:
    s.loc[0]
except Exception as e:
    print(e.__doc__)
    print(type(e).__name__)

Mapping key not found.
KeyError


También podemos pasar al método una lista de etiquetas, en cuyo caso se extraen los valores correspondientes a dichas etiquetas y en el orden en el que se incluyen en la lista.

In [31]:
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s.loc[["d", "a"]]

Unnamed: 0,0
d,40
a,10


Otra opción es pasar al método un rango.

In [32]:
s["b":"d"]

Unnamed: 0,0
b,20
c,30
d,40


En este caso es importante recalcar que, tal y como se ve en la imagen anterior, el método va a devolver todos los elementos entre los límites indicados **ambos incluidos**.

El método `pandas.Series.iloc` __permite extraer datos de la serie a partir de los índices implícitos__ que éstos tienen asignados.

La opción más simple es utilizar como argumento un número entero (el primer elemento de la serie recibe el índice cero).

In [33]:
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s

Unnamed: 0,0
a,10
b,20
c,30
d,40


In [34]:
s.iloc[1]

20

In [35]:
s.iloc[0]

10

`iloc` no funciona utilizando como argumento valores del índice explícito.

In [36]:
try:
    s.iloc["a"]
except Exception as e:
    print(e.__doc__)
    print(type(e).__name__)

Inappropriate argument type.
TypeError


In [37]:
s.iloc[3]

40

Si el número es negativo, hace referencia al final de la serie (en este caso, el último elemento recibe el índice -1). Esto tanto si se ha especificado un índice explícito como si no.

In [38]:
s.iloc[-1]

40

In [39]:
s.iloc[-4]

10

Una segunda opción es pasar como argumento una lista o array de números, en cuyo caso se devuelven los elementos que ocupan dichas posiciones en el orden indicado en la lista o array.

In [40]:
# Fijense el doble corchete. El par interior corresponde a una lista
s.iloc[[2, 0]]

Unnamed: 0,0
c,30
a,10


También podemos incluir en esta lista números negativos.

In [41]:
s.iloc[[-2, 0]]

Unnamed: 0,0
c,30
a,10


Atención con no incluir valores que no estén en el índice.

In [42]:
try:
    s.iloc[2, 0, 5]
except Exception as e:
    print(e.__doc__)
    print(type(e).__name__)


    Exception is raised when trying to index and there is a mismatch in dimensions.

    Examples
    --------
    >>> df = pd.DataFrame({'A': [1, 1, 1]})
    >>> df.loc[..., ..., 'A'] # doctest: +SKIP
    ... # IndexingError: indexer may only contain one '...' entry
    >>> df = pd.DataFrame({'A': [1, 1, 1]})
    >>> df.loc[1, ..., ...] # doctest: +SKIP
    ... # IndexingError: Too many indexers
    >>> df[pd.Series([True], dtype=bool)] # doctest: +SKIP
    ... # IndexingError: Unalignable boolean Series provided as indexer...
    >>> s = pd.Series(range(2),
    ...               index = pd.MultiIndex.from_product([["a", "b"], ["c"]]))
    >>> s.loc["a", "c", "d"] # doctest: +SKIP
    ... # IndexingError: Too many indexers
    
IndexingError


Una tercera opción es usar como argumento un rango de números.

In [43]:
s.iloc[1:3]

Unnamed: 0,0
b,20
c,30


Si el rango tiene la forma $a:b$, se incluyen todos los elementos desde aquel cuyo índice es $a$ (incluido) hasta el que tiene el índice $b$ (sin incluir).

Si no se especifica el primer valor, se consideran todos los elementos desde el principio de la serie.



In [44]:
s.iloc[:3]

Unnamed: 0,0
a,10
b,20
c,30


Y, si no se especifica el segundo valor, se consideran todos los elementos hasta el final de la serie.

In [45]:
s.iloc[2:]

Unnamed: 0,0
c,30
d,40


También pueden usarse valores negativos para indicar el comienzo y/o el final del rango.

In [46]:
s.iloc[1:-1]

Unnamed: 0,0
b,20
c,30


Otra opción para seleccionar elementos de una serie pandas es **usar arrays booleanos**.

In [47]:
s = pd.Series([5, 2, -3, 7, 8, 4])
s

Unnamed: 0,0
0,5
1,2
2,-3
3,7
4,8
5,4


Podemos seleccionar un conjunto de valores de la misma haciendo referencia al nombre de la serie y, entre los corchetes, una lista o array de booleanos.

In [48]:
s[[True, False, False, True, True, False]]

Unnamed: 0,0
0,5
3,7
4,8


En este caso hemos seleccionado los elementos cuyos índices son 0, 3 y 4, que son los índices que ocupan los booleanos `True` en la lista de booleanos usada (lista cuya longitud deberá ser igual a la longitud de la serie pues, de no ser así, se devuelve un error).

Esta lista o array de booleanos no tiene por qué ser especificada de forma explícita, puede ser el resultado de una expresión.

In [49]:
s = pd.Series([5, 2, -3, 7, 8, 4])
s

Unnamed: 0,0
0,5
1,2
2,-3
3,7
4,8
5,4


Aquí, hemos usado la expresión $s > 2$ para generar una serie pandas de booleanos, serie en la que los valores toman el valor `True` cuando el valor con el mismo índice de $s$ toma un valor mayor estricto que 2.

Podemos entonces usar este resultado para extraer valores de la serie $s$.

In [50]:
print(type(s > 2))
s > 2

<class 'pandas.core.series.Series'>


Unnamed: 0,0
0,True
1,False
2,False
3,True
4,True
5,True


In [51]:
s[s>2]

Unnamed: 0,0
0,5
3,7
4,8
5,4


Este mismo enfoque puede ser usado con los métodos `pandas.Series.loc` y `pandas.Series.iloc` ya vistos en las secciones anteriores con algún matiz adicional.

El método loc puede ser usado tanto con un array explícito de booleanos:

In [52]:
s.loc[[True, False, False, True, True, True]]

Unnamed: 0,0
0,5
3,7
4,8
5,4


o como con una expresión que genera, por ejemplo, una serie pandas de booleanos:

In [53]:
s.loc[s>2]

Unnamed: 0,0
0,5
3,7
4,8
5,4


Sin embargo, el método `iloc` tiene un comportamiento ligeramente diferente. Puede ser usado con arrays explícitos de booleanos:

In [54]:
s.iloc[[True, False, False, True, True, True]]

Unnamed: 0,0
0,5
3,7
4,8
5,4


Pero el uso de expresiones que generen una serie pandas de booleanos devuelve un error:

In [55]:
# Esta operación genera una serie
print(type(s>2))
s>2

<class 'pandas.core.series.Series'>


Unnamed: 0,0
0,True
1,False
2,False
3,True
4,True
5,True


In [56]:
try:
    s.iloc[s>2]
except Exception as e:
    print(e.__doc__)
    print(type(e).__name__)

Method or function hasn't been implemented yet.
NotImplementedError


Si el objeto que está generando la estructura de booleanos ($s$, en $s > 2$) fuese un array NumPy en lugar de tratarse de una serie pandas, sí sería posible usar el método .iloc. De esta forma, la expresión $s > 2$ genera, como hemos visto, una serie pandas, pero podemos extraer los valores con el atributo values, que genera un array numpy.

In [57]:
type((s>2).values)

numpy.ndarray

In [58]:
(s>2).values

array([ True, False, False,  True,  True,  True])

Si usamos esta expresión para realizar la selección en la serie original $s$, el resultado es ahora el correcto.

In [59]:
s.iloc[(s>2).values]

Unnamed: 0,0
0,5
3,7
4,8
5,4


Misma cosa ocurre si convertimos la serie en una lista.

In [60]:
s.iloc[list((s>2))]

Unnamed: 0,0
0,5
3,7
4,8
5,4


**Es por ello que pandas recomienda usar el método loc cuando trabajemos con selección basada en booleanos.**

También podemos realizar una selección aleatoria a partir de una serie. El método `pandas.Series.sample` permite especificar o bien el número de elementos a extraer o bien la fracción del número total de elementos a extraer (parámetros `n` y `frac`, respectivamente), pudiendo especificar si la extracción se realiza con reemplazo o no (parámetro `replace`), los pesos a aplicar a cada elemento para realizar una extracción aleatoria ponderada (parámetro `weights`, y una semilla para el generador de números aleatorios que asegure la reproducibilidad de la extracción (parámetro `random_state`).

In [61]:
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s

Unnamed: 0,0
a,10
b,20
c,30
d,40


In [62]:
s.sample(3, random_state = 18)

Unnamed: 0,0
d,40
b,20
a,10


In [63]:
s.sample(frac = 0.6, random_state = 18)

Unnamed: 0,0
d,40
b,20


Si no hay reemplazo, el número máximo de elementos que podemos extraer coincide con la longitud de la serie. Pero si la extracción la realizamos con reemplazo, podemos especificar cualquier número de elementos.

In [64]:
s.sample(10, random_state = 18, replace = True)

Unnamed: 0,0
c,30
d,40
a,10
b,20
c,30
b,20
c,30
c,30
c,30
a,10


El método `pandas.Series.pop` extrae y elimina un elemento de una serie cuyo índice se indica como argumento.

In [65]:
s = pd.Series([1, 2, 3, 4])
s

Unnamed: 0,0
0,1
1,2
2,3
3,4


In [66]:
s.pop(1)

2

In [67]:
s

Unnamed: 0,0
0,1
2,3
3,4


Devuelve un error en caso de que no exista.

In [68]:
s = pd.Series([1, 2, 3, 4])

try:
    s.pop(18)
except Exception as e:
    print(e.__doc__)
    print(type(e).__name__)

Mapping key not found.
KeyError


Si la serie tiene un índice explícito, el argumento de `pop` hará referencia a este índice.

In [69]:
s = pd.Series([10, 20, 30, 40], index = ["a", "b", "c", "d"])
s.pop("a")

10

In [70]:
s

Unnamed: 0,0
b,20
c,30
d,40


Y para el índice no explícito, devolverá un error.

In [71]:
try:
  s.pop(0)
except Exception as e:
    print(e.__doc__)
    print(type(e).__name__)

Mapping key not found.
KeyError


  s.pop(0)


### <font color='green'>Actividad 1</font>

Escribir una función que reciba un diccionario con las alturas (en metros) de los integrantes del grupo y devuelva una serie con las alturas mayores a 1.75 ordenadas de mayor a menor.

In [90]:
def filtro_alturas(alt : dict) -> dict:

    alt = pd.Series(alt, name = "Altura")

    return alt[list(alt>1.75)].sort_values(ascending=False)

In [93]:
alturas = {
    "Cata": 1.6,
    "Monse": 1.7,
    "Felipe": 1.8,
    "Nico": 1.73
}

print("Las alturas mayores que 1.75 ordenadas en forma decreciente son:")
display(filtro_alturas(alturas))

Las alturas mayores que 1.75 ordenadas en forma decreciente son:


Unnamed: 0,Altura
Felipe,1.8


<font color='green'>Fin Actividad 1</font>

### <font color='green'>Actividad 2</font>

Dada la siguiente serie:

```
s1 = pd.Series([10, 15, 20, 25, 30], index=[2, 5, 8, 9, 12])
```
Selecciona los elementos con índices 5 y 9.


In [99]:
s1 = pd.Series([10, 15, 20, 25, 30], index=[2, 5, 8, 9, 12])

print(f"Los elementos con índices 5 y 9 de s1 son:")
display(s1.loc[[5,9]])

Los elementos con índices 5 y 9 de s1 son:


Unnamed: 0,0
5,15
9,25


<font color='green'>Fin Actividad 2</font>

### <font color='green'>Actividad 3</font>

Dada la siguiente serie:

```
s2 = pd.Series([1, 2, 3, 4, 5], index=['a-1', 'b-2', 'c-3', 'a-4', 'b-5'])
```
Selecciona aquellos valores cuyos índices comienzan con 'a-'.


In [108]:
# Tu código aquí ...
s2 = pd.Series([1, 2, 3, 4, 5], index=['a-1', 'b-2', 'c-3', 'a-4', 'b-5'])
print(f"Los valores de s2 cuyos índices comienzan con 'a-' son:")
display(s2[[i[0:2] == 'a-' for i in list(s2.index)]])

Los valores de s2 cuyos índices comienzan con 'a-' son:


Unnamed: 0,0
a-1,1
a-4,4


<font color='green'>Fin Actividad 3</font>

### <font color='green'>Actividad 4</font>

Dada la siguiente serie:

```
s3 = pd.Series(list(range(20)), index=list(range(20, 0, -1)))
```
Selecciona aquellos valores que sean pares y cuyos índices sean impares.


In [117]:
# Tu código aquí ...
s3 = pd.Series(list(range(20)), index=list(range(20, 0, -1)))

print(f"Los valores que sean pares y cuyos índices sean impares son:")
s3 = s3[s3%2==0]
display(s3[s3.index%2 != 0]) # No hay ninguno que cumpla ambas condiciones

Los valores que sean pares y cuyos índices sean impares son:


Unnamed: 0,0


<font color='green'>Fin Actividad 4</font>

### <font color='green'>Actividad 5</font>

Dada la siguiente serie:

```
s4 = pd.Series(list(range(10, 101, 10)))
```
Utilizando una función, selecciona aquellos números que son divisibles por 3.


In [119]:
# Tu código aquí ...

s4 = pd.Series(list(range(10, 101, 10)))
print("Los números de s3 que son divisibles por 3 son:")
display(s4[s4%3 == 0])

Los números de s3 que son divisibles por 3 son:


Unnamed: 0,0
2,30
5,60
8,90


<font color='green'>Fin Actividad 5</font>

### <font color='green'>Actividad 6</font>

Dada la siguiente serie:

```
s5 = pd.Series([10, 23, 30, 33, 45, 52, 68, 77, 81, 97])
```
Selecciona todos los valores que sean primos o múltiplos de 7. Posteriormente, reasigna esos valores seleccionados al cuadrado de su valor original.


In [134]:
# Tu código aquí ...

s5 = pd.Series([10, 23, 30, 33, 45, 52, 68, 77, 81, 97])

def is_prime(n):
    for i in range(2, n):
        if n % i == 0:
            return False
    return True

print(f"Los valores de s5 que son primos o multiplos de 7 son:")
display(s5[[is_prime(s) or s%7==0 for s in s5.values]])

print(f"\n Por lo que sus cuadrados quedan dados por:")
display(s5[[is_prime(s) or s%7==0 for s in s5.values]]**2)

Los valores de s5 que son primos o multiplos de 7 son:


Unnamed: 0,0
1,23
7,77
9,97



 Por lo que sus cuadrados quedan dados por:


Unnamed: 0,0
1,529
7,5929
9,9409


<font color='green'>Fin Actividad 6</font>

<img src="https://drive.google.com/uc?export=view&id=1Igtn9UXg6NGeRWsqh4hefQUjV0hmzlBv" width="100" align="left" title="Runa-perth">
<br clear="left">


##<font color='red'>**Actividad Avanzada**</font>

### <font color='green'>Actividad 7</font>

Imagina que estás trabajando con una serie de datos financieros, donde cada índice representa una fecha específica y cada valor representa el precio de cierre de una acción en esa fecha. Las fechas no están en orden y algunas de ellas son particularmente importantes para ti debido a eventos externos.

En esta actividad deberás seleccionar precios de cierre en fechas específicas, y para ello deberás combinar el uso de loc, iloc y expresiones.

```
dates = [datetime.date(2023, 5, 15), datetime.date(2023, 1, 10), datetime.date(2023, 3, 23),
         datetime.date(2023, 2, 15), datetime.date(2023, 8, 30), datetime.date(2023, 4, 5)]

prices = [120.5, 115.2, 112.8, 116.5, 127.4, 119.0]

data = pd.Series(prices, index=dates)
```

1. Ordena la serie según sus índices de fecha.
2. Utiliza iloc para seleccionar el precio de cierre de la segunda fecha más reciente en la serie ordenada.
3. Iimagina que sabes que hubo un evento importante el 15 de febrero de 2023 y quieres saber cómo afectó el precio posteriormente. Utiliza loc para seleccionar todos los precios desde esa fecha en adelante.
4. Utilizando una combinación de expresiones, selecciona los precios que estén por encima del precio medio pero solo para fechas anteriores al 1 de abril de 2023.


In [159]:
# Tu código aquí ...
import datetime

dates = [datetime.date(2023, 5, 15), datetime.date(2023, 1, 10),
         datetime.date(2023, 3, 23),datetime.date(2023, 2, 15),
         datetime.date(2023, 8, 30), datetime.date(2023, 4, 5)]

prices = [120.5, 115.2, 112.8, 116.5, 127.4, 119.0]

data = pd.Series(prices, index=dates)
print("La data original es:")
display(data)

# Ordenar según los índices de fecha
data = data.sort_index()
print("Luego de ordenar los índices de fecha se tiene.")
display(data)

# Filtro segunda fecha más reciente
print(f"El precio de cierre de la segunda fecha más reciente es {data.iloc[-2]}.")

# Filtrar todos los precios desde 15 de Febrero de 2023
print("Los precios posteriores al 15 de Febrero de 2023 son:")
display(data.loc[data.index > datetime.date(2023,2,15)])

# Filtrar precios que estén por encima del precio medio pero solo para fechas
# anteriores al 1 de abril de 2023.
print(
    f"Los precios que están por encima del precio medio {data.mean():2,f} pero "
    "con fecha anterior al 1 de Abril de 2023 son:"
)
display(data[(data>data.mean()) & (data.index < datetime.date(2023,4,1))])

La data original es:


Unnamed: 0,0
2023-05-15,120.5
2023-01-10,115.2
2023-03-23,112.8
2023-02-15,116.5
2023-08-30,127.4
2023-04-05,119.0


Luego de ordenar los índices de fecha se tiene.


Unnamed: 0,0
2023-01-10,115.2
2023-02-15,116.5
2023-03-23,112.8
2023-04-05,119.0
2023-05-15,120.5
2023-08-30,127.4


El precio de cierre de la segunda fecha más reciente es 120.5.
Los precios posteriores al 15 de Febrero de 2023 son:


Unnamed: 0,0
2023-03-23,112.8
2023-04-05,119.0
2023-05-15,120.5
2023-08-30,127.4


Los precios que están por encima del precio medio 118.566667 pero con fecha anterior al 1 de Abril de 2023 son:


Unnamed: 0,0


<font color='green'>Fin Actividad 7</font>

<img src="https://drive.google.com/uc?export=view&id=1Igtn9UXg6NGeRWsqh4hefQUjV0hmzlBv" width="50" align="left" title="Runa-perth">
<br clear="left">