<img style="float: left;;" src='Figures/alinco.png' /></a>

# <center> <font color= #000047> Manipulación de Datos con la librería Pandas



<img style="float: right; margin: 0px 0px 15px 15px;" src="https://numfocus.org/wp-content/uploads/2016/07/pandas-logo-300.png" width="400px" height="400px" />

> Ya vamos agregando más librerías a nuestro arsenal. En estas clases hemos revisado aspectos muy básicos de estas librerías ([NumPy](https://www.numpy.org/) y [matplotlib](https://matplotlib.org/)). En estos enlaces pueden encontrar la documentación oficial para revisar qué más pueden hacer con estas librerías. También el `help` puede ser un buen punto de partida para conocer qué más cosas pueden realizar.


Referencias:
- https://pandas.pydata.org/
- https://towardsdatascience.com/data-science-with-python-intro-to-loading-and-subsetting-data-with-pandas-9f26895ddd7f
___

In [None]:
# Importar pandas


Los **pd.DataFrames** son los objetos por excelencia de pandas para manipular datos. Son eficientes y rápidos. Son la estructura de datos donde pandas carga los diferentes formatos de datos: cuando nuestros datos están limpios y estructurados, cada fila representa una observación, y cada columna una variable o característica. Tanto las filas como las columnas pueden tener etiquetas.

En esta clase vamos a trabajar con datos pertenecientes a ejemplos de la librería featuretools [en esta página](https://github.com/FeatureLabs/featuretools). Sin embargo para entender cómo es que se cargan estos datos, estos están disponibles en la carpeta data en formato CSV.

En esta y la siguiente clase, además de importar datos, aprenderemos a:
- seleccionar subconjuntos de datos;
- filtrar variables por categorías;
- relacionar tablas con datos complementarios;
- entre otros.

Comenzamos:

In [2]:
import pandas as pd
import numpy as np

___
# 1. Importando datos

En la carpeta "data" tenemos los archivos "customers_data.csv", "sessions_data.csv", "transactions_data.csv" y "products_data.csv", cada uno de ellos conteniendo información relevante acerca de transacciones de cierta empresa.

El primer paso para comenzar a trabajar con datos es importarlos. Lo podemos hacer con la función `pd.read_csv()`:

In [3]:
# Ayuda en la función pd.read_csv()
help(pd.read_csv)

Help on function read_csv in module pandas.io.parsers.readers:

read_csv(filepath_or_buffer: 'FilePath | ReadCsvBuffer[bytes] | ReadCsvBuffer[str]', sep=<no_default>, delimiter=None, header='infer', names=<no_default>, index_col=None, usecols=None, squeeze=None, prefix=<no_default>, mangle_dupe_cols=True, dtype: 'DtypeArg | None' = None, engine: 'CSVEngine | None' = None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=None, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression: 'CompressionOptions' = 'infer', thousands=None, decimal: 'str' = '.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, encoding_errors: 'str | None' = 'strict', dialect=None, error_bad_li

Muy bien, concentrémonos en los datos de cliente (comenzaremos con estos datos pequeños para ilustrar las funcionalidades, luego iremos añadiendo tamaño):

In [4]:
# Importar customers_data.csv
customers = pd.read_csv('Data/customers_data.csv')

In [7]:
customers.head(2)

Unnamed: 0.1,Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
0,0,1,60091,2011-04-17 10:48:33,1994-07-18
1,1,2,13244,2012-04-15 23:31:04,1986-08-18


In [8]:
customers.tail(2)

Unnamed: 0.1,Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
3,3,4,60091,2011-04-08 20:08:14,2006-08-15
4,4,5,60091,2010-07-17 05:27:50,1984-07-28


In [10]:
customers.describe()

Unnamed: 0.1,Unnamed: 0,customer_id,zip_code
count,5.0,5.0,5.0
mean,2.0,3.0,41352.2
std,1.581139,1.581139,25659.158651
min,0.0,1.0,13244.0
25%,1.0,2.0,13244.0
50%,2.0,3.0,60091.0
75%,3.0,4.0,60091.0
max,4.0,5.0,60091.0


In [11]:
customers.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5 entries, 0 to 4
Data columns (total 5 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   Unnamed: 0     5 non-null      int64 
 1   customer_id    5 non-null      int64 
 2   zip_code       5 non-null      int64 
 3   join_date      5 non-null      object
 4   date_of_birth  5 non-null      object
dtypes: int64(3), object(2)
memory usage: 328.0+ bytes


Bien, ya tenemos los datos cargados, sin embargo, se ve algo raro. 

¿Qué es esta columna "Unnamed: 0"? (abrir el CSV)

Para especificar que esta columna corresponde al índice, podemos usar el argumento `index_col`.

In [12]:
# Importar customers_data.csv, haciendo uso del argumento index_col
customers = pd.read_csv('Data/customers_data.csv', index_col=[0])
customers

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
0,1,60091,2011-04-17 10:48:33,1994-07-18
1,2,13244,2012-04-15 23:31:04,1986-08-18
2,3,13244,2011-08-13 15:42:34,2003-11-21
3,4,60091,2011-04-08 20:08:14,2006-08-15
4,5,60091,2010-07-17 05:27:50,1984-07-28


In [13]:
# Tipo de lo que importamos
type(customers)

pandas.core.frame.DataFrame

Ahora nuestro DataFrame luce bien. Sin embargo, podríamos querer indizar nuestro DataFrame directamente por el id de cliente, utilizando el método `set_index()`:

In [14]:
# Usar el método set_index para indizar por el id de cliente
customers.set_index('customer_id')

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,60091,2011-04-17 10:48:33,1994-07-18
2,13244,2012-04-15 23:31:04,1986-08-18
3,13244,2011-08-13 15:42:34,2003-11-21
4,60091,2011-04-08 20:08:14,2006-08-15
5,60091,2010-07-17 05:27:50,1984-07-28


In [15]:
customers

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
0,1,60091,2011-04-17 10:48:33,1994-07-18
1,2,13244,2012-04-15 23:31:04,1986-08-18
2,3,13244,2011-08-13 15:42:34,2003-11-21
3,4,60091,2011-04-08 20:08:14,2006-08-15
4,5,60091,2010-07-17 05:27:50,1984-07-28


Podemos ver que pandas no convierte **customer_id** en el índice permanente del DataFrame, a menos que se lo especifiquemos. Para especificarlo, debemos usar el argumento `inplace`

In [16]:
# Usar el método set_index para indizar por el id de cliente, usando el argumento inplace
# customers = customers.set_index("customer_id")
customers.set_index('customer_id', inplace=True)
customers

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,60091,2011-04-17 10:48:33,1994-07-18
2,13244,2012-04-15 23:31:04,1986-08-18
3,13244,2011-08-13 15:42:34,2003-11-21
4,60091,2011-04-08 20:08:14,2006-08-15
5,60091,2010-07-17 05:27:50,1984-07-28


___
# 2. Indización y selección de datos

Hay muchas formas de las cuales podemos seleccionar datos de DataFrames. Veremos, de acuerdo al artículo al final de este documento, la forma basada en corchetes ([]) y en los métodos `loc()` y `iloc()`.

Con los corchetes, podemos seleccionar ciertas filas, o bien, ciertas columnas. 

Para una selección de filas, podemos usar el indizado como en las listas: [start_index:end_index:step], recordando que el `end_index` no es inclusivo.

Por ejemplo, seleccionar los clientes en las primeras dos filas:

In [19]:
customers

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,60091,2011-04-17 10:48:33,1994-07-18
2,13244,2012-04-15 23:31:04,1986-08-18
3,13244,2011-08-13 15:42:34,2003-11-21
4,60091,2011-04-08 20:08:14,2006-08-15
5,60091,2010-07-17 05:27:50,1984-07-28


In [25]:
customers.loc[[1,5],:]

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,60091,2011-04-17 10:48:33,1994-07-18
5,60091,2010-07-17 05:27:50,1984-07-28


In [20]:
customers.iloc[:2,:]

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,60091,2011-04-17 10:48:33,1994-07-18
2,13244,2012-04-15 23:31:04,1986-08-18


In [27]:
customers[:2]

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,60091,2011-04-17 10:48:33,1994-07-18
2,13244,2012-04-15 23:31:04,1986-08-18


Ahora, seleccionar del tercer cliente en adelante:

In [31]:
customers.iloc[2,:]

zip_code                       13244
join_date        2011-08-13 15:42:34
date_of_birth             2003-11-21
Name: 3, dtype: object

Finalmente, seleccionar los clientes en las filas impares:

In [32]:
customers

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,60091,2011-04-17 10:48:33,1994-07-18
2,13244,2012-04-15 23:31:04,1986-08-18
3,13244,2011-08-13 15:42:34,2003-11-21
4,60091,2011-04-08 20:08:14,2006-08-15
5,60091,2010-07-17 05:27:50,1984-07-28


In [33]:
customers.iloc[::2]

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,60091,2011-04-17 10:48:33,1994-07-18
3,13244,2011-08-13 15:42:34,2003-11-21
5,60091,2010-07-17 05:27:50,1984-07-28


In [34]:
customers.iloc[1::2]

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2,13244,2012-04-15 23:31:04,1986-08-18
4,60091,2011-04-08 20:08:14,2006-08-15


Similarmente, para una selección de columnas, podemos usar una lista con los nombres de las columnas requeridas. Si pasamos solo una columna como un string en lugar de una lista, el resultado será un objeto **pd.Series**:

In [35]:
# Seleccionar la columna date_of_birth como Series
customers['date_of_birth']

customer_id
1    1994-07-18
2    1986-08-18
3    2003-11-21
4    2006-08-15
5    1984-07-28
Name: date_of_birth, dtype: object

In [36]:
type(customers['date_of_birth'])

pandas.core.series.Series

In [None]:
# Tipo


Las Series de pandas son arreglos unidimensionales que pueden ser etiquetados. En algunos casos, querremos seleccionar solo una columna pero mantener esta selección en un DataFrame. En este caso podemos pasar una lista con un solo elemento:

In [37]:
# Seleccionar la columna date_of_birth como DataFrame
customers[['date_of_birth']]

Unnamed: 0_level_0,date_of_birth
customer_id,Unnamed: 1_level_1
1,1994-07-18
2,1986-08-18
3,2003-11-21
4,2006-08-15
5,1984-07-28


In [38]:
# Tipo
type(customers[['date_of_birth']])

pandas.core.frame.DataFrame

Finalmente, seleccionamos dos columnas:

In [39]:
# Seleccionar las columnas date_of_birth y zip_code
customers[['date_of_birth','zip_code']]

Unnamed: 0_level_0,date_of_birth,zip_code
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1
1,1994-07-18,60091
2,1986-08-18,13244
3,2003-11-21,13244
4,2006-08-15,60091
5,1984-07-28,60091


Muy bien, ya vimos que los corchetes son útiles. También existen los poderosos métodos `loc` y `iloc`, que nos dan el poder de seleccionar ambos a la vez: columnas y filas.

¿En qué se diferencian?

- El método `loc` nos permite seleccionar filas y columnas de nuestros datos basados en etoquetas. Primero, se deben especificar las etiquetas de las filas, y luego las de las columnas.

- El método `lioc` nos permite hacer lo mismo pero basado en índices enteros de nuestro DataFrame (como si fueran matrices).

Como antes, si queremos seleccionar todas las filas, o columnas, simplemente escribimos `:` en el lugar adecuado.

Mejor con ejemplos:

Para un mejor entendimiento de esta parte, reetiquetaremos la numeración de clientes con una "numeración" alfabética. Es decir: 1-A, 2-B, ..., 5-E.

In [40]:
# Resetear índice en el lugar
customers

Unnamed: 0_level_0,zip_code,join_date,date_of_birth
customer_id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,60091,2011-04-17 10:48:33,1994-07-18
2,13244,2012-04-15 23:31:04,1986-08-18
3,13244,2011-08-13 15:42:34,2003-11-21
4,60091,2011-04-08 20:08:14,2006-08-15
5,60091,2010-07-17 05:27:50,1984-07-28


In [41]:
customers.reset_index(inplace=True)
customers

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
0,1,60091,2011-04-17 10:48:33,1994-07-18
1,2,13244,2012-04-15 23:31:04,1986-08-18
2,3,13244,2011-08-13 15:42:34,2003-11-21
3,4,60091,2011-04-08 20:08:14,2006-08-15
4,5,60091,2010-07-17 05:27:50,1984-07-28


In [43]:
customers.index

RangeIndex(start=0, stop=5, step=1)

In [44]:
customers.columns

Index(['customer_id', 'zip_code', 'join_date', 'date_of_birth'], dtype='object')

In [45]:
customers.index = ['A', 'B', 'C', 'D', 'E']
customers

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18
B,2,13244,2012-04-15 23:31:04,1986-08-18
C,3,13244,2011-08-13 15:42:34,2003-11-21
D,4,60091,2011-04-08 20:08:14,2006-08-15
E,5,60091,2010-07-17 05:27:50,1984-07-28


Ahora sí.

Seleccionemos el primer cliente con ambos métodos:

In [46]:
# Primer cliente con loc
customers.loc['A']

customer_id                        1
zip_code                       60091
join_date        2011-04-17 10:48:33
date_of_birth             1994-07-18
Name: A, dtype: object

In [47]:
customers.loc[['A']]

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18


In [48]:
# Primer cliente con iloc
customers.iloc[0]

customer_id                        1
zip_code                       60091
join_date        2011-04-17 10:48:33
date_of_birth             1994-07-18
Name: A, dtype: object

Nos dan series, ¿y si queremos DataFrames?

In [None]:
# Primer cliente con loc en DataFrame


In [None]:
# Primer cliente con iloc en DataFrame


Ahora, seleccionemos los clientes A y C con ambos métodos:

In [49]:
# Clientes A y C con loc
customers.loc[['A','C']]

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18
C,3,13244,2011-08-13 15:42:34,2003-11-21


In [50]:
# Clientes A y C con iloc
customers.iloc[[0,2]]

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18
C,3,13244,2011-08-13 15:42:34,2003-11-21


Ahora, de los clientes B y E, queremos su zip_code y su join_date:

In [51]:
# loc
customers.loc[['A','C'],['zip_code','join_date']]

Unnamed: 0,zip_code,join_date
A,60091,2011-04-17 10:48:33
C,13244,2011-08-13 15:42:34


In [53]:
# iloc
customers.iloc[[0,2],[1,2]]

Unnamed: 0,zip_code,join_date
A,60091,2011-04-17 10:48:33
C,13244,2011-08-13 15:42:34


Ahora, queremos solo zip_code y join_date, pero de todos los clientes:

In [54]:
customers

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18
B,2,13244,2012-04-15 23:31:04,1986-08-18
C,3,13244,2011-08-13 15:42:34,2003-11-21
D,4,60091,2011-04-08 20:08:14,2006-08-15
E,5,60091,2010-07-17 05:27:50,1984-07-28


In [56]:
# loc
customers.loc[:,['zip_code','join_date']]

Unnamed: 0,zip_code,join_date
A,60091,2011-04-17 10:48:33
B,13244,2012-04-15 23:31:04
C,13244,2011-08-13 15:42:34
D,60091,2011-04-08 20:08:14
E,60091,2010-07-17 05:27:50


In [57]:
# iloc
customers.iloc[:,[1,2]]

Unnamed: 0,zip_code,join_date
A,60091,2011-04-17 10:48:33
B,13244,2012-04-15 23:31:04
C,13244,2011-08-13 15:42:34
D,60091,2011-04-08 20:08:14
E,60091,2010-07-17 05:27:50


¿Qué tal? Ya tenemos varias formas de seleccionar e indexar ciertos datos.

Esto es, sin duda, muy útil. Por otra parte, muchas veces queremos obtener cierta información (clientes, en nuestro ejemplo) que cumplan algunos requisitos. Por ejemplo:
- que sean mayores de 18 años, o
- que su antiguedad en la plataforma sea menor a seis meses, o
- que residan en cierta zona,
- entre otros.

Para ello utilizamos los operadores de comparación (==, >, <, >=, <=, !=).

___
# 3. Filtrado de datos

Los operadores de comparación pueden ser utilizados con Series de pandas. 

Esto resulta ser súper útil para filtrar datos con ciertas condiciones específicas (esto lo veremos enseguida). 

Por ahora, veremos que al usar operadores de comparación con Series, el resultado será Series booleanas. Es decir, cada elemento de dichas series será `True` si la condición se satisface, y `Falso` de lo contrario.

Una vez tenemos la serie boolena, podemos aplicarla para la selección de filas, obteniendo un DataFrame filtrado como resultado.

**Ejemplos**

¿Cuáles clientes son mayores de 18 años?

In [58]:
customers

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18
B,2,13244,2012-04-15 23:31:04,1986-08-18
C,3,13244,2011-08-13 15:42:34,2003-11-21
D,4,60091,2011-04-08 20:08:14,2006-08-15
E,5,60091,2010-07-17 05:27:50,1984-07-28


In [62]:
type(customers.loc['A','date_of_birth'])

str

In [60]:
# Adult clients
customers['date_of_birth']<='2003-06-15'


A     True
B     True
C    False
D    False
E     True
Name: date_of_birth, dtype: bool

¿Cuáles clientes se registraron después del primero de Junio del 2011?

In [63]:
# Recent joins
customers['join_date']>'2011-06-01'

A    False
B     True
C     True
D    False
E    False
Name: join_date, dtype: bool

¿Cuáles clientes viven en la zona con CP 13244?

In [65]:
customers['zip_code'].dtype

dtype('int64')

In [66]:
# Zone
customers['zip_code']==13244

A    False
B     True
C     True
D    False
E    False
Name: zip_code, dtype: bool

Entonces ya tenemos las series booleanas de las que hablábamos. Ahora, ¿cómo podemos usar esto para obtener la información de los clientes que cumplen estas características?

In [67]:
# Filtrar por clientes adultos
customers[customers['date_of_birth']<='2003-06-15']

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18
B,2,13244,2012-04-15 23:31:04,1986-08-18
E,5,60091,2010-07-17 05:27:50,1984-07-28


In [68]:
# Filtrar por registros recientes
customers[customers['join_date']>'2011-06-01']

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
B,2,13244,2012-04-15 23:31:04,1986-08-18
C,3,13244,2011-08-13 15:42:34,2003-11-21


In [69]:
# Filtrar por zona
customers[customers['zip_code']==13244]

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
B,2,13244,2012-04-15 23:31:04,1986-08-18
C,3,13244,2011-08-13 15:42:34,2003-11-21


**¡Excelente!**

Los filtrados que acabamos de hacer fueron de una sola condición. Ahora, ¿cómo hacer filtrados con múltiples condiciones?

## 3.1 Filtrado con múltiples condiciones

Cuando queremos filtrar datos con múltiples condiciones, podemos usar operadores booleanos (`and`, `or`, `not`), solo con una pequeña modificación. Usamos:

- `&` en lugar de `and`,
- `|` en lugar de `or`, y
- `~` en lugar de `not`.

**Ejemplos**

Obtener la información de los clientes adultos que vivan en la zona con código postal 13244

In [70]:
customers

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18
B,2,13244,2012-04-15 23:31:04,1986-08-18
C,3,13244,2011-08-13 15:42:34,2003-11-21
D,4,60091,2011-04-08 20:08:14,2006-08-15
E,5,60091,2010-07-17 05:27:50,1984-07-28


In [71]:
customers[(customers['date_of_birth']<='2003-06-15') & (customers['zip_code']==13244)]

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
B,2,13244,2012-04-15 23:31:04,1986-08-18


Obtener la información de los clientes que sean adultos o que se hayan registrado luego del 6 de Junio del 2011

In [73]:
customers[(customers['date_of_birth']<='2003-06-15') | (customers['join_date']>'2011-06-01')]

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18
B,2,13244,2012-04-15 23:31:04,1986-08-18
C,3,13244,2011-08-13 15:42:34,2003-11-21
E,5,60091,2010-07-17 05:27:50,1984-07-28


Obtener la información de los clientes que **NO** se hayan registrado en 2011

In [74]:
#Los clientes que se registraron en el 2011
customers[(customers['join_date']>='2011-01-01')&(customers['join_date']<='2011-12-31')]

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
A,1,60091,2011-04-17 10:48:33,1994-07-18
C,3,13244,2011-08-13 15:42:34,2003-11-21
D,4,60091,2011-04-08 20:08:14,2006-08-15


In [75]:
customers[~((customers['join_date']>='2011-01-01')&(customers['join_date']<='2011-12-31'))]

Unnamed: 0,customer_id,zip_code,join_date,date_of_birth
B,2,13244,2012-04-15 23:31:04,1986-08-18
E,5,60091,2010-07-17 05:27:50,1984-07-28


De esta manera, podemos crear condiciones tan complejas y restrictivas como queramos para filtrar nuestros datos.

Útil, ¿no?