# ¡Aprendiendo Pandas! 🐼

Repaso de lo aprendido sobre Python, e introduccion de la principal estructuras de datos de Pandas, los `DataFrames`. Estos son datos tabulares bidimensionales, de tamaño variable y potencialmente heterogéneos. La clase se dividirá en los siguientes puntos:

1. Crearemos datos de prueba para nuestro proyecto.
2. Exploremos los datos creados.
3. ¿Cómo podemos preparar un correo electrónico?.
4. ¡Reto!.

In [None]:
# Instalamos una dependencia que no viene instalada en Colab por defecto
!pip install Faker

Collecting Faker
  Downloading Faker-13.2.0-py3-none-any.whl (1.5 MB)
[?25l[K     |▏                               | 10 kB 10.3 MB/s eta 0:00:01[K     |▍                               | 20 kB 14.2 MB/s eta 0:00:01[K     |▋                               | 30 kB 17.6 MB/s eta 0:00:01[K     |▉                               | 40 kB 15.8 MB/s eta 0:00:01[K     |█                               | 51 kB 17.5 MB/s eta 0:00:01[K     |█▎                              | 61 kB 11.1 MB/s eta 0:00:01[K     |█▌                              | 71 kB 12.2 MB/s eta 0:00:01[K     |█▊                              | 81 kB 13.4 MB/s eta 0:00:01[K     |██                              | 92 kB 14.6 MB/s eta 0:00:01[K     |██▏                             | 102 kB 15.6 MB/s eta 0:00:01[K     |██▍                             | 112 kB 15.6 MB/s eta 0:00:01[K     |██▋                             | 122 kB 15.6 MB/s eta 0:00:01[K     |██▉                             | 133 kB 15.6 MB/s eta 0:00

In [None]:
# Importamos las dependencias
import pandas as pd # Manejo de datos
import numpy as np # Estadistica
from datetime import datetime # Formato de fechas
from faker import Faker # Generacion de datos de prueba

# 1 Crearemos datos de prueba para nuestro proyecto

In [None]:
fake = Faker()
Faker.seed(4321) # Si quieres que te salga lo mismo que a mi usa esta línea
N_SAMPLE = 1000 # Numero de contactos a generar

In [None]:
# Generamos los datos utilizando una list comprehension
# La estructura de datos resultante es una lista de listas

contact_list = [ [ fake.first_name(), fake.last_name(), fake.address(),
                   fake.free_email(), fake.company(), *fake.currency(), 
                   fake.date_time() ] for _ in range(N_SAMPLE) ]

In [None]:
# Convertimos la lista de listas a un pandas DataFrame con nombres de columnas
contact_df = pd.DataFrame(contact_list, columns=['first name', 'last name', 'address', 
                                                 'email', 'company', 'sel_currency_code', 
                                                 'sel_currency_label', 'start_datetime'])

In [None]:
contact_df

Unnamed: 0,first name,last name,address,email,company,sel_currency_code,sel_currency_label,start_datetime
0,Jonathan,Russell,"510 Brenda Oval\nRobertbury, TN 57405",chendricks@gmail.com,Schmidt Group,HUF,Hungarian forint,2021-01-02 06:26:04
1,Melissa,Baker,"563 Lee Fort\nRogerville, WI 44492",christine35@gmail.com,"Brown, Parker and Fleming",MRO,Mauritanian ouguiya,2014-10-01 06:15:58
2,Jacqueline,Mathis,114 Bryan Throughway Suite 189\nSouth Andreamo...,daniellezimmerman@yahoo.com,Miller PLC,TTD,Trinidad and Tobago dollar,2000-06-13 04:28:17
3,Robert,Kirk,"90464 Amanda Port\nBennettport, SD 86163",lopezvictoria@hotmail.com,Burke LLC,NGN,Nigerian naira,1987-10-14 05:35:59
4,Andrew,Dunlap,"35819 Goodwin Islands\nLake Jeffreyshire, WY 1...",christophergarcia@gmail.com,Harris-Hopkins,BND,Brunei dollar,1981-06-12 10:51:21
...,...,...,...,...,...,...,...,...
995,Christina,Weaver,"11826 John Roads\nMillerfort, SC 92531",jessicacline@gmail.com,Bryan Inc,PEN,Peruvian sol,2008-12-04 14:51:29
996,William,Sanchez,"5550 Harris Gardens Apt. 259\nCharlesmouth, SC...",peteringram@hotmail.com,Richardson Ltd,HRK,Croatian kuna,2016-07-28 16:15:28
997,Kenneth,Contreras,211 Tammy Junctions Suite 553\nSouth Beverlyvi...,andersonmichelle@yahoo.com,Anderson-Hayes,PHP,Philippine peso,2009-04-12 04:10:27
998,Scott,Chang,"75484 Moore Keys Suite 160\nKatherinehaven, ME...",rayala@yahoo.com,Garcia-Jacobson,TOP,Tongan paʻanga,2010-07-04 16:48:59


In [None]:
# Usamos numpy para asignar una prioridad aleatoria entre 1 a 5 en valores enteros a cada contacto
contact_df['priority'] = np.random.randint(low=1, high=5, size=N_SAMPLE)

In [None]:
contact_df.head()

Unnamed: 0,first name,last name,address,email,company,sel_currency_code,sel_currency_label,start_datetime,priority
0,Jonathan,Russell,"510 Brenda Oval\nRobertbury, TN 57405",chendricks@gmail.com,Schmidt Group,HUF,Hungarian forint,2021-01-02 06:26:04,3
1,Melissa,Baker,"563 Lee Fort\nRogerville, WI 44492",christine35@gmail.com,"Brown, Parker and Fleming",MRO,Mauritanian ouguiya,2014-10-01 06:15:58,4
2,Jacqueline,Mathis,114 Bryan Throughway Suite 189\nSouth Andreamo...,daniellezimmerman@yahoo.com,Miller PLC,TTD,Trinidad and Tobago dollar,2000-06-13 04:28:17,3
3,Robert,Kirk,"90464 Amanda Port\nBennettport, SD 86163",lopezvictoria@hotmail.com,Burke LLC,NGN,Nigerian naira,1987-10-14 05:35:59,3
4,Andrew,Dunlap,"35819 Goodwin Islands\nLake Jeffreyshire, WY 1...",christophergarcia@gmail.com,Harris-Hopkins,BND,Brunei dollar,1981-06-12 10:51:21,3


In [None]:
# Guardamos nuestra base de datos de prueba
contact_df.to_csv('marketing_campaing_contacts.csv', index=False)

# 2 Exploremos los datos creados

In [None]:
# Leemos
contact_df = pd.read_csv('marketing_campaing_contacts.csv')

In [None]:
contact_df.head()

Unnamed: 0,first name,last name,address,email,company,sel_currency_code,sel_currency_label,start_datetime,priority
0,Jonathan,Russell,"510 Brenda Oval\nRobertbury, TN 57405",chendricks@gmail.com,Schmidt Group,HUF,Hungarian forint,2021-01-02 06:26:04,3
1,Melissa,Baker,"563 Lee Fort\nRogerville, WI 44492",christine35@gmail.com,"Brown, Parker and Fleming",MRO,Mauritanian ouguiya,2014-10-01 06:15:58,4
2,Jacqueline,Mathis,114 Bryan Throughway Suite 189\nSouth Andreamo...,daniellezimmerman@yahoo.com,Miller PLC,TTD,Trinidad and Tobago dollar,2000-06-13 04:28:17,3
3,Robert,Kirk,"90464 Amanda Port\nBennettport, SD 86163",lopezvictoria@hotmail.com,Burke LLC,NGN,Nigerian naira,1987-10-14 05:35:59,3
4,Andrew,Dunlap,"35819 Goodwin Islands\nLake Jeffreyshire, WY 1...",christophergarcia@gmail.com,Harris-Hopkins,BND,Brunei dollar,1981-06-12 10:51:21,3


In [None]:
contact_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1000 entries, 0 to 999
Data columns (total 9 columns):
 #   Column              Non-Null Count  Dtype 
---  ------              --------------  ----- 
 0   first name          1000 non-null   object
 1   last name           1000 non-null   object
 2   address             1000 non-null   object
 3   email               1000 non-null   object
 4   company             1000 non-null   object
 5   sel_currency_code   1000 non-null   object
 6   sel_currency_label  1000 non-null   object
 7   start_datetime      1000 non-null   object
 8   priority            1000 non-null   int64 
dtypes: int64(1), object(8)
memory usage: 70.4+ KB


## 2.1 Filtremos a los contactos que tienen entre 1 y 5 años registrados en nuestra base

In [None]:
# Convertimos la columna al tipo de dato correcto
contact_df['start_datetime'] = pd.to_datetime(contact_df['start_datetime'])

In [None]:
datetime.today()

datetime.datetime(2022, 2, 23, 17, 11, 35, 989277)

In [None]:
datetime.today() - pd.Timedelta(hours=1)

datetime.datetime(2022, 2, 23, 16, 11, 37, 472968)

In [None]:
# Contactos registrados hace menos de 5 años
filtro = contact_df['start_datetime'] > datetime.today() - pd.Timedelta(days=365*5)
contact_df[filtro]

Unnamed: 0,first name,last name,address,email,company,sel_currency_code,sel_currency_label,start_datetime,priority
0,Jonathan,Russell,"510 Brenda Oval\nRobertbury, TN 57405",chendricks@gmail.com,Schmidt Group,HUF,Hungarian forint,2021-01-02 06:26:04,3
19,Daniel,Ross,"384 Michael Village Suite 744\nEast Garyhaven,...",johnsonglenn@gmail.com,Harris PLC,CHF,Swiss franc,2017-10-31 17:59:16,3
24,Russell,Palmer,"774 Hawkins Skyway\nAvilashire, AK 69899",lgarcia@gmail.com,Byrd-Gomez,KES,Kenyan shilling,2018-06-09 02:56:54,4
37,Jason,Brown,"350 Vargas Plains Suite 343\nEast Mark, SC 12408",tpowers@hotmail.com,Johnson LLC,MVR,Maldivian rufiyaa,2021-01-30 23:03:38,3
56,Christopher,Mack,"709 Michael Fords Apt. 931\nPhillipsfort, WV 2...",skinnerkevin@hotmail.com,"Buchanan, Bell and Thornton",KMF,Comorian franc,2020-09-16 01:39:55,2
...,...,...,...,...,...,...,...,...,...
982,Laura,Davidson,"77160 Brad Centers\nMyerston, NH 58028",gcook@yahoo.com,Smith PLC,UGX,Ugandan shilling,2021-10-01 05:58:15,1
984,Gregory,Johnson,"03355 Jones Mews Apt. 583\nPort Paige, VT 05696",webbjeremy@hotmail.com,Vega-Hill,PYG,Paraguayan guarani,2021-01-05 10:21:26,3
985,Patty,Reese,"2615 Stephens Mill\nNorth Cherylmouth, RI 93567",anthony56@hotmail.com,Smith LLC,CRC,Costa Rican colón,2022-01-26 20:21:43,4
988,Stephanie,Chen,"021 Hart Junction\nJamesfort, LA 58138",millerdebbie@hotmail.com,Townsend-Hess,DOP,Dominican peso,2021-03-26 18:27:50,3


In [None]:
# Contactos registrados hace más de 1 año 
contact_df[contact_df['start_datetime'] < datetime.today() - pd.Timedelta(days=365)]

Unnamed: 0,first name,last name,address,email,company,sel_currency_code,sel_currency_label,start_datetime,priority
0,Jonathan,Russell,"510 Brenda Oval\nRobertbury, TN 57405",chendricks@gmail.com,Schmidt Group,HUF,Hungarian forint,2021-01-02 06:26:04,3
1,Melissa,Baker,"563 Lee Fort\nRogerville, WI 44492",christine35@gmail.com,"Brown, Parker and Fleming",MRO,Mauritanian ouguiya,2014-10-01 06:15:58,4
2,Jacqueline,Mathis,114 Bryan Throughway Suite 189\nSouth Andreamo...,daniellezimmerman@yahoo.com,Miller PLC,TTD,Trinidad and Tobago dollar,2000-06-13 04:28:17,3
3,Robert,Kirk,"90464 Amanda Port\nBennettport, SD 86163",lopezvictoria@hotmail.com,Burke LLC,NGN,Nigerian naira,1987-10-14 05:35:59,3
4,Andrew,Dunlap,"35819 Goodwin Islands\nLake Jeffreyshire, WY 1...",christophergarcia@gmail.com,Harris-Hopkins,BND,Brunei dollar,1981-06-12 10:51:21,3
...,...,...,...,...,...,...,...,...,...
995,Christina,Weaver,"11826 John Roads\nMillerfort, SC 92531",jessicacline@gmail.com,Bryan Inc,PEN,Peruvian sol,2008-12-04 14:51:29,3
996,William,Sanchez,"5550 Harris Gardens Apt. 259\nCharlesmouth, SC...",peteringram@hotmail.com,Richardson Ltd,HRK,Croatian kuna,2016-07-28 16:15:28,3
997,Kenneth,Contreras,211 Tammy Junctions Suite 553\nSouth Beverlyvi...,andersonmichelle@yahoo.com,Anderson-Hayes,PHP,Philippine peso,2009-04-12 04:10:27,4
998,Scott,Chang,"75484 Moore Keys Suite 160\nKatherinehaven, ME...",rayala@yahoo.com,Garcia-Jacobson,TOP,Tongan paʻanga,2010-07-04 16:48:59,1


In [None]:
# Asignamos los dos filtros combinados a un nuevo DataFrame
contact_dff = contact_df[(contact_df['start_datetime'] < datetime.today() - pd.Timedelta(days=365)) &  # Mayor de 1 año 
                         (contact_df['start_datetime'] > datetime.today() - pd.Timedelta(days=365*5))] # Menor de 5 años

In [None]:
contact_dff.shape

(71, 9)

## 2.2 Filtremos a los contactos de prioridad mayor a 3

In [None]:
# Asignamos el resultado del filtro de priorida al mismo DataFrame
contact_dff = contact_dff[contact_dff['priority'] >= 3]

In [None]:
contact_dff.shape

(40, 9)

In [None]:
contact_dff

Unnamed: 0,first name,last name,address,email,company,sel_currency_code,sel_currency_label,start_datetime,priority
0,Jonathan,Russell,"510 Brenda Oval\nRobertbury, TN 57405",chendricks@gmail.com,Schmidt Group,HUF,Hungarian forint,2021-01-02 06:26:04,3
19,Daniel,Ross,"384 Michael Village Suite 744\nEast Garyhaven,...",johnsonglenn@gmail.com,Harris PLC,CHF,Swiss franc,2017-10-31 17:59:16,3
24,Russell,Palmer,"774 Hawkins Skyway\nAvilashire, AK 69899",lgarcia@gmail.com,Byrd-Gomez,KES,Kenyan shilling,2018-06-09 02:56:54,4
37,Jason,Brown,"350 Vargas Plains Suite 343\nEast Mark, SC 12408",tpowers@hotmail.com,Johnson LLC,MVR,Maldivian rufiyaa,2021-01-30 23:03:38,3
69,James,Hill,"6826 Jennifer Drives\nRobinton, ND 08212",qblake@yahoo.com,Johnson-Fritz,LKR,Sri Lankan rupee,2019-12-22 06:12:47,4
124,Joshua,Mccarty,"PSC 0052, Box 5007\nAPO AE 03131",gallen@gmail.com,Shelton Ltd,CRC,Costa Rican colón,2019-06-06 23:01:44,3
129,Joanna,Barker,"38332 Hooper Green Suite 376\nMeganbury, PA 73519",adrian34@hotmail.com,Carter-Cunningham,SVC,Salvadoran colón,2021-01-22 03:17:12,3
140,Matthew,Lopez,USCGC Thompson\nFPO AA 46330,williamsnyder@yahoo.com,Hunter LLC,KHR,Cambodian riel,2018-04-09 19:20:17,4
188,Allen,Price,"9478 Chelsea Club\nNorth Nataliefurt, NJ 03580",carneynathaniel@yahoo.com,Perry PLC,CZK,Czech koruna,2018-05-21 09:48:48,3
192,Emily,Fischer,"7273 Gonzales Radial Suite 613\nOwenborough, D...",uwright@yahoo.com,Jenkins-Thomas,ETB,Ethiopian birr,2017-07-03 20:43:08,3


# 3 ¿Cómo podemos preparar un correo electrónico?

En Python existe un método llamado **interpolación de texto**, esto permite colocar **placeholders** en un texto plantilla que serán rellenados según el valor de nuestras variables. Esto nos ayudará a construir correos electronicos personalizados.

In [None]:
# Variables de ejemplo
first_name = 'Paolo'
last_name = 'Bejarano'
address = 'Avenida Salaverry 2520, Jesus Maria'
priority = '4'
company = 'Kurios'

## 3.1 Ejemplos de f-strings

### 3.3 f-strings de una sola línea 

```python

f" Var 1: {var1}, Var 2: {var2}"

" Var 1: {var1}, Var 2: {var2}".format(var1, var2)

" Var 1: {}, Var 2: {}".format(var1, var2)

f' '
```

In [None]:
oneline = f"Hola {first_name} {last_name} ✌🏽, ¡Te 👋🏽 desde {company}! 🚀"

In [None]:
oneline

'Hola Paolo Bejarano ✌🏽, ¡Te 👋🏽 desde Kurios! 🚀'

In [None]:
print(oneline)

Hola Paolo Bejarano ✌🏽, ¡Te 👋🏽 desde Kurios! 🚀


In [None]:
oneline = f'Hola {first_name} {last_name} ✌🏽, ¡Te 👋🏽 desde {company}! 🚀'

In [None]:
print(oneline)

Hola Paolo Bejarano ✌🏽, ¡Te 👋🏽 desde Kurios! 🚀


In [None]:
oneline = f'Hola {first_name} {last_name} ✌🏽, ¡Te "👋🏽" desde {company}! 🚀'

In [None]:
print(oneline)

Hola Paolo Bejarano ✌🏽, ¡Te "👋🏽" desde Kurios! 🚀


In [None]:
oneline = f"Hola {first_name} {last_name} ✌🏽, ¡Te '👋🏽' desde '{company}'! 🚀"

In [None]:
print(oneline)

Hola Paolo Bejarano ✌🏽, ¡Te '👋🏽' desde 'Kurios'! 🚀


### 3.3 f-strings de múltiples líneas 

```python

f"""

Lista de variables:

- Var 1: {var1} 
- Var 2: {var2}

"""

```

In [None]:
mail_template = f"""
Hola {first_name} 👋🏽 

En {company} estamos contentos de seguir trabajando con la familia {last_name} 🤗.
Eres un cliente de {priority} 🌟, eso te hace muy importante para nosotros.
Por ello queremos actualizar tu dirección para enviarte un 🎁 por tu preferencia.

\t🏡 Dirección registrada: '{address}'

Muchas gracis por tu tiempo y atención. Esperamos escuchar de tí pronto ✌🏽
"""

In [None]:
mail_template

"\nHola Paolo 👋🏽 \n\nEn Kurios estamos contentos de seguir trabajando con la familia Bejarano 🤗.\nEres un cliente de 4 🌟, eso te hace muy importante para nosotros.\nPor ello queremos actualizar tu dirección para enviarte un 🎁 por tu preferencia.\n\n\t🏡 Dirección registrada: 'Avenida Salaverry 2520, Jesus Maria'\n\nMuchas gracis por tu tiempo y atención. Esperamos escuchar de tí pronto ✌🏽\n"

In [None]:
print(mail_template)


Hola Paolo 👋🏽 

En Kurios estamos contentos de seguir trabajando con la familia Bejarano 🤗.
Eres un cliente de 4 🌟, eso te hace muy importante para nosotros.
Por ello queremos actualizar tu dirección para enviarte un 🎁 por tu preferencia.

	🏡 Dirección registrada: 'Avenida Salaverry 2520, Jesus Maria'

Muchas gracis por tu tiempo y atención. Esperamos escuchar de tí pronto ✌🏽



<img src="https://i.gifer.com/origin/4c/4c8146590c298b7099c37335ec29e404_w200.gif" alt="drawing" width="600"/>

# 4 ¡Reto! 

* Utilizando el último ejemplo realiza los cambios necesarios en el código para que en lugar de indicar el número de estrellas directamente agreguen/quiten emojis de estrella según el valor de la variable `priority`

* Ejemplo de salida esperada:

```python
# Considerando
priority = 4
```

>Hola Claudio 👋🏽 ...  
>
>Eres un cliente de 🌟🌟🌟🌟, eso te hace muy importante para nosotros.
>
>... Muchas gracias por tu tiempo y atención. Esperamos escuchar de tí pronto ✌🏽

In [None]:
### Coloca tu código aquí



###