# Series en Pandas

In [4]:
import pandas as pd

## Crear un objeto de tipo Series de Pandas a partir de una lista

* Un objeto **Series** en Pandas es un arreglo 1-dimensional que combina las mejores características de una lista y un diccionario.
* Los valores en una serie es similar a un array de NumPy. En este caso las filas y columnas pueden ser identificadas con etiquetas en lugar de sólo índices.

In [5]:
subjects = ["Programación", "Estadística", "Matematicas", "Seminario"]

print(pd.Series(subjects))

serie_subjects = pd.Series(subjects)

0    Programación
1     Estadística
2     Matematicas
3       Seminario
dtype: object


In [8]:
serie_subjects.index

RangeIndex(start=0, stop=4, step=1)

In [9]:
# o podemos utilizar las materias como indices para especificar por ejemplo, numero de alumnos por materia

student_number_list = [30,45,23,26]

student_number_series = pd.Series(student_number_list,
                                  index=["Programación", "Estadística", "Matematicas", "Seminario"])
print(student_number_series)

series_objects = pd.Series(student_number_list,
                                  index=["Programación", "Estadística", "Matematicas", "Seminario"])

Programación    30
Estadística     45
Matematicas     23
Seminario       26
dtype: int64


In [14]:
series_objects.loc["Matematicas"]

23

In [15]:
# De esta forma, podemos referirnos a un valor por su nombre,

print(student_number_series["Programación"])

30


In [16]:
type(student_number_series)

pandas.core.series.Series

In [17]:
registrations = [True, False, False, False, True]
pd.Series(registrations)

0     True
1    False
2    False
3    False
4     True
dtype: bool

## Crear un objeto Series a partir de un diccionario

In [18]:
scores = {
    "Juan Perez": 98,
    "Ernesto Flores": 78,
    "Luisa Rodríguez": 100,
    "Susana Espinoza": 80
}

pd.Series(scores)

Juan Perez          98
Ernesto Flores      78
Luisa Rodríguez    100
Susana Espinoza     80
dtype: int64

## Métodos frecuentes para Series

In [19]:
#creamos una serie
student_number_list = [30,45,23,26] # alumnos por materia

student_number_series = pd.Series(student_number_list,
                                  index=["Programación", "Estadística", "Matematicas", "Seminario"])

In [20]:
student_number_series

Programación    30
Estadística     45
Matematicas     23
Seminario       26
dtype: int64

In [21]:
student_number_series.sum() # suma de todos los alumnos

124

In [22]:
student_number_series.mean() # promedio de alumnos por materia

31.0

In [23]:
student_number_series.std() # desviación estándar

9.763879010584539

In [24]:
student_number_series.product()

807300

## Atributos de un método

* Un atributo es un dato/valor que vive dentro de un objeto, describiendo alguna característica o detalle de éste.
* Se parece a la sintaxis de un método, pero en este caso no se tienen argumentos (no hay paréntesis), es decir, de la forma `object.attribute`.

In [25]:
living = pd.Series(["Casa", "Departamento", "Otro"])
living

0            Casa
1    Departamento
2            Otro
dtype: object

In [26]:
living.size # cuenta de número de valores dentro de la serie

3

In [27]:
living.is_unique # regresa un True o False dependiendo si no hay valores duplicados

True

In [28]:
living.values # regresa un array de numpy con los valores de la serie

array(['Casa', 'Departamento', 'Otro'], dtype=object)

In [29]:
type(living.values)

numpy.ndarray

In [30]:
living.index # regresa los índices de la serie

RangeIndex(start=0, stop=3, step=1)

In [31]:
type(living.index)

pandas.core.indexes.range.RangeIndex

## Parámetros y argumentos

* Un **parámetro** es una variable de entrada (input) para una función/método/clase
* Un **argumento** es un valor concreto que se le provee al parámetro.
* Estos argumentos pueden incluirse de manera secuencial (siguiendo el orden asignado de la función), o explícitamente llamar a los parámetros (que no tienen que estar en orden),

In [32]:
fruits = ["Apple", "Orange", "Plum", "Grape", "Blueberry", "Watermelon"]
weekdays = ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Monday"]

In [33]:
pd.Series(fruits)

0         Apple
1        Orange
2          Plum
3         Grape
4     Blueberry
5    Watermelon
dtype: object

In [34]:
pd.Series(weekdays)

0       Monday
1      Tuesday
2    Wednesday
3     Thursday
4       Friday
5       Monday
dtype: object

In [35]:
# el orden de los argumentos va como data, index
pd.Series(fruits, weekdays)

Monday            Apple
Tuesday          Orange
Wednesday          Plum
Thursday          Grape
Friday        Blueberry
Monday       Watermelon
dtype: object

In [38]:
# o se pueden llamar directamente
pd.Series(data=fruits,
          index=weekdays)

Monday            Apple
Tuesday          Orange
Wednesday          Plum
Thursday          Grape
Friday        Blueberry
Monday       Watermelon
dtype: object

In [26]:
# por default, se puede apreciar que los índices los coloca como énteros

## Importación de datos (en particular series) con Pandas

Uno de los formatos más utilizados es **csv** (comma separated values). El método utilizado para su importación dentro de una serie es `pd.read_csv()`.

In [10]:
pokemon = pd.read_csv(filepath_or_buffer="../Datasets/pokemon.csv",
                      usecols=['Name']).squeeze("columns")
pokemon

0          Bulbasaur
1            Ivysaur
2           Venusaur
3         Charmander
4         Charmeleon
            ...     
1005    Iron Valiant
1006        Koraidon
1007        Miraidon
1008    Walking Wake
1009     Iron Leaves
Name: Name, Length: 1010, dtype: object

In [12]:
google = pd.read_csv(filepath_or_buffer="../Datasets/google_stock_price.csv",
                      usecols=['Price']).squeeze("columns")
google

0         2.490664
1         2.515820
2         2.758411
3         2.770615
4         2.614201
           ...    
4788    132.080002
4789    132.998001
4790    135.570007
4791    137.050003
4792    138.429993
Name: Price, Length: 4793, dtype: float64

## Más métodos de Pandas Series

In [43]:
pokemon = pd.read_csv(filepath_or_buffer="../Datasets/pokemon.csv",
                      usecols=['Name']).squeeze("columns")
google = pd.read_csv(filepath_or_buffer="../Datasets/google_stock_price.csv",
                      usecols=['Price']).squeeze("columns")

In [45]:
pokemon.head(5) # regresa un n = número de filas empezando desde el inicio.

0     Bulbasaur
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Name, dtype: object

In [46]:
pokemon.tail(5) # regresa un n = número de filas empezando desde el final.

1005    Iron Valiant
1006        Koraidon
1007        Miraidon
1008    Walking Wake
1009     Iron Leaves
Name: Name, dtype: object

In [50]:
pokemon.sample(n=30)

218       Magcargo
743       Rockruff
400      Kricketot
0        Bulbasaur
472      Mamoswine
736      Charjabug
135        Flareon
831        Dubwool
830         Wooloo
581      Vanillite
280         Kirlia
965      Revavroom
758        Stufful
399        Bibarel
308      Electrike
326         Spinda
259       Swampert
805    Blacephalon
754       Morelull
846    Barraskewda
922         Pawmot
558        Scraggy
827        Thievul
233       Stantler
784      Tapu Koko
397      Staraptor
782       Hakamo-o
665       Vivillon
774         Komala
921          Pawmo
Name: Name, dtype: object

## Aplicación de funciones de Python sobre Series

In [52]:
len(pokemon) # regresa la longitud de la serie

1010

In [53]:
type(pokemon) # regresa el tipo de objeto

pandas.core.series.Series

In [54]:
type(pokemon[1]) # pero dentro de esta serie cada valor es un string

str

In [55]:
list(pokemon) # convierte una Srie en una lista

['Bulbasaur',
 'Ivysaur',
 'Venusaur',
 'Charmander',
 'Charmeleon',
 'Charizard',
 'Squirtle',
 'Wartortle',
 'Blastoise',
 'Caterpie',
 'Metapod',
 'Butterfree',
 'Weedle',
 'Kakuna',
 'Beedrill',
 'Pidgey',
 'Pidgeotto',
 'Pidgeot',
 'Rattata',
 'Raticate',
 'Spearow',
 'Fearow',
 'Ekans',
 'Arbok',
 'Pikachu',
 'Raichu',
 'Sandshrew',
 'Sandslash',
 'Nidoran♀',
 'Nidorina',
 'Nidoqueen',
 'Nidoran♂',
 'Nidorino',
 'Nidoking',
 'Clefairy',
 'Clefable',
 'Vulpix',
 'Ninetales',
 'Jigglypuff',
 'Wigglytuff',
 'Zubat',
 'Golbat',
 'Oddish',
 'Gloom',
 'Vileplume',
 'Paras',
 'Parasect',
 'Venonat',
 'Venomoth',
 'Diglett',
 'Dugtrio',
 'Meowth',
 'Persian',
 'Psyduck',
 'Golduck',
 'Mankey',
 'Primeape',
 'Growlithe',
 'Arcanine',
 'Poliwag',
 'Poliwhirl',
 'Poliwrath',
 'Abra',
 'Kadabra',
 'Alakazam',
 'Machop',
 'Machoke',
 'Machamp',
 'Bellsprout',
 'Weepinbell',
 'Victreebel',
 'Tentacool',
 'Tentacruel',
 'Geodude',
 'Graveler',
 'Golem',
 'Ponyta',
 'Rapidash',
 'Slowpoke',
 'Sl

In [56]:
dict(pokemon) # convierte una Serie en un diccionario

{0: 'Bulbasaur',
 1: 'Ivysaur',
 2: 'Venusaur',
 3: 'Charmander',
 4: 'Charmeleon',
 5: 'Charizard',
 6: 'Squirtle',
 7: 'Wartortle',
 8: 'Blastoise',
 9: 'Caterpie',
 10: 'Metapod',
 11: 'Butterfree',
 12: 'Weedle',
 13: 'Kakuna',
 14: 'Beedrill',
 15: 'Pidgey',
 16: 'Pidgeotto',
 17: 'Pidgeot',
 18: 'Rattata',
 19: 'Raticate',
 20: 'Spearow',
 21: 'Fearow',
 22: 'Ekans',
 23: 'Arbok',
 24: 'Pikachu',
 25: 'Raichu',
 26: 'Sandshrew',
 27: 'Sandslash',
 28: 'Nidoran♀',
 29: 'Nidorina',
 30: 'Nidoqueen',
 31: 'Nidoran♂',
 32: 'Nidorino',
 33: 'Nidoking',
 34: 'Clefairy',
 35: 'Clefable',
 36: 'Vulpix',
 37: 'Ninetales',
 38: 'Jigglypuff',
 39: 'Wigglytuff',
 40: 'Zubat',
 41: 'Golbat',
 42: 'Oddish',
 43: 'Gloom',
 44: 'Vileplume',
 45: 'Paras',
 46: 'Parasect',
 47: 'Venonat',
 48: 'Venomoth',
 49: 'Diglett',
 50: 'Dugtrio',
 51: 'Meowth',
 52: 'Persian',
 53: 'Psyduck',
 54: 'Golduck',
 55: 'Mankey',
 56: 'Primeape',
 57: 'Growlithe',
 58: 'Arcanine',
 59: 'Poliwag',
 60: 'Poliwhirl',

In [57]:
sorted(pokemon) #convierte una Serie a una lista ordenada (como son strings, lo hace de manera alfabética)

['Abomasnow',
 'Abra',
 'Absol',
 'Accelgor',
 'Aegislash',
 'Aerodactyl',
 'Aggron',
 'Aipom',
 'Alakazam',
 'Alcremie',
 'Alomomola',
 'Altaria',
 'Amaura',
 'Ambipom',
 'Amoonguss',
 'Ampharos',
 'Annihilape',
 'Anorith',
 'Appletun',
 'Applin',
 'Araquanid',
 'Arbok',
 'Arboliva',
 'Arcanine',
 'Arceus',
 'Archen',
 'Archeops',
 'Arctibax',
 'Arctovish',
 'Arctozolt',
 'Ariados',
 'Armaldo',
 'Armarouge',
 'Aromatisse',
 'Aron',
 'Arrokuda',
 'Articuno',
 'Audino',
 'Aurorus',
 'Avalugg',
 'Axew',
 'Azelf',
 'Azumarill',
 'Azurill',
 'Bagon',
 'Baltoy',
 'Banette',
 'Barbaracle',
 'Barboach',
 'Barraskewda',
 'Basculegion',
 'Basculin',
 'Bastiodon',
 'Baxcalibur',
 'Bayleef',
 'Beartic',
 'Beautifly',
 'Beedrill',
 'Beheeyem',
 'Beldum',
 'Bellibolt',
 'Bellossom',
 'Bellsprout',
 'Bergmite',
 'Bewear',
 'Bibarel',
 'Bidoof',
 'Binacle',
 'Bisharp',
 'Blacephalon',
 'Blastoise',
 'Blaziken',
 'Blipbug',
 'Blissey',
 'Blitzle',
 'Boldore',
 'Boltund',
 'Bombirdier',
 'Bonsly',
 'Bo

In [58]:
sorted(google)

[2.47049,
 2.490664,
 2.509095,
 2.514326,
 2.51582,
 2.51582,
 2.530515,
 2.54795,
 2.553678,
 2.557912,
 2.613952,
 2.614201,
 2.622171,
 2.655795,
 2.676219,
 2.692408,
 2.753679,
 2.758411,
 2.770615,
 2.798012,
 2.849818,
 2.912832,
 2.92404,
 2.959906,
 2.977838,
 2.984065,
 3.012209,
 3.021176,
 3.155672,
 3.235373,
 3.257789,
 3.348449,
 3.353929,
 3.368624,
 3.410218,
 3.41221,
 3.425909,
 3.45505,
 3.512086,
 3.566631,
 3.56962,
 3.596519,
 3.60972,
 3.68693,
 3.74845,
 4.096396,
 4.183569,
 4.209721,
 4.211713,
 4.212461,
 4.240356,
 4.241352,
 4.242847,
 4.247579,
 4.250817,
 4.257293,
 4.259036,
 4.288177,
 4.319559,
 4.336247,
 4.354179,
 4.366135,
 4.378588,
 4.383569,
 4.393532,
 4.401004,
 4.402498,
 4.407231,
 4.411714,
 4.420929,
 4.432137,
 4.432635,
 4.433134,
 4.441602,
 4.453557,
 4.461527,
 4.465014,
 4.465014,
 4.480705,
 4.481951,
 4.481951,
 4.492162,
 4.494155,
 4.494404,
 4.499136,
 4.500631,
 4.50088,
 4.508352,
 4.509348,
 4.512586,
 4.525039,
 4.527032,


In [59]:
max(google) # regresa el valor máximo de toda la serie

151.863495

In [60]:
min(google) # regresa el valor mínimo de toda la serie

2.47049

In [61]:
max(pokemon)

'Zygarde'

## Operadores lógicos en Series

In [62]:
'Bulbasaur' in pokemon

False

In [63]:
'Bulbasaur' in pokemon.values

True

In [64]:
'Bulbasaur' in pokemon.index

False

## Más métodos en Series

In [55]:
google.sort_values() # regresa una serie con valores en orden

10        2.470490
0         2.490664
13        2.509095
11        2.514326
1         2.515820
           ...    
4341    150.000000
4336    150.000000
4346    150.141754
4345    151.000000
4395    151.863495
Name: Price, Length: 4793, dtype: float64

In [56]:
google.sort_values(ascending=True)

10        2.470490
0         2.490664
13        2.509095
11        2.514326
1         2.515820
           ...    
4341    150.000000
4336    150.000000
4346    150.141754
4345    151.000000
4395    151.863495
Name: Price, Length: 4793, dtype: float64

In [57]:
# Recordar que podemos tener en cadena varios métodos aplicados
google.sort_values(ascending=False).head(5)

4395    151.863495
4345    151.000000
4346    150.141754
4341    150.000000
4336    150.000000
Name: Price, dtype: float64

In [59]:
pokemon.sort_index() # ordena a la serie por su índice.

0          Bulbasaur
1            Ivysaur
2           Venusaur
3         Charmander
4         Charmeleon
            ...     
1005    Iron Valiant
1006        Koraidon
1007        Miraidon
1008    Walking Wake
1009     Iron Leaves
Name: Name, Length: 1010, dtype: object

In [60]:
pokemon.sort_index(ascending=False)

1009     Iron Leaves
1008    Walking Wake
1007        Miraidon
1006        Koraidon
1005    Iron Valiant
            ...     
4         Charmeleon
3         Charmander
2           Venusaur
1            Ivysaur
0          Bulbasaur
Name: Name, Length: 1010, dtype: object

## Extraer valores de una serie mediante un índice

* Podemos referenciar el valor único de la serie únicamente con su índice (como arrays o listas). **OJO** Esto va a dar problemas para DataFrames.
* Utilizando `iloc` (index location) para extraer un valor de una serie (junto con su índice).
* La sintáxis es la misma vista en listas y arrays.

In [61]:
pokemon[1]

'Ivysaur'

In [62]:
pokemon.iloc[1]

'Ivysaur'

In [63]:
pokemon.iloc[27:36]

27    Sandslash
28     Nidoran♀
29     Nidorina
30    Nidoqueen
31     Nidoran♂
32     Nidorino
33     Nidoking
34     Clefairy
35     Clefable
Name: Name, dtype: object

## Extraer valores de una serie por la etiqueta del índice 
* Para usar una etiqueta de un índice utilizamos `loc`

In [13]:
pokemon = pd.read_csv(filepath_or_buffer="../Datasets/pokemon.csv",
                      index_col=['Name']).squeeze("columns")
pokemon.head(5)

Name
Bulbasaur     Grass, Poison
Ivysaur       Grass, Poison
Venusaur      Grass, Poison
Charmander             Fire
Charmeleon             Fire
Name: Type, dtype: object

In [14]:
pokemon['Bulbasaur'] # usamos la etiqueta del índice

'Grass, Poison'

In [15]:
pokemon.iloc[0]

'Grass, Poison'

In [16]:
pokemon.loc[["Charizard", "Jolteon", "Meowth"]] # podemos extraer elementos particulares con loc

Name
Charizard    Fire, Flying
Jolteon          Electric
Meowth             Normal
Name: Type, dtype: object

In [17]:
pokemon.iloc[[5,134,51]] # podemos extraer elementos particulares con iloc

Name
Charizard    Fire, Flying
Jolteon          Electric
Meowth             Normal
Name: Type, dtype: object

In [18]:
pokemon.get("Moltres") # el método get también extrae un elemento por su etiqueta, pero presenta una alternativa
# cuando no encuentra un valor, en lugar de mostrar un error

'Fire, Flying'

In [19]:
pokemon.get("Agumon")

In [20]:
pokemon.get("Agumon", "No existe")

'No existe'

## Reescribir un valor en una serie

* Se utiliza el `loc/iloc`para localizar el valor, y se iguala a un nuevo valor

In [21]:
pokemon = pd.read_csv(filepath_or_buffer="../Datasets/pokemon.csv",
                      usecols=['Name']).squeeze("columns")
pokemon.head(5)

0     Bulbasaur
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Name, dtype: object

In [101]:
pokemon.iloc[0] = 'Pikachu'

In [102]:
pokemon.head(5)

0       Pikachu
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Name, dtype: object

## El método Copy

Las asignaciones en Python no copian objetos, crean enlaces entre un objetivo y un objeto. Para colecciones que son mutables o contienen elementos mutables, en algún momento se requiere una copia.

* El método `copy` duplica/replica un objeto.
* Cambios en una copia no mofifican el objeto original.

In [22]:
pokemon_df1 = pd.read_csv("../Datasets/pokemon.csv", usecols=["Name"]).squeeze('columns')
pokemon_df1

0          Bulbasaur
1            Ivysaur
2           Venusaur
3         Charmander
4         Charmeleon
            ...     
1005    Iron Valiant
1006        Koraidon
1007        Miraidon
1008    Walking Wake
1009     Iron Leaves
Name: Name, Length: 1010, dtype: object

In [23]:
# asignamos a otra variable
pokemon_df2 = pokemon_df1

In [24]:
pokemon_df2.iloc[0] = 'Agumon'

In [25]:
pokemon_df1.head(5) # ! Se modificó el archivo original

0        Agumon
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Name, dtype: object

In [112]:
pokemon_df2.head(5)

0        Agumon
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Name, dtype: object

In [115]:
pokemon_df1 = pd.read_csv("../Datasets/pokemon.csv", usecols=["Name"]).squeeze('columns')

pokemon_df2 = pokemon_df1.copy() # aplicamos método copy() en lugar de una asignación
pokemon_df2.iloc[0] = 'Agumon'

print(pokemon_df1.head(5))
print('--'*8)
print(pokemon_df2.head(5))

0     Bulbasaur
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Name, dtype: object
----------------
0        Agumon
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Name, dtype: object


## Métodos matemáticos aplicados en Series

In [117]:
google = pd.read_csv("../Datasets/google_stock_price.csv", usecols=["Price"]).squeeze("columns")
google.head(5)

0    2.490664
1    2.515820
2    2.758411
3    2.770615
4    2.614201
Name: Price, dtype: float64

In [119]:
google.count() # regresa el número de valores en la Serie, excluyendo valores nulos. 

4793

In [121]:
google.size # el atributo size si contempla valores nulos

4793

In [122]:
google.product() # regresa la multiplicacion de todos los valores en la serie

inf

In [123]:
google.mean() # regresa la media aritmetica de la serie

40.21137687001872

In [124]:
google.std() # desviación estándar

37.27475294386811

In [125]:
google.max() # valor máximo

151.863495

In [126]:
google.min() # valor mínimo

2.47049

In [127]:
google.median() # mediana

26.327717

In [128]:
google.mode() # moda

0    14.719826
1    49.000000
Name: Price, dtype: float64

In [129]:
google.describe() # crea una series (o dataframe) con un resumen de todas estos valores estadísticos

count    4793.000000
mean       40.211377
std        37.274753
min         2.470490
25%        12.767395
50%        26.327717
75%        56.311001
max       151.863495
Name: Price, dtype: float64

## Métodos de conteo en Series

In [132]:
pokemon_df = pd.read_csv("../Datasets/pokemon.csv", index_col=["Name"]).squeeze('columns')
pokemon_df.head(5)

Name
Bulbasaur     Grass, Poison
Ivysaur       Grass, Poison
Venusaur      Grass, Poison
Charmander             Fire
Charmeleon             Fire
Name: Type, dtype: object

In [134]:
pokemon_df.value_counts() # regresa el número de veces que cada valor único aparece u ocurre en una serie

Water               74
Normal              74
Grass               46
Psychic             39
Fire                36
                    ..
Fighting, Ice        1
Fire, Dragon         1
Normal, Dragon       1
Psychic, Steel       1
Fighting, Dragon     1
Name: Type, Length: 200, dtype: int64

In [135]:
pokemon_df.value_counts(normalize=True) # el argumento normalize permite devolver frecuencias/porcentajes.

Water               0.073267
Normal              0.073267
Grass               0.045545
Psychic             0.038614
Fire                0.035644
                      ...   
Fighting, Ice       0.000990
Fire, Dragon        0.000990
Normal, Dragon      0.000990
Psychic, Steel      0.000990
Fighting, Dragon    0.000990
Name: Type, Length: 200, dtype: float64

In [136]:
pokemon_df.value_counts(normalize=False) # el argumento normalize permite devolver frecuencias/porcentajes.

Water               74
Normal              74
Grass               46
Psychic             39
Fire                36
                    ..
Fighting, Ice        1
Fire, Dragon         1
Normal, Dragon       1
Psychic, Steel       1
Fighting, Dragon     1
Name: Type, Length: 200, dtype: int64

In [137]:
pokemon_df.value_counts(normalize=True,
                        ascending=True) # el argumento ascending te permite cambiar el orden de la serie resultante

Ice, Ghost          0.000990
Fire, Water         0.000990
Fighting, Flying    0.000990
Normal, Ground      0.000990
Dragon, Electric    0.000990
                      ...   
Fire                0.035644
Psychic             0.038614
Grass               0.045545
Normal              0.073267
Water               0.073267
Name: Type, Length: 200, dtype: float64

## Método apply

Es útilizado para utilizar una función y aplicarla a cada valor de la serie

In [139]:
pokemon_df = pd.read_csv("../Datasets/pokemon.csv", usecols=["Name"]).squeeze('columns')
pokemon_df.head(5)

0     Bulbasaur
1       Ivysaur
2      Venusaur
3    Charmander
4    Charmeleon
Name: Name, dtype: object

In [141]:
pokemon_df.apply(len) # se aplica a cada elemento (str por nombre de pokemon)

0        9
1        7
2        8
3       10
4       10
        ..
1005    12
1006     8
1007     8
1008    12
1009    11
Name: Name, Length: 1010, dtype: int64

In [142]:
# podemos utilizar una función personalizada
# ejemplo, una función que cuente las veces que aparece la letra 'b' en el string

def count_b(pokemon):
    return pokemon.count('b')

pokemon_df.apply(count_b)

0       1
1       0
2       0
3       0
4       0
       ..
1005    0
1006    0
1007    0
1008    0
1009    0
Name: Name, Length: 1010, dtype: int64

## Método map

* El método `map` es utilizado para contectar los valores de una serie con otro valor.
* Por ejemplo, utilizar diccionarios (que conectan claves con valores).

In [143]:
pokemon_df = pd.read_csv("../Datasets/pokemon.csv", index_col=["Name"]).squeeze('columns')
pokemon_df.head(5)

Name
Bulbasaur     Grass, Poison
Ivysaur       Grass, Poison
Venusaur      Grass, Poison
Charmander             Fire
Charmeleon             Fire
Name: Type, dtype: object

In [144]:
attack_powers = pd.Series({
    "Grass": 10,
    "Fire": 15,
    "Water": 15,
    "Fairy, Fighting": 20,
    "Grass, Psychic": 50
})

attack_powers

Grass              10
Fire               15
Water              15
Fairy, Fighting    20
Grass, Psychic     50
dtype: int64

In [146]:
pokemon_df.map(attack_powers) # utiliza los valores del diccionario y los sustituye en la serie (si es posible)

Name
Bulbasaur        NaN
Ivysaur          NaN
Venusaur         NaN
Charmander      15.0
Charmeleon      15.0
                ... 
Iron Valiant    20.0
Koraidon         NaN
Miraidon         NaN
Walking Wake     NaN
Iron Leaves     50.0
Name: Type, Length: 1010, dtype: float64