## Paquetes y Series

Una librería en Python es un conjunto de funciones y herramientas predefinidas que están diseñadas para realizar tareas específicas. Estas librerías están escritas en Python o en otros lenguajes y pueden ser utilizadas por los desarrolladores para facilitar la implementación de ciertas funcionalidades sin tener que escribir todo el código desde cero.

Por ejemplo, pandas es una librería en Python que proporciona estructuras de datos y herramientas de análisis de datos. Está diseñada para trabajar con datos tabulares y ofrece funcionalidades para la manipulación, limpieza, visualización y análisis de datos.

**En resumen, una librería en Python es un conjunto de funciones y herramientas que se pueden importar y utilizar en un programa para realizar tareas específicas de manera más eficiente.**

In [1]:
import pandas as pd

La serie es una estructura de datos unidimensional en donde cada dato tiene además una etiqueta.

In [2]:
sabores_helados = ["Chocolate" , "Fresa", "Vainilla", "Sambayon"]
sabores_helados

['Chocolate', 'Fresa', 'Vainilla', 'Sambayon']

Para crear una serie se usa el constructor pd.Series() que es capaz de convertir a serie distintas estructuras como listas,
diccionarios,etc.

In [3]:
pd.Series(sabores_helados) 

0    Chocolate
1        Fresa
2     Vainilla
3     Sambayon
dtype: object

In [4]:
loteria = [1,2,3,65,34,11]

pd.Series(loteria)

0     1
1     2
2     3
3    65
4    34
5    11
dtype: int64

In [5]:
registros = [True, False, True, True, False]

pd.Series(registros)

0     True
1    False
2     True
3     True
4    False
dtype: bool

## Atributos de una serie

In [6]:
prices = [ 2.99, 4.45, 1.36]
product = ["leche", "pan", "fideos"]

supermercado = pd.Series(data = prices, index = product )

supermercado

leche     2.99
pan       4.45
fideos    1.36
dtype: float64

In [7]:
supermercado.index

Index(['leche', 'pan', 'fideos'], dtype='object')

In [8]:
supermercado.values # Me muestra los valores de la serie

array([2.99, 4.45, 1.36])

In [9]:
supermercado.dtype

dtype('float64')

In [12]:
supermercado.shape

(3,)

In [11]:
supermercado.size

3

In [13]:
supermercado.ndim

1

La serie tiene, además, un atributo name, atributo que también encontramos en el índice. Una vez los hemos fijado, se muestran junto con la estructura al imprimir la serie

In [14]:
supermercado.name = "Mi lista de supermercado"
supermercado.head(4) 

leche     2.99
pan       4.45
fideos    1.36
Name: Mi lista de supermercado, dtype: float64

## Selección de registros

In [15]:
supermercado[0]

  supermercado[0]


2.99

In [16]:
supermercado[0:2]

leche    2.99
pan      4.45
Name: Mi lista de supermercado, dtype: float64

In [17]:
supermercado['leche']

2.99

In [18]:
supermercado.items

<bound method Series.items of leche     2.99
pan       4.45
fideos    1.36
Name: Mi lista de supermercado, dtype: float64>

## Fragmentos de comienzo a fin 
A nivel exploratorio, es bastante cómodo acceder a una porción inicial (o final) de los datos que manejamos. Esto se puede hacer de forma muy sencilla con series:

In [19]:
supermercado.head(3) #primeras 3 filas

leche     2.99
pan       4.45
fideos    1.36
Name: Mi lista de supermercado, dtype: float64

In [20]:
supermercado.tail(4) #últimas 4 filas 

leche     2.99
pan       4.45
fideos    1.36
Name: Mi lista de supermercado, dtype: float64

## Operaciones con series

**Operaciones logicas:**

In [21]:
supermercado > 2 

leche      True
pan        True
fideos    False
Name: Mi lista de supermercado, dtype: bool

In [22]:
supermercado[supermercado > 2]

leche    2.99
pan      4.45
Name: Mi lista de supermercado, dtype: float64

**Operaciones Aritméticas**:

Podemos operar entre series y escalares sin ningún tipo de problema:

In [23]:
supermercado/2

leche     1.495
pan       2.225
fideos    0.680
Name: Mi lista de supermercado, dtype: float64

In [24]:
descuentos = [0.15,0.18,0.02]

In [25]:
supermercado*descuentos

leche     0.4485
pan       0.8010
fideos    0.0272
Name: Mi lista de supermercado, dtype: float64

In [26]:
prueba_descuento = [0.15,0.18,0.02,0.1]

In [27]:
supermercado * prueba_descuento

ValueError: operands could not be broadcast together with shapes (3,) (4,) 

In [None]:
#ValueError: operands could not be broadcast together with shapes (3,) (4,) 

📢 Tener en cuenta que las operaciones se realizan entre registros que tienen el mismo índice (etiqueta)

## Ordenación

In [28]:
pokemon = pd.read_csv("pokemon.csv", 
                      usecols= ["Pokemon"])  

In [29]:
pokemon = pokemon.squeeze('columns')
# Squeeze es lo que transforma el dataset en una Serie
# Los DataFrames con una sola columna o una sola fila se comprimen en una Serie.

In [31]:
type(pokemon)
pokemon= pd.Series(sorted(pokemon))

In [32]:
pokemon.sort_index(inplace = True)
pokemon.head(7)

0     Abomasnow
1          Abra
2         Absol
3      Accelgor
4     Aegislash
5    Aerodactyl
6        Aggron
dtype: object

In [49]:
pokemon.sort_values(ascending= False,inplace= False)

720      Zygarde
719     Zweilous
718        Zubat
717        Zorua
716      Zoroark
         ...    
4      Aegislash
3       Accelgor
2          Absol
1           Abra
0      Abomasnow
Length: 721, dtype: object

## Contando valores

In [34]:
google = pd.read_csv("google_stock_price.csv")


In [35]:
google = google.squeeze('columns')

In [36]:
google.head()

0    50.12
1    54.10
2    54.65
3    52.38
4    52.95
Name: Stock Price, dtype: float64

In [37]:
google.value_counts()

Stock Price
291.21    5
307.94    3
289.71    3
243.26    3
194.80    3
         ..
195.05    1
193.26    1
185.42    1
172.83    1
782.22    1
Name: count, Length: 2886, dtype: int64

In [38]:
google.count() #devuelve el número de valores «no nulos» que contiene la serie

3012

In [39]:
google.shape  #hay nulos en la serie?

(3012,)

## Funciones estadisticas
Existen multitud de funciones estadísticas que podemos aplicar a una serie. Dependiendo del tipo de dato con el que estamos trabajando, serán más útiles unas que otras. Veamos  a modo de ejemplo:

In [40]:
google.mean()

334.3100929614874

In [41]:
google.median()

283.315

In [42]:
google.mode()

0    291.21
Name: Stock Price, dtype: float64

In [43]:
google.describe()

count    3012.000000
mean      334.310093
std       173.187205
min        49.950000
25%       218.045000
50%       283.315000
75%       443.000000
max       782.220000
Name: Stock Price, dtype: float64

## Máximos y mínimos

In [44]:
google.max()

782.22

In [45]:
google.argmin() #Posición (índice) del valor mínimo

11

In [46]:
google.nsmallest(3) # Obtener los n valores menores de una serie

11    49.95
9     50.07
0     50.12
Name: Stock Price, dtype: float64

## Exportación de series

In [47]:
google.to_list()

[50.12,
 54.1,
 54.65,
 52.38,
 52.95,
 53.9,
 53.02,
 50.95,
 51.13,
 50.07,
 50.7,
 49.95,
 50.74,
 51.1,
 51.1,
 52.61,
 53.7,
 55.69,
 55.94,
 56.93,
 58.69,
 59.62,
 58.86,
 59.13,
 60.35,
 59.86,
 59.07,
 63.37,
 65.47,
 64.74,
 66.22,
 67.46,
 69.12,
 68.47,
 69.36,
 68.8,
 67.56,
 68.63,
 70.38,
 70.93,
 71.98,
 74.51,
 73.9,
 70.17,
 74.62,
 86.13,
 93.61,
 90.81,
 92.89,
 96.55,
 95.22,
 97.92,
 97.34,
 95.74,
 92.26,
 84.59,
 86.19,
 84.27,
 83.85,
 91.42,
 90.91,
 92.34,
 86.19,
 86.16,
 83.69,
 84.62,
 82.47,
 83.68,
 87.29,
 89.61,
 90.43,
 90.9,
 89.89,
 89.61,
 90.11,
 88.06,
 85.63,
 84.91,
 86.63,
 85.74,
 85.14,
 89.26,
 89.8,
 88.15,
 89.95,
 92.42,
 91.78,
 93.06,
 93.86,
 95.86,
 96.28,
 96.35,
 98.7,
 96.3,
 101.25,
 97.15,
 96.66,
 94.18,
 96.83,
 97.43,
 96.67,
 97.59,
 97.57,
 99.89,
 101.85,
 98.55,
 96.86,
 94.05,
 90.27,
 88.47,
 94.53,
 93.95,
 95.07,
 97.71,
 95.85,
 102.88,
 105.32,
 102.08,
 97.92,
 99.22,
 95.69,
 93.9,
 93.61,
 96.4,
 97.52,
 99.11,
 

In [48]:
google.to_frame()

Unnamed: 0,Stock Price
0,50.12
1,54.10
2,54.65
3,52.38
4,52.95
...,...
3007,772.88
3008,771.07
3009,773.18
3010,771.61


[Pandas Documentación de Series](https://pandas.pydata.org/pandas-docs/stable/reference/series.html)