# Introducción a Pandas

> Pandas es una librería de Python escrita como extensión de NumPy para manipulación y análisis de datos.

Sitio oficial: [pandas.python.org](https://pandas.pydata.org/)
Documentación Oficial: [pandas.pydata.org/pandas-docs/stable/](https://pandas.pydata.org/pandas-docs/stable/)

In [1]:
import pandas as pd

## Series

Las Series son estructuras similares a los arrays de una dimensión. Son homogéneas, es decir, sus elementos tienen que ser del mismo tipo, y su tamaño es inmutable, es decir, no se puede cambiar, aunque si su contenido.

Disponen de un índice que asocia un nombre a cada elemento de la serie, a través de la cual se accede al elemento.

### Creación de una Serie a partir de una lista

`Series(data=lista, index=indices, dtype=tipo)`

Devuelve un objeto de tipo Series con los datos de la lista `lista`, las filas especificadas en la lista `indices` y el tipo de datos indicado en `tipo`. Si no incluímos la lista de índices se utilizan como índices los enteros del 0 al `n-1`, donde `n` es el tamaño de la serie. Si incluímos el tipo de dato, entonces este se infiere.

In [2]:
students = ['Mathew', 'Hallie', 'Jack', 'Alison', 'Victoria']
pd.Series(students)

0      Mathew
1      Hallie
2        Jack
3      Alison
4    Victoria
dtype: object

In [3]:
# Notemos que pandas automáticamente asignó el tipo de dato en la serie como "object" y configuró el parámetro dtype.
# También notemos que asigno valores a los índices, otorgándoles números enteros que inician en cero.
pd.Series(students, dtype='string')

0      Mathew
1      Hallie
2        Jack
3      Alison
4    Victoria
dtype: string

In [4]:
# Si creamos una serie a partir de una lista de números, veremos que pandas establece el tipo como 'int64'.
# Pandas almacena los valores de la serie en una matriz tipada utilizando la biblioteca Numpy.
# Esto nos brinda una aceleración significativa al procesar datos en comparación con las listas tradicionales de Python.
numbers = [1, 2, 3,]
pd.Series(numbers)

0    1
1    2
2    3
dtype: int64

### Creación de una Serie a partir de un diccionario

`Series(data=diccionario, index=indices)` 

Devuelve un objeto de tipo Series con los valores del diccionario `diccionario` y las filas especificados en la lista `indices`. Si no incluímos la lista de índices se utilizan como índices las claves del diccionario.

In [5]:
students_scores = {'Mathew': 'Physics', 
                   'Hallie': 'Chemistry', 
                   'Jack': 'English', 
                   'Alison': 'Math', 
                   'Victoria': 'History'}
s = pd.Series(students_scores)
print(s)

Mathew        Physics
Hallie      Chemistry
Jack          English
Alison           Math
Victoria      History
dtype: object


### Atributos de las Series

In [6]:
s.size  # Devuelve el número de elementos de la serie s.

5

In [7]:
s.index  # Devuelve una lista con los nombres de las filas del DataFrame s.

Index(['Mathew', 'Hallie', 'Jack', 'Alison', 'Victoria'], dtype='object')

In [8]:
s.dtype  # Devuelve el tipo de datos de los elementos de la serie s.

dtype('O')