# Librería **Pandas** 

###  Librería de Python especializada en la manipulación y análisis de datos. Utiliza Numpy como base. 

### Incorpora las estructuras **DataFrame** y **Series**.

Pandas permite la lectura y escritura de datos en varios formatos: csv, JSON, tablas SQL, y Excel. 

----------

## **Series:** 

Estructura (objeto) de una sola variable con indexación integrada. 

Secuencia de una dimensión, similar a un array 1D. Cada elemento tiene un índice asociado.  


In [1]:
import numpy as np
import pandas as pd

In [2]:
list_num = [1,2,3]
array_num = np.array([10,20,30])
letras = ['a','b','c']
d = {'a':10,'b':20,'c':30}

In [3]:
pd.Series(data=list_num)

0    1
1    2
2    3
dtype: int64

In [4]:
pd.Series(data=array_num, index=letras, dtype='float')

a    10.0
b    20.0
c    30.0
dtype: float64

In [5]:
pd.Series(array_num,letras)

a    10
b    20
c    30
dtype: int64

In [6]:
pd.Series(d)

a    10
b    20
c    30
dtype: int64

In [7]:
pd.Series(letras)

0    a
1    b
2    c
dtype: object

### atributos

In [8]:
s = pd.Series(data=array_num, index=letras, dtype='float')

In [9]:
s.size

3

In [10]:
s.index

Index(['a', 'b', 'c'], dtype='object')

In [11]:
s.dtype

dtype('float64')

In [12]:
s.count()
s.sum() 
s.cumsum()

a    10.0
b    30.0
c    60.0
dtype: float64

In [13]:
s.value_counts()

10.0    1
20.0    1
30.0    1
dtype: int64

In [14]:
s.value_counts(normalize=True)

10.0    0.333333
20.0    0.333333
30.0    0.333333
dtype: float64

In [15]:
s.min()
s.var() 
s.std() 
s.describe()

count     3.0
mean     20.0
std      10.0
min      10.0
25%      15.0
50%      20.0
75%      25.0
max      30.0
dtype: float64

In [16]:
s.sort_values(ascending=False)

c    30.0
b    20.0
a    10.0
dtype: float64

In [17]:
s.sort_index(ascending=False)

c    30.0
b    20.0
a    10.0
dtype: float64

## Indices

El índice de cada elemento puede ser cualquier etiqueta (numeros ordenados, desordenados, letras).

In [18]:
s1 = pd.Series([1,2,3,4], index = ['rojo', 'azul','blanco', 'negro'])                                   

In [19]:
s1

rojo      1
azul      2
blanco    3
negro     4
dtype: int64

In [20]:
s2 = pd.Series([5,3,2,1],index = [123, 'azul','GAMA', '18-12'])                                   

In [21]:
s2

123      5
azul     3
GAMA     2
18-12    1
dtype: int64

In [22]:
s2[123]
s2['18-12']

1

In [23]:
s2[[123, 'GAMA']]  

123     5
GAMA    2
dtype: int64

In [24]:
#s2[0]

In [25]:
s2.iloc[0] # extraccion del elemento por posición

5

In [26]:
s2.iloc[1:3]

azul    3
GAMA    2
dtype: int64

### Operaciones

In [27]:
s1

rojo      1
azul      2
blanco    3
negro     4
dtype: int64

In [28]:
s1*2

rojo      2
azul      4
blanco    6
negro     8
dtype: int64

In [29]:
s1**2 -5

rojo      -4
azul      -1
blanco     4
negro     11
dtype: int64

In [30]:
np.exp(s1)

rojo       2.718282
azul       7.389056
blanco    20.085537
negro     54.598150
dtype: float64

In [31]:
np.log10(s1)

rojo      0.000000
azul      0.301030
blanco    0.477121
negro     0.602060
dtype: float64

### Operaciones entre series

Se aplica la operación a los elementos con el mismo índice. Si alguna de las series no cuenta con uno de los índices, no puede realizar la operación y regresa NaN. 

In [32]:
s3 = s1 + s2
s3

123       NaN
18-12     NaN
GAMA      NaN
azul      5.0
blanco    NaN
negro     NaN
rojo      NaN
dtype: float64

In [33]:
s3.dropna() 

azul    5.0
dtype: float64

In [34]:
A = pd.Series([2, 4, 6], index=['a', 'b', 'c'])
B = pd.Series([1, 3, 5], index=['b', 'c', 'd'])
A + B

a    NaN
b    5.0
c    9.0
d    NaN
dtype: float64

In [35]:
A.add(B, fill_value=0)

a    2.0
b    5.0
c    9.0
d    5.0
dtype: float64

In [36]:
A.subtract(B, fill_value=10)

a   -8.0
b    3.0
c    3.0
d    5.0
dtype: float64

In [37]:
A.divide(B, fill_value=1)
A.multiply(B, fill_value=1)

a     2.0
b     4.0
c    18.0
d     5.0
dtype: float64

-------
## Ejercicio 1

i. Crear la serie A serie con: 
 - índices: letras del abecedario ordenadas (investigar función que genere la lista)  
 - valores: números enteros comenzando en 10, odenados de forma creciente y paso de 1 
 
ii. Crear la serie B serie con: 
 - índices: números enteros comenzando en 10, odenados de forma creciente y paso de 1  
 - valores: letras del abecedario con orden inverso (z, y, x, w ...)

iii. Seleccionar de cada una de las series los elementos con índice o valor entre d:i

-------