# Librería **Pandas** 

###  Librería de Python especializada en la manipulación y análisis de datos. Utiliza Numpy como base. 

### Incorpora las estructuras **DataFrame** y **Series**.

Pandas permite la lectura y escritura de datos en varios formatos: csv, JSON, tablas SQL, y Excel. 

----------

## **Series:** 

Estructura (objeto) de una sola variable con indexación integrada. 

Secuencia de una dimensión, similar a un array 1D. Cada elemento tiene un índice asociado.  


In [1]:
import numpy as np
import pandas as pd

In [2]:
list_num = [1,2,3]
array_num = np.array([10,20,30])
letras = ['a','b','c']
d = {'a':10,'b':20,'c':30}

In [3]:
pd.Series(data=list_num)

0    1
1    2
2    3
dtype: int64

In [4]:
pd.Series(data=array_num, index=letras, dtype='float')

a    10.0
b    20.0
c    30.0
dtype: float64

In [5]:
pd.Series(array_num,letras)

a    10
b    20
c    30
dtype: int64

In [6]:
pd.Series(d)

a    10
b    20
c    30
dtype: int64

In [7]:
pd.Series(letras)

0    a
1    b
2    c
dtype: object

### atributos

In [8]:
s = pd.Series(data=array_num, index=letras, dtype='float')

In [9]:
s.size

3

In [10]:
s.index

Index(['a', 'b', 'c'], dtype='object')

In [11]:
s.dtype

dtype('float64')

In [12]:
s.count()
s.sum() 
s.cumsum()

a    10.0
b    30.0
c    60.0
dtype: float64

In [13]:
s.value_counts()

10.0    1
20.0    1
30.0    1
dtype: int64

In [14]:
s.value_counts(normalize=True)

10.0    0.333333
20.0    0.333333
30.0    0.333333
dtype: float64

In [15]:
s.min()
s.var() 
s.std() 
s.describe()

count     3.0
mean     20.0
std      10.0
min      10.0
25%      15.0
50%      20.0
75%      25.0
max      30.0
dtype: float64

In [16]:
s.sort_values(ascending=False)

c    30.0
b    20.0
a    10.0
dtype: float64

In [17]:
s.sort_index(ascending=False)

c    30.0
b    20.0
a    10.0
dtype: float64

## Indices

El índice de cada elemento puede ser cualquier etiqueta (numeros ordenados, desordenados, letras).

In [18]:
s1 = pd.Series([1,2,3,4], index = ['rojo', 'azul','blanco', 'negro'])                                   

In [None]:
s1

rojo      1
azul      2
blanco    3
negro     4
dtype: int64

In [19]:
s2 = pd.Series([5,3,2,1],index = [123, 'azul','GAMA', '18-12'])                                   

In [None]:
s2

123      5
azul     3
GAMA     2
18-12    1
dtype: int64

In [24]:
s2[123]
s2['18-12']

1

In [25]:
s2[[123, 'GAMA']]  

123     5
GAMA    2
dtype: int64

In [26]:
#s2[0]

In [27]:
s2.iloc[0] # extraccion del elemento por posición

5

In [28]:
s2.iloc[1:3]

azul    3
GAMA    2
dtype: int64

### Operaciones

In [34]:
s1

rojo      1
azul      2
blanco    3
negro     4
dtype: int64

In [35]:
s1*2

rojo      2
azul      4
blanco    6
negro     8
dtype: int64

In [36]:
s1**2 -5

rojo      -4
azul      -1
blanco     4
negro     11
dtype: int64

In [37]:
np.exp(s1)

rojo       2.718282
azul       7.389056
blanco    20.085537
negro     54.598150
dtype: float64

In [38]:
np.log10(s1)

rojo      0.000000
azul      0.301030
blanco    0.477121
negro     0.602060
dtype: float64

### Operaciones entre series

Se aplica la operación a los elementos con el mismo índice. Si alguna de las series no cuenta con uno de los índices, no puede realizar la operación y regresa NaN. 

In [39]:
s3 = s1 + s2
s3

123       NaN
18-12     NaN
GAMA      NaN
azul      5.0
blanco    NaN
negro     NaN
rojo      NaN
dtype: float64

In [40]:
s3.dropna() 

azul    5.0
dtype: float64

In [41]:
A = pd.Series([2, 4, 6], index=['a', 'b', 'c'])
B = pd.Series([1, 3, 5], index=['b', 'c', 'd'])
A + B

a    NaN
b    5.0
c    9.0
d    NaN
dtype: float64

In [42]:
A.add(B, fill_value=0)

a    2.0
b    5.0
c    9.0
d    5.0
dtype: float64

In [43]:
A.subtract(B, fill_value=10)

a   -8.0
b    3.0
c    3.0
d    5.0
dtype: float64

In [44]:
A.divide(B, fill_value=1)
A.multiply(B, fill_value=1)

a     2.0
b     4.0
c    18.0
d     5.0
dtype: float64

-------
## Ejercicio 1

i. Crear la serie A serie con: 
 - índices: letras del abecedario ordenadas (investigar función que genere la lista)  
 - valores: números enteros comenzando en 10, odenados de forma creciente y paso de 1 
 
ii. Crear la serie B serie con: 
 - índices: números enteros comenzando en 10, odenados de forma creciente y paso de 1  
 - valores: letras del abecedario con orden inverso (z, y, x, w ...)

iii. Seleccionar de cada una de las series los elementos con índice o valor entre d:i

-------

In [46]:
import string

In [54]:
alphabet = list(string.ascii_lowercase)
numbers = [i for i in range(10, 10+len(alphabet))]

In [55]:
alphabet

['a',
 'b',
 'c',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'j',
 'k',
 'l',
 'm',
 'n',
 'o',
 'p',
 'q',
 'r',
 's',
 't',
 'u',
 'v',
 'w',
 'x',
 'y',
 'z']

In [57]:
numbers

[10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 25,
 26,
 27,
 28,
 29,
 30,
 31,
 32,
 33,
 34,
 35]

In [61]:
A = pd.Series(numbers, index=alphabet)
A

a    10
b    11
c    12
d    13
e    14
f    15
g    16
h    17
i    18
j    19
k    20
l    21
m    22
n    23
o    24
p    25
q    26
r    27
s    28
t    29
u    30
v    31
w    32
x    33
y    34
z    35
dtype: int64

In [69]:
B = pd.Series(sorted(alphabet, reverse = True), index = numbers)

In [80]:
alphabet_reverse = sorted(alphabet, reverse = True)

In [70]:
B

10    z
11    y
12    x
13    w
14    v
15    u
16    t
17    s
18    r
19    q
20    p
21    o
22    n
23    m
24    l
25    k
26    j
27    i
28    h
29    g
30    f
31    e
32    d
33    c
34    b
35    a
dtype: object

In [86]:
d = alphabet.index('d')
i = alphabet.index('i') + 1

In [87]:
A[alphabet[d:i]]

d    13
e    14
f    15
g    16
h    17
i    18
dtype: int64

In [88]:
d = alphabet_reverse.index('d') + 1
i = alphabet_reverse.index('i')

In [97]:
B[i:d]

27    i
28    h
29    g
30    f
31    e
32    d
dtype: object

In [111]:
ipd = B.values

In [119]:
A['d':'i'] 

d    13
e    14
f    15
g    16
h    17
i    18
dtype: int64

In [121]:
for 

SyntaxError: ignored

TypeError: ignored