In [33]:
import pandas as pd

In [None]:
help(pd.Series.iloc)

Help on property:

    Purely integer-location based indexing for selection by position.
    
    ``.iloc[]`` is primarily integer position based (from ``0`` to
    ``length-1`` of the axis), but may also be used with a boolean
    array.
    
    Allowed inputs are:
    
    - An integer, e.g. ``5``.
    - A list or array of integers, e.g. ``[4, 3, 0]``.
    - A slice object with ints, e.g. ``1:7``.
    - A boolean array.
    - A ``callable`` function with one argument (the calling Series or
      DataFrame) and that returns valid output for indexing (one of the above).
      This is useful in method chains, when you don't have a reference to the
      calling object, but would like to base your selection on some value.
    - A tuple of row and column indexes. The tuple elements consist of one of the
      above inputs, e.g. ``(0, 1)``.
    
    ``.iloc`` will raise ``IndexError`` if a requested indexer is
    out-of-bounds, except *slice* indexers which allow out-of-bounds
    indexi

In [None]:
diccionario = [{'a': 2, 'b': 4, 'c': 9}, {'a': 6, 'b': 12, 'c': 19}]

In [None]:
df = pd.DataFrame(diccionario)
df

Unnamed: 0,a,b,c
0,2,4,9
1,6,12,19


SERIES


In [None]:
# Creamos una serie
serie = pd.Series([2, 6, -1 , 8, 9, 2.3], index= ['a', 'b', 'c', 'd', 'e', 'f'])
serie

a    2.0
b    6.0
c   -1.0
d    8.0
e    9.0
f    2.3
dtype: float64

In [None]:
# Borramos una serie
serie2 = serie.drop(['a', 'e'])
serie2

b    6.0
c   -1.0
d    8.0
f    2.3
dtype: float64

In [None]:
serie

a    2.0
b    6.0
c   -1.0
d    8.0
e    9.0
f    2.3
dtype: float64

In [None]:
# Seleccionar
serie[['b', 'a']]

b    6.0
a    2.0
dtype: float64

In [None]:
# Asignación
serie['b'] = 55
serie

a     2.0
b    55.0
c    -1.0
d     8.0
e     9.0
f     2.3
dtype: float64

In [None]:
# Filtros
# Valores menores a 4
serie[~(serie>4)]

a    2.0
c   -1.0
f    2.3
dtype: float64

In [None]:
serie[(serie<4)]

a    2.0
c   -1.0
f    2.3
dtype: float64

In [None]:
# Valor entre intervalos - alt gr + 1 |
serie[(serie < 0) | (serie > 4)]

b    55.0
c    -1.0
d     8.0
e     9.0
dtype: float64

In [None]:
# Valores nulos al unir series con diferentes indices
serie3 = pd.Series([7, 5, -4], index=['b', 'c', 'e'])
serie3

b    7
c    5
e   -4
dtype: int64

In [None]:
serie

a    2.0
b    6.0
c   -1.0
d    8.0
e    9.0
f    2.3
dtype: float64

In [None]:
serie4 = serie + serie3
serie4

a     NaN
b    13.0
c     4.0
d     NaN
e     5.0
f     NaN
dtype: float64

In [None]:
serie4 = serie3 + serie
serie4

a     NaN
b    13.0
c     4.0
d     NaN
e     5.0
f     NaN
dtype: float64

In [None]:
# Operaciones con metodos de relleno
serie.add(serie3,fill_value=0)

a     2.0
b    13.0
c     4.0
d     8.0
e     5.0
f     2.3
dtype: float64

In [None]:
# Opereaciones de resta
serie4 = serie.sub(serie3, fill_value=0)
serie4

a     2.0
b    -1.0
c    -6.0
d     8.0
e    13.0
f     2.3
dtype: float64

In [None]:
# Operaciones de multiplicación
serie4 = serie.mul(serie3, fill_value=0)
serie4

a     0.0
b    42.0
c    -5.0
d     0.0
e   -36.0
f     0.0
dtype: float64

In [None]:
# Operaciones de división
serie4 = serie.div(serie3, fill_value=0)
serie4

a         inf
b    0.857143
c   -0.200000
d         inf
e   -2.250000
f         inf
dtype: float64

### DATAFRAME

In [35]:
datos = {'Alumno':['Maria', 'Lucia', 'Jose', 'Eva'],
         'Nota': [8, 9, 6, 10]}
df= pd.DataFrame(datos, columns=['Alumno', 'Nota'])
df

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9
2,Jose,6
3,Eva,10


In [36]:
# Borrar columna
df.drop('Nota', axis=1)
df

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9
2,Jose,6
3,Eva,10


In [37]:
#Mostrar parte del Dataframe
df.head(2)

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9


In [43]:
# Mostrar un ejemplo del dataframe
df_ejemplo = df.sample(3)

In [41]:
# Ordenar el dataframe
df.sort_index()

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9
2,Jose,6
3,Eva,10


In [48]:
# Ordenamos el dataframe 
df_ejemplo.sort_index()

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9
2,Jose,6


In [49]:
# Ordenamos por la columna Nota
df.sort_values(by='Nota')

Unnamed: 0,Alumno,Nota
2,Jose,6
0,Maria,8
1,Lucia,9
3,Eva,10


In [50]:
# Ordenamos por la columna Alumno
df.sort_values(by='Alumno')

Unnamed: 0,Alumno,Nota
3,Eva,10
2,Jose,6
1,Lucia,9
0,Maria,8


In [52]:
# Asigna rango a las entradas
df.rank()
df

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9
2,Jose,6
3,Eva,10


In [53]:
# Grabar en csv

df.to_csv('misDatos.csv', index=False, columns = ['Alumno', 'Nota'])

In [56]:
# Leer Dataframe
mis_datos = pd.read_csv('misDatos.csv', header=None,nrows=2)
mis_datos.columns=['Alumno','Nota']
mis_datos

Unnamed: 0,Alumno,Nota
0,Alumno,Nota
1,Maria,8


In [57]:
mis_datos = pd.read_csv('misDatos.csv')
mis_datos.columns=['Alumno','Nota']
mis_datos

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9
2,Jose,6
3,Eva,10


In [58]:
# Grabar en un excel
df.to_excel('misDatos.xlsx',index=False, sheet_name='MiHoja')




In [59]:
# Leer un excel
mis_datos_excel = pd.read_excel('misDatos.xlsx')
mis_datos_excel

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9
2,Jose,6
3,Eva,10


### Seleccion

In [60]:
df

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9
2,Jose,6
3,Eva,10


In [61]:
# Seleccionamos desde el 2 hasta el final
df[2:]

Unnamed: 0,Alumno,Nota
2,Jose,6
3,Eva,10


In [62]:
# Seleccionamos hasta el 1
df [:1]

Unnamed: 0,Alumno,Nota
0,Maria,8


In [64]:
df[1:3]

Unnamed: 0,Alumno,Nota
1,Lucia,9
2,Jose,6


In [70]:
# Por posicion fila columna
df.iloc[[1],[1]]

Unnamed: 0,Nota
1,9


In [71]:
# Por etiqueta, fila por indice y columna por valor
df.loc[[1],['Nota']]

Unnamed: 0,Nota
1,9


In [73]:
# Por etiqueta, fila por indice y columna por valor
df.loc[[2],['Alumno']]

Unnamed: 0,Alumno
2,Jose


In [76]:
# Filtro
df_mayor9 = df[df['Nota']>8]
df_mayor9

Unnamed: 0,Alumno,Nota
1,Lucia,9
3,Eva,10


### Obtener información del DataFrame

In [77]:
# Nos da el número de filas y de columnas
df.shape

(4, 2)

In [78]:
# Nos informa del indice
df.index

RangeIndex(start=0, stop=4, step=1)

In [80]:
# Columnas
df.columns

Index(['Alumno', 'Nota'], dtype='object')

In [81]:
# Nos da información
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Alumno  4 non-null      object
 1   Nota    4 non-null      int64 
dtypes: int64(1), object(1)
memory usage: 192.0+ bytes


In [82]:
# Nos indica los valores no nulos
df.count()

Alumno    4
Nota      4
dtype: int64

In [83]:
# Suma de valores
df.sum()

Alumno    MariaLuciaJoseEva
Nota                     33
dtype: object

In [85]:
# Nos da la suma acumulada
df.cumsum()

Unnamed: 0,Alumno,Nota
0,Maria,8
1,MariaLucia,17
2,MariaLuciaJose,23
3,MariaLuciaJoseEva,33


In [86]:
# El minimo
df.min()

Alumno    Eva
Nota        6
dtype: object

In [87]:
# El máximo
df.max()

Alumno    Maria
Nota         10
dtype: object

In [88]:
# REsumen con estadisticas basicas
df.describe()


Unnamed: 0,Nota
count,4.0
mean,8.25
std,1.707825
min,6.0
25%,7.5
50%,8.5
75%,9.25
max,10.0


In [89]:
# Obtenemos la media
df.mean()

  df.mean()


Nota    8.25
dtype: float64

In [91]:
# Obtenemos la mediana
df.median()

  df.median()


Nota    8.5
dtype: float64

### Aplicando Funciones

In [92]:
# Multiplica por 2
multiplica_por_dos = lambda x: x*2

In [93]:
df

Unnamed: 0,Alumno,Nota
0,Maria,8
1,Lucia,9
2,Jose,6
3,Eva,10


In [95]:
df['Nota']=df['Nota'].apply(multiplica_por_dos)

In [96]:
df

Unnamed: 0,Alumno,Nota
0,Maria,16
1,Lucia,18
2,Jose,12
3,Eva,20


In [97]:
df['Nota'] = df['Nota'] + 25

In [98]:
cuadrado = lambda x : x**2

In [99]:
df['Nota']=df['Nota'].apply(cuadrado)

In [100]:
df

Unnamed: 0,Alumno,Nota
0,Maria,1681
1,Lucia,1849
2,Jose,1369
3,Eva,2025
