# Introducción a Numpy y Pandas

*Numpy* es una librería de python especializada en operaciones númericas con matrices o arreglos multidimensionales.

*Pandas* es una librería de python especializada en el manejo de datos organizados en tablas así como el procesamiento especializado para cálculos estadísticos y matemáticos.

## Numpy

La unidad básica de trabajo en Numpy son los *array*.

In [1]:
# Importar numpy
import numpy as np

In [2]:
# Creando arreglos
#1D
a = np.array([1, 2, 3, 4, 5, 6])

#2D
b = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])


In [3]:
# Visualizarlos
print("Arreglo 1D:\n", a)
print("Arreglo 2D:\n ", b)

Arreglo 1D:
 [1 2 3 4 5 6]
Arreglo 2D:
  [[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]


In [4]:
# Tamaño de arreglos
print(a.ndim)
print(a.size)
print(a.shape)
# ¿Qué crees que signifique cada uno de los resultados que obtuviste?
# ¿Pueden obtener la misma información con el arreglo 2D?

1
6
(6,)


In [5]:
# Tamaño de arreglos
print(b.ndim)
print(b.size)
print(b.shape)

2
12
(3, 4)


In [6]:
# Accesando a datos individuales
print(b[0])
# Obtenemos la primer línea

[1 2 3 4]


In [7]:
# Accesando a datos individuales
print(b[0,0])
#Obtenemos el primer elemento de la primer línea

1


In [10]:
print(b[:,2])

[ 3  7 11]


In [11]:
print(b[2,:])

[ 9 10 11 12]


In [8]:
# Operaciones básicas
# Suma
a1 = np.array([[1,2],[3,4]])
a2 = np.array([[5,0],[8,-3]])
a3 = a1+a2
print(a3)

[[ 6  2]
 [11  1]]


In [12]:
# Multiplicación por escalares
a4 = a1*5
print(a4)

[[ 5 10]
 [15 20]]


In [13]:
# Operaciones adicionales
print(a1.max())
print(a1.min())
print(a1.sum())

4
1
10


In [14]:
# ¿Qué obtenemos con estas operaciones? ¿Que quiere decir el parametros axis?
print(a)
print(a1.max(axis=0))
print(a1.min(axis=0))
print(a1.sum(axis=0))

[3 4]
[1 2]
[4 6]


In [15]:
# ¿Qué obtenemos con estas operaciones? ¿Que quiere decir el parametros axis?
print(a1.max(axis=1))
print(a1.min(axis=1))
print(a1.sum(axis=1))

[2 4]
[1 3]
[3 7]


## Pandas

Una de las librerías que nos permite realizar fácilmente tareas de estadística es Pandas.

In [None]:
# Importamos las librerías que ocuparemos en este ejercicio
import pandas as pd

## Lectura de datos con Pandas

In [None]:
# Si estas usando google colab ejecutar esto
from google.colab import files
uploaded = files.upload()

In [None]:
# Lectura de datos con google colab
import io
df = pd.read_csv(io.BytesIO(uploaded['resultados_futbol.csv']))

In [None]:
# Lectura de datos
df = pd.read_csv('resultados_futbol.csv')

In [None]:
df

In [None]:
# Analisis descriptivo de los datos
df.describe()

In [None]:
# visualización
df.head(10)

In [None]:
# Visualización
df.tail()

In [None]:
# Filtrado de filas
#df2 = df[df['home_team'] == 'Mexico']
df2 = df[(df['home_team'] == 'Mexico') | (df['away_team'] == 'Mexico')]
#df2 = df[df.home_team == 'Mexico']
df2.head()

In [None]:
# Seleccionar columnas
df2 = df[['home_team', 'home_score']]
df2.head()

## Retos

### Reto 1
1. ¿Cuántos partidos ha jugado México como  local? ¿Cuántos como visitantes?
2. ¿Cuál es el promedio de goles de México como visitante?
3. ¿Cuál es el promedio de goles de México como local?
4. ¿Cuál es el mayor número de goles anotados por México en partidos como local??
4. ¿Cuál es el mayor número de goles anotados por México en partidos como visitante?

In [None]:
# Espacio para tu programa
df_mx_local = df[df.home_team == 'Mexico']
df_mx_local.shape

In [None]:
df_mx_vis = df[df.away_team == 'Mexico']
df_mx_vis.shape

In [None]:
# Pregunta 3
df_mx_local.home_score.mean()

In [None]:
# Pregunta 4
print(df_mx_local.home_score.max())
print(df_mx_local.away_score.max())

In [None]:
print(df_mx_local.away_score.max())

In [None]:
df_mx_local[df_mx_local.away_score==7]

In [None]:
df[df.away_score==21]

### Reto 2
Calcula el histograma de goles anotados por México como visitante.

In [None]:
# Creación histograma
df_mx_vis.away_score.hist(bins=20)