<a href="https://colab.research.google.com/github/marianobonelli/Introduccion_a_Python_2023/blob/main/Introduccion_a_Python_4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introducción a la programación y análisis de datos con Python orientado a la producción agropecuaria

[![Cronograma](https://img.shields.io/badge/-Cronograma-blue?style=flat&logo=google-docs&logoColor=white)](https://docs.google.com/document/d/1wDjkT1pYXirQgByWfcu82Szsbn8249sRxHX0E7leNog/edit?usp=sharing)
[![Canal de Discord](https://img.shields.io/badge/-Discord-blue?style=flat&logo=discord&logoColor=white)](https://discord.gg/WaA2uTp4)
[![Video de la clase](https://img.shields.io/badge/-Video%20de%20la%20clase-blue?style=flat&logo=youtube&logoColor=white)](https://)
[![Repositorio de GitHub](https://img.shields.io/badge/-Repositorio%20de%20GitHub-blue?style=flat&logo=github&logoColor=white)](https://github.com/marianobonelli/Introduccion_a_Python_2023)


---



**Clase 4: Miércoles 15 de noviembre**


Introducción a librerías - Parte I:

* Introducción a librerías y ejemplos.

* Importación y manejo de datos con pandas.

* Uso de matplotlib, seaborn y plotly para visualizar datos.


---

# Introducción a librerías y ejemplos

Una *librería* o *biblioteca* es un conjunto de funciones implementadas por otro programador que nos facilitan realizar tareas, principalmente porque no debemos volver a programar este código.

<img src="http://www.goalexandria.com/wp-content/uploads/2016/02/alt-lib.png" width=200px>

*¿Como usamos una librería?* Primero debemos importarla, para lo cual tenemos opciones. A continuación, se expone la sintaxis general junto con un ejemplo:

* Opción 1: importar una librería, sin alias.

  > **import** (nombre de la libreria)

  ```python
  import math

  ```

* Opción 2: importar una librería, con alias.

  > **import** (nombre de la libreria) **as** (nombre abreviado)

  ```python
  import pandas as pd

  ```

Las librerías muchas veces están separadas en distintos módulos. Podríamos decir que la librería es como un estante de libros, y en cada libro se encuentran las funciones de un tema en común, incluso un "libro" podría estar subdividido en "capítulos". Es decir, los distintos módulos de una librería podrían llegar a estar subdivididos en módulos, y cada módulo podría estar nuevamente subdividido.

Si lo que queremos son módulos o funciones particulares de una librería, podemos importar de a uno o más de diversas formas.

* Opción 1: importar un módulo o función, sin alias.

  > **from** (nombre de la libreria) **import** (nombre de un módulo)

  ```python
  from random import randint

  ```

* Opción 2: importar más de un módulo o función.

  > **from** (nombre de la libreria) **import** (nombre de un módulo), (nombre de otro módulo), ...

  ```python
  from random import randint, randrange

  ```

* Opción 3: importar un módulo o función, con un alias.

  > **from** (nombre de la libreria) **import** (nombre de un módulo) **as** (nombre abreviado)

  ```python
  from matplotlib import pyplot as plt

  ```

* Opción 4: importar un módulo o función, con un alias, otra forma.

  > **import** (nombre de la libreria)**.**(nombre de un módulo) **as** (nombre abreviado)

  ```python
  import matplotlib.pyplot as plt

  ```

* Opción 5: importar todos los módulos o funciones de una librería.

  > **from** (nombre de la librería) **import** * (todo)

  ```python
  from numpy import *

  ```

Una vez importada la librería, podremos utilizar las funciones y variables definidas en ella. La utilización de una función o variable dependerá de cómo hayamos realizado la importación. Ejemplos:

* Si se importó una librería o módulo:
  > (nombre de la libreria/módulo)**.**función*(argumentos)*

  > (nombre de la libreria/módulo)**.**(nombre de la variable)

  ```python
  import math

  print(math.sin(math.pi / 2))

  ```

* Si se importó una función o variable:
  > función(argumentos)

  > variable

  ```python
  from math import sin, pi

  print(sin(pi / 2))

  ```

* Si se importó una librería dividida en módulos:

  > (nombre de la libreria)**.**(nombre del módulo)**.**función*(argumentos)*

  ```python
  import matplotlib

  datos = [i for i in range(-10, 10)]
  print(matplotlib.pyplot.plot(datos, datos))

  ```


**Notas:**
- No es obligatorio especificar un nombre abreviado con **as**, puede utilizarse una librería con su nombre original omitiendo este comando.
- No sólo pueden importarse módulos de una librería, sino también funciones sueltas, según lo que necesiten. Siempre tengan cuidado de que los nombres de función sean únicos. Si importan una función directamente entonces no querrán definir su propia función con el mismo nombre.
- Es una buena práctica que todas las librerías se importen al principio del programa, o sea que las instrucciones de **import** se encuentren arriba de todo.


**Ejemplos:**

In [None]:
import math  # Importamos la libreria math

print('El seno de 0 es ', math.sin(0), 'y el coseno', math.cos(0))

In [None]:
from math import sin, cos  # Importamos directamente las funciones que usaremos

print('El seno de 0 es ', sin(0), 'y el coseno', cos(0))

In [None]:
import math as m  # Importamos la libreria math abreviada como m

print('El seno de 0 es ', m.sin(0), 'y el coseno', m.cos(0))

In [None]:
# En este caso usamos el módulo 'path' de la librería 'os' y lo apodamos 'pth'
from os import path as pth

print(pth.join('Carpeta','Archivo.rar'))

Si cierta librería no se encuentra instalada en el sistema, entonces el comando *import* para esa librería no funcionará. Usando la herramienta **pip** se pueden instalar librerías nuevas. En este ejemplo, al ejecutar el siguiente bloque de código se instalan las librerías *numpy* y *pandas* en el entorno de Google Colab.

In [None]:
! pip install numpy
! pip install scipy

# Importación y manejo de datos con pandas

[Pandas](https://pandas.pydata.org) es una librería muy popular en los últimos tiempos. Nos permite, entre otras cosas, sistematizar con unas pocas funciones la conversión de un archivo de información en los tipos de datos que Python maneja. En esta clase la utilizaremos para poder leer archivos con información en filas y columnas, tales como los formatos **excel** o **csv**.

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/e/ed/Pandas_logo.svg/1200px-Pandas_logo.svg.png" width=600px>

A continuación mostraremos un ejemplo donde se accede a la información de un archivo utilizando *pandas*. El archivo que leeremos se llama **california_housing_test.csv**, normalmente desde nuestra computadora podremos acceder a los archivos locales mediante su ubicación en el disco. Colab requiere cargar los archivos a su entorno antes de poder usarlos, este archivo es uno de los archivos de prueba que proporciona colab:

In [None]:
import pandas as pd

df = pd.read_csv("/content/sample_data/california_housing_test.csv")
# La variable archivo es de un tipo de dato especial de pandas llamado 'DataFrame'
df

## Exploración Básica de Datos

Antes de analizar los datos, es útil explorarlos para entender su estructura, tipo de datos, y estadísticas básicas. head(), tail(), info() y describe() son métodos útiles para esto.

In [None]:
df.head()

In [None]:
df.tail()

In [None]:
df.info()

In [None]:
df.describe()

## Selección y Filtrado de Datos

Pandas permite seleccionar columnas específicas y filtrar filas según ciertos criterios. Esto es fundamental para enfocar el análisis en datos relevantes.

In [None]:
# Selección de los valores de una columna

df['median_income']

In [None]:
print('Media: ', df['median_income'].mean())
print('Max: ', df['median_income'].max())
print('Min: ', df['median_income'].min())
print('Desvío: ', df['median_income'].std())

In [None]:
# Filtrado:

df_filtrado = df[df['median_income'] >= 3.5]
df_filtrado

## Guardar Datos Procesados

Después de procesar y analizar los datos, es común guardar el resultado. Pandas permite exportar los DataFrame a diferentes formatos, como CSV, Excel, entre otros.

In [None]:
df_filtrado.to_csv('datos_modificados.csv', index=False)

# **Maplotlib**
[Matplotlib](https://matplotlib.org/) (**Mat**-h **Plot** **Lib**rary)

<img src="https://www.machinelearningplus.com/wp-content/uploads/2018/11/23_DensityPlot_With_Histogram_Matplotlib-min.png" width=300px>

<img src="https://www.machinelearningplus.com/wp-content/uploads/2018/11/29_PyramidPlot_Matplotlib-min.png" width=300px>
<img src="https://www.machinelearningplus.com/wp-content/uploads/2018/11/36_TimeSeries_Peaks_Troughs_Matplotlib-min.png" width=300px>

##  Introducción a Matplotlib

Matplotlib es una librería de visualización de datos en Python que permite la creación de gráficos estáticos, animados e interactivos. Es muy flexible y se utiliza comúnmente para hacer gráficos y visualizaciones de datos de manera sencilla.

In [17]:
import matplotlib.pyplot as plt


## Creación de un Gráfico Simple


In [None]:
plt.plot([1, 2, 3, 4], [1, 4, 9, 16])
plt.show()

## Ejemplos de gráficos con el dataset de iris

In [None]:
import seaborn as sns
iris = sns.load_dataset('iris')
iris.head()

In [None]:
# Gráfico de Dispersión

plt.scatter(iris['sepal_length'], iris['sepal_width'])
plt.title('Gráfico de Dispersión del Largo y Ancho del Sépalo de Iris')
plt.xlabel('Largo del Sépalo (cm)')
plt.ylabel('Ancho del Sépalo (cm)')
plt.show()

In [None]:
# Histograma

plt.hist(iris['petal_length'], bins=20, color='green')
plt.title('Histograma del Largo del Pétalo de Iris')
plt.xlabel('Largo del Pétalo (cm)')
plt.ylabel('Frecuencia')
plt.show()

In [None]:
# Grafico de barras

promedio_petal_length = iris.groupby('species')['petal_length'].mean()
promedio_petal_length.plot(kind='bar', color=['red', 'blue', 'green'])
plt.title('Promedio del Largo del Pétalo por Especie')
plt.xlabel('Especie')
plt.ylabel('Promedio del Largo del Pétalo (cm)')
plt.show()