<a href="https://colab.research.google.com/github/marianobonelli/Introduccion_a_Python_2024/blob/main/Introduccion_a_Python_2024_4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introducción a la programación y análisis de datos con Python orientado a la producción agropecuaria

[![Cronograma](https://img.shields.io/badge/-Cronograma-blue?style=flat&logo=google-docs&logoColor=white)](https://docs.google.com/document/d/1RkiQrAyWAuJglmTdKCfa4QQ4JYHh0Klg6iRRzxSv8cc/edit?usp=sharing) [![Repositorio de GitHub](https://img.shields.io/badge/-Repositorio%20de%20GitHub-blue?style=flat&logo=github&logoColor=white)](https://github.com/marianobonelli/Introduccion_a_Python_2024) [![Video de la clase](https://img.shields.io/badge/-Video%20de%20la%20clase-blue?style=flat&logo=youtube&logoColor=white)](https://youtu.be/V862Qnol488)
---


**Clase 4: Jueves 29 de agosto**


Introducción a librerías - Parte I:

* Introducción a librerías y ejemplos.

* Importación y manejo de datos con requests y pandas.


---

# Introducción a librerías y ejemplos

Una *librería* o *biblioteca* es un conjunto de funciones implementadas por otro programador que nos facilitan realizar tareas, principalmente porque no debemos volver a programar este código.

<img src="http://www.goalexandria.com/wp-content/uploads/2016/02/alt-lib.png" width=200px>

*¿Como usamos una librería?* Primero debemos importarla, para lo cual tenemos opciones. A continuación, se expone la sintaxis general junto con un ejemplo:

* Opción 1: importar una librería, sin alias.

  > **import** (nombre de la libreria)

  ```python
  import math

  ```

* Opción 2: importar una librería, con alias.

  > **import** (nombre de la libreria) **as** (nombre abreviado)

  ```python
  import pandas as pd

  ```

Las librerías muchas veces están separadas en distintos módulos. Podríamos decir que la librería es como un estante de libros, y en cada libro se encuentran las funciones de un tema en común, incluso un "libro" podría estar subdividido en "capítulos". Es decir, los distintos módulos de una librería podrían llegar a estar subdivididos en módulos, y cada módulo podría estar nuevamente subdividido.

Si lo que queremos son módulos o funciones particulares de una librería, podemos importar de a uno o más de diversas formas.

* Opción 1: importar un módulo o función, sin alias.

  > **from** (nombre de la libreria) **import** (nombre de un módulo)

  ```python
  from random import randint

  ```

* Opción 2: importar más de un módulo o función.

  > **from** (nombre de la libreria) **import** (nombre de un módulo), (nombre de otro módulo), ...

  ```python
  from random import randint, randrange

  ```

* Opción 3: importar un módulo o función, con un alias.

  > **from** (nombre de la libreria) **import** (nombre de un módulo) **as** (nombre abreviado)

  ```python
  from matplotlib import pyplot as plt

  ```

* Opción 4: importar un módulo o función, con un alias, otra forma.

  > **import** (nombre de la libreria)**.**(nombre de un módulo) **as** (nombre abreviado)

  ```python
  import matplotlib.pyplot as plt

  ```

* Opción 5: importar todos los módulos o funciones de una librería.

  > **from** (nombre de la librería) **import** * (todo)

  ```python
  from numpy import *

  ```

Una vez importada la librería, podremos utilizar las funciones y variables definidas en ella. La utilización de una función o variable dependerá de cómo hayamos realizado la importación. Ejemplos:

* Si se importó una librería o módulo:
  > (nombre de la libreria/módulo)**.**función*(argumentos)*

  > (nombre de la libreria/módulo)**.**(nombre de la variable)

  ```python
  import math

  print(math.sin(math.pi / 2))

  ```

* Si se importó una función o variable:
  > función(argumentos)

  > variable

  ```python
  from math import sin, pi

  print(sin(pi / 2))

  ```

* Si se importó una librería dividida en módulos:

  > (nombre de la libreria)**.**(nombre del módulo)**.**función*(argumentos)*

  ```python
  import matplotlib

  datos = [i for i in range(-10, 10)]
  print(matplotlib.pyplot.plot(datos, datos))

  ```


**Notas:**
- No es obligatorio especificar un nombre abreviado con **as**, puede utilizarse una librería con su nombre original omitiendo este comando.
- No sólo pueden importarse módulos de una librería, sino también funciones sueltas, según lo que necesiten. Siempre tengan cuidado de que los nombres de función sean únicos. Si importan una función directamente entonces no querrán definir su propia función con el mismo nombre.
- Es una buena práctica que todas las librerías se importen al principio del programa, o sea que las instrucciones de **import** se encuentren arriba de todo.


**Ejemplos:**

In [None]:
import math  # Importamos la libreria math

print('El seno de 0 es ', math.sin(0), 'y el coseno', math.cos(0))

In [None]:
from math import sin, cos  # Importamos directamente las funciones que usaremos

print('El seno de 0 es ', sin(0), 'y el coseno', cos(0))

In [None]:
import math as m  # Importamos la libreria math abreviada como m

print('El seno de 0 es ', m.sin(0), 'y el coseno', m.cos(0))

Si cierta librería no se encuentra instalada en el sistema, entonces el comando *import* para esa librería no funcionará. Usando la herramienta **pip** se pueden instalar librerías nuevas. En este ejemplo, al ejecutar el siguiente bloque de código se instalan las librerías *numpy* y *pandas* en el entorno de Google Colab.

In [None]:
! pip install numpy
! pip install scipy

# Importación y manejo de datos con pandas

Importemos primero algunos archivos con el comando !wget

wget es una herramienta de línea de comandos que se utiliza para descargar archivos desde la web. En Google Colab, se puede usar directamente con el signo de exclamación (!) al principio del comando.

Cómo funciona wget

wget toma una URL como argumento y descarga el contenido del archivo en la ubicación especificada.
Puedes usar la opción -O para nombrar el archivo descargado.

In [None]:
# Descargar los archivos usando wget
!wget https://raw.githubusercontent.com/marianobonelli/Introduccion_a_Python_2024/main/assets/series-historicas-pizarra.csv -O series-historicas-pizarra.csv
!wget https://raw.githubusercontent.com/marianobonelli/Introduccion_a_Python_2024/main/assets/A872824.xls -O A872824.xls
!wget https://raw.githubusercontent.com/marianobonelli/Introduccion_a_Python_2024/main/assets/app.csv -O app.csv



---



[Pandas](https://pandas.pydata.org) es una librería muy popular en los últimos tiempos. Nos permite, entre otras cosas, sistematizar con unas pocas funciones la conversión de un archivo de información en los tipos de datos que Python maneja. En esta clase la utilizaremos para poder leer archivos con información en filas y columnas, tales como los formatos **excel** o **csv**.

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/e/ed/Pandas_logo.svg/1200px-Pandas_logo.svg.png" width=600px>

A continuación mostraremos un ejemplo donde se accede a la información de un archivo utilizando *pandas*. El archivo que leeremos se llama **california_housing_test.csv**, normalmente desde nuestra computadora podremos acceder a los archivos locales mediante su ubicación en el disco. Colab requiere cargar los archivos a su entorno antes de poder usarlos, este archivo es uno de los archivos de prueba que proporciona colab:

In [None]:
import pandas as pd

## Formas de leer datos con Pandas

In [None]:
# Lee un archivo CSV y lo carga en un DataFrame.
df = pd.read_csv("app.csv")

In [None]:
# leer el csv, determinar el separador y eliminar las primeras 4 filas

df = pd.read_csv("archivo.csv", # ruta al archivo
                 sep=",", # Aca podemos configurar el separador
                 skiprows=4 # Aca podemos eliminar los primeros renglones a la hora de armar el df
                 )

In [None]:
# Lee un archivo Excel (.xlsx, .xls) y lo carga en un DataFrame.
df = pd.read_excel()

In [None]:
# Lee un csv a partir de una url
url = 'https://raw.githubusercontent.com/marianobonelli/Introduccion_a_Python_2024/main/assets/app.csv'
df = pd.read_csv(url)

## Exploración Básica de Datos

Antes de analizar los datos, es útil explorarlos para entender su estructura, tipo de datos, y estadísticas básicas. head(), tail(), info() y describe() son métodos útiles para esto.

Muestra las primeras 5 filas de un DataFrame.

In [None]:
df.head()

Muestra las últimas 5 filas de un DataFrame.

In [None]:
df.tail()

 Muestra un resumen de la información del DataFrame, incluyendo el tipo de datos y el uso de memoria.








In [None]:
df.info()

 Muestra estadísticas descriptivas del DataFrame para columnas numéricas.


In [None]:
df.describe()

 Muestra el conteo de valores nulos en cada columna del DataFrame.


In [None]:
df.isnull().sum()

Merge : Combina dos DataFrames en uno solo

In [None]:
df_a = pd.read_csv("app.csv")
df_b = pd.read_csv("app.csv")

df_c = pd.merge(df_a, df_b)
df_c

Rename : Cambia el nombre de las columnas especificadas en el diccionario.

In [None]:
df.rename(columns={'columna_antigua1': 'columna_nueva1', 'columna_antigua2': 'columna_nueva2'})

Drop : Elimina las columnas especificadas

In [None]:
df.drop(columns=['columna1', 'columna2'])

Valores nulos:

.isna(): Este método devuelve un DataFrame del mismo tamaño que df, donde cada celda contiene True si el valor es faltante (NA o NaN) y False si no lo es.

.sum(): Cuando aplicas .sum() a este DataFrame de valores booleanos, pandas suma los True (que se cuentan como 1) en cada columna. El resultado es una Serie que muestra el conteo de valores NA en cada columna del DataFrame original.

In [None]:
df.isna()

In [None]:
df.isna().sum()

In [None]:
df.isna().sum().sum()

Dropna : Se utiliza para eliminar filas con valores nulos (NaN) en un DataFrame de pandas. dropna()

In [None]:
df.dropna()

Si deseas eliminar columnas con valores nulos en lugar de filas, puedes usar:

In [None]:
df.dropna(axis=1)

Fillna : se utiliza para reemplazar los valores nulos (NaN) se puede utilizar el método fillna(), especificando el valor.

In [None]:
df.fillna(0)

Ordenar df a partir de una columna

In [None]:
df.sort_values(by='columna')

## Selección y Filtrado de Datos

Pandas permite seleccionar columnas específicas y filtrar filas según ciertos criterios. Esto es fundamental para enfocar el análisis en datos relevantes.

In [None]:
# Selección de los valores de una columna

df['Velocidad_']

In [None]:
print('Media: ', df['Velocidad_'].mean())
print('Max: ', df['Velocidad_'].max())
print('Min: ', df['Velocidad_'].min())
print('Desvío: ', df['Velocidad_'].std())

In [None]:
# Filtrado:
# Seleccionar los valores del df donde los valores de esta columna son x

df_filtrado = df[df['Velocidad_'] >= 3.5]
df_filtrado

## Guardar Datos Procesados

Después de procesar y analizar los datos, es común guardar el resultado. Pandas permite exportar los DataFrame a diferentes formatos, como CSV, Excel, entre otros.

In [None]:
df_filtrado.to_csv('datos_modificados.csv', index=False)

# Introducción a **requests**


[requests](https://requests.readthedocs.io/en/latest/user/quickstart/#make-a-request) es una librería de Python que facilita hacer solicitudes HTTP de manera sencilla y eficiente. Permite interactuar con APIs y descargar datos de la web.

<img src="https://requests.readthedocs.io/en/latest/_static/requests-sidebar.png" width=300px>

### Qué es una API?


Una API (Application Programming Interface, o Interfaz de Programación de Aplicaciones) es un conjunto de definiciones y protocolos que permite a diferentes aplicaciones comunicarse entre sí. Las APIs permiten que los desarrolladores utilicen las funcionalidades de un software o servicio sin tener que conocer cómo está implementado internamente.

¿Cómo funcionan las APIs?
Intermediario: Actúan como intermediarios entre dos sistemas, permitiendo que un programa solicite datos o realice acciones en otro programa.
Estandarización: Las APIs definen un conjunto de reglas sobre cómo una aplicación puede interactuar con otra, proporcionando métodos y rutas específicas para acceder a datos y servicios.
Ejemplos comunes: APIs de redes sociales (Facebook, Twitter), APIs de pagos (PayPal, Stripe), APIs de datos climáticos (NASA, OpenWeather), entre muchas otras.
Ejemplo práctico
Un ejemplo clásico es cuando una app de clima utiliza la API de un servicio meteorológico para obtener y mostrar el pronóstico del tiempo. La app envía una solicitud a la API con la ubicación del usuario, y la API devuelve la información del clima.

Las APIs son esenciales para integrar servicios, automatizar procesos y crear aplicaciones modernas que puedan interactuar con múltiples fuentes de datos y funcionalidades.

In [None]:
import requests

# Haciendo una solicitud GET
response = requests.get('https://dolarapi.com/v1/dolares/tarjeta')

# Imprimiendo el contenido de la respuesta
print(response.text)

Una Response en la librería requests de Python contiene varios componentes útiles que permiten manejar y analizar la respuesta de una solicitud HTTP. Aquí tienes los componentes más importantes:

## Componentes de una response
**status_code**: El código de estado HTTP que indica si la solicitud fue exitosa o si hubo algún error (200 para éxito, 404 para no encontrado, etc.).

In [None]:
print(response.status_code)

In [None]:
# Verificar si la solicitud fue exitosa
if response.status_code == 200:
  print('Solicitud exitosa')
else:
  print('Hubo un problema con la solicitud')

**text**: El contenido de la respuesta como una cadena de texto (en formato HTML, JSON, etc.).



In [None]:
print(response.text)

**content**: El contenido de la respuesta en bytes, útil para trabajar con datos binarios como imágenes o archivos.

In [None]:
print(response.content)

**json()**: Si la respuesta está en formato JSON, puedes convertirla directamente a un diccionario de Python usando este método.

In [None]:
data = response.json()
print(data)

**headers**: Un diccionario que contiene los encabezados de la respuesta, como el tipo de contenido, la longitud, y más.

In [None]:
print(response.headers)

**url**: La URL final de la solicitud, que puede diferir de la original si hubo redirecciones.

Recomendamos tener instalado en el navegador la extensión: [JSON formatter](https://chromewebstore.google.com/detail/bcjindcccaagfpapjjmafapmmgkkhgoa)

In [None]:
print(response.url)

**encoding**: La codificación de caracteres de la respuesta (por defecto, intenta detectar la codificación basada en los encabezados de la respuesta).

In [None]:
print(response.encoding)

**cookies**: Las cookies enviadas por el servidor en la respuesta, representadas como un objeto de tipo RequestsCookieJar.

In [None]:
print(response.cookies)

**elapsed**: Tiempo que tomó la solicitud en completarse, representado como un objeto timedelta.

In [None]:
print(response.elapsed)

**history**: Lista de respuestas previas si hubo redirecciones. Cada elemento es una Response anterior.

In [None]:
print(response.history)

**reason**: Explicación en texto del código de estado HTTP (por ejemplo, "OK" para 200).



In [None]:
print(response.reason)

**ok**: Devuelve True si el código de estado es menor que 400, lo que indica que la solicitud fue exitosa.

In [None]:
print(response.ok)

## Obtención de datos agrocimáticos a partir de la API de NASA POWER

[Tutorial](https://power.larc.nasa.gov/docs/tutorials/api-getting-started/) para el armado de la API de NASA POWER

[Link](https://power.larc.nasa.gov/data-access-viewer/) al panel de NASA POWER


<video width="800" controls>
  <source src="https://power.larc.nasa.gov/docs/tutorials/data-access-viewer/video/api-demo-from-dave.mp4" type="video/mp4">
</video>



In [None]:
parameters = 'GWETTOP,GWETROOT,PRECTOTCORR'
longitud = -64.29
latitud = -33.1
start = 20240101 # AAAAMMDD
end = 20240115 # AAAAMMDD

response = requests.get(f"https://power.larc.nasa.gov/api/temporal/daily/point?parameters={parameters}&community=RE&longitude={longitud}&latitude={latitud}&start={start}&end={end}&format=json")

# Imprimiendo el contenido de la respuesta
print(response.url)

# Minidesafíos

## Minidesafíos **requests**:



### 1. Armar un llamado a la API de power.larc.nasa.gov y obtener los datos de precipitación, temperatura mínima, temperatura media, temperatura máxima para una coordenada y un rango de fechas a elección.

### 2. Obtener los datos tanto como json y como csv

## Minidesafíos Pandas

### 1. Leer el csv con pandas y visualizar el dataframe

### 2. Descripción del dataframe:

Visualizar los tipos de datos almacenados con .info() y calcular estadísticas descriptivas con .describe()

### 3. Obtener los valores medios para cada columna del periodo:



### 4. Contabilizar los días que tuvieron valores por encima de la media para cada columna:



### 5. Contabilizar los días que tuvieron valores bajo cero de temperatura mínima:

# Anexo

En este anexo incluimos el uso de la librería [ydata-profiling](https://pypi.org/project/ydata-profiling/), la cual genera un reporte a partir de un DataFrame de pandas.

Es importante tener en cuenta que, para utilizarla, primero hay que instalar la librería. Sin embargo, algunas de sus dependencias pueden entrar en conflicto con las versiones ya preinstaladas en Colab, lo que nos pedirá reiniciar el entorno. Una vez reiniciado, debemos volver a instalar todo, y esta vez ya no presentará problemas.

In [None]:
# el comando %%capture captura la salida del código para evitar que se muestre
# en este caso la estamos utilizando para que evite mostrar todo el proceso de instalación de la librería

!pip install numba==0.56.4
!pip install ydata_profiling
from ydata_profiling import ProfileReport

In [None]:
profile = ProfileReport(df, title="Profiling Report") # Reemplazar df por el nombre de la variable que le hayan asignado al dataframe
profile