<a href="https://colab.research.google.com/github/sebabecerra/CursoBasicoPython/blob/main/Librerias.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Libraries

## Visión General

### Notas
* Una biblioteca es una colección de paquetes o módulos que se agrupan para extender la funcionalidad.
* Tipos:
  1. Bibliotecas estándar (incluidas con Python)
  2. Bibliotecas y paquetes de terceros (necesitan ser instalados)
* Normalmente se instalan usando gestores de paquetes como pip o conda.

### ¿Qué son entonces los Paquetes?
- Un paquete puede incluir módulos y subpaquetes.

### Paquetes vs Bibliotecas
- Python usa paquetes para organizar dentro de sus bibliotecas, y bibliotecas para proporcionar y extender funcionalidades.
- Aunque **todas las bibliotecas pueden considerarse paquetes** (si están estructuradas de esa manera), **no todos los paquetes son bibliotecas**.

### Importancia
* Ayuda a ahorrar tiempo, estandarizar procesos y agregar funcionalidades complejas fácilmente.
* Se usan para cosas como análisis de datos, aprendizaje automático, desarrollo web, automatización y más.



## Bibliotecas Estándar de Python

### Notas

* Al igual que con los módulos, usamos las palabras clave `from` e `import`.
    * `import` obtiene los módulos del módulo.
    * `from` se usa para obtener atributos específicos de un módulo directamente.
* Cuándo usar uno u otro:
    * `import module_name`: Cuando necesitas acceder a varias funciones o atributos de un módulo.
    * `from module_name import attribute_name`: Usa esto cuando solo necesitas una función o atributo específico de un módulo.


### Importancia de las Bibliotecas

### Notas

¿Qué pasa si queremos manipular archivos? Podemos usar la biblioteca estándar en Python para abrir, leer, escribir y cerrar archivos.

Funciones:
- `open`: Abre un archivo. El modo 'r' es para leer, 'w' para escribir (sobrescribe el contenido), 'a' para agregar, y 'b' para modo binario.
- `read`: Lee el contenido de un archivo abierto. También se puede usar `readline()` para una sola línea o `readlines()` para todas las líneas como una lista.
- `write`: Escribe una cadena en un archivo abierto. Si el archivo está abierto en modo agregar ('a'), el texto se añade al final.
- `close`: Cierra un archivo abierto, lo cual es importante para liberar recursos del sistema.

### Ejemplos

**Nota: Este ejemplo está pensado para hacerse en Google Colab con acceso a la carpeta `sample_data`**.

Para leer el contenido de `california_housing_test.csv` e imprimirlo:


In [None]:
# Open the file in read mode
file = open('sample_data/california_housing_test.csv')

# Read the file
content = file.read()

# Close the file
file.close()

# Print the content
print(content)

Ahora, ¿qué pasa si queremos obtener estos datos en algo utilizable (como un diccionario) para realmente comenzar a realizar análisis de datos:

In [None]:
import csv

data_dict = {}
for index, row in enumerate(csv.reader(content.strip().split('\n'))):
    if index == 0:
        # Initialize dictionary with column headers as keys
        for column in row:
            data_dict[column] = []
    else:
        # Append each element in the row to the correct list in the dictionary
        for col_index, value in enumerate(row):
            data_dict[list(data_dict.keys())[col_index]].append(value)

# Print the dictionary to verify contents
print(data_dict)


Está bien, honestamente es mucho trabajo cada vez que queremos trabajar con archivos CSV. Pero podríamos usar una biblioteca de terceros llamada `pandas` para cargar archivos de manera mucho más fácil.

## Bibliotecas de Terceros

### Ejemplo con Pandas

Con una biblioteca como `pandas`, ¡puedes leer el archivo y convertirlo en 3 líneas de código!

In [None]:
import pandas as pd

# Create a dataframe from csv file
df = pd.read_csv('sample_data/california_housing_test.csv')

# Print the dataframe
df

# get sume of total_bedrooms
sum_total_bedrooms = df['total_bedrooms'].sum()

### Notas

* Estos son paquetes y bibliotecas de terceros (no incluidos en la Biblioteca Estándar de Python) que necesitan ser instalados por separado.
* La forma en que instalas un paquete depende del gestor de paquetes que estés utilizando.
* Hay dos formas principales de hacerlo:
    1. *Pip* - Si usas `pip` para la gestión de paquetes (Google Colab usa esto).
    2. *Conda* - Si usas `conda` o `mamba` para la gestión de paquetes (usaremos esto en el Capítulo Avanzado).

**NOTA: Profundizaremos más en la gestión de paquetes en el capítulo avanzado.**

### Bibliotecas Comunes de Terceros

A continuación se muestran algunas bibliotecas comunes de terceros utilizadas en ciencia de datos:
- **Pandas**: Ofrece estructuras de datos y operaciones para manipular tablas numéricas y series temporales.
- **NumPy**: Soporta arrays y matrices grandes y multidimensionales, junto con una colección de funciones matemáticas de alto nivel.
- **Matplotlib**: Una biblioteca de gráficos para crear visualizaciones estáticas, animadas e interactivas en Python.
- **Seaborn**: Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos.
- **SciPy**: Se utiliza para computación científica y técnica, ofreciendo módulos para optimización, álgebra lineal y más.
- **Scikit-learn**: Implementa una variedad de algoritmos de aprendizaje automático para tareas de minería de datos, análisis de datos y aprendizaje automático.
- **Plotly**: Crea gráficos interactivos y visualmente atractivos para la publicación en la web.

### ¿Dónde encuentro paquetes?

[PyPi](https://pypi.org/) - para `pip`  
[Anaconda](https://www.anaconda.com/) - para `conda`


### Listando Paquetes Instalados

Si estás ejecutando esto en Google Colab, usa lo siguiente:

In [None]:
!pip list

Package                       Version
----------------------------- ---------------
aiobotocore                   2.5.0
aiofiles                      22.1.0
aiohttp                       3.8.5
aioitertools                  0.7.1
aiosignal                     1.2.0
aiosqlite                     0.18.0
alabaster                     0.7.12
altgraph                      0.17.4
anaconda-anon-usage           0.4.2
anaconda-catalogs             0.2.0
anaconda-client               1.12.1
anaconda-cloud-auth           0.1.3
anaconda-navigator            2.5.2
anaconda-project              0.11.1
anyio                         3.5.0
appdirs                       1.4.4
argon2-cffi                   21.3.0
argon2-cffi-bindings          21.2.0
arrow                         1.2.3
arxiv                         2.1.0
astroid                       2.14.2
astropy                       5.1
asttokens                     2.0.5
async-lru                     2.0.4
async-timeout                 4.0.2
atomicwri

Si estás ejecutando esto localmente usando Conda, ejecuta esto:

In [None]:
!conda list

# packages in environment at C:\Users\jbecerra\AppData\Local\anaconda3:
#
# Name                    Version                   Build  Channel
_anaconda_depends         2023.09             py311_mkl_1  
abseil-cpp                20211102.0           hd77b12b_0  
aiobotocore               2.5.0           py311haa95532_0  
aiofiles                  22.1.0          py311haa95532_0  
aiohttp                   3.8.5           py311h2bbff1b_0  
aioitertools              0.7.1              pyhd3eb1b0_0  
aiosignal                 1.2.0              pyhd3eb1b0_0  
aiosqlite                 0.18.0          py311haa95532_0  
alabaster                 0.7.12             pyhd3eb1b0_0  
altgraph                  0.17.4                   pypi_0    pypi
anaconda-anon-usage       0.4.2           py311hfc23b7f_0  
anaconda-catalogs         0.2.0           py311haa95532_0  
anaconda-client           1.12.1          py311haa95532_0  
anaconda-cloud-auth       0.1.3           py311haa95532_0  
anaconda-navi

Nota: `!pip list` funcionará si estás usando conda; PERO no incluirá todos tus paquetes.

### Instalación de Paquetes

#### Notas

- Una vez más, dependiendo de tu gestor de paquetes, dependerá si necesitas usar pip o conda para instalar.

#### Ejemplos

##### Instalación con `pip` (ejemplo de Google Colab)

Google Colab viene de serie con un montón de bibliotecas instaladas; pero aquí hay una que no tenemos:

##### Instalación con `pip` (ejemplo de Visual Studio Code)

Para instalar un paquete en Visual Studio Code usando pip, abre una terminal y ejecuta lo siguiente:


In [None]:
!pip install pyjokes

##### Instalación con `conda` (Ejemplo Local)

**Nota: Este es un ejemplo SOLO si estás ejecutando localmente y tienes Anaconda instalado (en Colab, pandas ya está instalado).**

Dado que `pandas` es una biblioteca fuera de la biblioteca estándar de Python, podemos instalarla con conda.


In [None]:
!pip install pandas

## Importar el Paquete

Ahora que hemos instalado una biblioteca, necesitamos importarla. Esto nos permite usarla en nuestro cuaderno específico / entorno (profundizaremos más en los entornos más adelante en la sección avanzada).

Mostraremos cómo importar bibliotecas, paquetes y módulos de Python. Aquí tienes un recordatorio de la diferencia entre los tres:
1. **Biblioteca**: Una colección de paquetes y módulos.
2. **Paquete**: Un directorio con scripts de Python y un archivo `__init__.py`.
3. **Módulo**: Un archivo de script de Python que puede ser importado.

### Ejemplos

In [None]:
import pyjokes

pyjokes.get_joke()