| ![Isaac Zainea](https://raw.githubusercontent.com/Izainea/Izainea.github.io/master/logo.png) | Curso de Introducción a la Analítica de Datos | Isaac Zainea |
|:---:|:---:|:---:|


# Hola Mundo

¡Bienvenido al curso de Introducción a la Analítica de Datos! Este curso está diseñado para proporcionar una base sólida en conceptos y técnicas de análisis de datos. Trabajaremos con paquetes actualizados en Python a fecha de mayo de 2023. Antes de continuar aprovechamos y repasamos algunos conceptos básicos, que nos ayudarán a entender mejor el curso.

## ¿Qué es la Analítica de Datos?

La Analítica de Datos es el proceso de examinar datos para sacar conclusiones sobre la información que contienen, con el objetivo de tomar decisiones sobre los datos. La analítica de datos se emplea en muchas industrias para permitir que las empresas y las organizaciones tomen mejores decisiones comerciales y, en el sector científico, para verificar o refutar modelos y teorías existentes. En este repositorio encontrarás una serie de cuadernos de Jupyter que te ayudarán a aplicar técnicas de análisis de datos a problemas del mundo real. 

En este curso, aprenderás a:

- Importar y limpiar datos
- Explorar y visualizar datos
- Comunicar los resultados del análisis

Nos ayudaremos principalmente de Python y Jupyter Notebook, pero también utilizaremos otras herramientas como SQL, Excel, Power BI, etc.

## ¿Qué es Python?

Python es un lenguaje de programación de alto nivel, interpretado, interactivo y orientado a objetos. Fue creado por Guido van Rossum y lanzado por primera vez en 1991. Python es un lenguaje de programación multiparadigma, lo que significa que admite programación orientada a objetos, programación imperativa y programación funcional. Es un lenguaje de programación interpretado, lo que significa que no se compila a código máquina ejecutable, sino que se ejecuta directamente por el intérprete. Esto permite que los programas escritos en Python se ejecuten en múltiples plataformas sin necesidad de cambios. El lenguaje de programación Python es mantenido por la Python Software Foundation. 

Para este curso, el uso de Python se hará através de Google Colab, se requiere entonces que cree una cuenta de gmail para poder acceder a esta herramienta. Google Colab es un entorno de Jupyter Notebook que no requiere configuración y se ejecuta completamente en la nube, por lo tanto no es necesario instalar nada en tu computadora.


## Jupyter Notebook

Aunque el mundo de la programación para algunos puede resultar intimidante, confuso e inaccesible; **Jupyter Notebook** es una herramienta que facilita el aprendizaje de Python por su idea revolucionaria de combinar código, texto y visualizaciones en un mismo documento.

La estructura de cuaderno permite que tengamos celdas de texto y celdas de código en bloques. 

**Celdas de texto**
Las celdas de texto se escriben en formato Markdown, que es un lenguaje de marcado ligero que permite añadir formato al texto. Por ejemplo, para escribir un título de nivel 1, utilizamos el símbolo `#` seguido del texto:

```markdown
# Título de nivel 1
```

Para escribir un título de nivel 2, utilizamos el símbolo `##` seguido del texto:

```markdown
## Título de nivel 2
```

Para escribir un título de nivel 3, utilizamos el símbolo `###` seguido del texto:

```markdown
### Título de nivel 3
```

y así sucesivamente. Google Colab tiene un editor muy simple de Markdown, que permite ver el resultado del texto formateado en tiempo real.

**Celdas de código**

Por otro lado, las celdas de código se escriben en Python. Por ejemplo, para imprimir un mensaje en pantalla, utilizamos la función `print()`:

```python
print("Hola Mundo")
```

En lo que sigue, observe que la celda siguiente es una celda de código. Para ejecutar el código, haga clic en el botón de reproducción que aparece a la izquierda de la celda o presione `Ctrl + Enter`:


In [1]:
print("Hola Mundo")

Hola Mundo


Como es su primera ejecución, en Google Colab debio aparecer un mensaje que dice:

```
Advertencia: Este cuaderno no lo ha creado Google.
```

Esto es porque el cuaderno no se encuentra en su Google Drive, sino en el repositorio de GitHub. Para poder ejecutar el código, debe hacer clic en el botón `Ejecutar de todos modos`. Pasará un tiempo mientras se instalan las dependencias necesarias para ejecutar el código. Cuando termine, verá el mensaje `Conectado` en la parte superior derecha de la página la información de la RAM y el Disco que está utilizando desde Colab.



## Librerias de Python

Una de las principales ventajas de Python es la gran cantidad de librerías que existen para realizar diferentes tareas. En este curso, utilizaremos principalmente las siguientes librerías:

- **NumPy**: es una librería de Python que proporciona una gran colección de funciones matemáticas y de alto nivel que operan en arreglos y matrices.

- **Pandas**: es una librería de Python que proporciona estructuras de datos y herramientas de análisis de datos de alto rendimiento y fáciles de usar.

- **Matplotlib**: es una librería de Python que permite crear visualizaciones estáticas, animadas e interactivas.

- **Seaborn**: es una librería de Python que permite crear visualizaciones estadísticas en Python.

In [2]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

La sintaxis para importar una librería es la siguiente:

```python
import libreria as alias
```

Al cargar la libreria todas las funciones que contiene se pueden utilizar utilizando el alias. Se usa "." para acceder a las funciones de la librería. Por ejemplo si la función es `funcion()` y la librería se llama `libreria` entonces se utiliza `libreria.funcion()`. Si se importó con el alias `alias` entonces se utiliza `alias.funcion()`.


Por ejemplo, para importar la librería NumPy con el alias `np`, utilizamos:

```python
import numpy as np
```

Y si de numpy quiero utilizar la función `array()` entonces utilizo `np.mean()`.

Por ejemplo:
    
```python
import numpy as np
np.mean([1,2,3,4,5])
```
tiene como resultado `3.0`. El promedio de los números del 1 al 5 es 3.

In [3]:
import numpy as np
np.mean([1,2,3,4,5])

3.0

## Ejercicios

1. Importe la librería NumPy con el alias `np` y calcule el promedio de los números del 1 al 5.

2. Importe la librería Pandas con el alias `pd` y cree un DataFrame con los siguientes datos:

| Nombre | Edad | Sexo |
|--------|------|------|
| Juan   | 25   | M    |
| Ana    | 30   | F    |
| Pedro  | 45   | M    |
| María  | 35   | F    |
