# Sprint 7 - Terminales y Servicios Web (Sesiones)
**Versión para estudiantes**

El propósito de los siguientes ejercicios es introducir en el uso y manejo de terminales de comandos (**Powershell** o **Git - Bash**), a la vez de integrar estas herramientas con **Python**. En concreto, vamos a enfocarnos en los siguientes aspectos:

* Comandos básicos
* Ejecución de programas Python
* Integración con GitHub
* Desarrollo de aplicación web

Para llevar a cabo este objetivo con éxito, es recomendable instalar una aplicación que permita manipular todas las herramientas en una sola interfaz por lo que a continuación se describen los pasos para instalar **Visual Studio Code** y prepararlo para nuestro trabajo como analistas o científicos de datos:

1. Descarga Python desde el link https://www.python.org/downloads/, y durante la instalación especifica que el programa sea parte en PATH.
2. Descarga git -bash desde el link https://git-scm.com/downloads.
3. Descarga Visual Studio Code (en adelante, VS Code) desde el link https://code.visualstudio.com/download.
4. Ingresa a VS Code y busca siguiente ícono: ![](extensions.png). Ingresa dando click y allí encontrarás un listado de extensiones compatibles a adicionar en tu aplicación.
5. Instala las siguientes extensiones:
    * **Python**: Te permitirá usar Python en VS Code.
    * **Jupyter**: Te permitirá trabajar con Jupyter Notebooks en VS Code.
    * **WSL**: Te permitirá trabajar con entornos Linux (además a Windows o Mac).
    * **Start git-bash**: Te permitirá trabajar con la terminal Git Bash.
    
    Si gustas explora otras extensiones que te llamen la atención.

Estás listo, ahora puedes trabajar con todas estas herramientas dentro de VS Code.

## Comandos básicos

Abre una terminal de comandos (Powershell o Git - Bash) en tu VS Code y realiza los siguentes ejercicios:

### Ejercicio 1

Crea una carpeta llamada **Directorio Principal** en cualquier lugar que estimes conveniente dentro de tu computadora.

Define la carpeta que creaste como tu directorio de trabajo.

Verifica que **Directorio Principal** se encuentra vacío.

Crea en **Directorio Principal** 3 archivos archivos llamados **logs.txt**, **programa.py** y **otro.md** los cuales estarán por el momento vacíos.

Crea en **Directorio Principal** 3 subdirectorios llamados **Scripts**, **Textos** y **Otros**.

Elimina tanto el subdirectorio **Otros** como el archivo **otro.md**.

Mueve el archivo **logs.txt** al Subdirectorio **Textos**.

Copia el archivo **programa.py** al subdirectorio **Scripts** y luego de hacerlo borra el archivo de **Directorio Principal**.

Limpia la terminal para un mejor orden.

### Ejercicio 2

Ubícate en el subdirectorio **Textos** y en el archivo **logs.txt** ingresa el siguiente texto utilizando la terminal:

```
ESTE ES UN REGISTRO DE ACTIVIDADES
==================================
Autor: [Su nombre]
Fecha: [Fecha de hoy]

Actividades:
```

Verifica que el texto se ingresó de forma correcta en el archivo imprimiendo su contenido en la terminal.

Mira el tamaño del archivo **logs.txt** en bytes.

En una nueva línea del archivo **logs.txt** ingresa el siguiente texto: 

```
* [Timestamp actual] Creacion de archivo logs
```

## Ejecución de programas Python

### Ejercicio 1

Usando la terminal verifica la versión de Python que has instalado.

Consulta en la terminal las librerías y módulos que tienes instalado en Python con su correspondiente.

Verifica que tengas instaladas las siguientes librerías:

* numpy
* pandas
* scipy
* matplotlib
* seaborn
* streamlit
* plotly
* plotly-express

Si no las tienes utiliza para cada una el siguiente comando de instalación: 

```
pip install [nombre de la librería]
```

### Ejercicio 2

Ubícate en el subdirectorio **Scripts** y cambia de nombre el archivo **programa.py** a **pares.py**.

Usando la terminal, ingresa el código Python necesario en este archivo para que se impriman uno a uno los 5 primeros números pares. Ten cuidado con la tabulación para garantizar que tu código esté bien escrito.

Ejecuta el programa **pares.py** desde la terminal y verifica que el script funciona correctamente.

Abre el archivo **pares.py** y modifícalo de tal forma que permita al usuario seleccionar en la terminal la cantidad de números pares que desea imprimir. Utiliza la librería `argparse`.

Prueba que el programa modificado funcione desde la terminal.

Escribe una nueva linea en **logs.txt** indicando el programa que has creado y manteniendo el formato que hemos venido utilizando en el archivo.

### Ejercicio 3

Dentro del directorio **Scripts** crea un nuevo archivo llamado **res_estadistico.py**.

Ingresa el código necesario en **res_estadistico.py** tal que opere recibiendo como entrada desde la terminal la ruta a un archivo *csv*, y devolviendo como salida un resumen estadístico con las siguientes métricas:

* Media
* Desviación Estandar
* Cuartil 1
* Mediana
* Cuartil 3

Como referencia puedes utilizar el archivo **datos.csv**.

**NOTA:** Si deseas puedes escribir directamente el código en el archivo **res_estadístico.py**, y utiliza la terminal únicamente para ejecutar el programa cuando lo hayas terminado.

Prueba que el programa funcione desde la terminal.

Escribe una nueva linea en **logs.txt** indicando el programa que has creado y manteniendo el formato que hemos venido utilizando en el archivo.

### Ejercicio 4

Crea un nuevo programa en **Scipts** llamado **saludo.py** que reciba como *argumento opcional* el texto "Hola" y devuelva como respuesta una de las siguientes posibilidades:

* "Hola, ¿cómo estas?" con una probabilidad del 50%
* "Mucho gusto, me llamo Computina" con una probabilidad del 25%
* "Disculpa pero no quiero hablar contigo" con una probabilidad del 25%
* Si recibe algo distinto a "Hola" la respuesta debería ser "Parece que tus padres no te enseñaron a saludar...".

Prueba que el programa funcione desde la terminal.

Escribe una nueva linea en **logs.txt** indicando el programa que has creado y manteniendo el formato que hemos venido utilizando en el archivo.

### Ejercicio 5

Crea un nuevo programa en **Scripts** lamado **primos.py** que reciba como input desde la terminal un número entero positivo, y devuelva como resultado un texto que indique si dicho número es o no primo. Ten en consideración lo siguiente:

* Si se entrega como input un número decimal el programa debe arrojar un mensaje de error.
* Si se entrega como input un número que sea 0 o negativo debe imprimir un mensaje que indique que dicho número no es válido.
* Si se entrega un número primo debe indicar en un mensaje este hecho.
* Si se entrega un número compuesto (no primo) debe indicar en un mensaje este hecho, así como también mostrar una descomposición de dos divisores (i.e. si se da como input el 4, el mensaje debe señalar que "2 * 2 = 4").

Prueba que el programa funcione desde la terminal.

Escribe una nueva linea en **logs.txt** indicando el programa que has creado y manteniendo el formato que hemos venido utilizando en el archivo.

### Ejercicio 6

Crea un nuevo programa en **Scripts** llamado **grafico.py**.

Mira el siguiente código e intenta identificar qué tipo de gráfico está intentando hacer.

```py
import numpy as np
import pandas as pd
import argparse

parser = argparse.ArgumentParser(description = "Programa que grafica un histograma Normal dadas unas medidas de localizacion y escala") 
parser.add_argument("media", type = float, help = "Medida de localización del histograma")
parser.add_argument("desv", type = float, help = "Medida de escala del histograma")
parser.add_argument("-N","--n", default = 100, type = int, help = "Tamaño de muestra")

args = parser.parse_args()

datos = np.random.normal(size = args.n, loc = args.media, scale = args.desv)
datos = datos.round(0).astype(int)

datos_trim = []
for i in range(len(datos)):
    if datos[i] <= abs(args.media) + 3*args.desv or datos[i] >= abs(args.media) - 3*args.desv:
        datos_trim.append(datos[i])
datos_trim = pd.DataFrame(datos_trim)
datos_trim.columns = ['Datos']

histograma = datos_trim.groupby('Datos').size()
for i in range(len(histograma)):
    if histograma.index[i]>=0:
        s = "+"
    else:
        s = ""
    print(
        s,
        histograma.index[i],
        ' '*(1+len(str(np.max([np.max(histograma.index),
                               abs(np.min(histograma.index))]))) - 
                               len(str(abs(histograma.index[i])))),
        '*'*round(100*histograma.iloc[i]/len(datos_trim)), 
        sep = ""
    )
```

Una vez que lo entiendas, copia este código en **grafico.py** y mira su documentación con el argumento opcional `--help` en la terminal.

Prueba que el programa funcione desde la terminal.

Escribe una nueva linea en **logs.txt** indicando el programa que has creado y manteniendo el formato que hemos venido utilizando en el archivo.

## Integración con GitHub

[GitHub](https://github.com/) es uno de los principales repositorios en la nube para documentos en ámbitos vinculados con la tecnología de información. Únete a este comunidad creando una cuenta gratuita directamente desde su página web.

### Ejercicio 1

Crea un repositorio público en GitHub llamado `Programas_DATAXX` (XX hace referencia al número de tu cohorte). Asegúrate que el repositorio cuente con el archivo **README.md** correspondiente y garantiza que pueda contener información de Python a través del archivo **.gitignore** del caso.

### Ejercicio 2

Clona el repositorio localmente en **Directorio Principal**. Para hacerlo recuerda copiar el link de tu repositorio y ejecutar el siguiente comando en la terminal:

```
git clone [link de tu repositorio]
```

Ubícate en el repositorio clonado localmente y guarda allí una copia de la carpeta **Scripts** con todos los archivos que contiene.

Abre los archivos **README.md** y reemplaza su contenido con aquel de **logs.txt**.

Has `commit` y `push` de los cambios y verifica que los mismos se hayan cargado en la página de GitHub correctamente.

## Desarrollo de aplicación web

Vamos a desarrollar nuestra primera aplicación web mediante una servicio online llamado [Render](https://render.com/), el cual se integra de forma satisfactoria con repositorios en GitHub y permite la utilización de programas Python como los que hemos generado. Crea una cuenta gratuita y accede a tu Dashboard para explorarlo.

### Ejercicio 1

Crea un repositorio público en GitHub llamado `Render_DATAXX` (XX hace referencia al número de tu cohorte). Asegúrate que el repositorio cuente con el archivo **README.md** correspondiente y garantiza que pueda contener información de Python a través del archivo **.gitignore** del caso.

Clona el repositorio localmente en **Directorio Principal**.

Ubícate en el repositorio clonado y crea el archivo **reqs.txt** con el siguiente contenido.

```
pandas
streamlit
plotly
plotly-express
```

### Ejercicio 2

En el repositorio clonado guarda el notebook con el análisis exploratorio del dataset **iris** desde el link

https://raw.githubusercontent.com/jsaraujott/datos/refs/heads/main/EDA.ipynb

Para esto, copia todo el contenido que allí aparece y pégalo en un archivo en blanco al que guardarás con una extensión *ipynb*.

Explora y comprende lo que está siendo ejecutado en este documento.

En el repositorio clonado crea un programa llamado **app.py** que contenga el siguiente código a ser completado usando como referencia el notebook que guardaste hace un momento:

```py
# Cargar liberias
## Aquí tu código ##

# Cargar datos
## Aquí tu código ##

# Poner título
st.header('Relación de variables', divider = "gray")

# Descargar dataset
st.download_button(
    label = "Descargar dataset", 
    data = df.to_csv(index=False), 
    file_name = "df.csv"
)

st.divider()

# Seleccionar 2 variables cualquiera
## Aquí tu código ##
v = st.multiselect(
    label = "Seleccione máximo 2 variables:",
    options = opciones,
    max_selections = 2
)

# Ejecutar análisis
analisis_b = st.button(
    label = "Analizar"
)

st.divider()

# Analisis
if analisis_b:
    try:

        col1, col2 = st.columns(2)
        
        # Visualizar histograma de variable 1
        with col1:
    
            ## Aquí tu código ##
            st.plotly_chart(hist_plot01, use_container_width=True)

            c1, c2, c3 = st.columns(3)

            with c1: 
                ## Aquí tu código ##
                st.metric(
                    label = "Media",
                    value = "{:.1f}".format(prom1)
                )
            with c2:
                ## Aquí tu código ##
                st.metric(
                    label = "Mediana",
                    value = "{:.1f}".format(med1)
                )
            with c3:
                ## Aquí tu código ##
                st.metric(
                    label = "Desviación",
                    value = "{:.1f}".format(desv1)
                )

        # Visualizar histograma de variable 2
        with col2:
            
            ## Aquí tu código ##
            st.plotly_chart(hist_plot02, use_container_width=True)

            c4, c5, c6 = st.columns(3)

            with c4: 
                ## Aquí tu código ##
                st.metric(
                    label = "Media",
                    value = "{:.1f}".format(prom2)
                )
            with c5:
                ## Aquí tu código ##
                st.metric(
                    label = "Mediana",
                    value = "{:.1f}".format(med2)
                )
            with c6:
                ## Aquí tu código ##
                st.metric(
                    label = "Desviación",
                    value = "{:.1f}".format(desv2)
                )
            
        # Visualizar dispersion entre variables
        ## Aquí tu código ##
        st.plotly_chart(disp_plot, use_container_width=True)

        ## Aquí tu código ##
        st.metric(
            label = "Correlación de Pearson",
            value = "{:.1%}".format(correl[0,1])
        )

    except:
        
        st.write("Faltan variables por seleccionar")
```

Comprueba que **app.py** funciona ejecutándola desde la terminal.

Has `commit` y `push` de los cambios en el repositorio y verifica que los mismos se hayan cargado en la página de GitHub correctamente.

### Ejercicio 3

Vuelve a la página de Render y crea un nuevo servicio web siguiendo estos pasos:

1. Conéctate con el repositorio de GitHub `Render_DATAXX` ingresando su link.

2. Define el comando de construcción de la aplicación copiando lo siguiente:

```
pip install --upgrade pip && pip install -r reqs.txt
```

3. Define el comando de inicialización de la aplicación copiando lo siguiente:

```
streamlit run app.py
```

4. Verifica que la instancia de despliegue sea gratuita.

5. Espera a que la construcción y el despliegue finalice (aprox. 10 minutos)