#**Tratamiento de datos, estadística descriptiva y visualización de datos**

##**Tema 1 - Uso de modulos de Python**

###**¿Qué es un módulo?**


> Un módulo permite agrupar, gestionar y utilizar lógicamente el código Python. Normalmente, un archivo .py de Python
se convierte en un módulo. En el módulo se pueden definir funciones, clases o variables, y puede incluir un código de
ejecución.

> En pocas palabras, es un archivo de código y se divide en módulo estándar y módulo externo.

* Módulo estándar: Módulos incorporados en Python (os, svs, math, random, datetime, json, csv, sqlite3)
* Módulo externo: Módulos fabricados por una 3ra parte. (pandas, numpy, matplotlib, scipy, flask, tensorflow, keras)

> Los módulos estandar se instalan al instalar Python. No es necesario memorizar lo que hay en el módulo estándar, ya
que se puede buscar a través de un motor de busqueda o a través de la biblioteca estandar de Python en
https://docs.python.org/3/library/.

> Los módulos externos han sido creados por otras personas (como las bibliotecas de código abierto), es necesario
instalar los modulos para poder utilizarlos en el codigo. La forma mas recomendada y segura de instalar una biblioteca
externa es utilizar pip. Despues de Python 3.4, se incluye basicamente en el programa de instalacion binaria de Python
y se puede utilizar fácilmente.

In [None]:
#Ejercicio de sample

import random

data = ('a','s','b','c','ch','n')
print(random.choice(data)) #Tomar un unico elemento de la lista de forma aleatoria

#para muestreo aleatorio
muestra = random.sample(data,3)
print(muestra)

In [None]:
#Practica modulo SO , datetime y demas

import random
import os
import datetime as dt # datetime tiene el alias dt
from time import sleep

"""
for i in range(10): #iteramos en un rango de 10
  sleep(5) #hace una pausa de 5 seg
  fecha_actual = dt.datetime.now() #extraemos la fecha actual
  print(fecha_actual)

#Uso del timedelta

fecha = dt.datetime.now() #calculo de la fecha actual

en_dos_dias = fecha + dt.timedelta(days=2) #sumamos 2 dias a la fecha actual
print(fecha)
print(en_dos_dias)

"""

#Uso del modulo OS

os.mkdir("GT08_S") #creamos una carpeta llamada prueba
print(os.listdir()) #mostramos el contenido de la carpeta actual



In [None]:
#Uso del modulo OS
print(os.getcwd) #imprimimos la ruta actual / directorio / carpeta

os.rmdir("GT08_S") #eliminamos una carpeta llamada test2 que antes se tuvo que crear
print(os.listdir()) #mostramos el contenido de la carpeta actual



---



##**Tema 2 - Panda Series**

###**Creación de una Serie a partir de un valor escalar**

Un escalar es un valor simple (un número, una cadena, un booleano, etc.), no una lista.
Cuando se pasa un escalar a pd.Series, pandas repite ese valor tantas veces como elementos tenga el índice que especifiques.

Ejemplo:

In [None]:
import pandas as pd

s = pd.Series(5, index=[0, 1, 2, 3])
print(s)

#Aquí el 5 (escalar) se repite en todas las posiciones porque el índice tiene 4 elementos.

**Uso del operador * con escalares**

El operador * puede intervenir en dos sentidos:

a) Multiplicar una Serie por un escalar

Se aplica a cada valor de la Serie:

In [None]:
s = pd.Series([1, 2, 3])
print(s)
print('-'*15) #estetico
print(s * 5)


b) Usar * en listas antes de crear la Serie

En Python, una lista se puede repetir con *.
Ejemplo:

In [None]:
valores = [5] * 4   # crea [5, 5, 5, 5]
s = pd.Series(valores)
print(s)

#Esto hace lo mismo que pd.Series(5, index=[0,1,2,3]), pero usando * directamente en la lista.

4. ¿Cuándo usar cada forma?

pd.Series(escalar, index=...) → útil cuando quieres inicializar rápido con un mismo valor.

[valor] * n → útil si quieres primero manipular la lista antes de convertirla en Serie.

serie * escalar → útil para operaciones matemáticas vectorizadas (multiplicar todos los elementos).



---



###**Practica de Panda Series**

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import openpyxl

#creacion de una serie usando una lista
serie = pd.Series(["Anthony","Joshua","Hector","Mariana","Keitlyn","Jorge"])
print(serie)

print('--'*30)
#crear serie usando diccionario
diccionario = {"Anthony":20,"Joshua":21,"Hector":22,"Mariana":23,"Keitlyn":24,"Jorge":25}
serie2 = pd.Series(diccionario)
print(serie2)

print('--'*30)
#Crear serie con indices predefinidos
serie3 = pd.Series(["Anthony","Joshua","Hector","Mariana","Keitlyn","Jorge"], index = ["a",3,"c","d","e","f"])
print(serie3)

In [None]:
#acceder a un valor de la serie

print(serie[3])
print(serie2["Hector"])
print(serie3["c"])

In [None]:
plt.plot(serie)
plt.show()

In [None]:
plt.plot(serie2)
plt.show()

In [None]:
plt.plot(serie3)
plt.show()

In [None]:
print(serie.index) #ver los indices de la serie

print(serie.values) #ver los valores de la serie