# Python essentials 


## 1. Python

### 1.1 Funciones  

Las funciones son como mini programas dentro de un programa. Su objetivo es combatir la duplicación de código y granularlo en pequeñas porciones.

- El string def define la función.
- La entrada de las funciones son los argumentos.
- La salida de una función son los valores de retorno.
- Los parámetros son las variables dentro de los paréntesis en la declaración de la función.
- El valor de retorno es especificado usando la sentencia return.

Cada función tiene un valor de retorno. Si tu función no tiene una sentencia de retorno, el valor a retornar por defecto es None. 

In [1]:
import random
def randomGenerator():
    x = random.randint(1, 10)
    return x

print("the number is: " + str(randomGenerator()))

the number is: 1


### 1.2 Alcance global y local  
- El alcance puede entenderse como cierta área en el código que contiene variables.
- El alcance global se entiende como el área fuera de las funciones. Las funciones asignadas en dicha área son llamadas variables globales. 
- Cada función tiene su propio alcance, a esto se entiende por alcance local. Las variables definidas dentro de las funciones se conocen como variables locales.
- El código de alcance global **no** puede usar variables locales.
- El código en una función con alcance local no puede usar variables de otra función con alcance local.
- Si hay una sentencia de declaración para una variable en una función, esta siempre será de alcance local.



In [2]:
var1 = 10 #global variable
def funct():
    var2 = 20 #local variable
    global var3 
    var3= 100
    
funct()
print(var1)
print(var1+var3)
#print(var2) imprime error 

10
110


### 1.3 Sentencias Try y Except 
- El error divide-by-zero ocurre cuando python divide un número por cero.
- Los errores hacen que el programa se caiga.
- Un error que ocurre dentro de un bloque try causa que se ejecute el código en el bloque except. Ese código puede manejar el error o entregar un mensaje al usuario, de esta forma el programa puede seguir funcionando.

In [3]:
def div42by(number):
    try:
        return 42/number
    except:
        print("ERROR: You tried to divide by zero. ")
print(div42by(10))
print(div42by(90))
print(div42by(0))
print(div42by(1))

4.2
0.4666666666666667
ERROR: You tried to divide by zero. 
None
42.0


### 1.4 Tipo de dato: List
Primero que todo, debes saber que en python los arreglos no son una estructura de datos nativa. Python posee 'list' o listas que son mutables, esto significa que son capaces de modificarse, cambiando el contenido que almacenan. 
Las listas pueden almacenar información de distinto tipo. Es como una mochila, dentro de esta puedes almacenar lo que quieras. 

#### los métodos más útiles para interactuar con listas: 
- **list1.insert(position, element)**,  insert an element in  position
- **list1.append(element)**,  insert an element in the top of the list
- **list1.remove(element)**, remove an element. if the element doesn't exist in list then return a ValueError. You MUST use try-except.
- **list1.extends(lista2)**, insert in the top of the list1 all the elements of list2
- **list1.count(element)**, return the number of appearances of the element in list
- **list1.index(element)**, obtain the position of the element in list. if the element doesn't exist in list then return a ValueError(use try-except)
- **list.copy()**, this make a copy of a list
- **list.sort()**, this returns the sorted list data in ascending order
- **list.reverse()**, reverse the items in any list. useful for sorting lit in descending order.
- **list.clear()**, remove all elements in list. useful for re-assigning the values of a values of a list by removing the previous items 




In [4]:
bag = ['apple', 1, True, "LOL","last_item"]
for x in range(0,len(bag)):
    print(bag[x])
print(bag[-1])
print(bag[-2])

apple
1
True
LOL
last_item
last_item
LOL


### 1.5 Tipo de dato: Diccionario
Un diccionario es una colección de muchos valores, pero a diferencia de los índices de las listas, los diccionarios pueden usar distintos tipos de datos, no solo enteros. Los índices en los diccionarios son llamados llaves y están asociados a un valor llamado valor-clave.
- Los diccionarios son mutables. Las variables tienen referencias a los valores de los diccionarios, no al valor del diccionario.
- Los diccionarios no tienen orden, no tienen un primer valor-clave.

In [5]:
myCat = {'size': 'small', 'color': 'black', 'disposition': 'loud'}
print(myCat['color'])
'color' in myCat
#if('color' in myCat != False): print('My cat has the color:'+ myCat['color'])
#if('color' not in myCat != True): print('wtf my cat does not have color')
print(list(myCat.keys()))
print(list(myCat.values()))
print(list(myCat.items()))
print('my cat color is: ' + myCat.get('color', 'does not have color :('))


black
['size', 'color', 'disposition']
['small', 'black', 'loud']
[('size', 'small'), ('color', 'black'), ('disposition', 'loud')]
my cat color is: black


EXERCISE: Counting the characters of string

In [6]:
import pprint
longtext = 'holacomoestaijiji'
count = {}
for char in longtext.upper():
    count.setdefault(char,0)
    count[char] = count[char] + 1
pprint.pprint(list(count.items()))
    

[('H', 1),
 ('O', 3),
 ('L', 1),
 ('A', 2),
 ('C', 1),
 ('M', 1),
 ('E', 1),
 ('S', 1),
 ('T', 1),
 ('I', 3),
 ('J', 2)]


The pprint module's pprint() "pretty print" function can display a dictionary value cleanly. The pformat() function returns a string value of this output. 

### 1.6 Strings
Caracteres de escape:   
- \' = Single quote  
- \" = Double quote  
- \t = tab  
- \n = Line break  
- \\ = Backlash  


     
también, """ any_text """ es útil.   

In [7]:
print("This is a text message: 'hello  \" wut \"'")
r"That's not my cat\'s' name"
print("""h
o
l
a""")

This is a text message: 'hello  " wut "'
h
o
l
a


##### Métodos útiles 
- text.upper() or text.lower() = todos los caracteres se transforman a mayús o minús 
- text.isalpha() = sólo letras
- text.isalnum() = sólo números o letras
- text.isdecimal() = sólo numeros
- text.isspace() = sólo espacios
- text.istitle() = string que comienzan con mayús y  el resto es minús



In [8]:
text = "heLlO World"
print(text.upper())
print(text.lower())
us = ['cat','mouse','dog']
print(' and '.join(us))

HELLO WORLD
hello world
cat and mouse and dog


String formatting

In [9]:
name = 'John'
place = 'St. Clement'
time = '10'
food = 'avocado'
print('Hello %s, you are invited to a party in %s street at %s pm. Bring %s.' % (name,place, time, food))

Hello John, you are invited to a party in St. Clement street at 10 pm. Bring avocado.


### 1.7 Expresiones regulares

- Las expresiones regulares son como mini lenguajes para especificar patrones de texto. Escribir código para hacer reconocimento de patrones de texto puede resultar bastante tedioso, en estos casos, las expresiones regulares pueden ahorrarnos bastante trabajo.
- Regex strings usan \ backslashes (like \d), así que a menudo son strings del tipo: r'\d'.   
- Para emplear Regex, es necesario **importar re**.   
- Debes llamar a la función **re.compile()** para crear un objeto regex.
- \d es la regex para un digito numerico del 0 al 9.   
- \D para cualquier carácter que no es un digito numerico del 0 al 9.
- \w cualquier letra, digito numerico, o underscore character.
- \W para cualquier caracter que no sea una letra, digito o carácter subrayado
- \s para cualquier espacio, tabulacion y salto de linea
- \S para cualquier caracter que no sea espacio, tabulacion y salto de linea
- El caracter ^ antecediendo a  [aeiou] entregará todos los caracteres distintos al contenido del paréntesis

In [10]:
# Queremos un código para identificar si el texto es un número de telefono
def isPhoneNumber(text): #412-123-1231
    if(len(text)!= 12): 
        return False
    for i in range(0,3):
        if not text[i].isdecimal(): 
            return False
    if(text[3] != '-'): 
        return False
    for i in range(4,7):
        if not text[i].isdecimal():
            return False
    if(text[7]!= '-'):
        return False
    for i in range(8, 12):
        if not text[i].isdecimal():
            return False
    return True

number = '412-123-1231'
if(isPhoneNumber(number) == True):
    print('Wow. Thanks!')
else: print('error')

Wow. Thanks!


Esto es equivalente a:

In [11]:
import re
message = 'Call me 128-123-9999 tomorrow, or at 111-222-3333'
phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')
#mo = phoneNumRegex.search(message) //obtiene la primera ocurrencia y almacena en mo
print(phoneNumRegex.findall(message)) # Con findall encontramos todas las ocurrencias en el texto

['128-123-9999', '111-222-3333']


Es posible **agrupar** los elementos que componen a la expresión regular, de esta forma, podremos obtener partes específicas. 
Para agrupar los elementos que componen la expresión regular utilizamos peréntesis, estos deberán rodear dichos grupos.    
     
Por ejemplo: r'(\d\d\d\d)-(\d\d\d)-(\d\d\d)', está conformado por 3 grupos. 

In [12]:
phoneNumRegex = re.compile(r'(\d\d\d)-(\d\d\d)-(\d\d\d\d)')
mo = phoneNumRegex.search('Call me 128-123-9999')
mo.group(3) # despliega el grupo 3 compuesto por 9999

'9999'

El carácter **|**, conocido como pipe, permite localizar las posibles ocurrencias en un string dado un grupo de posibles candidatos.   

In [13]:
# programa que retorna la primera ocurrencia
saRegex = re.compile(r'sa(ndia|bor|bado|lud|grado)')
mo = saRegex.search("La sandia tiene un sabor sagrado")
#mo = saRegex.search("La naranja tiene un color pálido")
#mo == None
mo.group()

'sandia'

El carácter **?** en una expresión regular hace referencia a _cero o una ocurrencia_ de un grupo, por ejemplo: 

In [14]:
batRegex = re.compile(r'Bat(wo)?man') # Regex
mo = batRegex.search('The adventures of Batman')
mo.group() # print Batman
mo = batRegex.search('The adventures of Batwoman')
mo.group() # print Batwoman

'Batwoman'

El carácter * en una expresión regular hace referencia a _cero o n ocurrencias_ de un grupo, por ejemplo:

In [15]:
batRegex = re.compile(r'Bat(wo)*man') #regex
mo=batRegex.search('The adventures of Batwowowowowowowoman')
mo.group()

'Batwowowowowowowoman'

El carácter **+** en una expresión regular hace referencia a _una o más ocurrencias_ de un grupo, por ejemplo:


In [16]:
batRegex = re.compile(r'Bat(wo)+man')
mo = batRegex.search('The adventures of Batwowoman')
mo.group()

'Batwowoman'

Los curly brackets {x} indican que en una expresión regular debe presentarse un grupo una cantidad x de veces, ejemplo:


In [17]:
batRegex = re.compile(r'Bat(wo){3}man')
mo = batRegex.search('The adventures of Batwowowoman')
mo.group()

'Batwowowoman'

Cuando el curly brackets contiene dos atributos {x,y}, entonces x significa la cantidad mínima y y la cantidad máxima de el grupo de la expresión regular

In [18]:
batRegex = re.compile(r'Bat(wo){3,6}man')
mo = batRegex.search('The adventures of Batwowowowowoman')
mo.group()

'Batwowowowowoman'

El punto **.** en una expresión regular reemplaza un carácter faltante para hacer el match con un string, por ejemplo:

In [19]:
atRegex = re.compile (r'.at')
atRegex.findall("the cat en the hat sat on the flat mat")

['cat', 'hat', 'sat', 'lat', 'mat']

Utilizando findall() y agregando los elementos a un arreglo

In [20]:
lyrics = '12 Drummers Drumming, 11 Pipers Piping, 10 Lords a Leaping, 9 Ladies Dancing, 8 Maids a Milking, 7 Swans a Swimming, 6 Geese a Laying, 5 Golden Rings, 4 Calling Birds, 3 French Hens, 2 Turtle Doves, and a Partridge in a Pear Tree'
xmasRegex = re.compile(r'\d+\s\w+') #Buscar una cadena de texto con digito_letra
arr=xmasRegex.findall(lyrics)
print(arr)

['12 Drummers', '11 Pipers', '10 Lords', '9 Ladies', '8 Maids', '7 Swans', '6 Geese', '5 Golden', '4 Calling', '3 French', '2 Turtle']


Podemos substituir elementos de una Regex

In [21]:
nameRegex = re.compile(r'Agent \w+')
message = 'Agent Alice gave the secret documents to Agent Bob.'
nameRegex.findall(message)
nameRegex.sub('REDACTED', message)

'REDACTED gave the secret documents to REDACTED.'

#### Para mayor información sobre Expresiones regulares, recomiendo leer la documentación de la librería re

## 2. Web Scraping

Web scraping es una técnica utilizada mediante programas de software para extraer información de sitios web. Usualmente, estos programas simulan la navegación de un humano en internet, ya sea usando el protocolo HTTP manualmente, o inscrustando el navegador en una aplicación.   
Para hacer web scraping se necesita, en primera instancia, instalar en tu máquina la librería HTTP **Requests** para Python.   
```sh
$ python -m pip install requests
```


In [22]:
import requests
# vamos a intentar ingresar a Falabella
res = requests.get('https://www.falabella.com/falabella-cl/')
len(res.text) #indica la cantidad de caracteres que componen la pagina
#print(res.text) #imprime los chars de la página


456004

El siguiente paso es instalar la libreria de Python **BeautifulSoup**.
```sh
$ pip install beautifulsoup4
```

In [23]:
import bs4
#import requests
# vamos a extraer el valor del siguiente producto de falabella
res = requests.get('https://www.falabella.com/falabella-cl/product/8116897/Notebook-Intel-Core-i7-9750H-16GB-RAM-+-32GB-Intel-Optane-512GB-SSD-NVIDIA-GeForce-RTX-2080-15.6-/8116897')
res.raise_for_status() # con este metodo nos aseguramos que la petición fue realizada con éxito
#parseamos el texto a formato html
soup = bs4.BeautifulSoup(res.text, 'html.parser')
#Copiamos la ruta CSS del elemento que deseamos extraer
element = soup.select('html body.custom_class div#__next div.jsx-1987097504.main section.jsx-4234634535.pdp-body div.jsx-4234634535.container div.jsx-4234634535.productContainer div.jsx-4113348717.pdp-container section.jsx-4113348717.pdp-detail-section div div.jsx-2170457292.product-specifications div.jsx-2170457292.product-specifications-column.fa--product-specifications-column__desktop div.jsx-2170457292.price div#testId-pod-prices-8116897.jsx-1904860942.prices.prices-4_GRID ol.jsx-1904860942.ol-4_GRID.pdp-prices.fa--prices li.jsx-1904860942.price-0 div.jsx-1904860942.cmr-icon-container span.copy13.primary.high.jsx-185326735.normal')
element[0].text

'$  2.399.990 '

Sería ideal generar una función que genere estre proceso y que tenga como argumento la url del producto que deseamos scrapear

In [24]:
#import bs4, requests
import pprint
def getElements(productUrl):
    res = requests.get(productUrl)
    res.raise_for_status()
    soup = bs4.BeautifulSoup(res.text, 'html.parser')
    name = soup.findAll("b", {"class": "pod-subTitle"})
    price = soup.findAll("li", {"class": "price-0"})
    item = []
    for i in range(len(price)):
        item.append([name[i].text, price[i].text])
    return item
    
elements = getElements('https://www.falabella.com/falabella-cl/category/cat70057/Notebooks?page=2')
pprint.pprint(elements)

[['Notebook Pavilion x360 Intel Core i3 4GB RAM 256GB SSD 14"', '$  609.990 '],
 ['Notebook 240 G7 Intel Celeron 4GB RAM 500GB HDD 14"', '$  299.990 '],
 ['Notebook VivoBook X512JA Intel Core i7-1065G7 8GB RAM + 32GB Intel Optane '
  '512GB SSD 15.6"',
  '$  759.990 (Oferta)'],
 ['Matebook D14 AMD Ryzen R5 8GB RAM 512GB SSD 14"', '$  649.990 '],
 ['Notebook Intel Pentium Gold 4GB RAM 500GB HDD 15.6"', '$  399.990 '],
 ['Notebook Asus VivoBook X420FA Intel Pentium Gold 4GB RAM 128GB SSD 14"',
  '$  349.990 (Oferta)'],
 ['Notebook Hp 240 Cel N4020 4Gb 500Gb Win10H', '$  349.900 '],
 ['Notebook 240 G7 Intel Core i3-1005G1 4GB RAM 1TB HDD 14"', '$  419.990 '],
 ['Notebook Intel Core i7-9750H 16GB RAM + 32GB Intel Optane 512GB SSD NVIDIA '
  'GeForce RTX 2080 15.6"',
  '$  2.399.990 '],
 ['Macbook Air 13" Intel Core i5 8GB RAM 512GB SSD Silver', '$  1.449.990 '],
 ['Notebook/Hp/240 G7/Intel Celeron/4Gb/500Gb/W10/14', '$  349.990 (Oferta)'],
 ['Notebook Lenovo V130 I3-7020 8Gb 1Tb W10Home', 

## 3. Base de datos
Una base de datos es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior uso. 
### Base de datos relacionales
Es un modelo utilizado en la actualidad para almacenar datos.  Relaciona filas con columnas en tablas. El poder de las bases de datos relacionales esta en su habilidad de recuperar datosde forma eficiente de  tablas, en particular, en aquellos casos donde hayan multiples tablas relacionadas.
### Terminología
- **Base de datos:**
Contiene muchas tablas.
- **Relación (o tabla):**
Contiene filas y columnas.
- **Tupla (o fila):**
Un conjunto de campos que generalmente representan un "objeto".
- **Atributo (columna o campo):**
Uno de posiblemente muchos elementos de datos correspondientes al objeto representado por la fila.

### SQL
**Structured Query Language** es el lenguaje que usamos para enviar comandos a la base de datos. 
### Administrador de una base de datos
Un **database administrator** (DBA) es una persona resposable del diseño, implementación, mantenimiento y reparación de la base de datos de alguna organización. Su rol ingloye el desarrollo y diseño de estrategias de base de datos, monitoreo y mejoras en el comportamiento y capacidad, planificando a futuro posibles requerimientos de expansión. También, coordinan e implementan medidas de seguridad para salvaguardar la base de datos.

### Modelo de base de datos
Un modelo de base de datos o esquema de base de datos es una estructura o formato para una base de datos, descrito en un lenguaje formal compatible por el sistema de gestión de base de datos.
#### Sistemas de base de datos comunes
- **Oracle**,
Grande, comercial, escala enterprise, muy modificable
- **MySql**,
Simple, rápido y escalable, open source commercial
- **SqlServer**,
- **HSQL, SQLite, Postgres,** etc

### SQLite Browser
SQLite es una base de datos popular, es gratis, rápida y pequeña.   
SQLite Browser nos permite manipular directamente archivos SQLite. Para descargar el software necesario debes dirigirte a la siguiente direccion y seguir las instrucciones de instalación: http://sqlitebrowser.org/      
SQLite es incrustado en Python, entre muchos otros lenguajes de programación.
Una vez instalado, deberás ejecutar el programa y crear una nueva base de datos. Para ello tienes que hacer clic en New Database, seleccionar la ruta donde desees almacenar tu base de datos y asignarle un nombre.   
Para usos prácticos, llamaré a la base de datos 'mydb'. Luego, deberás crear las tablas de tu base de datos. Partiremos creando una tabla 'Users', que almacenará los siguientes datos: Nombre y email.   
SQLite Browser te permite crear tablas con una interfaz gráfica simple
![image.png](attachment:image.png)
Como puedes apreciar en la imagen, en la parte de abajo se ha generado código SQL de forma automática.



## 4. Django

Cuando tenemos una página web, necesitamos tener un servidor para que nuestra página se aloje y permita recibir requests de información por parte de nuestros usuarios.   
Django es un framework de desarrollo web escrito en Python que soporta el patrón MVC. La meta fundamental de Django es facilitar la creación de sitios web complejos. Django pone énfasis en el re-uso, la conectividad y extensibilidad de componentes, el desarrollo rápido y el principio DRY (Dont repeat yourself)
![image.png](attachment:image.png)

Recomiendo usar Anaconda, crear un entorno y instalar Django.

```sh
$ conda install django
```
Para saber qué versión tienes de Django
```sh
$ python -m django --version
```

### Creando un proyecto
Para crear tu primer proyecto con Django, deberás ejecutar el siguiente comando en tu terminal:

```sh
$ django-admin startproject nombre-proyecto
```

Para casos prácticos, he llamado a mi proyecto "mysite".    
Independiente del directorio donde hayas ejecutado el comando anterior, se debería haber creado una carperta con el nombre de tu proyecto. 

![image.png](attachment:image.png)

Estos archivos son:
- el directorio raíz **mysite/** es el contenedor de tu proyecto. Su nombre no le interesa a Django, por lo que puedes renombrarlo y no generarás problema alguno.
- manage.py: Un archivo que te permite interactuar con el proyecto de varias formas, almacena comandos útiles para tu proyecto. 
- _ init _.py: Es un archivo vacío que le dice a python que este directorio debe ser considerado como paquete Python
- settings.py: Configuraciones para este proyecto Django.
- urls.py: Las declaraciones URL para este proyecto Django; Una tabla de contenidos de su sitio basado en Django.
- asgi.py: An entry-point for ASGI-compatible web servers to serve your project.
wsgi.py: Un punto de entrada para que los servidores web compatibles con WSGI puedan servir su proyecto.

Para verificar que tu proyecto funciona, dirigete al directorio /mysite y corre el siguiente comando:
```sh
$ python manage.py runserver
```
Una vez ejecutado el comando, visita http://127.0.0.1:8000/, verás ésta imagen:
![image-2.png](attachment:image-2.png)
El server montado se actualiza constantemente frente a cada request o petición que realices. No debes reiniciar el server cuando realices cambios, sin embargo, casos como añadir archivos o directorios si requieren que reinicies el server.

Cada aplicacion que escribes en Django consiste de paquetes python que siguen ciertas convenciones. Django viene con la utilidad de que automáticamente genera la estructura básica de un directorio para una aplicación, así que sólo debes concentrarte en escribir código.
Dentro de un proyecto puedes tener una o varias apps.   
    
Para usos prácticos, crearemos una app de encuestas en el mismo directorio en donde se encuentra tu archivo manage.py, de esta forma será importada como un módulo de alto nivel, en vez de un submódulo.   

Para crear la aplicación, asegurate que estás en el mismo directorio de manage.py y ejecuta este comando:

```sh
$ python manage.py startapp polls
```
Eso creará un directorio polls que se presenta de la siguiente forma:
![image-3.png](attachment:image-3.png)
Esta estructura de directorios almacenará la aplicación encuesta.
En el archivo polls/views.py, escriba el siguiente código:
```js
from django.http import HttpResponse

def index(request):
    return HttpResponse("Hello, world. You're at the polls index")
```
Esta es la vista más simple posible en Django. Para llamar la vista, tenemos que asignarla a una URLconf.   
Para crear una URLconf en el directorio polls, cree un archivo llamado urls.py. Dentro de urls.py debe escribir el siguiente código:
```js
from django.urls import path
from . import views

urlpatterns = [
    path('',views.index, name='index'),
]
```
El siguiente paso es señalar la URLconf raíz en el módulo polls.url. Cree un archivo mysite/urls.py y añada un import para django.urls.include e inserte una include()  en la lista urlpatterns, para obtener:

```js
from django.contrib import admin
from django.urls import include, path

urlpatterns = [
    path('polls/', include('polls.urls')),
    path('admin/', admin.site.urls),
]
```
La función include() permite hacer una referencia a otros URLconfs. Cada vez que Django encuentra include(), corta cualquier parte de la URL que coincide hasta ese pundo y envía la cadena restante a la URLconf incluida para seguir el proceso.   
La idea detrás de include() es facilitar la conexión y ejecución inmediata de las URLs. Dado que las encuestas están en su propia URLconf (polls/urls.py).   

     
      
      
Bien!. Sólo resta en probar lo hecho. Corra el server nuevamente y vaya a http://localhost:8000/polls/.

libraries like: scipy, matplotlib, numpy, pandas, django?? then ML->DL
