# Python

## System

La forma más basica de Python para interactuar con el Sistema Operativo es mediante el modulo `os` basado en UNIX.

In [None]:
import os, shutil, stat

filename = "C:/Users/dario/Desktop/Python/Jupyter/Python/TextFiles/archivoSystema.txt"
os.makedirs(os.path.dirname(filename), exist_ok=True)
fout = open(filename, "wt")
fout.write("Hello File!")
fout.close()

exists = os.path.exists(filename)
print(exists)
fakeFilename = filename + "fAKE"
exists = os.path.exists(fakeFilename)
print(exists)
print()

file = os.path.isfile(filename)
print(file)
directory = os.path.isdir(filename)
print(directory)
newFilename = "C:/Users/dario/Desktop/Python/Jupyter/Python/TextFiles/archivoSystemaCopy.txt"
shutil.copy(filename, newFilename)
try:
    betterName =  "C:/Users/dario/Desktop/Python/Jupyter/Python/TextFiles/archivoSysNuevo.txt"
    os.rename(newFilename, betterName)
except FileExistsError:
    print("Already Renamed File!")
print()

# Hard Links are multiple names of one file
# Soft or symbolic links stores the new name in a new file
try:
    hardLinkName = "C:/Users/dario/Desktop/Python/Jupyter/Python/TextFiles/ArchHardLink.txt"
    os.link(betterName, hardLinkName)
except FileExistsError:
    print("Already Hard Linked File!")
print(os.path.isfile(hardLinkName))
print(os.path.islink(hardLinkName))
try:
    softLinkName = "C:/Users/dario/Desktop/Python/Jupyter/Python/TextFiles/ArchSoftLink.txt"
    os.symlink(betterName, softLinkName)
except FileExistsError:
    print("Already Soft Linked File!")
print(os.path.isfile(softLinkName))
print(os.path.islink(softLinkName))

# Unix permissions: Read, write, execute.
# Groups: Creator(User), User Group, Global
# Octal code for read only by User
os.chmod(betterName, 0o400)
# Stat constant for read only by User
os.chmod(betterName, stat.S_IRUSR)

#Change owner (Chown), get symlink path (realpath)
os.remove(newFilename)

print()
directoryName = "C:/Users/dario/Desktop/Python/Jupyter/Python/TextFiles/testFolder"
os.mkdir(directoryName)
print(os.path.exists(directoryName))
os.rmdir(directoryName)
print(os.path.exists(directoryName))
print()

directoryNameTwo = "C:/Users/dario/Desktop/Python/Jupyter/Python/TextFiles/testFolderTwo"
try:
    os.mkdir(directoryNameTwo)
except FileExistsError:
    print("Folder ya existe!")
print(os.listdir(directoryNameTwo))
directoryNameThree = "C:/Users/dario/Desktop/Python/Jupyter/Python/TextFiles/testFolderTwo/innerFolder"
try:
    os.mkdir(directoryNameThree)
except FileExistsError:
    print("Folder ya existe!")
folderFile = "C:/Users/dario/Desktop/Python/Jupyter/Python/TextFiles/testFolderTwo/innerFolder/innerFile.txt"
os.makedirs(os.path.dirname(folderFile), exist_ok=True)
fout = open(folderFile, "wt")
fout.write("Hello Inner File!")
fout.close()
print(os.listdir(directoryNameThree))

Cuando ejecutas un programa el sistema operativo crea un proceso unico. El proceso utilizara recursos de CPU, memoria y espacio mediante las estructuras de datos que son controlados por el Kernel. Un proceso es por lo general una instancia que no puede modificar o interactuar con otros procesos.

El sistema operativo lucha constantemente por mantener todos los procesos activos y cambiar de uno a otro por prioridad de uso. La libreria `os` ofrece algunas herramientas iniciales.

In [None]:
import os
print(os.getpid(), os.getcwd(),  os.getlogin(), 
      os.get_terminal_size(), sep = "\n")

import subprocess
# Excecutes a program and gets its ouput
retOne = subprocess.getoutput("date /T")
retTwo = subprocess.getstatusoutput("date /T")
print(retOne, retTwo, sep="\n")

Para generar subprocesos utilizamos el modulo `multiprocessing`. Desafortunadamente el codigo no funciona en Jupyter y tiene que ser introducido a un script.

In [None]:
import multiprocessing, os
def imprimirMensaje(msj):
    pidDice(msj)
def pidDice(msj):
    print("Proceso %s dice: %s" % (os.getpid(), msj))
if __name__ == "__main__":
    pidDice("ProgramaPrincipal")
    for n in range(4):
        p = multiprocessing.Process(target=imprimirMensaje, args=("Subproceso: %s" % (n),))
        p.start()
        
import multiprocessing, os, time
def pidDice(nombre):
    print("Soy %s, en pid %s" % (nombre, os.getpid()))
def errorLoop(nombre):
    pidDice(nombre)
    s = 1
    f = 10000
    for n in range(s, f):
        print("\tNum %s of %s cada segundo." % (n, f))
        time.sleep(1)
if __name__ == "__main__":
    pidDice("principal")
    pNew = multiprocessing.Process(target=errorLoop, args=("loopy",))
    pNew.start()
    time.sleep(5)
    pNew.terminate()

Los programadores pasan gran parte de su tiempo lidiando con tiempos y zonas horarias. El principal problema es que no hay una manera o maneras establecidas de representar la fecha. Despues tenemos lenguaje, signos, biciestos, calendarios, zonas horarias y cambios de horario. 

Para trabajar con fechas existen muchos modulos como `datetime, time, calendar, dateutil` entre otros. Muchos de estos modulos lamentablemente no son compatibles entre si.

In [None]:
# Datetime module defines date (years, monts, days)
# time (hours, minutes, seconds, fractions)
# datetime (dates and times)
# timedelta (date and times intervalos)
# Sus limites son desde el año 1 hasta el año 9999.

from datetime import date
halloween = date(2019, 10, 31)
print(halloween, halloween.day, halloween.month, halloween.year)
print(halloween.isoformat())
now = date.today()
from datetime import timedelta
one_day = timedelta(days = 1)
tomorrow = now + one_day
print(now, tomorrow)
print(now + (17*one_day))
from datetime import time
noon = time(12, 30, 59, 1)
print(noon.hour, noon.minute, noon.second, noon.microsecond)
from datetime import datetime
now_datetime = datetime.now()
print(now_datetime.isoformat())
print(now_datetime.date(), now_datetime.time())
now_noon = datetime.combine(now, noon)
print(now_noon.isoformat())

El modulo `time` utiliza el numero de segundos desde el Unix time (1 de Enero de 1970) o epoch.

In [None]:
# Struct_time objects
# Localtime for time zone and gmtime for UTC

import time
now = time.time()
print(now)
print(time.ctime(now))
local = time.localtime(now)
print(local)
print(time.mktime(local))
print(time.gmtime(now))

formatString = "Hoy es : %A, %B %d %Y, local time %I:%M:%S%p"
today = time.localtime()
print(time.strftime(formatString, today))

formatStringTwo = "%Y-%m-%d"
print(time.strptime("2019-01-29", formatStringTwo))

In [None]:
# get all windows locale codes.
import locale
for x in locale.windows_locale.values():
    print(x.replace('_','-'))

For some examples of the **locales module** execute time and timetwo scripts.

Another alternative modules are:

- arrow
- dateutil
- iso8601
- fleming

## Network

Creamos programas rapidos (performance), seguros (robustness), simples (complexity) e integrados (communication).

* **Single Machine**: Tareas realizadas en un lugar.
* **Sequential**: Realizar o ejecutar las tareas una a la vez.
* **Concurrency**: Hacer más de una cosa al mismo tiempo.
* **Distributed - Networking**: Hacer más de una cosa en distintos lugares.
* **Synchronous**: Una tarea se hace al terminar la anterior.
* **Asynchronous**: Las tareas se realizan de forma independiente aunque el resultado dependa de su secuencia.

Si los recursos de una computadora se encuentran en espera normalmente es por **I/O Bound**, cuando el bus de información esta lleno o **CPU Bound**, cuando el cpu esta realizando operaciones complejas. El metodo más simple de manejar multiples tareas es mediante **Queues**, listas en donde las tareas pendientes se agregan por un lado y salen por el otro al ser ejecutadas (FIFO). 

Las **soluciones sincronas** se obtienen mediante operaciones secuenciales las cuales se pueden iterar para cada nuevo input o al realizar cada operación en *batch* para todos los inputs (asumiendo que se cuenta con el espacio para guardar todos los inputs y todos los outputs).

Las **soluciones asincronas** se obtienen mediante operaciones independientes realizadas por distintos **trabajadores** que se dividen las operaciones y las realizan en serie, sin embargo se vuelve sincrona si los trabajadores realizan sus operaciones a distintas velocidades.

Para solucionar el problema de las velocidades los queues **distribuyen las tareas** al entregar el ultimo input del stack al trabajador especializado que se encuentre en espera. Mediante más trabajadores se utilicen habra una mayor disponibilidad para procesar la informacion entrante del queue.

Una forma de implementar queues en Python es utilizar la libreria `multiprocessing` la cual puede asignar funciones a distintos procesos y encadenar sus inputs y outputs mediante un queue intermediario. Nota: No se pueden asignar más de un proceso dentro de Jupyter Notebooks. 

In [None]:
import multiprocessing as mp

def firstWorker(inputs, outputs):
    for data in inputs:
        print('Primera operacion en', data)
        outputs.put(data)
        
def secondWorker(inputs):
    while True:
        data = inputs.get()
        print('Segunda operacion en', data)
        inputs.task_done()

inputs_queue = mp.JoinableQueue()
secondProc = mp.Process(target=secondWorker, args=(inputs_queue,))
secondProc.deamon = True
secondProc.start()
inputs = ['Ensalada', 'Pan', 'Queso', 'Postre']
firstWorker(inputs, inputs_queue)
inputs_queue.join()

Un **thread** es un hilo de ejecución dentro de un proceso. A veces es más conveniente utilizar multiples threads dentro de un solo proceso a manera de trabajadores. Para ello utilizamos la libreria `threading` de la que despues surgio `multiprocessing`.

In [2]:
import threading, queue, time

def firstWorker(inputs, inputs_queue):
    for data in inputs:
        time.sleep(5)
        print('Primera operacion en', data)
        inputs_queue.put(data)
        
def secondWorker(inputs_queue):
    while True:
        data = inputs_queue.get()
        print('Segunda operacion en', data)
        time.sleep(10)
        inputs_queue.task_done()

inputs_queue = queue.Queue()
for n in range(2):
    second_thread = threading.Thread(target=secondWorker, args = (inputs_queue,))
    second_thread.start()
inputs = ['Ensalada', 'Pan', 'Queso', 'Postre']
firstWorker(inputs, inputs_queue)
inputs_queue.join()

Primera operacion en Ensalada
Segunda operacion en Ensalada
Primera operacion en Pan
Segunda operacion en Pan
Primera operacion en Queso
Segunda operacion en Queso
Primera operacion en Postre
Segunda operacion en Postre


Una diferencia importante entre `multiprocessing` y `threading` es que los hilos no pueden accesar a la funcion de terminar, para ello se debe terminar el proceso que los contiene. 

Por el manejo de memoria los Threads pueden ser peligrosos ya que comparten los recursos del mismo proceso. Debemos asegurarnos de que no interfieran con las variables globales del proceso y que todo el codigo sea *Thread Safe*.

En particular son utiles para esperar operaciones I/O ya que en estos casos todo el input utilizada distintas variables. Cuando compartan informacion se debe realizar de forma controlada, aplicando **Locks** a las variables mientras un Thread realiza su trabajo.

En Python los Threads no pueden acelerar operaciones CPU por una implementacion denominada **Global Interpreter Lock**. Se recomienda usar Threads para ciertos problemas I/O y procesos para problemas de CPU.

Un ejemplo de threads es el servidor web Apache, mientras que un ejemplo de eventos activados y repartidos a trabajadores es el servidor web Nginx. La libreria **gevent** esta basada en eventos y convierte un programa imperativo en corutinas mediante generadores que se comunican entre sí. Los mini threads que genera gevent se denominan **Green Threads**.

Frameworks basados en el concepto de eventos son **tornado** y **gunicorn**. Uno para programas por eventos de bajo nivel y otro para optimizar servidores web.

La libreria **Twisted** nos permite realizar conexiones asincronas mediante eventos. Se conectan las funciones con los eventos como recibir datos o cerrar una conexion. Este particular diseño por eventos se denomina **callback**. La implementacion oficial de Python para diseñar sistemas asincronos por eventos es **asyncio**. Existen algunas tecnicas para evitar los errores asincronos:

1. Fire and Forget: Cada trabajador entrega su resultado sin importar que haya quien pueda recibirlo.
2. Request Reply: Cada trabajador entrega su resultado cuando reciba un mensaje de otro trabajador que este listo.
3. Back Pressure (Throttling): Se alenta un trabajador rapido para sincronizarlo con el trabajador lento que le sigue.

La libreria **Celery** ejecuta tareas sincronas o asincronas mediante threads, eventos o procesos. La libreria **Thoonk** utiliza Redis para crear Job Queues y Pub Sub, otra similar es **Rq** y **ZeroMQ**.

En la creación de redes o **networking** se utilizan distintos sistemas o patrones:

1. Request Reply: Este sistema cliente servidor es sincrono, el cliente espera a que el servidor responda su pedido. 
2. Push o Fanout: Envias datos a cualquier trabajador disponible, un ejemplo es un servidor web que utiliza un load balancer para los pedidos.
3. Pull o Fanin: Aceptas datos de una o varias fuentes disponibles, un ejemplo es un logger que toma los mensajes de texto de multiples procesos y los escribe en un archivo.
4. Publish Subscribe (Pub-Sub): Publicador envia datos y todos los subscriptores reciben una copia, a diferencia del push que solo lo recibe el primero.

El modelo **Pub-Sub** no es un queue sino un broadcast. Se puede simular en **Redis** con los procesos publicando mensajes y los subscriptores recibiendo informacion filtrada de los procesos a los que estan subscritos. Otro sistema Pub Sub es ZeroMQ y RabbitMQ que pueden ser accesados mediante el API **pika**.

El **Internet** se basa en protocolos que definen como se hacen conexiones, intercambian datos, terminan conexiones, manejan timeouts etc. Los protocolos se organizan por capas:

1. Señales electricas
2. Protocolo de Internet (IP). Como crear direcciones de red y como mover paquetes de información.
3. User Datagram Protocol (UDP). Define como enviar mensajes cortos (datagram's).
4. Transmission Control Protocol (TCP). Define como enviar mensajes largos (streams).

En la red TCP/IP las maquinas tienen una direccion local IP de 127.0.0.1 con el nombre **localhost**, esta se denomina la interfaz **loopback**. Si la maquina esta conectada a internet tiene una direccion IP publica.

Sockets

Vienen de c Y Unix
Socket level coding
Client Server exchange

Client send a string in UDP to server
Server returs a packet of data with a string to client
Server nees to listen for request at Client public adress and port. Same for client.

El cleinte envia una peticion y luego espera la respesta
el servidor espera una peticion y luego envia la respuesta..

UDP sends messages of limited size
TCP sends streams of ytes, you dont know how many will recieve or send. nEEDS A TERMINATOR INFORMATIONS TO reasamble mesage rom segments, fixes size in bytes, or delimiter caracters.
messages are bytes not nicode strings the libreary bytes is needed.

ZeroMQ
socket types

Message passing Libraries.

aCTIVEMQ
RabbitMQ

MQ = message queue

For packet retrieval and testing use scapy.

---

Las computadoras tienen direcciones IP publicas 85.2.101.94 pero el DNS o Domain Name System convierte Ips a nombres mediante una base de datos distribuida. 






In [10]:
import socket
hostIP = socket.gethostbyname('www.google.com')
nameAlternativeIP = socket.gethostbyname_ex('www.google.com')
print(hostIP, nameAlternativeIP)
#Ask for UDP or TCP info only.
udpInfo = socket.getaddrinfo('www.google.com', 80, socket.AF_INET, socket.SOCK_STREAM)
tcpInfo = socket.getaddrinfo('www.google.com', 80, socket.AF_INET, socket.SOCK_DGRAM)
print(udpInfo)
print(tcpInfo)
#Ask or service and port
port = socket.getservbyname('http')
service = socket.getservbyport(80)
print(port,service)

172.217.15.4 ('www.google.com', [], ['172.217.15.4'])
[(<AddressFamily.AF_INET: 2>, <SocketKind.SOCK_STREAM: 1>, 0, '', ('172.217.15.4', 80))]
[(<AddressFamily.AF_INET: 2>, <SocketKind.SOCK_DGRAM: 2>, 0, '', ('172.217.15.4', 80))]
80 http


Existen muchas librerias para el manejo de **Email** en Python, incluyendo smtplib, email, poplib, imaplib, smtpd y Lamson, ademas de las que se especializan en transferir bytes como ftplib.

Cuando un sitio web pone su informacion en formato API que puede ser recolectado facilmente por programas automaticos mediante intercambio de JSON O XML Y ademas sigue la implementacion Web API representational state transfer (RESTful) tiene un medio para que los bytes de un servidor puedan ser accesados facilmente por un cliente automatico

los APIs generalmente requieren de una llave para restringir el acceso a la informacion y para identificar al cliente automatico, algunos roveedores de APIs como servicio de datos son NYT, Youtube, Twitter, Facebook Linkedlin, Weather Underground y Marvel Commics.

RPC

Si queremos ejecutar codigo en otras computadoras utilizamos llamadas RPC (Remote Procedure Calls).
Los APIs son una forma de RPC en donde la llamada se realiza mediante el URL o Request Body.

En el cliente

Conveierte la funcion y sus argumentos en bytes (marshalling, serializing, encoding)
Envia los bytes a la maquina remota

En el remoto:

Recibe los bytes y el RPC los decodifica a las estrcturas originales.
El cliente envuentra y llama la funcion decodificada.
Codifica los reultados y los envia de regreso

En el liente

Recibe los resultados codificados y los decodifica.

En python el modulo RPC utiliza XML ys e denomina xmlrpc

Una variante es por MessagePacks denominada msgpack-rpc-python

Fabric es un paqete de rpc que deja baar  subir archivos y ademas ejecutar comandos sudo. utiliza SSH por defecto, el protocolo que ha remplazado telnet para ejecutar programas en otras computadoras. En el escribes scripts fabric e indicas si se deben ejecutar local o remotamente. Cuando ejecutas estos archivos en fabric o fab indicas cual maquina remota y cual funcion a ejecutar.

La libreria salt es similar a fabric pero utiliza ZeroMQ en vez de SSH. Alternativas son puppet, chef y ansible.

---

Cuando la cantidad de inputs y datos superan una comutadora comenzamos a hablar de servidores que distribuyen la carga.
Para distribuir de forma eficiente uno de los primer sistemas es Hadoop creao por Yahoo. Python tiene muchos interfaces para sistemas Hadoop, uno de ellos es Luigi utilizado por spotify. 

Spark surgio como un rival de Hadoop aunque su instalacion es un poco ms omplicada. O Disco que usa python para realizar el mapReduce y Erlang para comuncaciones.






## Tips Python

COPY COde
Stackoverflow
Pypi
Pip
virtualenvs
pipenv
pip requrements

Documentations

Pylint, pyflakes and pep8

unittest
expected = assertion

doctest

nose
tox
py.test

CI (automaate testing)

buildbot
jenkins
travis-ci

debugging

print vars()

pdb Es el debuger standard de Python

Breakpoints and steps

Logging as an alternative to print()
Module logging with messages of priorit levels debug info, warn, error and critical.
logger objects, handlers that direct the message, formatters that create the output and filters to make decisions from outputs.

Para oprimizar el modulo timeit y su funcion timeit(code, number, count)

pARA MAYOR Cython es un convertidor a C aunque en la realidad la mayoria de los modulos ya estan optimizados en c y solo se nvuelven en Python hooks por conveniencia. Internamente la liberaria estanar utiliza mucho CPython, un rival es PyPy que interpreta utilizando optimizadores de Java pero todavia no forma parte del estandard.

Python generalmente utiliza gIT O Mercurial como sistema de contrl de versiones distribuidos.

LIBROS

Head First Python 210
Python Essential Reference 4
Python Cookbook 3
Core Python App Programming 3
Python for Data Analysis 2012
Python in Practice 2013




## Modulos

Algunos modulos

Graficcas 2D

Imghdr: Detecta tipo de imagen
colorsys: Convierte entre sistemas de colores

PIL: No estandar pero defecto para rocesar 2D.
Pillow: Basado en PIL pero con funcionalidad avanzada.

ImageMagick: Suit de programas para modificar imagenes 2D bitmap. Conectamos mediante wand.

GUI's

Tkinter es el basico y en standar
Otros son:
Qt gtk+, WXPython, Kivy.

Qt utilizan componentes nativos y otros componente WEB dado que web es un GUI universal, mediante sus graficos, teto y multimedia. Algunos guis basados en web son rctk Y Muntjac.

Las apps web suelen tener un servidor y un cliente, el cliente puede ser thin o rich cuando realiza pocas o muchas de las tareas de la aplicacion. Normalmente se comunican mediante RESTFUL APIs, AJAX o JSON.

3d GRAPHICS

Panda3D es Open Source.

Blender o Maya o Houdini


PLOTTING

Matplotlib Server side
Client side (jS integration) use bokeh

GAMES

Invent your own computer games with Python
The Python game Book

Pygame

MUSIC

PYKNON
mingus
remix
sebastian
pano
beets
echonest
monstermash
shiva
mpd album art

OFFICE

DOCX for word documents
python excel xlrd, xlwt and xluutils.
csv for excel also works

Oletools
pywin32
pywinauto
swapy

python-magic
reportlab for pdf

LOGISTICS

PythonFedex, PythonUPS, stamps.com, Python for business intelligence, Cubes and OpenERP

Data Crunching: Solve everyday problems using ajva, python and More

Python in finance, data secirity, maps, pandas



Files
Directories
Programs and Processes
Calendars and CLocks

Concurrency
Network

Tips

SYSTEM                  297 a 320
NETWORK                 320 a 369
TIPS                    369 a 408

CURRENT PROYECTS        408 a 423
DATA VISUALIZATION      423 a 438
SCIENCES                438 a 462
INSTALLING HELP         462 a 474
ANSWERS TO EXERSICES    474 a 515
CHEAT SHEETS            515 a 568

In [None]:
Descomponer problema en pasos
Abstrar los detalles especificos para generalizar
Modelar para crear un diagrama que describa el proceso
Generalizacion utilizar distintos inputs similares y obtener resultados similares

Computadoras se descirben por modelos de input proceess output

INPUT flujo de datos desde afuera del sistema
Process tareas requeridas para transformar inputs
OUTPUTs flujo de datos fuera del sistema

Algoritmo lista de pasos ordenados para lograr tarea
Flow diagram modelo de un algoritmo y del dlujo de datos
Input output model


In [None]:
SPHINX


Readme
    proposito del proyecto o libreria.
    descarga del codigo fuente.
    creditos.

Install
    pip install module
    python setup.py install
    
License
    Establece licencia
 
Documentacion
    Introduccion: Como utilizar quickstart ejemplo
    Tutorial: Un uso primario en detalle, paso a paso para un prototipo.
    API referencia: Docstrings, interfaces, parametros y valores de retorno.
    Dev docs: Convenciones en el codigo, estructura y diseño
    
Sphinx convierte reStructuredText o reST, subset de markup a HTML, LaTEX, manuales, y plain text.
Read the docs for hosting.



DOCS:
    Tutorials
    How To Guides
    References
    Explanations
    
project_root/
│
├── project/  # Project source code
├── docs/
├── README
├── HOW_TO_CONTRIBUTE
├── CODE_OF_CONDUCT
├── examples.py

http://docutils.sourceforge.net/docs/user/rst/quickref.html
http://www.sphinx-doc.org/en/master/usage/restructuredtext/basics.html



C:\Program Files (x86)\Microsoft Visual Studio\Shared\Python36_64\Scripts\sphinx-build




