
# Curso de Python para el análisis de datos

Programación básica en Python:
    
   + Módulos de Python o cómo extender el conjunto de instrucciones.
   + Tipos de datos y operaciones.
   + Un programa en Python.
   + Una función en Python.
   + Slicing.
   + Referencias.
   + Comprehensions.
   + Generators.
   + Objetos.
   + Lectura de datos.
    

## Python

Una vez que haya instalado IPython, estará listo para realizar todo tipo de operaciones.

El programa de software que utiliza para invocar a los operadores se llama **intérprete**. Usted puede ingresar sus comandos como un "diálogo" entre usted y el intérprete. Los comandos se pueden ingresar como parte de un script (un archivo de texto con una lista de comandos para ejecutar) o directamente en la *celda*.

Para preguntarle al intérprete qué hacer, debe **invocar** a un operador:


<b>- Empecemos por el clásico “Hola mundo".</b>

print('Hola mundo')

In [3]:
print('Hola mundo =)')

Hola mundo =)


Una vez que haya instalado IPython, estará listo para realizar todo tipo de operaciones.

3 + 4 + 9

In [1]:
3 + 4 + 9

16

list(range(10))

In [2]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

otra celda

## Operadores aritméticos

![operadoresAritmeticos.png](attachment:operadoresAritmeticos.png)

In [4]:
5+6

11

In [5]:
5-1

4

In [6]:
2*6

12

In [7]:
2**3

8

In [8]:
12/6

2.0

In [9]:
4.5//2

2.0

In [10]:
7 % 2

1

## Operadores relacionales

![operadoresRelacionales.png](attachment:operadoresRelacionales.png)

In [11]:
5 == 3

False

In [12]:
5 != 3

True

In [13]:
5 < 3

False

In [14]:
5 > 3

True

In [15]:
5 <= 5

True

In [16]:
5 >= 3

True

## Módulos

Python es un lenguaje de programación de propósito general, por lo que cuando queremos usar comandos más específicos (como operadores estadísticos u operadores de procesamiento de cadenas), generalmente necesitamos importarlos antes de poder usarlos. Para Scientific Python, una de las librerías más importantes es **numpy** (Python numérico), que se puede cargar así:

import numpy as np

In [17]:
import numpy as np

np.sqrt(16)

In [22]:
a = np.sqrt(16)
print(a)

4.0


In [23]:
type(a)

numpy.float64

np.arange(10)

In [24]:
s1 = np.arange(10)
print(s1)

[0 1 2 3 4 5 6 7 8 9]


In [25]:
type(s1)

numpy.ndarray

El acceso a las funciones, variables y clases de un módulo depende de la forma en que se importó el módulo:

import math <br>
math.cos(math.pi)

In [26]:
import math
math.cos(math.pi)

-1.0

import math as m   # importar usando un alias <br>
m.cos(m.pi)

In [27]:
import math as m # importar usando un alias
m.cos(m.pi)

-1.0

from math import cos,pi # import solo algunas funciones <br>
cos(pi)

In [28]:
from math import cos,pi # import solo algunas funciones
cos(pi)

-1.0

from math import *   # importe global <br>
cos(pi)

In [29]:
from math import * # importe global
cos(pi)

-1.0

## Variables

A menudo, el valor devuelto por una operación se utilizará más adelante. Los valores se pueden almacenar para su uso posterior utilizando un **operador de asignación**:

a = 101 <br>
type(a)

In [30]:
a = 101
type(a)

int

El comando ha almacenado el valor 101 con el nombre <code>a</code>. Estos valores almacenados se denominan **objetos**.

Hacer una asignación a un objeto define el objeto. Una vez que se ha definido un objeto, se puede hacer referencia a él y utilizarlo en cálculos posteriores.

Para hacer referencia al valor almacenado en el objeto, simplemente use el nombre del objeto. Por ejemplo:

a = np.sqrt(a) <br>
a <br>
type(a) 

In [32]:
a = np.sqrt(a)
print(a)
type(a)

3.1701538797227005


numpy.float64

Hay algunas reglas generales para los nombres de los objetos:

+ Utilice solo letras, números y "guiones bajos" (_).
+ NO use espacios en ninguna parte del nombre.
+ Un número no puede ser el primer carácter del nombre.
+ Las letras mayúsculas son tratatas de manera diferente que las minúsculas (i.e., Python es case-sensitive).

3a = 10

In [33]:
3a = 10

SyntaxError: invalid syntax (<ipython-input-33-f986eee6e224>, line 1)

En el modo interactivo, la última expresión impresa es asignada a la variable _. Esto significa que cuando estés usando Python como una calculadora de escritorio, es más fácil seguir calculando, por ejemplo:

impuesto = 12.5 / 100 <br>
precio = 100.50 <br>
precio * impuesto

In [34]:
impuesto = 12.5 / 100
precio = 100.50
precio * impuesto

12.5625

precio + _ 

In [36]:
precio + _

113.06

round(_, 2)

In [37]:
round(_, 2)

113.06

## Escritura dinámica

Cuando asigna un nuevo valor a un objeto existente (*escritura dinámica*), los valores anteriores de ese objeto se borran de la memoria de la computadora. El valor anterior de b era 10.0498756211, pero después de una nueva asignación:

b = 10.0498756211

In [39]:
b = 10.0498756211

b = 'a' <br>
print(b)

In [42]:
b = a
print(b)

3.1701538797227005


El valor de un objeto se cambia solo a través del operador de asignación. El uso de un objeto en un cálculo no cambia el valor.

Lo brillante de organizar operadores en términos de argumentos de entrada y valores de salida es que la salida de un operador se puede utilizar como entrada para otro. Esto permite construir cálculos complicados a partir de cálculos más simples.

Una forma de conectar los cálculos es mediante el uso de objetos para almacenar las salidas intermedias:

a = np.arange(5) <br>
np.sqrt(a)

In [43]:
np.sqrt(a)

1.780492594683477

También puede pasar la salida de un operador directamente como argumento a otro operador:

np.sqrt(np.arange(5))

In [46]:
np.sqrt(np.arange(5))

array([0.        , 1.        , 1.41421356, 1.73205081, 2.        ])

### Tipos de datos (Data Types)

La mayoría de los ejemplos utilizados hasta ahora se han referido a números. Pero las computadoras también funcionan con otros tipos de información: texto, fotografías, sonidos, conjuntos de datos, etc. La palabra *type* se utiliza para referirse al tipo de información.

Es importante conocer los tipos de datos porque los operadores esperan que sus argumentos de entrada sean de tipos específicos. Cuando utiliza el tipo de entrada incorrecto, es posible que la computadora no pueda procesar su comando.

Para nuestros propósitos, es importante distinguir entre varios tipos básicos:

+ Datos numéricos (positivos y negativos):
     + números decimales y fraccionarios (**flotantes**), <code>a = 3.5 </code>
     + números enteros de longitud arbitraria (**ints**): <code>c=1809109863596239561236235625629561</code>
+ **Strings** de datos textuales: usted indica los datos de la cadena a la computadora encerrando el texto entre comillas (e.g.,<code>name = "python"</code>).
+ Datos **booleanos**: <code>a = True</code> o <code>a = False</code>.
+ **Números complejos**: <code>a = 2 + 3j</code>
+ Tipos de secuencia: **tuplas, listas, conjuntos, diccionarios** y **archivos**.

<b> - Tipos de Datos: Enteros, reales y complejos</b>

entero = 23 # type(entero) daría un int

In [47]:
entero = 23

In [48]:
type(entero)

int

entero = 23L # type(entero) daría long

In [76]:
entero = 23

SyntaxError: invalid syntax (<ipython-input-76-5aed34da2835>, line 1)

In [None]:
type(entero)

entero = 027 # 027 octal = 23 en base 10

In [68]:
entero= 0o27

In [69]:
type(entero)

int

entero = 0x17 # 0x17 hexadecimal = 23 en base 10

In [70]:
entero = 0x17

In [71]:
type(entero)

int

real = 0.2703

In [72]:
real = 0.2703

In [73]:
type(real)

float

real = 0.1e-3

In [54]:
real = 0.1e-3

In [55]:
type(real)

float

3+5j

In [74]:
complejo = 3+5j

In [75]:
type(complejo)

complex