# Trabajando con Datos en el Entorno de Ejecución (Python)

Chequeemos la versión

In [None]:
import sys
print(sys.version)

In [None]:
!python --version

##Palabras y Frases

A diferencia de los lenguajes humanos, el vocabulario de Python es en realidad bastante reducido. Llamamos a este “vocabulario” las “palabras reservadas”. Se trata de palabras que tienen un significado muy especial para Python. Cuando Python se encuentra estas palabras en un programa, sabe que sólo tienen un único significado para él.

Las palabras reservadas en el lenguaje que utilizan los humanos para hablar con
Python son, entre otras, las siguientes:

```
and      del     global   not      with
as       elif    if       or       yield
assert   else    import   pass
break    except  in       raise
class    finally is       return
continue for     lambda   try
def      from    nonlocal while
```

Por ejemplo, frente a la orden `print`, Python _imprimirá_ lo que le indiquemos:

In [None]:
# El clásico primer ejemplo
print('Hello World!')

In [None]:
print('¡Hola Mundo!')

<h2>¿Qué podemos revisar?</h2>

Podemos revisar cuál versión de Python tenemos (pero eso ya lo sabíamos)

In [None]:
!python --version

Podemos revisar las librerías disponibles.

In [None]:
!pip list -v

Podemos instalar librerías

In [None]:
!pip install advertools

Podemos conectarnos al drive de google de una manera sencilla

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Es necesario revisar muy bien la sintaxis para comprender los errores:

In [None]:
print 'Imprimamos esto'

In [None]:
print('Imprimamos esto')

Necesitamos definir los objetos si queremos llamarlos

In [None]:
x

In [None]:
x = [1,2,3,5]
x

Se pueden comenter muchos errores programando, los errores más comunes son:

*Errores de sintaxis (Syntax errors)*

In [None]:
primt '¡Hola, mundo!'

*Errores lógicos: la sintaxis es correcta pero el orden de las sentencias está mal*

In [None]:
+ x

*Errores semánticos: la descripción es sintácticamente correcta y está en el orden correcto, pero sencillamente hay un error en el programa*

In [None]:
print(1,000,000)

Un primer vocabulario

- **bug** Un error en un programa.
- **código fuente** Un programa en un lenguaje de alto nivel.
- **código máquina** El lenguaje de más bajo nivel para el software, es decir,
el lenguaje que es directamente ejecutado por la unidad central de
procesamiento (CPU).
- **compilar** Traducir un programa completo escrito en un lenguaje de alto nivel a
un lenguaje de bajo nivel, para dejarlo listo para una ejecución posterior.
- **error semántico** Un error dentro de un programa que provoca que haga algo
diferente de lo que pretendía el programador.
- **función print** Una instrucción que hace que el intérprete de Python muestre un
valor en la pantalla.
- **indicador de línea de comandos (prompt)** Cuando un programa muestra un
mensaje y se detiene para que el usuario teclee algún tipo de dato.
- **interpretar** Ejecutar un programa escrito en un lenguaje de alto nivel traduciéndolo
línea a línea.
- **lenguaje de alto nivel** Un lenguaje de programación como Python, que ha sido
diseñado para que sea fácil de leer y escribir por las personas.
- **lenguaje de bajo nivel** Un lenguaje de programación que está diseñado para ser
fácil de ejecutar para una computadora; también recibe el nombre de “código
máquina”, “lenguaje máquina” o “lenguaje ensamblador”.
- **memoria principal** Almacena los programas y datos. La memoria principal
pierde su información cuando se desconecta la alimentación.
- **memoria secundaria** Almacena los programas y datos y mantiene su información
incluso cuando se interrumpe la alimentación. Es generalmente más
lenta que la memoria principal. Algunos ejemplos de memoria secundaria
son las unidades de disco y memorias flash que se encuentran dentro de los
dispositivos USB.
- **modo interactivo** Un modo de usar el intérprete de Python, escribiendo comandos
y expresiones directamente en el indicador de la línea de comandos.
- **parsear** Examinar un programa y analizar la estructura sintáctica.
- **portabilidad** Es la propiedad que poseen los programas que pueden funcionar en
más de un tipo de computadora.
- **programa** Un conjunto de instrucciones que indican cómo realizar algún tipo de
cálculo.
- **resolución de un problema** El proceso de formular un problema, encontrar una
solución, y mostrar esa solución.
- **semántica** El significado de un programa.
- **unidad central de procesamiento** El corazón de cualquier computadora. Es
lo que ejecuta el software que escribimos. También recibe el nombre de
“CPU” por sus siglas en inglés (Central Processsing Unit), o simplemente,
“el procesador”.

Podemos hacer operaciones entre objetos (en eso se profundizará en el módulo correspondiente)

In [None]:
x = 43
x = x + 1
print(x)

<h2>Variables, expresiones y sentencias</h2>

<h3>Valores y Tipos</h3>

- Un valor es una de las cosas básicas que utiliza un programa, como una letra o un
número.
- Un tipo es la clasificación del valor

El intérprete de Python nos puede indicar el tipo de valor que tenemos:

In [None]:
type('¡Hola, mundo!')

In [None]:
type(4)

In [None]:
type(x)

In [None]:
type(3.2)

In [None]:
type('17')

Importante para no cometer errores semánticos o de sintaxis: no usar separadores de miles en los números grandes y utilizar el punto (.) como separador de decimales

In [None]:
print(1,000,000)
print(1000000)

In [None]:
print(1.000.000)

<h3>Variables</h3>
Una variable es un nombre que se refiere a un valor. Una sentencia de asignación crea variables nuevas y las da valores:

In [30]:
mensaje = 'Y ahora algo completamente diferente'
n = 17
pi = 3.1415926535897931

```
# Esto tiene formato de código
```

Para conocer el valor de la variable, se puede usar la función `print` y `type` para conocer el tipo

In [None]:
print(mensaje)
type(mensaje)

In [None]:
print(n)
type(n)

In [None]:
print(pi)
type(pi)

## Nombres de variables y palabras claves

Los programadores generalmente eligen nombres para sus variables que tengan sentido y documenten para qué se usa esa variable.

Los nombres de las variables pueden ser arbitrariamente largos. Pueden contener tanto letras como números, pero no pueden comenzar con un número. Se pueden usar letras mayúsculas, pero es buena idea comenzar los nombres de las variables con una letras minúscula.

El carácter guión-bajo (_) puede utilizarse en un nombre. A menudo se utiliza en nombres con múltiples palabras, como en mi_nombre o `velocidad_de_golondrina_sin_carga`. Los nombres de las variables pueden comenzar con un carácter guión-bajo, pero generalmente se evita usarlo así a menos que se esté escribiendo código para librerías que luego utilizarán otros.

Si se le da a una variable un nombre no permitido, se obtiene un error de sintaxis:

In [None]:
76trombones = 'gran desfile'

In [None]:
more@ = 1000000

In [None]:
class = 'Teorema avanzado de Zymurgy'

## Sentencias

Una _sentencia_ es una unidad de código que Python (el intérprete) puede ejecutar:

In [None]:
print(1)
x = 2
print(x)

## Operadores

Son símbolos especiales que representan cálculos:

In [None]:
# Suma
20+32

In [None]:
# Resta
hour = 60
hour-1

In [None]:
# Multiplicación
minute = 59
hour*60 + minute

In [None]:
# División
minute/60

In [None]:
## Potenciación
5**2

In [None]:
2**3

In [None]:
# Podemos combinar operadores para definir operaciones mas complejas
(5+9)*(15-7)

In [None]:
# DIvisión entera
minute//60

# Abriendo archivos

Son varios los tipos de archivos que podemos cargar, aunque las últimas actualizaciones de Python han incorporado restricciones a algunas extensiones (p.ej. los archivos generados por otros programas de procesamientos de datos como stata o spss o sas pueden presentar dificultades al momentos de importarlos)

In [None]:
# veamos dónde estamos ubicados
import os
os.getcwd()

In [61]:
# Podemos cambiar el directorio
os.chdir('/content/Archivos')

In [None]:
os.getcwd()

In [None]:
## Archivo plano txt
import numpy as np
filename = 'datos.txt'
datatxt = np.loadtxt(filename, delimiter='\t', dtype=str)
print(datatxt)

In [None]:
import pandas as pd
datacsv = pd.read_csv('datos.csv')
print(datacsv)

In [None]:
# Excel
import pandas as pd
file = 'datos.xlsx' 
dataexcel = pd.ExcelFile(file)
print(dataexcel)

In [None]:
# Stata
import pandas as pd
datastata = pd.read_stata('datosStata.dta')
print(datastata)

In [None]:
# SPSS
dataspss = pd.read_spss('./contet/Archivos/DatosSPSS.sav')
type(dataspps)

In [None]:
!pip install pyreadstat

In [None]:
# SPSS
import pyreadstat
dataspss = pyreadstat.read_sav('DatosSPSS.sav')
type(dataspss)

## Convertir los datos en un objeto

Podemos convertir los datos que tenemos en un tipo específico de objeto

In [None]:
# Lo más práctico, en un data frame
type(datatxt)

In [None]:
import pandas as pd
df = pd.DataFrame(data=datatxt)
df.head()

In [None]:
type(dataexcel)

In [None]:
dataexcel.sheet_names

In [None]:
dfexcel = dataexcel.parse("datos")
dfexcel.head()