# Análisis y visualización de datos abiertos con python
# 1. Introducción a Python

Bienvenido al curso de Análisis y Visualización de Datos Abiertos con Python. 

Durante el curso, aprenderás a manipular y visualizar datos de manera eficiente, utilizando herramientas y técnicas avanzadas. Al final del curso, esperamos que tengas las habilidades necesarias para realizar análisis de datos con confianza y en profundidad.

Este tutorial está diseñado para aquellos interesados en el análisis de datos y la visualización, y que desean aprender cómo utilizar Python y Pandas para realizar esta tarea de manera efectiva. Aunque no se requiere experiencia previa en programación o análisis de datos, se recomienda tener un conocimiento básico de Excel y Python para aprovechar al máximo el tutorial.

Este primer tutorial está diseñado para proporcionar una introducción práctica y en profundidad a la programación en Python y los notebooks de Anaconda.         
        

## 1.1 Python y Jupyter Notebooks

**Python es un lenguaje de programación** interpretado, dinámico y de alto nivel, creado por Guido van Rossum en 1991. Es ampliamente utilizado en diversos campos, incluyendo la ciencia de datos, el desarrollo web, la inteligencia artificial y la automatización de tareas. Python es conocido por ser fácil de aprender y leer, y cuenta con una amplia variedad de bibliotecas y módulos que facilitan el desarrollo de aplicaciones y proyectos. Además, es un lenguaje multiplataforma, lo que significa que se puede utilizar en diferentes sistemas operativos como Windows, Mac y Linux.

Para utilizar Python existen una serie de herramientas. En este curso nos centraremos es Anaconda y Notebooks.
Un **Jupyter Notebook** es una aplicación web que permite crear y compartir documentos que contienen código, texto, visualizaciones y otros elementos interactivos. Los Jupyter Notebooks se usan comúnmente en la ciencia de datos y la programación para explorar y analizar datos, desarrollar y probar código y crear informes o presentaciones interactivas. 



Antes de empezar cualquier proyecto, es importante **organizar bien los archivos**. Para ello, es recomendable crear una carpeta para el curso o proyecto. Jupyter incluye un gestor de archivos fácil de usar, desde el cual se puede abrir un notebook dando doble clic en él en el navegador de archivos de Jupyter.

Para **crear un nuevo notebook**, se puede hacer clic en File -> New -> Notebook, y asegurarse de guardarlo en la carpeta correcta.

Los Jupyter Notebooks están compuestos por **celdas**, que pueden ser de dos tipos: Markdown o Code. Las **celdas Markdown** permiten escribir texto en formato Markdown, mientras que las **celdas Code** permiten escribir código en el lenguaje de programación elegido. La salida generada por el código, como texto, tablas, imágenes, etc., también se mostrará en la celda Code.

Para **ejecutar una celda**, se puede hacer clic en el botón Run o presionar Ctrl + Enter. Es importante tener en cuenta que el kernel del Jupyter Notebook muestra el estado de ejecución y el lenguaje de programación en la esquina superior derecha..

### Ejercicio 1

1. Cree una carpeta para este curso
2. Descarga este Jupyter Notebook y colocalo en la carpeta del curso
3. Ejecuta la siguiente celda y examina las diferentes partes de la celda.

In [1]:
print("Hello world!")

Hello world!


## 1.2 Valores, variables y tipos

Antes de empezar necesitamos algunas definiciones:

* Valor: la medida o atributo real
* Variable: una medida o atributo que puede cambiar

Por ejemplo, cinco es un valor, pero a es una variable que puede tener cualquier valor, como 5.

5

In [2]:
a = 5
a

5

En Python existen diferentes tipos de datos, como números enteros, flotantes, texto y booleanos.

Los números enteros se escriben sin decimales, mientras que los flotantes tienen decimales. El texto se escribe entre comillas simples o dobles. Los booleanos son verdadero o falso.

* integer: número entero
* float: número decimal
* string: cadena de texto
* boolean: verdadero o falos
* None y nan: cuando no existe

para saber el tipo de un valor usamos la función _type()_

Por default el notebook nos muestra la salida de las instrucciones en la última linea de la celda sin necesidad de usar la intrucción `print`

Asignemos a la variable `a` el valor entero `5`

In [3]:
a = 5
a, type(a)

(5, int)

Ahora, asignemos a la misma variable `a` el valor flotante `5.0`. Podemos ver que aunque la variable es la misma el tipo cambia.

In [4]:
a = 5.0
a, type(a)

(5.0, float)

Tambien podemos asignar a `a` el texto `'cinco'`, marcando entre comillas que es un valor de texto. 

Cabe destacar que aunque para un humano el valor es el mismo, para la computadora son tres valores diferentes con distintas características. Tanto `5` como `5.0` son números y se pueden en usar operaciones matemáticas, aunque se representan diferenten en la memoria. 
Por otro lado `cinco` es un texto y se le aplican operaciones diferentes.

In [5]:
a = "cinco"
a, type(a)

('cinco', str)

Otro tipo de datos son los Booleanos, los cuales pueden ser verdaderos o Falsos.

In [6]:
a = False
a, type(a)

(False, bool)

A veces necesitamos representar la falta de información. `None` y `nan` se utilizan para representar cuando el valor "no existe" o "no es un número"

In [7]:
a = None
a, type(a)

(None, NoneType)

Python incluye una serie de herramientas por default, pero algunas mas especializadas se encuentran en bibliotecas especiales. Por ejemplo, `nan` o "not a number" es parte de biblioteca de operaciones matemáticas `numpy`.

**NOTA:** Si vez el siguiente error o similar es necesario instalar paquetes adicionales para leer un archivo de formato Excel, ve el tutorial [Instalación e inicio con Anaconda](./CP0-Instalacion.md) con instrucciones al respecto.

In [8]:
from numpy import nan
a = nan
a, type(a)

(nan, float)

### Listas

Además existen tipos que son colecciones de otros valores:
* list: lista ordenada
* dic: diccionario con llaves

Primero definiremos una lista, en este caso usaremos una nueva variable llamada `l`

In [9]:
l = [1,2,3,4,5,6,7,8,9,0]
l, type(l)

([1, 2, 3, 4, 5, 6, 7, 8, 9, 0], list)

Podemos acceder a las elementos de las listas por su posición. Las listas empiezan de cero. 

In [10]:
l[0]

1

Se puede acceder a un elemento de una lista por su indice

In [11]:
l[3]

4

El usar números negativos en el indice nos regresa el elemento contando del final hacia el principio

In [12]:
l[-1]

0

También podemos acceder a multiples consecutivos elementos de la lista con el formato `inicio : final`. 
Nota que no se incluye el último número.

In [13]:
l[2:6]

[3, 4, 5, 6]

Si no se marca el final en automático se pone el resto de la lista

In [14]:
l[4:]

[5, 6, 7, 8, 9, 0]

Las listas pueden contener valores de distintos tipos, incluyendo otras listas

In [15]:
l = [1,2, 'tres', 4, ['cinco','five', '5','cinq', 5], 6, 'siete']
l, type(l)

([1, 2, 'tres', 4, ['cinco', 'five', '5', 'cinq', 5], 6, 'siete'], list)

### Diccionarios

Los diccionarios son pares de números, tienen una llave y un valor. 

La llave debe de ser un tipo _inmutable_ como texto, número o Booleano.

In [16]:
a = {'uno':1, 'dos':2, 'tres':3, 'cuatro':4, 'cinco':5}
a, type(a)

({'uno': 1, 'dos': 2, 'tres': 3, 'cuatro': 4, 'cinco': 5}, dict)

Se puede acceder al diccionario usando la llave.

In [17]:
a['tres']

3

## 1.3 Operaciones y funciones

En Python se pueden realizar operaciones matemáticas, como suma, resta, multiplicación y división. También se pueden usar operadores de comparación, como igual a (==), menor que (<) y mayor que (>).

Las operaciones y comparaciones se combinan para crear expresiones, que son evaluadas para producir un resultado.

Una **función** toma una serie de argumentos y realiza una serie de pasos y regresa un resultado (generalmente). 

Podemos distinguir las funciones por que usan parentesis.
* print('Hola mundo')
* ' '.join(['a','b','c','d'])

Los corchetes se usan para encontrar la posición dentro de una estructura de datos

In [18]:
a = 5
b = 17
a + b

22

Tambien podemos verificar si dos variables son iguales con `==`

In [19]:
a == b

False

Para diferencia se usa `!=`

In [20]:
a != b

True

Además hay operaciones como mayor `>`, menor `<`, mayor o igual `>=` y menor o igual `<=`, 

In [21]:
a > b

False

En el caso de las cadenas de texto existen funciones como unir, capitalizar, remplazar o quitar acentos

In [22]:
s = 'foo'
t = 'bar'
s+t

'foobar'

Se pueden unir varios textos con otro texto

In [23]:
'-'.join([s,t,t,s])

'foo-bar-bar-foo'

Se puede cambiar de mayusculas a minusculas de varias formas

In [24]:
s.capitalize()

'Foo'

O se puede remplazar un texto específico por otro

In [25]:
t.replace('ar','arggggg')

'barggggg'

No todas las funciones están en los paquetes básicos. Por ejemplo, quitar acentos esta en ´unidecode´, por lo cuál es necesario instalarlo e importarlo.

In [26]:
import unidecode
s = 'foó'
unidecode.unidecode(s)

'foo'

## 1.4 Comentarios y errores

Es importante documentar los pasos que seguimos dentro de un análisis, parte de esta documentación son los comentarios.

Los comentarios son pequeños textos dentro del código que explican lo que este hace. Los comentarios empiezan con #.

In [27]:
# Importa la funcion unidecode para quitar acentos
from unidecode import unidecode
a = 'foó' #declara variable
unidecode(a) # ejecuta la funcion

'foo'

Cuando python no encuentra un problema puede levantar un warning o error. Un warning es una advertencia, mientras que un error implica que algo fallo. Estos se muestran como celdas rojas.

Para leer un error es importante recordar:
* La flecha verde indica en que linea se cometio el error
* La última linea dice el resumen del error, esta linea es la que se googlea para buscar una solución

In [28]:
a = {'uno':1, 'dos':2, 'tres':3, 'cuatro':4, 'cinco':5}
a[3]

KeyError: 3

### Ejercicio 2
1. Crea una nueva celda de código
2. Crea una lista con cinco elementos y guardala en una variable _b_
3. Encuentra el primer, tercer y ultimo elemento
4. En una celda nueva escribe una expresión que generé un error
5. Reconoce cada uno de los elementos del mensaje de error
6. Busca el error en google y explica que sucedió

**Gracias!**