# Python en 20 mínutos: el camino hacia el análisis de datos

## Python como una calculadora
Cualquier lenguaje de programación puede utilizarse como una calculadora.

Realizar **operaciones** aritméticas con Python es muy sencillo. Únicamente tenemos que utilizar el operador adecuado:

* Suma: `+`
* Resta: `-`
* Multiplicación: `*`
* División: `/`
* División entera: `//`
* Potenciación: `**`
* Módulo (el resto de una división): `%`


In [None]:
4 + 4

In [None]:
4 * 3

In [None]:
3 +3 - 2

## Variables
Como en la mayoría de lenguajes, en Python solemos querer ponerle nombre a las variables, números, strings y demás objetos que creamos. La manera de hacerlo es a través de la asignación. Tan sencillo como utilizar el signo "=" :

In [None]:
x = 10
nombre = 'javier'

In [None]:
#El IMC se calcula dividiendo el peso en kilogramos por el cuadrado de la estatura en metros
peso = 70
altura = 1.70
imc = peso / altura ** 2
imc

## Funciones 

Las inmensa totalidad de las funcionales en Python las realizamos a través de las funciones.

In [None]:
print('me llamo javier')

In [None]:
round(imc, 3)

## Tipos de datos en Python
Existen una cantidad enorme de tipos de dato en Python. Los propios usuarios pueden crear nuevos tipos de datos a través de las clases (¡y de las clases que han creado otras personas en la infinidad de bibliotecas que hay para Python!). No obstante, existen una serie de tipos básicos, que vienen ya integrados en Python.

* Integers: números enteros **(int)** 

* Float: Números decimales **(float)**

* String : las variables que contienen texto. También conocidas como variables **(str)**

* Lógicas: las variables que contienen valores True o False **(bool)**


La función **type()** **nos permite ver qué tipo de dato es el objeto que pasamos:

In [None]:
print(7)
print(7.1235)
print("7")
print(True)

In [None]:
print(type(7))
print(type(7.1235))
print(type("7"))
print(type(False))

## Colecciones en Python
Por lo general, se considera una colección a una estructura o tipo de dato que dentro contiene otros elementos.

En Python, consideramos colecciones a cualquier objeto que es iterable, es decir: que podemos iterar por él (normalmente con un for). De hecho, los strings pueden considerarse como un tipo de colección, ya que, como ya hemos visto podemos iterar por sus caractéres

In [None]:
string = 'me encanta La pizza'
for caracter in string:
    print(caracter.upper() , "!!")

        

Además de los strings, existen otras estructuras de datos en la familia de las colecciones. Las principales son **las listas, las tuplas, los sets y los diccionarios.**

### Listas

In [None]:
lista_numerica = [1,4,6,102,1.4]
lista_numerica

In [None]:
lista = ['1',5,4.2,True]

In [None]:
lista_ciudad = ['barcelona','sevilla','badajoz','zamora']
print(lista_ciudad[2])
print(lista_ciudad[1:3])

In [None]:
for ciudad in lista_ciudad:
    if ciudad =='badajoz':
        print(ciudad, 'es mi ciudad favorita')
    else:
        print(ciudad, 'tampoco está mal')

### Diccionarios
Los diccionarios de Python son una secuencia ordenada y mutable de claves y valores. Son una estructura de dato muy pontente. Se definen con llaves { }, y sus elementos se escriben de la forma clave:valor, y separados por comas ,:


In [None]:
primer_diccionario = {"persona":'rosa',
                      "comida":'pasta',
                      "animal":'elefante', 
                      'numero':'6'
                      }


In [None]:
primer_diccionario['comida']

In [None]:
primer_diccionario['pais'] = 'senegal'

In [None]:
primer_diccionario

## Bibliotecas: un infinito mundo de funciones
En esencia, las bibliotecas son código (funciones y clases) que hacen cosas útiles, y que alguien ha escrito para que nosotros no tengamos que hacerlo.

Principalmente, hay dos sitios donde podemos ir a buscar bibliotecas que nos sean útiles para nuestros propósitos:

* La Biblioteca Estándar de Python [Python's Standard Library](https://docs.python.org/3/library/) contiene todo lo que hemos visto hasta ahora, y muchísimo más. Vienen disponibles con nuestra instalación de Python: al ser biblioteca estándar, nos vale con tener Python instalado. No tenemos que irnos a internet a descargar e instalar nada más.

* Bibliotecas de terceros: Internet está plagado de bibliotecas escritas en Python para hacer prácticamente todo lo que te puedas imaginar. Eso sí: tendremos que descargar e instalarlas. El Python Package Index o PyPI es el repositorio de software oficial para aplicaciones de terceros en el lenguaje de programación Python.








In [None]:
import math
math.sqrt(25)

## Analizando datos con pandas

In [None]:
import pandas as pd

In [None]:
diccionario = {
    "nombre": ["Julio", "Nuria", "Jose", "Luis", "Nuria","Daniel", "Javier",'Elisa','Sofía','Carlos','Nuria'],
    "edad": [ 22, 14, 22, 80, 14, 7, 32, 48, 17, 72, 26],
    "sexo": ["M", "F","M","M","F","M","F", 'F','F','M','F'],
}

gente = pd.DataFrame(diccionario)
gente

In [None]:
titanic = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/titanic.csv')

In [None]:
titanic

In [None]:
titanic.info()

In [None]:
titanic.describe()

In [None]:
titanic.sort_values(by='age', ascending=False)

In [None]:
titanic['class'].value_counts()

In [None]:
third_class = titanic[titanic['class']=='Third']
third_class

## Visualizando datos


In [None]:
import matplotlib.pyplot as plt

In [None]:
plt.hist(titanic['age'], bins =10) 
 
plt.xlabel("Edad")
plt.title("Histograma de la edad de los pasajeros del Titanic")
plt.show()

In [None]:
plt.style.use('seaborn')
plt.hist(titanic['age'], bins =10) 
 
plt.xlabel("Edad")
plt.title("Histograma de la edad de los pasajeros del Titanic")
plt.show()