## Ejemplo 1: Préstamos Peer-to-Peer (Finanza)


### El Modelo de Negocio

Préstamos Peer-to-peer (abreviado P2P) ocurren cuando inversores prestan dinero directamente a personas o negocios a través de una plataforma online. La plataforma online pone en contacto de manera digital y automática a los prestamistas con los inversores, y conduce también el análisis crediticio y de riesgo necesario para determinar el riesgo del préstamo y la tasa de interés adecuada. Suele haber un menor costo de operación en los prestamos P2P, por esto los inversores obtienen retornos más altos, y los prestamistas intereses más bajos. Aunque hoy en día, esto ya no suele ser siempre así.

### Compañía: Lending Club

**Lending Club** es una compañía de préstamos P2P de los Estados Unidos. El trabajo de  Lending Club es poner en contacto, de manera digital, inversores con prestamistas. Cuando los inversores prestan dinero a través de Lending Club, el dinero es distribuido a los prestamistas, y cuando estos últimos devuelven el préstamo, el capital y el interés es devuelto a los inversores. 
Si quieres saber más acerca de Lending Club visita su [página web](https://www.lendingclub.com/).

### El set de datos

El set de datos proveniente de Lending Club contiene datos sobre préstamos desembolsados por la compañía, incluyendo el estado actual del préstamo al crearse el set de datos, (Current, Late, Fully Paid, etc.) e información acerca de pagos. Las variables incluyen también información acerca de la situación financiera y otros datos acerca del prestamista. 
El set de datos contiene alrededor de 890 mil observaciones y 75 variables. Puedes encontrar más detalles acerca de este set de datos en la página online de [Kaggle](https://www.kaggle.com/wendykan/lending-club-loan-data)

### Bajar y guardar

Para bajar el set de datos:

- Visita la página de [Kaggle](https://www.kaggle.com/wendykan/lending-club-loan-data)
- Navega hacia abajo y haz clic en el archivo llamado "loan.csv"
- Haz clic luego el botón "Download" arriba de la pantalla
- Descomprime el archivo
- Mantiene el nombre del set de datos como "loan.csv"
- Guarda el archivo en la carpeta que contiene los Jupyter notebooks en donde vez el archivo “GUARDA_DATASETS_AQUI”.

**Atención:**
- Necesitas estar logueado en Kaggle para bajar el set de datos.
- Necesitas aceptar los términos y condiciones

## Ejemplo 2: Predecir el precio de venta de casas

En este set de datos, tenemos variables con características de las casas y los barrios en donde se encuentran localizadas, y el objetivo es predecir el precio de venta en base a estas variables. Predecir el precio de venta suele ser un dato útil para anticipar áreas en donde hacer futuras inversiones.

### Bajar y guardar

Par bajar el código haz lo siguiente:

- Visita la [página web House Sale Price competition](https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data)
- Navega hacia abajo y haz clic en “train.csv” y luego en el botón de “Download” a la derecha
- Cámbiale el nombre al set de datos a “houseprice.csv”
- Guarda el set de datos en la carpeta que contiene los Jupyter notebooks, en donde vez el archivo “GUARDA_DATASETS_AQUI”.


## Ejemplo 3: Predecir sobrevivencia en el Titanic

### Historia
Como probablemente sabes, el Titanic fue un lamentable hecho en donde el barco llamado Titanic choca con in tempano de hielo, y se hunde, terminando con la vida de 1502 de sus 2224 pasajeros. Es curioso, como el análisis de las características de los pasajeros revela datos interesantes acerca de quienes fueron priorizados al momento del salvataje, siendo la mayoría de los sobrevivientes mujeres y niños de clase alta. 

### Para generar el set de datos, sigue estas instrucciones

In [1]:
import pandas as pd
import numpy as np

In [2]:
data = pd.read_csv('https://www.openml.org/data/get_csv/16826755/phpMYEkMl')
data.head()

Unnamed: 0,pclass,survived,name,sex,age,sibsp,parch,ticket,fare,cabin,embarked,boat,body,home.dest
0,1,1,"Allen, Miss. Elisabeth Walton",female,29.0,0,0,24160,211.3375,B5,S,2,?,"St Louis, MO"
1,1,1,"Allison, Master. Hudson Trevor",male,0.9167,1,2,113781,151.55,C22 C26,S,11,?,"Montreal, PQ / Chesterville, ON"
2,1,0,"Allison, Miss. Helen Loraine",female,2.0,1,2,113781,151.55,C22 C26,S,?,?,"Montreal, PQ / Chesterville, ON"
3,1,0,"Allison, Mr. Hudson Joshua Creighton",male,30.0,1,2,113781,151.55,C22 C26,S,?,135,"Montreal, PQ / Chesterville, ON"
4,1,0,"Allison, Mrs. Hudson J C (Bessie Waldo Daniels)",female,25.0,1,2,113781,151.55,C22 C26,S,?,?,"Montreal, PQ / Chesterville, ON"


In [3]:
data = data.replace('?', np.nan)
data.isnull().sum()

pclass          0
survived        0
name            0
sex             0
age           263
sibsp           0
parch           0
ticket          0
fare            1
cabin        1014
embarked        2
boat          823
body         1188
home.dest     564
dtype: int64

In [4]:
def get_first_cabin(row):
    try:
        return row.split()[0]
    except:
        return np.nan 

In [5]:
data['cabin'] = data['cabin'].apply(get_first_cabin)

In [6]:
data.to_csv('../titanic.csv', index=False)

**Atención**

Si ejecutas ese Jupyter notebook desde donde se localiza en la carpeta que contiene los Jupyter notebooks, el set de datos del titanic, se guardara en la carpeta adecuada.

Sino, asegurate de que ese guardado en la carpeta que contiene los Jupyter notebooks, en donde vez el archivo que dice GUARDAR_DATASETS_AQUI
