# <font color='navy'>Introducción a Algotrading</font>
<font color='blue'>Ing. Carlos Crespo Elizondo, MSF</font><br>
MF-013 Análisis de Inversión<br>
Clase del 26 de octubre 2021<br>

Maestría de Finanzas, Facultad de Economía<br>
UANL<br>

## Trabajando con datos financieros

> _"Claramente los datos le ganan a los algortimos.  Sin datos exahustivos tiendes a obtener predicciones no-exahustivas."_  Rob Thomas (Gerente General la división Analytics Business de IBM).

Tipos de información financiera (ejemplos).
<table>
    <th></th>
    <th>Datos Estructurados</th>
    <th>Datos No Estructurados</th>
    <tr>
        <td>Datos históricos</td>
        <td>Precios de cierre</td>
        <td>Noticias financieras</td>
    </tr>
    <tr>
        <td>Datos en tiempo real</td>
        <td>Precios bid/ask de las criptos</td>
        <td>Un tweet de Ellon Musk</td>
    

## Tipos de archivos

Hay muchos formatos de datos que provienen de fuentes externas.  Durante el resto del curso trabajaremos con archivos CSV y JSON's.

### Archivos CSV

Son archivos de texto simple, separados por comas.  CSV es la abreviación de "Comma Separated Values".<br><br>
En la mayoría de los archivos CSV, la primer fila representa los encabezados de las columnas.  Todas las filas posteriores, representan entradas de datos.  En otros casos, las primeras filas representan espcificaciones del archivo en cuestión. 

Por lo general es una descarga manual del usuario.

### Archivos JSON

Son archivos que guarda estructura de datos en formato JSON (JavaScript Object Notation).  Es un formato utilizado para transmitir datos entre una aplicación y un servidor.

## Archivos CSV y Python

Python tiene su propia librería para leer archivos CSV.  La librería se llama `csv`.  Una limitante es que no puedes cargar directamente un archivo de internet como lo hicmos con la función de Numpy `loadtxt( )`.  Para poder obtener datos de internet se ocuparía otra librería como `requests` o `urlib`, haciendo la obtención de datos de internet más complicada de lo que es.

Por lo anterior solo utilizaremos pandas para leer archivos csv.

## Importar precios de WALMEX

Pasos:
1. Importar datos de internet, guardarlos en un DataFrame de pandas y gurdarlo como "__*walmex*__"
1. Formato del DataFrame:
    * Index: Columna de fechas
    * Fecha más antigua:  Index 0
    * Fecha más reciente:  Index -1
    * Nombre y órden de las columnas: "Apertura", "Maximo", "Minimo", "Cierre"$^+$
1. Crear una columna del DataFrame con los Retornos logarítmicos de los precios de cierre diarios
1. Realizar las siguientes gráficas:
    * Precios de cierre
    * Retornos diarios
    * Histograma de los retornos
<br><br>

__**NOTAS:__<br>
$+$ No te recomiendo utilizar acentos al momento de definir el nombre de variables, columnas, df, etc.

### Lista de emisoras

<table>
    <tr>
      <th><center></center></th>
      <th><center></center></th>
      <th><center></center></th>
      <th><center></center></th>
  </tr>
    
  <tr>
    <td style="text-align:center;">ac</td>
    <td style="text-align:center;">alfaa</td>
    <td style="text-align:center;">alpeka</td>
    <td style="text-align:center;">alsea</td>
  </tr>
  
  <tr>
    <td style="text-align:center;">amxl</td>
    <td style="text-align:center;">asurb</td>
    <td style="text-align:center;">bimboa</td>
    <td style="text-align:center;">bolsaa</td>
  </tr>
  
  <tr>
    <td style="text-align:center;">cemexcpo</td>
    <td style="text-align:center;">elektra</td>
    <td style="text-align:center;">femsaubd</td>
    <td style="text-align:center;">gapb</td>
  </tr>
  
  <tr>
    <td style="text-align:center;">gcarsoa1</td>
    <td style="text-align:center;">gcc</td>
    <td style="text-align:center;">gmexicob</td>
    <td style="text-align:center;">grumab</td>
  </tr>
  
  <tr>
    <td style="text-align:center;">ienova</td>
    <td style="text-align:center;">kimbera</td>
    <td style="text-align:center;">kofubl</td>
    <td style="text-align:center;">labb</td>
  </tr>
  
  <tr>
    <td style="text-align:center;">livepolc1</td>
    <td style="text-align:center;">megacpo</td>
    <td style="text-align:center;">omab</td>
    <td style="text-align:center;">orbia</td>
  </tr>

  <tr>
    <td style="text-align:center;">penoles</td>
    <td style="text-align:center;">pinfra</td>
    <td style="text-align:center;">tlevisacpo</td>
    <td style="text-align:center;">walmex</td>
  </tr>

</table>

#### Obtener datos de más acciones

De la liga cambiar "walmex" por la acción de interés, por ejemplo "ac":<br>
http://bit.ly/oncedos-walmex ---> http://bit.ly/oncedos-ac

## Función `read_csv( )` de pandas

`read_csv( )` nos permite controlar varios parámetros y termina siendo un DataFrame.  La clase `DataFrame` tiene varios métodos que tienen muchos usos en el campo de las finanzas. 

https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html

### 1. Importar datos de Walmex

#### Importar datos sin las primeras 6 líneas

### 2. Formato del DataFrame

#### 2.1 Index: Columna de fechas

Dos opciones para cambiar la columna "*__Date__*" al index:
1. Cambiar la columan "*__Date__*" a index de manera manual.
2. Importar los datos espcificando que la columna "_**Date**_" es el index.

##### Una vez ya importado el `DataFrame`

##### Importar datos especificando que la columan "Date" será el index

### 2.2 / 2.3 Orden de fechas

#### Método `sort_index( )`

#### Atributo `parse_dates`

### 2.4 Nombre y órden de las columnas: "Apertura", "Maximo", "Minimo", "Cierre" 

Cambios finales al df:
1. Borrar las columnas que no utilizaremos
1. Renombrar las columnas a español
1. Ordenar las columnas en el formato O-H-L-C

#### 2.4.1 Borrar columnas

#### 2.4.2 Renombrar columnas

#### 2.4.3 Reordenar columnas

### Volver a hacer todo en una sola celda

### 2.3 Crear columna de retornos diarios
$$RetLogaritmico = ln(Precio_n) - ln(Precio_{n-1})$$<br>
$$ =ln\frac{Precio_n}{Precio_{n-1}}$$

#### Retornos en la escala logarítmica

#### Retornos en la escala números reales

### 2.4 Graficar

#### 2.4.1 Precio de cierre

#### 2.4.2 Retornos

#### 2.4.3 Histograma

## Crear funciones

Las funciones es un bloque de código diseñado para hacer un trabajo específico.  

Las funciones pueden:
* Recibir valores
* Tener valores predeterminados *por defalut* para el caso en que no se definan valores
* NO RECIBIR VALORES!
* Regresar un resultado
* No regresar nada

### Función para importar datos archivos de Bloomberg