In [12]:
# IMPORTACIÓN DE DATOS DE UNA PLANILLA
# LIBRERIA CSV
# Vamos a leer un archivo "SPY.csv" que tiene las cotizaciones de los últimos 20
# años del ETF que replica el S&P500
# 1- Importamos la libreria CSV que tiene un método para leer justamente este tipo de archivos
# 2- Usamos el método Reader de la libreria csv, y pasamos de argumento el archivo y el delimitador
# 3- Creamos una lista vacía
# 4- Armamos un ciclo definido que recorra todas las filas del archivo
# 5- En cada procesamiento del ciclo insertamos la fila a la lista creada
# 6- Imprimimos las primeras 5 filas

import csv

data = csv.reader(open("SPY.csv"), delimiter=";")
lista = []
for fila in data:
    lista.append(fila)
print(lista[0:5])
print("--------------------")
# Accedemos a una sola fila
print(lista[1])
# Accedemos a un elemento único de una determinada fila, en este caso, al 3° elemento de la 2° fila
lista[1][2]


[['timestamp', 'open', 'high', 'low', 'close', 'adjusted_close', 'volume'], ['19/3/2020', '239.25', '247.38', '232.22', '240.51', '240.51', '288124389'], ['18/3/2020', '236.25', '248.37', '228.02', '240', '240', '324845381'], ['17/3/2020', '245.04', '256.17', '237.07', '252.8', '252.8', '260566279'], ['16/3/2020', '241.18', '256.9', '237.36', '239.85', '239.85', '295019288']]
--------------------
['19/3/2020', '239.25', '247.38', '232.22', '240.51', '240.51', '288124389']


'247.38'

In [13]:
# Imprimir en la pantalla la fecha y el precio de cierre de, los primeros 5 datos de la serie.
import csv

data = csv.reader(open("SPY.csv"), delimiter=";")
lista = []
for fila in data:
    lista.append(fila)

primeros5 = lista[1:6]
for ohlc in primeros5:
    print(ohlc[0] + " Cierre $" + str(ohlc[4]))


19/3/2020 Cierre $240.51
18/3/2020 Cierre $240
17/3/2020 Cierre $252.8
16/3/2020 Cierre $239.85
13/3/2020 Cierre $269.32


In [14]:
# Guardamos una columna en una lista
# Esto de tener todas las filas guardadas como filas no nos servira
# mucho porque cada fila tiene datos que no tienen nada que ver entre si,
# por lo general, va a ser mas útil agrupar datos de columnas de este tipo de series

# Tengo en la variable lista todas las filas
import csv

data = csv.reader(open("SPY.csv"), delimiter=";")
lista = []
for fila in data:
    lista.append(fila)
# Vamos a recorrer esas filas e ir llenando una lista con solo los valores de las fechas
# en este caso
# PASOS:
# 1- Definimos la lista de fechas vacía
# 2- Luego armamos el ciclo definido
# 3- Dentro del bloque del ciclo agregamos la lista vacía
# 4- Por ultimo, imprimimos las primeras 5 fechas a ver si esta todo ok
fechas = []
for i in range(1, len(lista)):
    fechas.append(lista[i][0])
print(f"1- {fechas[0:5]}")

# La manera abreviada de llenar la lista es definirla y en el mismo paso, adentro de los corchetes,
# llenarla. Para llenarla, ponemos el valor y luego la iteración que define al valor.
fechas = [lista[i][0] for i in range(i, len(lista))]
print(f"2- {fechas[0:5]}")


1- ['19/3/2020', '18/3/2020', '17/3/2020', '16/3/2020', '13/3/2020']
2- ['20/3/2000']


In [15]:
# Podriamos también directamente cuando leemos el CSV armar la o las columnas que necesitaremos
# Por ejemplo:
import csv

data = csv.reader(open("SPY.csv"), delimiter=";")
cierres_ajustados = []
for fila in data:
    cierres_ajustados.append(fila[5])
print(cierres_ajustados[0:5])
# En este caso, estamos guardando tambien el encabezado de la columna, podriamos quitarlo con la funcion del()
del cierres_ajustados[
    0
]  # Borra el primer valor (el que tiene el encabezado) pero "resetea" el lugar 0.
print(cierres_ajustados[0:4])


['adjusted_close', '240.51', '240', '252.8', '239.85']
['240.51', '240', '252.8', '239.85']


In [16]:
# Forma mas abreviada de obtener una determinada columna con solo 5 lineas en total desde el CSV
import csv

data = csv.reader(open("SPY.csv"), delimiter=";")
cierres_ajustados = [fila[5] for fila in data]
del cierres_ajustados[0]
cierres_ajustados[0:4]


['240.51', '240', '252.8', '239.85']

In [17]:
# Ejercicio: Partiendo de la data de cierres, calcular la columna de variaciones diarias.
# Como la serie de datos esta ordenada del mas reciente primero hasta el mas antiguo al final,
# lo calcularemos como el cociente de: cierre_ajustado[i] / cierre_ajustado[i+1] = cierre actual / cierre anterior
# Luego, utilizaremos el método float() para transformar el dato que me viene encomillado, es decir, como string, a decimal
# y también utilizaremos el método round para limitar la cantidad de decimales del resultado.
import csv

data = csv.reader(open("SPY.csv"), delimiter=";")
cierres_ajustados = [fila[5] for fila in data]
del cierres_ajustados[0]

variaciones = []
for i in range(0, len(cierres_ajustados)):
    try:
        var = round(
            (float(cierres_ajustados[i]) / float(cierres_ajustados[i + 1]) - 1) * 100, 2
        )
        variaciones.append(var)
    except:
        pass
print(variaciones[0:4])
# Utilizamos el método try/except para evitar dos tipos de errores:
# 1- El error de "out of range", es decir, cuando llegue al final de la serie que no me tire error por querer
# buscar el elemento siguiente (que no existe)
# 2- El error potencial de alguna division por cero en caso que tenga un 0 en algún cierre (por defecto
# de la data feed)


[0.21, -5.06, 5.4, -10.94]


In [18]:
# DE CSV A DICCIONARIO
# En realidad, no es muy util utilizar diccionarios para calcular parametros y hacer análisis, el uso de
# diccionarios es mas limitado a definiciones mas bien estáticas, pero de todos modos de manera
# didáctica les dejo ejemplo de como armar un diccionario clave valor de fechas de cierres partiendo de un CSV
import csv

data = csv.reader(open("SPY.csv"), delimiter=";")
fechas_cierres = []
for fila in data:
    dicc = {}
    dicc[fila[0]] = fila[5]
    fechas_cierres.append(dicc)
fechas_cierres[0:4]


[{'timestamp': 'adjusted_close'},
 {'19/3/2020': '240.51'},
 {'18/3/2020': '240'},
 {'17/3/2020': '252.8'}]

#### Lectura de balances desde un CSV

In [19]:
# Veamos primero que trae en la primera fila
import csv
data = csv.reader(open('balances.csv'), delimiter=';')
filas = [fila for fila in data]
filas[0]

['symbol',
 'period',
 'date',
 'intangibleAssets',
 'totalLiab',
 'totalStockholderEquity',
 'otherCurrentLiab',
 'totalAssets',
 'commonStock',
 'otherCurrentAssets',
 'retainedEarnings',
 'otherLiab',
 'otherAssets',
 'totalCurrentLiabilities',
 'otherStockholderEquity',
 'propertyPlantEquipment',
 'totalCurrentAssets',
 'longTermInvestments',
 'netTangibleAssets',
 'shortTermInvestments',
 'netReceivables',
 'longTermDebt',
 'inventory',
 'accountsPayable']

In [20]:
# Veamos ahora un ejemplo para traer solo los blancos de FB
import csv
data = csv.reader(open('balances.csv'), delimiter=';')
balances = list()
for fila in data:
    if fila[0] == "FB":
        balances.append(fila)
print("La cantidad de balances es", len(balances), "\nEl primero es", balances[0])

La cantidad de balances es 20 
El primero es ['FB', 'trimestral', '31/12/2019', '894000000', '32322000000', '101054000000', '10854000000', '133376000000', 'NULL', '8000000', '55692000000', '7327000000', '2759000000', '15053000000', '-489000000', '44783000000', '66225000000', 'NULL', '81445000000', '35776000000', '9518000000', 'NULL', 'NULL', '1363000000']


In [21]:
activos_anuales = {}
for balance in balances:
    if balance[1]=="anual":
        activos_anuales[balance[2]]=round(int(balance[7])/1000000)
activos_anuales

{'31/12/2019': 133376,
 '31/12/2018': 97334,
 '31/12/2017': 84524,
 '31/12/2016': 64961,
 '31/12/2015': 49407,
 '31/12/2014': 40184,
 '31/12/2013': 17895,
 '31/12/2012': 15103,
 '31/12/2011': 6331,
 '31/12/2010': 2990}

In [22]:
ratio = {}
for balance in balances:
    if balance[1] == "anual":
        try:
            ratio[balance[2]]=round(int(balance[16])/int(balance[13]),2)
        except:
            ratio[balance[2]] = "No se pudo calcular"
ratio

{'31/12/2019': 4.4,
 '31/12/2018': 7.19,
 '31/12/2017': 12.92,
 '31/12/2016': 11.97,
 '31/12/2015': 11.25,
 '31/12/2014': 9.4,
 '31/12/2013': 11.88,
 '31/12/2012': 10.71,
 '31/12/2011': 'No se pudo calcular',
 '31/12/2010': 'No se pudo calcular'}